#14 データ分析手法(回帰分析)

 [公開]
icon 秋山 賢 が 2018/07/06 19:01 に投稿
  投稿を編集(サインイン)
  ストック
  アンケート回答

  目次

回帰分析

回帰分析とは、簡単に言うと「要因(x)が結果(y)に影響を与えたか?」を調べて、それぞれの関係を明らかする分析手法です。

回帰分析を行う主な目的としては、
①数値の予測
②要因分析
が挙げられます。

例えば、xを「気温」、yを「ビールの売上」とすると、「気温がビールの売上にどれくらい影響を与えたか?(気温1度上がる毎に売上はどれくらい上がるのか?)」を知る方法が回帰分析による数値の予測になります。

このとき「x」を説明変数、「y」を目的変数と言います。

y = ax + b

その変数の関係性を上記の式で表し、
a(傾き)とb(切片)が分かれば、x(気温)からy(売上)を予測することが可能になります。

実際に回帰分析にて売上予測してみる

以下の架空データを用います。

「気温とビール売上データ」

日付気温(平均)ビール売上
6月23日20.6 ¥231,111
6月24日21.3¥251,222
6月25日26.2¥311,333
6月26日25.7¥291,444
6月27日27.7¥311,555
6月28日27.4¥300,666
6月29日28.2¥331,777
6月30日28.6¥352,888
7月1日28.1¥351,999

EXCEL等にて気温とビール売上をプロットした散布図を作成します。

image-20180702112225535.png

最小二乗法(OLS:Ordinary Least Squares)という方法を用いて、係数aと定数bを求めます。
最小二乗法とは図にプロットしたそれぞれの2乗を足したものが最小になるような傾きと切片を持つ直線を求める方法になります。

EXCELを用いて以下の操作を行うと最小二乗法にて求めた直線と数式を下記の図のように出すことが可能です。
1.プロットした任意の点を選択し「近似曲線の追加」をクリック。
2.近似曲線のオプションタブにて「線形近似」「グラフに数式を表示する」を選択しOK。

image-20180702113944222.png

a(傾き)とb(切片)が求められました。
以下の数式にて、気温xが?度だった場合の売上予測が可能になります。
y = 13069x - 35723

・気温20度
y = 13069 × 20 - 35723
y = 225657
気温が20度の場合、¥225,657の売上が見込める。

・気温25度
y = 13069 × 25 - 35723
y = 291002
気温が25度の場合、¥291,002の売上が見込める。

・気温30度
y = 13069 × 30 - 35723
y = 356347
気温が30度の場合、¥356,347の売上が見込める。

さいごに

上記で紹介したものは、回帰分析の中でも説明変数が1つだけの「単回帰分析」というものになります。
他には、
説明変数が2つ以上の「重回帰分析」や「ロジスティック回帰分析」があり、マーケティングや気象・医療分野など高度な分析にて活用されています。


 コメント追加