静粛に、只今統計勉強中

仕事でデータ分析をすることになったバリバリ文系アラフィフのおっさんが、独学で統計の勉強を始めました。

『マンガでわかる統計学 回帰分析編』に従ってExcel分析ツールの重回帰分析の結果を読んでみた1

『マンガでわかる統計学 回帰分析編』の第3章では重回帰分析について解説されるのですが、このあたりになると計算方法は説明されるものの、あるいは説明すらなく、計算じたいはパソコン任せ、という描写が出てきます。*1
勉強のためなら自分で計算に拘るのも有りでしょうが、実践的ではないってことなんでしょうね。

そこで、エクセルExcelユーザーなら重回帰分析がお手軽にできる分析ツールを使っちゃおうぜ! というのが今回のお題。

 

散布図行列

だがしかし、分析ツールの前にやらなくちゃいけないことがあります。

106ページにあるように、重回帰分析の流れは、単回帰分析とほとんど同じ。
『マンガでわかる統計学 回帰分析編』に従って単回帰分析の手順を追ってみた1 ~回帰係数のF検定~ - 静粛に、只今統計勉強中
となれば、重回帰分析のStep1は「散布図行列」です。Rコマンダーなら超カンタンに作れる散布図行列ですが、エクセルExcelでやるのは大変そう・・・

と思ったら、

またしてもBDAstyle様ですよ。参りましたー。

さっそく使わせていただいたら、*2
f:id:cyclo-commuter:20180203143411j:plain
これがもう完璧。言うことなしです。こんなスゴイものを公開していただいて、感謝に堪えません。

 

重回帰式を求める

さあ、分析ツールの出番です。

  1. [データ]タブから【データ分析】をクリック
    f:id:cyclo-commuter:20180203151508j:plain

  2. 「回帰分析」を選択して【OK】をクリック
    f:id:cyclo-commuter:20180203151704j:plain

  3. 入力Y範囲に従属変数(目的変数)の範囲、入力X範囲に独立変数(説明変数)の範囲をラベル付きで指定、表&グラフはマシマシの全部乗せで行ってみましょう。
    f:id:cyclo-commuter:20180203152508j:plain

  4. はい、出ました!
    f:id:cyclo-commuter:20180203152800j:plain

この、統計学を知らなければナンノコッチャわからん数字を『マンガでわかる統計学 回帰分析編』に従って読み解いていきます。

まずは、重回帰式から。

偏微分も行列の計算も私の限界を超えていますが、単回帰のときと同じく最小二乗法で導かれる由。多次元グラフ上にプロットされた (x1i, x2i, yi )(i=1,2,3...n) の最も近くを通る直線をイメージ・・・ できないか。

とにかく、エクセルExcelが計算してくれたので、それを見ましょう。

今回のデータについて回帰式を y = a1x1 + a2x2 + b 、x1をお店の面積、x2を最寄り駅からの距離とするとき、f:id:cyclo-commuter:20180203160208j:plain
こうです。
重回帰式は y = 41.51347826x1 - 0.340882686x2 + 65.32391639 となりますね。

 

重回帰式の精度を確認する

このあたりの計算は私でも追えますが、 割愛します。詳細な解説と合わせて『マンガでわかる統計学 回帰分析編』でご確認ください。
ここでは平たく言って、
f:id:cyclo-commuter:20180203164507j:plain

補正 R2 とは、自由度調整済み寄与率R*2 のことです。0.5以上を目安として、1に近いほどモデルの当てはまりがよい(精度が高い) 由。

*1:読み返したら、マンガで割愛された箇所でも、後から文章でフォローされてました。

*2:データは『マンガでわかる統計学 回帰分析編』の第3章のを拝借しています。