『マンガでわかる統計学 回帰分析編』に従ってExcel分析ツールの重回帰分析の結果を読んでみた1
『マンガでわかる統計学 回帰分析編』の第3章では重回帰分析について解説されるのですが、このあたりになると計算方法は説明されるものの、あるいは説明すらなく、計算じたいはパソコン任せ、という描写が出てきます。*1
勉強のためなら自分で計算に拘るのも有りでしょうが、実践的ではないってことなんでしょうね。
そこで、エクセルExcelユーザーなら重回帰分析がお手軽にできる分析ツールを使っちゃおうぜ! というのが今回のお題。
散布図行列
だがしかし、分析ツールの前にやらなくちゃいけないことがあります。
106ページにあるように、重回帰分析の流れは、単回帰分析とほとんど同じ。
『マンガでわかる統計学 回帰分析編』に従って単回帰分析の手順を追ってみた1 ~回帰係数のF検定~ - 静粛に、只今統計勉強中
となれば、重回帰分析のStep1は「散布図行列」です。Rコマンダーなら超カンタンに作れる散布図行列ですが、エクセルExcelでやるのは大変そう・・・
と思ったら、
またしてもBDAstyle様ですよ。参りましたー。
さっそく使わせていただいたら、*2
これがもう完璧。言うことなしです。こんなスゴイものを公開していただいて、感謝に堪えません。
重回帰式を求める
さあ、分析ツールの出番です。
- [データ]タブから【データ分析】をクリック
- 「回帰分析」を選択して【OK】をクリック
- 入力Y範囲に従属変数(目的変数)の範囲、入力X範囲に独立変数(説明変数)の範囲をラベル付きで指定、表&グラフはマシマシの全部乗せで行ってみましょう。
- はい、出ました!
この、統計学を知らなければナンノコッチャわからん数字を『マンガでわかる統計学 回帰分析編』に従って読み解いていきます。
まずは、重回帰式から。
偏微分も行列の計算も私の限界を超えていますが、単回帰のときと同じく最小二乗法で導かれる由。多次元グラフ上にプロットされた (x1i, x2i, yi )(i=1,2,3...n) の最も近くを通る直線をイメージ・・・ できないか。
とにかく、エクセルExcelが計算してくれたので、それを見ましょう。
今回のデータについて回帰式を y = a1x1 + a2x2 + b 、x1をお店の面積、x2を最寄り駅からの距離とするとき、
こうです。
重回帰式は y = 41.51347826x1 - 0.340882686x2 + 65.32391639 となりますね。
重回帰式の精度を確認する
このあたりの計算は私でも追えますが、 割愛します。詳細な解説と合わせて『マンガでわかる統計学 回帰分析編』でご確認ください。
ここでは平たく言って、
補正 R2 とは、自由度調整済み寄与率R*2 のことです。0.5以上を目安として、1に近いほどモデルの当てはまりがよい(精度が高い) 由。