Excel VBAで『マンガでわかる統計学 因子分析編』の主成分分析の手順をマクロにしてみた2
主成分分析の学習の続きです。
今回は、『マンガでわかる統計学 因子分析編』で説明される分析の流れを、実はもう作ってしまったマクロのソースコードを追いながら確かめてみたいと思います。
主成分分析の流れ
Step1 変数ごとに基準化する。
イメージにすると以下のようになります。(変数に格納しているので、ワークシート上には表示されません。)
Mat1は、後で主成分得点を求めるときに使います。
Step2 相関行列を求める。
こうなります。
Step3 固有値と固有ベクトルを求める。
関数yacobiで固有値解析した結果がこちら。このセル範囲は後で削除します。
Step4, 5 第1主成分と第2主成分を確認する。それらを元に散布図を描く。
こうなります。
この散布図は、固有ベクトルそのものではなく、「主成分負荷量を元に描く」としている解説もあります。Rも(FactoMineRパッケージのPCA()とか)そういう仕様ですね。
『マンガでわかる統計学 因子分析編』には主成分負荷量の説明はありませんが、
主成分得点と観測変数との相関係数のこと。(略)
第主成分の主成分負荷量は、固有ベクトルにの分散(固有値)の正の平方根をかけることで求めることができる。
主成分負荷量 | 統計用語集 | 統計WEB
ということなので、計算は簡単です。試しに主成分負荷量を計算して散布図を描いてみましたが、固有ベクトルを元にした散布図とほとんど変わりありませんでした。
迷いましたが、今回は固有ベクトルで行こうと思います。