静粛に、只今統計勉強中

仕事でデータ分析をすることになったバリバリ文系アラフィフのおっさんが、独学で統計の勉強を始めました。

Excel VBAで『マンガでわかる統計学 因子分析編』の主成分分析の手順をマクロにしてみた2

主成分分析の学習の続きです。

今回は、『マンガでわかる統計学 因子分析編』で説明される分析の流れを、実はもう作ってしまったマクロのソースコードを追いながら確かめてみたいと思います。

 

主成分分析の流れ

Step1 変数ごとに基準化する。

f:id:cyclo-commuter:20180710152737p:plain
イメージにすると以下のようになります。(変数に格納しているので、ワークシート上には表示されません。)
f:id:cyclo-commuter:20180710153756p:plain
Mat1は、後で主成分得点を求めるときに使います。

 
Step2 相関行列を求める。

f:id:cyclo-commuter:20180710154646p:plain
f:id:cyclo-commuter:20180710154221p:plain
こうなります。
f:id:cyclo-commuter:20180710154011p:plain

 
Step3 固有値固有ベクトルを求める。

f:id:cyclo-commuter:20180710155133p:plain
関数yacobiで固有値解析した結果がこちら。このセル範囲は後で削除します。
f:id:cyclo-commuter:20180710160234p:plain

 
Step4, 5 第1主成分と第2主成分を確認する。それらを元に散布図を描く。

f:id:cyclo-commuter:20180710161323p:plain
f:id:cyclo-commuter:20180710161431p:plain
こうなります。
f:id:cyclo-commuter:20180710162927p:plain
f:id:cyclo-commuter:20180710162946p:plain

この散布図は、固有ベクトルそのものではなく、「主成分負荷量を元に描く」としている解説もあります。Rも(FactoMineRパッケージのPCA()とか)そういう仕様ですね。

『マンガでわかる統計学 因子分析編』には主成分負荷量の説明はありませんが、

主成分得点と観測変数との相関係数のこと。(略)
i主成分z_{i}の主成分負荷量は、固有ベクトルz_{i}の分散(固有値)の正の平方根をかけることで求めることができる。
主成分負荷量 | 統計用語集 | 統計WEB

ということなので、計算は簡単です。試しに主成分負荷量を計算して散布図を描いてみましたが、固有ベクトルを元にした散布図とほとんど変わりありませんでした。

迷いましたが、今回は固有ベクトルで行こうと思います。