静粛に、只今統計勉強中

仕事でデータ分析をすることになったバリバリ文系アラフィフのおっさんが、独学で統計の勉強を始めました。

因子分析の<沼>に片足だけ突っ込んでみた1

本当は、Excel VBAで『マンガでわかる統計学 因子分析編』の因子分析の手順をマクロにしてみたという見出しにしたかったのです。
ですが、因子分析には固有値問題をクリアしてもなお残る難題があって、残念ながらそれは叶いませんでした。

その難題が何かはおいおい語るとして、今回からしばらく、『マンガでわかる統計学 因子分析編』の因子分析の手順をエクセルExcelで確かめながら、因子分析がいかに<沼>であるか、その一端でもお伝えしていければ、と思います。

 

第一の沼:因子抽出法

『マンガでわかる統計学 因子分析編』では、主因子法が解説されますが、因子抽出法は他にもいろいろあります。SPSSだと、主成分分析*1、重み付けのない最小二乗法、一般化した最小二乗法、最尤法、主因子法、アルファ因子法、イメージ因子法から選べるようですが*2 、最近のトレンドは最尤法のようです。

しかし、著者の高橋信氏は、主因子法を「過去の遺物」扱いし、なんでもかんでも最尤法で計算すればよいという方向に疑念を抱いていて、その理由をいくつか挙げられています。*3

一方、こちらの記事では、

制約はあるものの最尤法>最小二乗法>反復主因子法の順に選択するのがよい、とされています。

どちらの主張も説得力があるように感じられ、素人には判断がつきません。

f:id:cyclo-commuter:20180717150857j:plain

いずれにしても、『マンガでわかる統計学 因子分析編』で手順が詳細に解説されているのは主因子法だけですので、主因子法で学習を進めるしかないのですが・・・

  

Step1 変数ごとに基準化する

データの基準化(標準化)のためには、以前作ったStandardScore関数が便利です。

J3セルを例に取ると、以下のように数式を入力します。

f:id:cyclo-commuter:20180717175425p:plain

で、O17セルまでコピーすると、以下のように全データについて基準化した値が表示されます。

f:id:cyclo-commuter:20180717175528p:plain

※元データは、『マンガでわかる統計学 因子分析編』から拝借しています。

*1:SPSSでは、なぜか主成分分析が因子分析の一部のように扱われていますが、これはSPSSに限ったことではないようです。

多くの 汎用ソフトウェアが FA と PCA を同じモジュールで扱いそして PCA がデフォルトになっていることもユーザを混乱させる原因になっている.

http://www.sigmath.es.osaka-u.ac.jp/~kano/research/seminar/30BSJ/kano.pdf

*2:https://www.ibm.com/support/knowledgecenter/ja/SSLVMB_23.0.0/spss/base/idh_fact_ext.html

*3:『マンガでわかる統計学 因子分析編』209ページ