静粛に、只今統計勉強中

仕事でデータ分析をすることになったバリバリ文系アラフィフのおっさんが、独学で統計の勉強を始めました。

因子分析の<沼>に片足だけ突っ込んでみた2

『マンガでわかる統計学 因子分析編』で解説される手順をエクセルExcelで確かめながら行う、因子分析の学習の続きです。前回は、Step1まで進めました。

 

Step2 から Step8 までは、数理の説明が続きます。
何度読み返しても咀嚼しきれないほど難解ですが、式変換のプロセスをすっ飛ばしてかいつまむと、

  1. 基準化したデータの全変数を目的変数とし、潜在する説明変数=共通因子を2つとすると、目的変数ui=ai1 × 共通因子i1 + ai2 × 共通因子i2 + 独自因子i が成り立つ、と仮定する。*1
  2. このとき、 ai1 と ai2 =因子負荷量は、相関行列を式変換した
    f:id:cyclo-commuter:20180717164813p:plain
    から求めることができる。(di2は独自因子iの分散)

ということのようです。

 

Step9 分析対象のデータから実際の相関行列を求め、その対角要素から独自因子の分散をひく。

相関行列は、分析ツールで求めてみましょう。
[データ]タブから【データ分析】をクリックして、

f:id:cyclo-commuter:20180717171845p:plain

「相関」を選択して、【OK】をクリック。

f:id:cyclo-commuter:20180717171917p:plain

入力元と出力先を指定して(「先頭行をラベルとして使用」にチェックして)、【OK】をクリック。

f:id:cyclo-commuter:20180717172036p:plain

以下のように分析結果が出力されます。

f:id:cyclo-commuter:20180717175748p:plain

右上側が空欄なので、左下側からコピペします。

f:id:cyclo-commuter:20180717175846p:plain

貼り付けるときは、行列を入れ替えて。

f:id:cyclo-commuter:20180717175939p:plain

コピペが済んだら、共通性iから独自因子iの分散di2をひいて見出しを整えると、こうなります。

f:id:cyclo-commuter:20180717180038p:plain

*1:共通因子を「2つ」に限る必要はありません。制約はあるものの、分析者が個数を決めます。