静粛に、只今統計勉強中

仕事でデータ分析をすることになったバリバリ文系アラフィフのおっさんが、独学で統計の勉強を始めました。

『マンガでわかる統計学 因子分析編』を読み返してみた

『マンガでわかる統計学 因子分析編』は、高橋信氏の『マンガでわかる統計学』シリーズ第三弾になります。
前二作の キャラクターが合流するストーリーには、シリーズを順に読んできた人はニヤリとさせられることでしょう。
内容の難しさは、さらにアップしていますが・・・

マンガでわかる統計学 因子分析編

マンガでわかる統計学 因子分析編

ていうか、前作のうちロジスティック回帰分析もそうでしたが、この本の説明だけでは、主成分分析も因子分析もできないようになっているのが、なんとも残念です。
というのも、計算の肝に当たる「ラグランジュの未定乗数法」の説明がすっぱりと省略されてしまっているからです。
ならばとネットで調べてみましたが、著者が「数学的に難しい」と言うだけあって、計算の手順がまったく理解できませんでした。ぐぬぬ

せっかく第3章でヒイヒイ言いながら行列の数式を追ったのに、いざ分析! となったら計算ができないのですから、正直、梯子を外された感は否めません。
前二作の再読にあたっては、解説に基づいて実際にエクセルExcelで計算したり、VBAでコーディングしたりしながら理解を深めてきたのですが、今の私のレベルでは限界を超えていて、そうしたアプローチは、当面は諦めるしかないようです・・・

では、『マンガでわかる統計学 因子分析編』は初学者が読むに相応しくないのかというと、全くそんなことはありません。むしろ、数理はわからないけれど統計ソフトで主成分分析も因子分析もやっちゃうぜ、という人(ていうか私ですが)こそ読むべき本だと思います。

それは、この本では、他ではあまり取り上げられることのない主成分分析・因子分析にまつわる注意点が、みっちりと説明されているからです。

山ほどある注意点は、究極的には

に還元されます。
つまり、主成分分析と因子分析(特に因子分析)は、分析者の恣意的な判断が混入しやすい分析手法だということです。
それはもう、分析前の変数の選択から、分析に際しての様々な方法の選択、分析後の解釈に至るまで、分析者自信が判断しなければならないことだらけですから、結果を捻じ曲げようと思えばいくらでも曲げられてしまいます。わざとじゃなくたって、どう曲がるか知れません。

ですから、これから主成分分析・因子分析をしようと思う人は、この本に書かれている注意点をしっかりと頭に入れて行なったほうがよいでしょう。

さらに言えば、

多種多様な計算方法が存在するということはつまり、(略)唯一無二の計算方法が存在しないことを意味します。

『マンガでわかる統計学 因子分析編』高橋信(オーム社)201ページ

という指摘も重要です。
この文章に限らず、著者の言葉からは、メタ視点から統計学じたいを相対化しようとするまなざしを感じます。

世の中には「統計学が最強の学問である」などと言って反っくり返っている方もいるようですが、とんでもない。
著者の薫陶を受けて私は、統計学はたかだか「技法」であって、それも数多(あまた)の統計学者たちの試行錯誤によってかなりとっちらかっている技法の集合なのだ、と考えるようになったのですが、思い込みが過ぎますかね?