静粛に、只今統計勉強中

仕事でデータ分析をすることになったバリバリ文系アラフィフのおっさんが、独学で統計の勉強を始めました。

Excel VBAでスピアマンの順位相関係数を求める関数を作ってみた2

散布図を作って分析っぽいことをしていると、割とすぐ壁にぶつかります。

 例えば、

f:id:cyclo-commuter:20171213155938j:plain
のようなアンケートの回答データを散布図にすると、

f:id:cyclo-commuter:20171213160438j:plain

こんなことになってしまいます。いちおう近似曲線(線形だから回帰直線ですね)を引いてみましたが、見た目じゃ全然相関がわからないですよね。
これは、ざっくり言うとアンケートの回答データが連続的な値を取らない質的変数だからで、グリッドの交点上に複数の値が重なってプロットされているために濃淡が見えないのです。
その上、あれこれ調べるうちに、普通の相関係数CORRELPEARSONで計算できるピアソンの積率相関係数)が正規分布に従う連続変量を仮定していることも発覚!
エクセルExcel打つ手なし!?

というときにぜひ使ってみたいのが、スピアマンの順位相関係数です。これは正規分布を仮定しなくていいし、順位がつくデータなら質的変数でも使えます。*1
ただし、このスピアマンの順位相関係数、エクセルExcel標準の関数はありません。となれば、例によって自作するしかないでしょう。

*1:
ちなみに尺度水準別の相関係数の使い分けは下表のようになる由。

ピアソン  r:間隔尺度
スピアマン ρ:順序尺度
クラメール V:名義尺度