静粛に、只今統計勉強中

仕事でデータ分析をすることになったバリバリ文系アラフィフのおっさんが、独学で統計の勉強を始めました。

Excel VBAでスピアマンの順位相関係数を求める関数を作ってみた1

エクセルExcel で単純集計から脱し、分析っぽいことを始める段階って、前回まで取り上げたクロス表の他に、散布図を使い出したりしませんか?
ていうか私がそうでした。

 f:id:cyclo-commuter:20171213143616g:plain

上図のように値がプロットされると「これはXとYの間に相関がある!」なんて、よく分かりもせずに人に説明しちゃったりして。
で、あれこれ弄っているうちに近似曲線とかグラフに数式を表示するとかR-2乗値とかを発見するわけです。

f:id:cyclo-commuter:20171213150113j:plain f:id:cyclo-commuter:20171213150133j:plain
なぜエクセルExcel回帰直線と言わずに近似曲線と称しているか、最近になってようやくその意味を知るわけですが、それはひとまず置いておいて、今回は相関係数の話。

R-2乗値って何?から始まって、相関係数R=√決定係数R2 が相関の強弱を測る指標であることを知り、関数CORREL(とPEARSON)の存在に辿りついて、散布図の横にそっと相関係数Rを添えるようになったのが、今から5ヶ月くらい前でしょうか。
なぜR2 でなくRを?
相関係数を2乗して値が小さくなる決定係数は、見た目で相関が弱く見えて嫌だったんですね。お恥ずかしいことに。