相関係数を求める数式をとことん噛み砕いてみた2
前回からの続き、
相関係数はなぜいい感じに-1から1の間に収まるのか?
これを高1で数学と決別した文系オヤジが、ベクトルの内積を利用した方法で学びます。
わからないことが出てくる度にグーグル先生にお伺いを立てる泥縄式勉強法でやってますので、至らぬ点があることはご承知おきください。
ベクトルの内積を利用する方法にしたのは、以前読んだ『マンガで学べる!統計解析』でそのやり方が解説されていたからですが、
そのときは雰囲気だけ味わってよしとしていました。
いざ、ちゃんと理解しようと思って読み返すと、いやもうサッパリわからん。
内積って? から始まり、余弦定理→三平方の定理→三角関数まで遡ってもまだ腑に落ちません。そもそもベクトルとは? まで調べてようやくイメージが掴めてきました。
ベクトルって?
ベクトルというと、こちらにあるようにをイメージするわけですが、
一方でこちらにあるように
1次元配列とてしても表せるようです。
ベクトルは、
矢印でもあり、
一次元配列でもある。*1
ここを抑えておかないと、その先の説明に付いていけなくなります。
コサインって?
遠い昔の記憶がかすかに残る三角関数。
は、直角三角形をCの形になぞって、底辺の長さ÷斜辺の長さでしたね。
ざっくり、半径1の円内で中心から円まで直線を引き、その終点からX軸と垂直になる直線を引いたとき、 で表すとイメージしやすいです。
内積って?
の前に本当は、余弦定理って? が挟まるのですが、ここでは割愛します。
こちらに詳しい説明がありますので、知りたい方はどうぞ。
さらに、内積の詳しい解説がこちらにありますので、読んでおいてください。
ポイントは、内積の求め方には2種類ある、ということです。
(内積が何であるかは、この際あまり重要ではありません。)
ベクトル a,b があるとき、内積 は、
1つめの求め方
2つめの求め方
こちらは、余弦定理から導出される求め方になります。
ここで |a| |b| はベクトル a,b の長さを表し、
で求められるのだそうです。
いよいよ相関係数
ここからがスペクタクルです。
(2)から、
成分(座標)がわからなくてもベクトルの要素から2片の長さとその間の角が計算できてしまうのが驚異的ですが、ここで(5)の分子に(1)、分母に(3)(4)を代入すると、
もうおわかりですね? a,b を に置き換えれば、
相関係数の尺度
だから相関係数は-1から1の間に収まるんですねー。
その様子をアニメーションGIFにしてみました。
半径1の円において赤線の長さが=相関係数の値になりますので、絶対値で1を超えることはありえません。
ああ、スッキリした! ここまでやれば、さすがにもう忘れないと思います。
ところで、相関係数は比例尺度ではないので「相関係数0.6は0.3の2倍の相関があるわけではない」ということは、しばしば注意されるところです。
相関係数の値と相関の度合いを図にするとこんな感じになるでしょうか。
もしそうだとすれば、 から に変換してあげれば、比例尺度になったりしませんかねえ?