静粛に、只今統計勉強中

仕事でデータ分析をすることになったバリバリ文系アラフィフのおっさんが、独学で統計の勉強を始めました。

ベン図だけでわかる包除原理

包除原理というのは、和集合の要素数を計算するための基本的な原理、なのだそうです。個数定理とよばれることもあるとか。

高校1年の数学Aで学ぶ内容みたいですが、私は習った覚えがありません。習わなかったと思います。習わなかったんじゃないかな。

 

ともあれ、学びなおそうと思ってググってみたのですが、検索にかかったサイトを手当たりしだいに見てみても、説明(証明)が全然頭に入ってきません。

 

で、しかたなくベン図を描きながらあれこれ考えていたら、

なんだ、こういうことか!

続きを読む

偏相関係数は残差の相関係数だった3


前回、統計検定2級試験の2018年6月 問2で取り上げられたデータを使って、実際に、常設映画館数と一般病院病床数を各々人口に回帰させる単回帰モデルを最小二乗法で推定した時の残差、 e1とe2相関係数が、偏相関係数の定義
 r_{12・3}=\dfrac{r_{12}-r_{13}r_{23}}{\sqrt{1-r_{13}^2}\sqrt{1-r_{23}^2}}
で求められる値と一致することを確かめることができました。

今回は、このことが数理の上でも証明されることを確認してみたいと思います。

導出のプロセスを勉強にするにあたっては、こちら

のPDF「VI-1-2. 偏相関分析」を参考にさせていただきました。ありがとうございました。

続きを読む

偏相関係数は残差の相関係数だった2

前回は、手持ちの入門書で偏相関係数のことを学びなおそうとしたけれども、いま一つピンとこなかった、というお話をしました。

そこで今回は、統計検定2級試験の2018年6月 問2で取り上げられているデータにとことん向き合うことで、相関係数は残差どうしの相関係数であることを実感したい! と思います。

続きを読む

偏相関係数は残差の相関係数だった1

統計検定2級試験、2018年6月 問2〔3〕の一番目の選択肢には、こう書かれています。

残差e1 と残差 e2相関係数は,人口の影響を除去した時の相関係数であり,常設映画館数と一般病院病床数の偏相関係数とよばれるものである。

これだけだと「残差e1 と残差 e2ってなんじゃい!」ってなってしまいますので、問題文をかいつまんで説明しますと、都道府県別の

  • 人口
  • 常設映画館数
  • 一般病院病床数

という3つの変数がありまして、

  • 人口と常設映画館数
  • 人口と一般病院病床数
  • 常設映画館数と一般病院病床数

のいずれも正の相関が認められます。でも、常設映画館数と一般病院病床数って関係があるとは思えませんよね?

続きを読む

Amazon定期おトク便がいつもお得とは限らない件

f:id:cyclo-commuter:20190327125406j:plain

 

定期的に買うものがある人にとって、Amazon定期おトク便はとてもありがたいサービスですよね?*1
ご多分に漏れずわたしも利用しているのですが、先日、
このサービスが必ずしもお得じゃない
ことがあることに気づいてしまったので、ご報告したいと思います。

*1:そりゃなんじゃ?という人は“Amazon定期おトク便”でググってみてください。

続きを読む