静粛に、只今統計勉強中

仕事でデータ分析をすることになったバリバリ文系アラフィフのおっさんが、独学で統計の勉強を始めました。

偏相関係数は残差の相関係数だった1

統計検定2級試験、2018年6月 問2〔3〕の一番目の選択肢には、こう書かれています。

残差e1 と残差 e2相関係数は,人口の影響を除去した時の相関係数であり,常設映画館数と一般病院病床数の偏相関係数とよばれるものである。

これだけだと「残差e1 と残差 e2ってなんじゃい!」ってなってしまいますので、問題文をかいつまんで説明しますと、都道府県別の

  • 人口
  • 常設映画館数
  • 一般病院病床数

という3つの変数がありまして、

  • 人口と常設映画館数
  • 人口と一般病院病床数
  • 常設映画館数と一般病院病床数

のいずれも正の相関が認められます。でも、常設映画館数と一般病院病床数って関係があるとは思えませんよね?

続きを読む

Amazon定期おトク便がいつもお得とは限らない件

f:id:cyclo-commuter:20190327125406j:plain

 

定期的に買うものがある人にとって、Amazon定期おトク便はとてもありがたいサービスですよね?*1
ご多分に漏れずわたしも利用しているのですが、先日、
このサービスが必ずしもお得じゃない
ことがあることに気づいてしまったので、ご報告したいと思います。

*1:そりゃなんじゃ?という人は“Amazon定期おトク便”でググってみてください。

続きを読む

不偏分散の平方根は不偏標準偏差じゃなかった

分散 Vの(正の)平方根 \sqrt{V}標準偏差であることは、みなさんご存じですよね?

では、不偏分散 \dfrac{1}{n-1}\displaystyle\sum_{i=1}^n(X_i-\bar X)^2 の(正の)平方根 \sqrt{\dfrac{1}{n-1}\displaystyle\sum_{i=1}^n(X_i-\bar X)^2}は、不偏標準偏差でしょうか?

タイトルで種明かししちゃってるんだから、こんな謎かけしてもしょうがないんですが、でも、にわかには信じがたいですよね? 答えがノーだなんて。

続きを読む

不偏じゃないほうの標本分散も一致推定量だった

前回、母分散の不偏推定量が不偏分散 \dfrac{1}{n-1}\displaystyle\sum_{i=1}^n(X_i-\bar X)^2 であることをようやく理解したわけですが、推定量の望ましい性質は、不偏性のほかに一致性というのもあります。

一致性というのは、推定量大数の法則に従っている場合に指す言葉で、

サンプルサイズが大きくなれば、推定値は母集団が持つ真の値に近づくよね。

という、感覚的にも至極とうぜんのことを言っていたりするわけですが、統計学的にはn→∞で証明されているわけで、無限大の前には不偏分散の分母にあるマイナス1なんて、文字どおり物の数じゃなかったりします。(このことは前々回、オオカミ先生も言ってましたね。)

というわけで今回は、不偏じゃないほうの標本分散も一致推定量であることをシミュレーションで確かめてみたいと思います。

続きを読む

標本の不偏分散はやっぱり母分散の不偏推定量だった2

前回、

不偏分散について学びなおすぞ!

と決意して、わりとたくさん持ってる『マンガで(ほにゃらら)統計学』を片っ端から読み返してみたけれども、全然わからなかった、というお話をしました。

 

今回は、もう少しハードな本とか親切なWEBサイトとかを駆使して、何が何でも不偏分散の本質を理解してやろうと思います。

続きを読む