静粛に、只今統計勉強中

仕事でデータ分析をすることになったバリバリ文系アラフィフのおっさんが、独学で統計の勉強を始めました。

標本平均の分布が正規分布になることをシミュレーションで確かめてみた2

前回は、N=1000の母集団からn=10の標本を1000回抽出し、標本分布を作るところまで行いました。

今回は、サンプルサイズnの大きさや母集団の分布の形によって、標本分布の形・標本平均の平均・標本平均の分散がどう変わるかを確認してみたいと思います。

続きを読む

標本平均の分布が正規分布になることをシミュレーションで確かめてみた1

標本平均というのは、母集団から抽出した標本の平均値のことです。
言わずもがなですね。

 E(\bar{X})=\mu

ですから、標本平均は母集団の平均値であることが期待されるわけですが、残念ながらピッタリ一致することは滅多にありません。

 V(\bar{X})=\frac{\sigma^2}{n}

母分散をサンプルサイズ nで割った分だけバラついてしまうことになっています。
上の式から、標本平均の分散は、

  • サンプルサイズ nが小さいほど、大きくなる
  • サンプルサイズ nが大きいほど、小さくなる

ということがわかります。

驚きなのは、 nが十分に大きければ、母集団がどのような分布であっても標本平均の確率分布は(近似的に)正規分布に従うことです。

このことを実感してみたくて、Excelでシミュレートしてみました。

続きを読む

Excel VBAでワークシート上の表をLaTeX形式に変換するマクロを作ってみた

12月に入ってから、 \LaTeX の勉強を始めました。

 \LaTeXってなんぞや? という方は、以下のサイトをご参照ください。

LaTeX入門 - TeX Wiki

こちらのサイトを参考にさせていただき、 W32TeX というディストリビューションをインストールしました。

現在、W32TeX に付属しているエディタ TeXworks にちまちまとコマンドを打ち込んでは結果を確認するという感じで、試行錯誤しているところです。

TeXworks の基本的な使い方も上記のサイトで解説されていたので、順を追って手を動かし、思うようにならないところは以下のサイト

を参照させていただいたり、ググってコマンドを調べたりして、のんびりやっていますが、思ったよりも簡単というか、ハードルが低い感じがします。めんどくささとしては、HTMLで文章を作成する感じとそう変わらないかな、と。

 

しかしながら、HTMLでもそうでしたが、表組み \LaTeX でもとても面倒です。
ここだけは、Mcirosoft WORD の WYSIWYGには敵いませんね。

変換ツール - TeX Wiki

には、CSVExcel形式から  \LaTeX 形式への変換ツールが紹介されていますが、Webアプリを試してみたところ、機能面でもの足りなかったり、使い勝手がよくなかったりして、正直イマイチでした。

と言って、スタンドアロンアプリやLaTeXパッケージをインストールするのはちょっと面倒ですし、いちいち使い心地を確かめる気にもなれません。

というわけで、例によってVBAで作っちゃいました。

続きを読む

統計検定2級を受験してきた

というわけで、11月25日(日)に本試験を受けてきました。

手応えとしてはまずまずだったのですが、Web合格発表はおよそ1か月後。
ここ数日ソワソワと落ち着かない気分でしたが、ブログで受験報告でもしようかと思って統計検定の公式サイトを見てみたら、もう正解が発表されていました。

となればもう、答え合わせをしてみるしかありませんよねえ。

続きを読む

統計検定2級試験の合格率と設問分類で重回帰分析してみた

そろそろ試験実施日が近くなってきたので、統計検定2級試験の設問分類をあれこれ弄るシリーズも、ここでいったん締めたいと思います。
勉強に集中せねば。

ラストは、合格率に影響を与えている小項目があるかどうかを回帰分析で探ってみます。*1

*1:本当は項目で分析したかったのですが、変数の数が多すぎるのと、多重共線性の問題が解決できないのであきらめました。

続きを読む