静粛に、只今統計勉強中

仕事でデータ分析をすることになったバリバリ文系アラフィフのおっさんが、独学で統計の勉強を始めました。

統計検定2級の設問分類をクロス集計してみた1

相変わらず、勉強がてら統計検定2級の過去問を分類したデータをあれこれと弄っておりますが、今回は、出題の有無をダミー変数として、小項目と実施年月でクロス集計してみました。もちろん、なんらかトレンド、つまり時系列的な傾向が読み取れたらいいなぁ、という期待を込めてです。

 

2012年~2018年6月の小項目・実施年月クロス集計
(全11回,試験年月ごとに 出題された:1 されなかった:0 として計算した)

f:id:cyclo-commuter:20181105134315p:plain

ざっくり、「必ず出る」「よく出る」「出たり出なかったり」の3セクターに分けてみました。

 

「必ず出る」

仮説検定

このうち、頻出のカイ2乗検定独立性の検定適合度検定)と母平均の差の検定については、既に触れました。

仮説検定のうち、その他の項目は出たり出なかったりします。
f:id:cyclo-commuter:20181106104146p:plain
が、周期性は読み取れませんねー。
母分散の比の検定が、2017年6月までは5回ごとの出題でしたが、前回そのパターンが崩されています。

まあ、ヤマを張らなくても、ほとんどの場合は基本を押さえておけば大丈夫です。
稀に難問が出ますが、そこは捨ててかかったほうが効率的かと。

あ、母分散が未知か既知か(t検定かz検定か)を見分けなくちゃいけない時がありますので、そこだけ注意しましょう。

 

確率

苦手なんですよね、確率。
年を取って頭が固くなったせいか、場合の数を数えるときに、場合を見落としちゃうんです。

例えば、「3人のジャンケンであいこ」というお題があったとき、

f:id:cyclo-commuter:20181106161456p:plain と と  だけで計算しちゃったりして。
f:id:cyclo-commuter:20181106161456p:plain の場合を見落としてるんです。ホント情けない限り。_| ̄|○

 幸いと言うべきか、統計検定2級試験はマーク式の選択問題なので、ケアレスミスをしたまま計算した結果は、たいてい選択肢からかけ離れた値になります。
そこで、間違えた個所に思い当ることができれば、計算しなおして正答にたどり着くことも不可能ではありません。時間はかかってしまいますが・・・

試験日までに演習の数をこなして、少しでも慣れておきたいところですね。

あと、ベイズの定理はこれまで3回以上間が空いたことがありませんので、
f:id:cyclo-commuter:20181114142154p:plain
しっかり押さえておかないとですね。

 

散らばらりなどの指標

f:id:cyclo-commuter:20181107131509p:plain

四分位範囲(四分位偏差)、ローレンツ曲線、ジニ係数に周期性を読み取りたい感じになってます。ま、そんなに難しくもないですし、出題の有無に関わらず覚えてしまえばいいと思いますが。
そう言えば、ローレンツ曲線を描画するマクロとジニ係数を計算する関数を作ったこともありました。