静粛に、只今統計勉強中

仕事でデータ分析をすることになったバリバリ文系アラフィフのおっさんが、独学で統計の勉強を始めました。

統計検定2級試験の合格率と設問分類で重回帰分析してみた

そろそろ試験実施日が近くなってきたので、統計検定2級試験の設問分類をあれこれ弄るシリーズも、ここでいったん締めたいと思います。
勉強に集中せねば。

ラストは、合格率に影響を与えている小項目があるかどうかを回帰分析で探ってみます。*1

*1:本当は項目で分析したかったのですが、変数の数が多すぎるのと、多重共線性の問題が解決できないのであきらめました。

続きを読む

統計検定2級の設問分類をクロス集計してみた1

相変わらず、勉強がてら統計検定2級の過去問を分類したデータをあれこれと弄っておりますが、今回は、出題の有無をダミー変数として、小項目と実施年月でクロス集計してみました。もちろん、なんらかトレンド、つまり時系列的な傾向が読み取れたらいいなぁ、という期待を込めてです。

 

2012年~2018年6月の小項目・実施年月クロス集計
(全11回,試験年月ごとに 出題された:1 されなかった:0 として計算した)

f:id:cyclo-commuter:20181105134315p:plain

続きを読む

統計検定2級の設問を分類→集計してみた4

統計検定2級の設問を分類→集計してみたシリーズの第4回です。

今回は、「解答番号」*1を合計してみました。

そんなもん集計して何の意味があるんだと言われそうですが、大まかに言って後半になるほど、つまり「解答番号」が大きくなるほど難易度が上がる傾向にありますので、これをもって難易度を測る目安にしようという訳です。

まあ、必ずそうだとは言えませんので、あくまでも目安の一つと思っていただきたいですね。

*1:「解答番号」は、解答欄に付されている通し番号のことです。解答選択肢の番号のことではないので、ご注意ください。

続きを読む

統計検定2級の設問を分類→集計してみた3

前回・前々回の2回で、過去11回の統計検定2級試験の設問を、公式サイトの出題範囲表に基づいて分類し、項目ごとに出題回数・設問数を集計してみました。

集計結果を二つ並べてみると、

f:id:cyclo-commuter:20181113143202p:plain

確率変数の期待値・分散・標準偏差が、出題回数・設問数ともに安定の第2位をキープしています。

この項目は、かつては、分散の公式

 V\begin{bmatrix}X\end{bmatrix}=E\begin{bmatrix}X^2\end{bmatrix}-E\begin{bmatrix}X\end{bmatrix}^2

をベースとして、離散型確率変数の期待値や連続型確率変数の分散などを答えさせるような、比較的易しい問題が多かったのですが、2016年11月から突如として難易度が跳ね上がったように思われます。*1

*1:2016年11月の問題は特に難しかったです。

続きを読む