静粛に、只今統計勉強中

仕事でデータ分析をすることになったバリバリ文系アラフィフのおっさんが、独学で統計の勉強を始めました。

統計検定2級の設問を分類→集計してみた1

一念発起して統計検定2級を受験しようと思い、過去問を解いてみたら合格ラインに達しなくてこりゃヤバイ。
というのが前回のお話でした。

その後の実際の勉強法としては、

  1. 前回の過去問を解いてみる
  2. 解けなかったところ・間違えたところをおさらいする
  3. 前々回の過去問を解いてみる
  4. 以上を2012年~2018年6月までの12回分繰り返す
  5. 以上を1セットとして、解けるようになるまでひたすら繰り返す

というものになります。

この勉強法の弱点は、問題と解答そのものを暗記してしまうことです。
そうなってしまっては、肝心の解き方を忘れてしまう恐れが出てくるからです。

ですので、適度に間をあけて、問題と解答は忘れてるけど、解くのに必要な知識は覚えている、という状態に持っていかなくてはなりません。

この、なかなか退屈な作業を少しでも楽しいものにしたいと思い、学習対象そのものに対して統計学的なアプローチを試みることにしました。

 

まずは、問題を解きながら各設問を分類していきます。
分類は、公式サイトの統計検定2級出題範囲表に準拠しました。

f:id:cyclo-commuter:20181027142108p:plain

で、分類してみた結果がこんな感じ。

f:id:cyclo-commuter:20181027142550p:plain

解答番号一つにつき、出題範囲表の小項目&項目を一つ当てはめています。複数の項目にまたがる設問もありますが、その場合は出題頻度に応じて、正答に一番関連していると思われる項目、もしくは設問と複数の選択肢を包含する項目を当てました。
なるべく間違いがないよう、また試験年月ごとに矛盾が生じないよう、答え合わせの段階でも見直し、さらにそれを2セット繰り返しましたが、なにぶん100%私の主観によっていますので、正確性や精度については保証できません。
この記事に限ったことではありませんが、当ブログを利用した結果生じた損害については一切の責任を負いませんので、ご承知おきください。

 

まずは、項目ごとの出題回数を単純集計してみました。

2012年~2018年6月の項目別出題回数
(全11回,試験年月ごとに 出題された:1 されなかった:0 として計算した)

小項目 項目 出題回数
散布図と相関 散布図 11
確率変数 確率変数の期待値・分散・標準偏差 10
散らばりなどの指標 箱ひげ図 9
標本調査と無作為抽出 標本抽出法 9
仮説検定 独立性の検定 8
仮説検定 母平均の差の検定 8
散布図と相関 相関係数 8
データの分布の記述 ヒストグラム 7
仮説検定 母平均の検定 6
確率 ベイズの定理 6
確率 加法定理 6
確率 事象と確率 6
推定 正規母集団の母平均の区間推定 6
推定 母比率の区間推定 6
中心傾向の指標 平均値 6
標本分布 標準正規分布表の利用 6
回帰分析 重回帰モデル 5
確率 乗法定理 5
確率分布 二項分布 5
散らばりなどの指標 標準偏差 5
単回帰と予測 観測値と予測値 5
標本分布 標本平均の期待値・分散 5
データの分布の記述 幹葉図 4
データの分布の記述 度数分布表 4
仮説検定 第1種の過誤と第2種の過誤 4
仮説検定 母分散の比の検定 4
回帰分析 回帰係数の検定 4
確率分布 ポアソン分布 4
散らばりなどの指標 四分位範囲(四分位偏差) 4
時系列データの処理 指数化 4
実験計画の概念の理解 分散分析 4
推定 信頼区間 4
中心と散らばりの活用 変動係数 4
中心傾向の指標 中央値 4
標本分布 二項分布の正規近似 4
カテゴリカルデータ 2元クロス表 3
仮説検定 帰無仮説(H0)と対立仮説(H1) 3
仮説検定 適合度検定 3
確率分布 ベルヌーイ試行 3
確率変数 2変数の共分散・相関 3
確率変数 確率変数の和と差 3
散らばりなどの指標 ローレンツ曲線 3
時系列データの処理 コレログラム 3
時系列データの処理 成長率 3
実験 フィッシャーの3原則 3
単回帰と予測 決定係数 3
単回帰と予測 標準誤差 3
単回帰と予測 分散分析表 3
中心と散らばりの活用 標準化(z得点) 3
データの分布の記述 分布の形状 2
仮説検定 仮説検定の理論 2
仮説検定 検出力 2
回帰分析 ダミー変数を用いた回帰 2
回帰分析 回帰直線の傾きの推定と検定 2
回帰分析 自由度調整(修正)済み決定係数 2
確率 条件付き確率 2
確率分布 一様分布 2
散らばりなどの指標 ジニ係数 2
推定 一致性,不偏性 2
単回帰と予測 回帰係数 2
データの分布の記述 質的変数(カテゴリカル・データ) 1
データの分布の記述 量的変数 1
仮説検定 母比率の検定 1
仮説検定 両側検定と片側検定 1
確率分布 幾何分布 1
観察研究と実験研究 観察研究 1
観察研究と実験研究 調査の設計 1
散布図と相関 共分散 1
散布図と相関 層別した散布図 1
散布図と相関 相関係数 1
時系列データの処理 <階差系列> 1
時系列データの処理 トレンド 1
時系列データの処理 幾何平均 1
時系列データの処理 系列相関 1
時系列データの処理 平滑化(移動平均 1
推定 定量と推定値 1
推定 母比率の差の区間推定 1
推定 母分散の区間推定 1
単回帰と予測 残差プロット 1
単回帰と予測 変数変換 1
標本調査と無作為抽出 偏りの源 1
標本分布 カイ二乗分布 1
標本分布 分布表の活用 1

久しぶりに縦に長くなってしまいました。(;^_^A

当然のことながら、学習はこれらの項目すべてを網羅する必要がありますが、なかでも上位に挙がったド定番の項目は必勝にしておかなければなりません。

散布図の問題は、2012年以降100%の確率で出題されています。難易度は決して高くはありませんが、その分、問題や選択肢にひとひねり加えられていることが多いので、うっかりミスをしないよう注意が必要です。

 

※<階差系列>は公式サイトの出題範囲表には記載がありませんでしたが、他に当てはめられる項目が見当たらなかったので、やむなく上表のように記しています。