静粛に、只今統計勉強中

仕事でデータ分析をすることになったバリバリ文系アラフィフのおっさんが、独学で統計の勉強を始めました。

統計検定2級の設問を分類→集計してみた4

統計検定2級の設問を分類→集計してみたシリーズの第4回です。

今回は、「解答番号」*1を合計してみました。

そんなもん集計して何の意味があるんだと言われそうですが、大まかに言って後半になるほど、つまり「解答番号」が大きくなるほど難易度が上がる傾向にありますので、これをもって難易度を測る目安にしようという訳です。

まあ、必ずそうだとは言えませんので、あくまでも目安の一つと思っていただきたいですね。

 

2012年~2018年6月の項目別解答番号合計

小項目 項目 NOの合計
仮説検定 独立性の検定 545
仮説検定 母平均の差の検定 394
回帰分析 重回帰モデル 322
確率変数 確率変数の期待値・分散・標準偏差 295
実験計画の概念の理解 分散分析 252
推定 正規母集団の母平均の区間推定 239
推定 母比率の区間推定 224
仮説検定 母平均の検定 194
標本分布 標準正規分布表の利用 162
仮説検定 母分散の比の検定 145
標本調査と無作為抽出 標本抽出法 143
単回帰と予測 観測値と予測値 142
仮説検定 適合度検定 131
確率 ベイズの定理 131
確率分布 二項分布 120
標本分布 標本平均の期待値・分散 120
確率 事象と確率 119
散布図と相関 散布図 119
散布図と相関 相関係数 117
回帰分析 回帰係数の検定 116
仮説検定 第1種の過誤と第2種の過誤 104
単回帰と予測 決定係数 99
単回帰と予測 回帰係数 97
中心傾向の指標 平均値 93
単回帰と予測 分散分析表 88
確率 加法定理 86
確率分布 ポアソン分布 86
推定 信頼区間 83
確率 乗法定理 82
仮説検定 帰無仮説(H0)と対立仮説(H1) 81
標本分布 二項分布の正規近似 80
回帰分析 回帰直線の傾きの推定と検定 70
回帰分析 ダミー変数を用いた回帰 69
確率変数 2変数の共分散・相関 67
回帰分析 自由度調整(修正)済み決定係数 65
散らばりなどの指標 箱ひげ図 63
時系列データの処理 指数化 61
確率分布 一様分布 57
仮説検定 検出力 56
確率分布 ベルヌーイ試行 52
単回帰と予測 標準誤差 51
推定 一致性,不偏性 48
仮説検定 仮説検定の理論 47
標本分布 カイ二乗分布 43
確率変数 確率変数の和と差 40
データの分布の記述 度数分布表 40
確率分布 幾何分布 39
中心傾向の指標 中央値 39
実験 フィッシャーの3原則 38
中心と散らばりの活用 変動係数 37
散らばりなどの指標 標準偏差 37
カテゴリカルデータ 2元クロス表 35
散布図と相関 層別した散布図 35
中心と散らばりの活用 標準化(z得点) 33
単回帰と予測 変数変換 33
単回帰と予測 残差プロット 33
仮説検定 両側検定と片側検定 31
時系列データの処理 系列相関 31
時系列データの処理 コレログラム 30
確率 条件付き確率 28
推定 母比率の差の区間推定 28
仮説検定 母比率の検定 28
時系列データの処理 成長率 27
散らばりなどの指標 ジニ係数 27
推定 母分散の区間推定 23
散らばりなどの指標 ローレンツ曲線 21
推定 定量と推定値 21
散らばりなどの指標 四分位範囲(四分位偏差) 19
データの分布の記述 ヒストグラム 18
データの分布の記述 分布の形状 17
標本分布 分布表の活用 17
標本調査と無作為抽出 偏りの源 15
時系列データの処理 平滑化(移動平均 13
観察研究と実験研究 観察研究 13
時系列データの処理 <階差系列> 11
観察研究と実験研究 調査の設計 9
時系列データの処理 トレンド 7
散布図と相関 共分散 5
データの分布の記述 幹葉図 5
散布図と相関 相関係数 5
時系列データの処理 幾何平均 3
データの分布の記述 質的変数(カテゴリカル・データ) 1
データの分布の記述 量的変数 1

 

独立性の検定が第1位になりましたが、前々回お話ししたようにカイニ乗検定に関する問題は、基本を押さえておけば決して難しくはありません。

いきなり、上の集計の信憑性が揺らいでしまったようですが、前回お話しした確率変数の期待値・分散・標準偏差が第4位に食い込んでいるあたり、難易度で重みづけした設問数という見方も、あながち間違いではないのではないでしょうか。

 

さて、今回注目したいのは第2位の母平均の差の検定です。

f:id:cyclo-commuter:20181113143548p:plain

出題回数では5位タイ、設問数では第3位と、上位をキープしてきましたが、難易度で重みづけしたところ、第2位(独立性の検定の問題が難しくないので実質第1位)になりました。

 

細目を見ると、

試験日 NO 小項目 項目 細目
2018年6月 24 仮説検定 母平均の差の検定 等分散を仮定した2標本
2016年11月 28 仮説検定 母平均の差の検定 対応のある2標本
2016年6月 28 仮説検定 母平均の差の検定 等分散を仮定した2標本
2015年11月 27 仮説検定 母平均の差の検定 対応のある2標本
2015年11月 28 仮説検定 母平均の差の検定 対応のある2標本
2014年11月 19 仮説検定 母平均の差の検定 等分散を仮定した2標本
2014年11月 20 仮説検定 母平均の差の検定 等分散を仮定した2標本
2014年11月 21 仮説検定 母平均の差の検定 等分散を仮定した2標本
2014年6月 16 仮説検定 母平均の差の検定 等分散を仮定した2標本
2014年6月 17 仮説検定 母平均の差の検定 等分散を仮定した2標本
2013年11月 19 仮説検定 母平均の差の検定 等分散を仮定した2標本
2013年11月 27 仮説検定 母平均の差の検定 対応のある2標本
2013年11月 29 仮説検定 母平均の差の検定 対応のある2標本
2013年11月 30 仮説検定 母平均の差の検定 等分散を仮定した2標本
2013年11月 31 仮説検定 母平均の差の検定 等分散を仮定した2標本
2012年11月 30 仮説検定 母平均の差の検定 等分散を仮定した2標本

出題は

  • 対応のある2標本によるt検定
  • 等分散を仮定した2標本によるt検定

に二分されていることがわかります。

 

対応のある2標本におけるt検定量を求める数式

 \Large{t=\dfrac{\bar{d}-\mu}{\sqrt{\dfrac{s_{d}^2}{n}}}=\dfrac{\bar{d}-\mu}{\dfrac{s_{d}}{\sqrt{n}}}=\dfrac{\sqrt{n}(\bar{d}-\mu)}{s_{d}}}

 \bar{d} は差  d_{i} の標本平均、 s_{d}^2 はその不偏分散、 \mu は通常は0)

と、

等分散を仮定した2標本におけるt検定量を求める数式

{\Large{t=\dfrac{\bar{x}-\bar{y}}{\sqrt{\dfrac{1}{n_{x}}+\dfrac{1}{n_{y}}}\sqrt{\dfrac{s_{x}^2×(n_{x}-1)+s_{y}^2×(n_{y}-1)}{n_{x}+n_{y}-2}}}}}

は、何も見ずに書けるくらいきっちりと覚えておきましょう。
うろ覚えだと、選択肢に騙されてしまう設問(過去問)が多いのです。

*1:「解答番号」は、解答欄に付されている通し番号のことです。解答選択肢の番号のことではないので、ご注意ください。