静粛に、只今統計勉強中

仕事でデータ分析をすることになったバリバリ文系アラフィフのおっさんが、独学で統計の勉強を始めました。

統計検定準1級の過去問で台風の上陸数がポアソン分布に従うと知った1

現在、大型で猛烈な台風19号が日本列島に接近中です。

ウェザーニュース社が発表した予報円の真ん中を進んだ場合、13日(日)あたりに関東を直撃するコースになっていて、また大きな被害が生じてしまうことが心配されます。

それにつけても、近年日本に上陸する台風が多い気がするなあ、などとぼんやり思っていたら、タイムリーなことに2016年6月実施の統計検定準1級の論述問題 問1で、台風の上陸数に関する問題が出題されていました。

 

問題によると、 気象庁が1951年からの台風の上陸数を公開しているらしいので、ググってみると、

ありました。

台風の中心が北海道、本州、四国、九州の海岸線に達した場合を「日本に上陸した台風」としています 。

だそうです。ふーん、沖縄や奄美などの島しょ部を通過しただけでは「上陸」にはならないんですねえ。

このデータをExcelに転記して、問題と同じように1951年から2014年までの上陸数をまとめてみます。

f:id:cyclo-commuter:20191009143747p:plain

細かい話ですが、D12セルの「10以上」は数字の「10」のみ入力して、セルの書式設定で「以上」を表示させています。

f:id:cyclo-commuter:20191009125434p:plain

標準偏差が1.673…ということは、不偏分散がその二乗で2.800…となります。

標本平均が2.843…なので、期待値=分散= \lambdaという特徴を持つポアソン分布に、台風の上陸数の分布が従うのではないか、と考えられるわけですね。

 

問題では、1年間の台風の上陸数がパラメータ \lambda=2.84ポアソン分布に従うと仮定したときの上陸数(回)の確率と期待度数を求めよ、とあります。

ポアソン分布の確率(密度)関数は

 p(x)=\dfrac{\lambda^x}{x!}e^{-\lambda}

と与えられますが、ネイピア数を2.718としても、 2.718^{-2.84}関数電卓がないと計算できませんので、統計検定の試験では、もうこういう問題は出題されないでしょうね。

ここでは、Excelの関数を使います。

f:id:cyclo-commuter:20191009131859p:plain

で、観測度数(年)と期待度数でグラフを作ってみると、

f:id:cyclo-commuter:20191009132241p:plain

若干の乖離はありますが、概ね \lambda=2.84ポアソン分布に従うといってよさそうですね。しかし問題では、有意水準5%で適合度検定をせよ、とあります。

適合度検定の\chi^2統計量は、観測度数を O_i、期待度数を E_iとして、

 Y=\displaystyle \sum_i\frac{(O_i-E_i)^2}{E_i}

で求められます。これもExcelで計算すると、

f:id:cyclo-commuter:20191009134753p:plain

\chi^2統計量の値は23.51…で、この値は「 H_0:台風上陸数の観測度数は \lambda=2.84ポアソン分布に従う」とする帰無仮説の下で自由度9の\chi^2分布に従います。*1

5%境界値は16.91…なので、あらら帰無仮説 H_0:台風上陸数の観測度数は \lambda=2.84ポアソン分布に従う」は棄却されてしまいました。

では、台風の上陸数はポアソン分布に従わないのかというと、そうでもないんですね。

 

ちょっと長くなったので、続きは次回にしましょうか。

*1:適合後検定の自由度は通常、級数-1ですが、この場合は、 \lambdaを標本平均で推定していますので、さらに-1となります。