静粛に、只今統計勉強中

仕事でデータ分析をすることになったバリバリ文系アラフィフのおっさんが、独学で統計の勉強を始めました。

統計検定準1級の過去問で台風の上陸数がポアソン分布に従うと知った2

前回は、2016年6月実施の統計検定準1級試験の問題に沿って適合度検定をしたところ、帰無仮説「H0:台風上陸数の観測度数はλ=2.84のポアソン分布に従う」が棄却されてしまった、というところまでお話ししました。

 

今回は、やっぱり試験問題の内容に沿って、それでも台風上陸数はポアソン分布に従うというところから、最新のデータを使うとどうなるか、まで進めたいと思います。

 

前回の適合度検定で使った表がこちら。 

f:id:cyclo-commuter:20191009134753p:plain

10回以上の上陸が1回あって、これが外れ値になっていることがH12セルの値からわかります。そこで問題では、上陸数6回以上をまとめて検定をしてみよ、とあります。

言われたとおりにしてみると、

f:id:cyclo-commuter:20191009144948p:plain

おお! 今回は \chi^2値が3.01…で5%境界値が11.07…ですから、帰無仮説は棄却されませんでした!

 

しかし、検定が思いどおりにならないからといって、勝手に階級をまとめるとかありなの? とか思ってしまいますが、どうやら普通に「あり」みたいです。

というのも、カイ二乗検定の場合、確率の小さい右裾のほうでひとたび事象が生起してしまうと、それがただちに外れ値になってしまうから。そのため、

  1.  すべてのセルの期待度数が1以上であること
  2. 期待度数5未満のセルが,全体の20%未満であること

χ2検定の制約

という制約があるとも。そこで、右裾の確率の低いほうの階級をまとめてしまうというのは、カイ二乗検定の常套的なオプションとしてあるみたいですね。

 

ところで、1年に10回上陸というのがどれくらい「外れ値」かというと、

f:id:cyclo-commuter:20191009153034p:plain

というくらい、滅多にないことみたいです。

じっさい、2004年(平成16年)にそれだけ上陸したんですが、正直まったく覚えていませんでした。なんでかなあ、と思ったら、

私が住んでいる関東に上陸したのは、10回中2回だけだったんですね。

リンク先を見ていただくと、上陸・通過地点は日本海側が多い感じですが、10回を通して日本列島の津々浦々に満遍なく襲来したことがわかります。

Wikipediaで見てみると、

被害も大きかったこともわかります。でも覚えてない。

それはたぶん、この後も毎年、豪雨や台風による被害が各地で頻発するようになったからじゃないかな、と。

 

最後に、気象庁のWEBサイトから2015~2019年の上陸数を転記してみました。

f:id:cyclo-commuter:20191009154751p:plain

すると、あら不思議、

f:id:cyclo-commuter:20191009155005p:plain

f:id:cyclo-commuter:20191009160329p:plain

  • 標本平均は、2.84→2.97に上昇。
  • 適合度検定は、階級をまとめなくても帰無仮説は棄却されず。
  • 1年に10回以上上陸するのは、1349年に1度→974年に1度に短縮。

という結果に。

これをもって台風の上陸数が増加していると結論付けるのは軽率に過ぎるでしょうが、でもちょっと気がかりではあります。

とりあえず、台風19号が上陸するかどうかはもうすぐわかります。