静粛に、只今統計勉強中

仕事でデータ分析をすることになったバリバリ文系アラフィフのおっさんが、独学で統計の勉強を始めました。

『マンガでわかる統計学 回帰分析編』に従って単回帰分析の手順を追ってみた3 ~信頼区間の推定~

前々回と前回の2回で単回帰分析の F 検定と t 検定を行いました。
次は、Step5 母回帰Ax + B を推定するを行います。

と言っても、点推定であれば回帰式で単純計算できますから、わざわざ記事にする必要もないですね。引き続き『マンガでわかる統計学 回帰分析編』に従って、信頼率95%の区間推定をしてみましょう。

88ページに、信頼区間の幅は

{\sqrt{F(1,個体の個数-2;0.05)×\biggl(\dfrac{1}{個体の個数}+\dfrac{(x_{0}-\bar{x})^2}{S_{xx}}\biggr)×\dfrac{S_{e}}{個体の個数-2}}}

で求める、とあります。

ここで、 F(1,個体の個数-2;0.05) は前々回に計算した F 検定の F 値ではなく、第1自由度が説明変数の数、第2自由度が観測数-説明変数の数-1、危険率が0.05のときの F 値になります。

また、x0 は説明変数 x の一番目の観測値を表します。つまり、信頼区間の幅は
xi ( i =0,1,2,...,nx )のときn+1個分あり、xi の値ごとに異なる、ということです。
このとき、予測値 ŷi の95%信頼区間は、
[ ŷi - 信頼区間の幅]以上[ ŷi + 信頼区間の幅]以下、となります。
グラフにするとこんな感じ。

f:id:cyclo-commuter:20180131153911g:plain

で、計算結果がこちら。

f:id:cyclo-commuter:20180131155438j:plain

今回は観測値を元に計算しましたが、xの値は必ずしも観測値である必要はありません。表には27℃がありませんが、x=27として計算しても問題ありません。

ただし、96ページで釘を刺されていますが、20℃とか35℃のように観測値の範囲外の値を代入したて求めた予測値と信頼区間「信用するに足るものなのか、数学的には保証できない」そうですので、注意してください。