静粛に、只今統計勉強中

仕事でデータ分析をすることになったバリバリ文系アラフィフのおっさんが、独学で統計の勉強を始めました。

Excel VBAでコレログラムを作成するマクロを作ってみた1

2019年11月実施の統計検定2級試験の問題が公式WEBサイトに公開されていたので、ダウンロードして解いてみたのですが、またしてもコレログラムの問題で間違ってしまいました。

2015年11月に初登場してこれで4回目の出題になりますが、4回とも一度で正解できたことがありません。

コレログラムについては、手持ちの本でもGoogleで検索しても、詳しくてしかもとっつきやすい解説に巡り合えなかったので、主に公式問題集の解説を読んでなんとなくわかった気になっていました。

しかし実は全くわかっていなかったのだという現実を、そろそろ直視しないといけないようです。トホホ。

しかたがないので、一からきちんと学ぶとしましょう。

続きを読む

統計検定準1級の過去問で台風の上陸数がポアソン分布に従うと知った2

前回は、2016年6月実施の統計検定準1級試験の問題に沿って適合度検定をしたところ、帰無仮説「H0:台風上陸数の観測度数はλ=2.84のポアソン分布に従う」が棄却されてしまった、というところまでお話ししました。

 

今回は、やっぱり試験問題の内容に沿って、それでも台風上陸数はポアソン分布に従うというところから、最新のデータを使うとどうなるか、まで進めたいと思います。

続きを読む

統計検定準1級の過去問で台風の上陸数がポアソン分布に従うと知った1

現在、大型で猛烈な台風19号が日本列島に接近中です。

ウェザーニュース社が発表した予報円の真ん中を進んだ場合、13日(日)あたりに関東を直撃するコースになっていて、また大きな被害が生じてしまうことが心配されます。

それにつけても、近年日本に上陸する台風が多い気がするなあ、などとぼんやり思っていたら、タイムリーなことに2016年6月実施の統計検定準1級の論述問題 問1で、台風の上陸数に関する問題が出題されていました。

続きを読む

Excel VBAで<てこ比>を求める関数を作ってみた

前回は、Excel分析ツールの回帰分析の結果から、の「基本的診断プロット」と同じグラフを作れんものかとチャレンジしましたが、Residuals vs Leverage まで来たところで、てこ比をどうしようか、となって終わりました。

そこで今回は、Excelてこ比を計算してみたいと思います。 

計算方法ですが、 

RとRコマンダーではじめる多変量解析

RとRコマンダーではじめる多変量解析

の73ページに、

射影行列(式(3.57))の対角要素 hiiを、てこ比またはレベレッジ(Leverage)という。

また、70ページに、

 yの係数を Hとし、その要素を、

 H=X(X^TX)^{-1}X^T=\begin{pmatrix}h_{11} \ldots h_{1n} \\ \vdots  \ddots \vdots  \\ h_{n1} \ldots h_{nn}\end{pmatrix}

とおく。 Hを射影行列という。(略)ハット行列ともいう。

さらに、54ページに

 X=\begin{pmatrix}1 x_{11} x_{12}  \\ 1 x_{21} x_{22}  \\ \vdots   \vdots  \vdots    \\1 x_{n1} x_{n2} \end{pmatrix}

とあります。

射影行列(ハット行列)は、最小二乗法で計算するときに導かれる行列らしいのですが、私自身がまだ十分に理解できていないので、ここで解説することはできません。

が、上の手がかりさえあれば、計算そのものは進めることができます。

 Xは、説明変数が二つの場合を表していて、 x_{i1},x_{i2}がそれにあたります。
ちなみに、左側に並んでいる「1」は切片のための列だそうで、切片は定数項なので「1」となります。*1
あとは、行列の計算で Hを求めて、対角要素を抽出するだけです。
(ちなみに、 X^T Xの転置行列、 X^{-1} X逆行列を表します。)

*1: \hat y = \alpha\times1+\beta_{1}\times x_{1}+\beta_{2}\times x_{2}となるから。

続きを読む

Excel分析ツールの回帰分析結果から回帰診断図を作ってみよう

前回までの3回で、Rを使って回帰診断図

f:id:cyclo-commuter:20190828151740j:plain

の読み方を、またExcelの散布図を使って対数変換の意味を学びました。

今回は、Excel分析ツールの回帰分析結果から、Rと同様の回帰診断図を作れるかチャレンジしてみたいと思います。

  • Excel分析ツールで回帰分析
  • Residuals vs Fitted
  • Normal Q-Q 
  • Scale-Location
  • Residuals vs Leverage
続きを読む