静粛に、只今統計勉強中

仕事でデータ分析をすることになったバリバリ文系アラフィフのおっさんが、独学で統計の勉強を始めました。

『Excelでできるらくらく統計解析 増補版』の正誤表を作ってみた

古本で安く手に入れた『Excelでできるらくらく統計解析 増補版』を読んでいたら、わりと大きな間違いがあることに気付きました。

Excelでできるらくらく統計解析 増補版

Excelでできるらくらく統計解析 増補版

正誤表があるかな、と思って出版元である自由国民社のホームページで検索してみましたが、残念ながらありませんでした。
あれこれ検索してみたら、著者のブログで、2014年版で改訂をしたとの文言を発見。

こちらも古本で手に入れて、 間違いが直っているか確認してみましたが、直っているところもあれば、そのままのところもあります。
最新は2016年版ですが、

こちらは、文中の画面コピーをExcel 2016のものに変えただけみたいですので、購入していません。

Excelがバージョンアップする度に新版を出すのはよいとしても、それまで間違いを放置するのは、あまり褒められた態度とは言えないと思います。
そこで、勝手に正誤表を作ってみることにしました。

~お断り~

  • 私が読んでいて気付いたものだけですので、抜けがあるかもしれません。
  • 2011年の増補版に対する正誤表になりますので、それ以降の版では修正済の箇所を含みます。

 

Excelでできるらくらく統計解析 増補版』の私的な正誤表
対象
ページ
P37 算術平均」 調和平均」
P116 ソン分布 ソン分布
P121
以降
標本分散/標本標準偏差 不偏分散/不偏標準偏差
P127 標本分散は不偏分散とも呼びます。

標本分散:\frac{1}{n}\sum_{i=1}^{n}(x_{i}-\bar{x})^2

不偏分散:\frac{1}{n-1}\sum_{i=1}^{n}(x_{i}-\bar{x})^2

P131
以降
標本の

標本の大きさ*1

P152 下側信頼限界=(空欄)

上側信頼限界=(n-1)*s^2/CHIINV(α/2,n-1)
ある母集(n-1)*s^2/CHIINV(1-α/2,n-1)に、
下側信頼限界=(n-1)*s^2/CHIINV(α/2,n-1)
上側信頼限界=(n-1)*s^2/CHIINV(1-α/2,n-1)
ある母集団からn=20の標本を抽出したときに、
P163
以降
帰無仮説を採択

帰無仮説は棄却されない*2 *3

付録A P13 離散型確率分布の期待値と分散の例 連続型確率分布の期待値と分散の例
付録A P14

f:id:cyclo-commuter:20180314150125p:plain
画像をクリックすると拡大します

f:id:cyclo-commuter:20180315132724p:plain
付録A P31 Ctrlキーを押しながら型Enterキーを押します。 CtrlキーとShiftキーを押しながらEnterキーを押します。

 

特にいただけないのが、連続型確率分布の分散の計算例でしょう。

f(x)=\dfrac{1}{2}x\quad(0\leqq{x}\leqq2) の分散 V(X) を求めているのですが、3行目の式変換で符号を間違えて、そのまま計算を続けてしまっているのです。
この本、付録の数理の説明(式変換のプロセス)がとても丁寧でわかりやすいのに、どうしてこのような初歩的なミスが見過ごされてしまったのか、とても残念です。

正しい計算例を再掲しておきます。

=\displaystyle \int_0^2 \Bigl(x-\dfrac{4}{3}\Bigr)^2\cdot \dfrac{1}{2}xdx

=\displaystyle \int_0^2 \Bigl(x^2-\dfrac{8}{3}x+\dfrac{16}{9}\Bigr)\cdot \dfrac{1}{2}xdx

=\displaystyle \int_0^2 \Bigl(\dfrac{1}{2}x^3-\dfrac{4}{3}x^2+\dfrac{8}{9}x\Bigr)dx

=\begin{bmatrix}\dfrac{1}{8}x^4-\dfrac{4}{9}x^3+\dfrac{4}{9}x^2\end{bmatrix}^2_{0}=\dfrac{2}{9}

 

ところでこの例題、2014年6月の統計検定2級の試験問題にもなっていて、公式問題集には別の解法が解説されています。
せっかくですから、そちらの解法も理解しておきたいところ。

まずは、V(X)=E(X^2)-E(X)^2 の導出から。
公式問題集の解説では式変換のプロセスが端折られすぎててよくわからないので、もっと細かく追ってみます。

=\displaystyle \int_{-\infty}^{+\infty}(x-\mu)^2f(x)dx

=\displaystyle \int_{-\infty}^{+\infty}(x^2-2\mu x+\mu^2)f(x)dx

なんと、ここで積分の式を3つに分けちゃいます。

=\displaystyle \int_{-\infty}^{+\infty}x^2f(x)dx-\int_{-\infty}^{+\infty}2\mu xf(x)dx+\int_{-\infty}^{+\infty}\mu^2f(x)dx

で、E(X)=\displaystyle \int_{-\infty}^{+\infty}xf(x)dx\displaystyle \int_{-\infty}^{+\infty}f(x)dx=1 だから、

=E(X^2)-2\mu E(X)+\mu^2

すごい! さらに、\mu=E(X) だから、

=E(X^2)-2E(X)^2+E(X)^2

=E(X^2)-E(X)^2

導出完了!

公式問題集の解法がすごいのは、f(x)=\dfrac{1}{2}x\quad(0\leqq{x}\leqq2) の分散 V(X) を求める際に、公式の一部を再変換して計算時間を短縮しているところです。

V(X)=E(X^2)-E(X)^2

=\displaystyle \int_{-\infty}^{+\infty}x^2f(x)dx-E(X)^2

=\displaystyle \int_{0}^{2}x^2\dfrac{1}{2}xdx-\Bigl(\dfrac{4}{3}\Bigr)^2  *E(X)=\displaystyle \int_{0}^{2}x\dfrac{1}{2}xdx=\begin{bmatrix}\dfrac{x^3}{6}\end{bmatrix}_0^2=\dfrac{4}{3}

=\begin{bmatrix}\dfrac{x^4}{8}\end{bmatrix}_0^2-\dfrac{16}{9}=2-\dfrac{16}{9}=\dfrac{2}{9}

少しずつではありますが、数理も把握できるようになってきて、だんだん楽しくなってきました。

この調子で学習を深めていきたいですね。

*1:よくある間違いです。

*2:ついでに言うと、帰無仮説が棄却されたときは、×「差がないとはいえない」 ◯「差があるといえる」

*3:著者が作成された「統計アドイン」は素晴らしく学習の役に立つのですが、検定結果で帰無仮説と対立仮説が対照的に扱われているのだけは、いただけません。