静粛に、只今統計勉強中

仕事でデータ分析をすることになったバリバリ文系アラフィフのおっさんが、独学で統計の勉強を始めました。

『まんがと図解でわかる統計学』を読んでみた

タイトルからある程度察しがつくかもしれませんが、この本、マンガパートの割合は決して大きくはありません。全223ページ中、おまけ的なページも含めてたったの46ページ。比率にして20.6%しかないので、マンガを期待して手に取った人は、文章パートの多さにガッカリしてしまうかもしれませんね。 

まんがと図解でわかる統計学 (宝島SUGOI文庫)

まんがと図解でわかる統計学 (宝島SUGOI文庫)

しかし、この少ししかないマンガパートのできが実によいのです。

  • 統計学の入門書という性質上、どうしても文字が多くなってしまいますが、文字のほとんどを台詞としてフキダシ内にまとめて、「普通のマンガ」として読めるようにしています。
  • 読み辛くない範囲でできるだけ小さくコマを割って、少ないページでも情報量が不足しないようにしています。
  • 一般的にフキダシだらけのマンガは読みづらいことが多いですが、この本では背景やトーンでフキダシと絵のメリハリを付けていて、目が自然とネームを追えるようになっています。
  • キャラクターもストーリーも月並みですが、キャラクターの表情や書き文字が効果的で、なかなかに楽しめます。

 

で、肝心の内容ですが、この本には数式はほとんど出てきません。*1
数理の説明はすっぱりとカットした上で、できるだけ統計学のエッセンスをギュッと詰め込もう。
というのが、この本のコンセプトのようです。入門というより概論ですね。

よって、この本を読んでも統計分析ができるようにはなりません。
この本で学べることは、以下の2つです。

  • 基本的な統計用語の意味を知ることができる
  • 統計指標を作ったり読んだりする際に注意すべきポイントを知ることができる

お勧めの対象はズバリ、企業とかに入社したばかりの新入社員、それも、これまで統計学を全く学んでこなかった人になります。営業や事務であれば、今後、統計資料に目を通す機会やデータを集計することも増えるでしょうから、最初のイロハとしてこの本を読んでおくのは「あり」かな、と。

 

ただし、第3章の文章パートは読み飛ばしてください。
間違いも多いし、この本の中途半端な説明では、かえって分からなくなると思うので。

私が気づいた間違いを挙げておきます。

対象
ページ
p150 標本標準偏差=母集団の標準偏差÷\sqrt{標本数} 標本平均標準偏差=母集団の標準偏差÷\sqrt{標本サイズ}
p150 標本とは「3つのサイコロを投げた」場合のサイコロ(標本)の数のこと(=3)。これを2回行なった場合、その値(=2)のことは標本サイズと呼ぶ 標本サイズとは「3つのサイコロを投げた」場合のサイコロ(標本)の数のこと(=3)。これを2回行なった場合、その値(=2)のことは標本と呼ぶ
p170~p171 「このような~」から「~となる)。」までの説明が理論的に間違っています。

製造業の品質管理で「有意に仕様サイズと異なるか」を確かめる場合の有意水準を0.1%などとされたら、厳しいどころか甘々です。
「第2種の誤り=本当は仕様サイズと違うのに同じとみなしてしまう誤り」の確率を大きくするだけですからね。

 

ついでに言うと、37ページの説明にも間違いがあります。

正しくは、「ももシロファンが8人以上」となる確率が5.5%です。
「ももシロファン8人、ABCファン2人」の組み合わせだけなら4.4%。
二項分布に従う確率変数の初歩的な計算なんですけども・・・ *2

*1:数式が出てくる場合も日本語で表されていて、概念の説明に留まるため、この本を読んだだけで計算ができるようにはなりません。

*2:計算方法については以下を参照してください。