北海道苫小牧市出身の初老PGが書くブログ

永遠のプログラマを夢見る、苫小牧市出身のおじさんのちらしの裏

完全独習 統計学入門

さくっと読み終えました。

完全独習 統計学入門
小島 寛之
4478820090

結論から言えば、要点だけをわかりやすく解説した良書だと思います。高校の頃はもやもやしてよくわからなかった標準偏差正規分布の正体がわかった上に、統計的検定を元にした区間推定や、最終的にはt検定の概念まで理解することができました。

自分もこの著者と同じく、統計は数学っぽくなくて苦手でした。その数学っぽくなさの正体が、現実世界との節点だと言うことに気がついたのは最近です。つまり、統計学は数学の中でも現実を意識した分野であり、その点において物理や化学に近いと言うことです。

この本は、統計の数学らしくない側面をうまく説明しています。「使うのは中学数学だけ」と言うキャッチフレーズとは裏腹に、論理の積み重ね方はかなり慎重であり、安心して読むことができます。逆に言えば、理系の人間ではないと最後まで読み切ることは難しいかもしれません。ですが、最後まで読めなくても標準偏差の正体がわかるだけでも、この本を手に取る価値は大きいと思います。

自分用のまとめ

  • 標準偏差は1.96倍して使う。平均値から標準偏差の1.96倍だけ離れた範囲にほとんどのデータは入っていると思っていい*1
  • 標本平均・標本分散は、母平均・母分散ではない
  • 標本の数が増えれば増えるほど、その標本平均の分散は小さくなる(\frac{\sigma} { \sqrt{n} })
  • 母集団が正規分布であれば、
    • 標本平均は正規分布となる → 母分散がわかる場合の母平均の推定に利用
    • 標本分散は自由度が標本数-1の\chi ^2分布する → 母分散の推定に利用
    • 標本平均と標本分散からt分布に従う統計量を作れる → 母平均の推定に利用
  • \chi ^2分布とt分布にも正規分布と同様に95%信頼区間があるが、自由度によって変動する*2

*1:95%

*2:表を用いて求める