工学のためのデータサイエンス入門 フリーな統計環境Rを用いたデータ解析

間瀬・神保・鎌倉・金藤 共著

期待して読んだ。期待していたのは、

このうち、1番は期待通りであった。qqプロット、AIC、Cookの距離、など、こ れまで統計、多変量解析でお目にかからなかった項目が並ぶ(AICは理工系の基 礎数学「確率統計」に出ていたが)。

正規qqプロットなんて、業界的には便利でしばしば使っているが、あまり文献 では出てこない。が、故にこのプロット法を何と呼ぶか、デファクトがないら しい。たぶんうちでは、正規qqプロットと言っても通じない。正規確率プロッ トなら通じるかも。

統計の知識のスマートな入門と言うにはちょっと難しいかも。推定、検定あた りを読むのがかなり時間がかかった。それはそもそも推定、検定が難しい分野 であり、どう説明しても難しいものだ、という予感もする。

大学生とか、若い技術者に、統計が重要だから読んどけ、と言って渡すと、推 定検定あたりで撃沈しそうだ。

ただし、そのあたりを乗り切ってしまうと、この本はかなり良い。実際に統計 解析して結果を検証するという過程が見える。しかも、Rという武器があるの で、とりあえずは手が動く。分散分析でRで同一性検定なんてリストのままで 実行できる。

Rの入門書は、統計的解説が少なくて(知っているという前提になっているので) 統計解析の話になったらわけわからなくなって読み切れないし、統計の入門書は ややこしい理論か、簡便な計算法、の説明が長くて大変。その間で結局丁度良い 参考書ではあろう。もうちょっと皮相でもよかったかも知れないが、そのあたり は著者のこだわりだろうし。

会社の机上に置いておいて、なんかあったら引っぱり出すという本だな。

(2005/06/10)