この本は、大丈夫なのか?
もう、読みにくくて、読みにくくて、我慢して週末連休をかけて、第1章をだ
いたい読んだ。第1章の最後の方は流し読み。
しかし、まず、標準偏差やら共分散がnで割ってあるのはいいのか?
奥野「多変量解析法」ではn-1で、
柴田「確率統計」では、標本分散はnで、母分散はn-1で割れと書いてある。
普通のパッケージソフトでは、予測値と言って n-1 で割ってる。
n-1で割ったうえで脚注を付ける(or逆)の方が親切だと思うのだが。(どうや
らずっと先の2章のおわりの方で自由度調整の話が出てくるらしい。が、コン
パクトな形では出てこないのでやっぱりわからない)。
(そういう意味では、奥野「多変量解析法」ではn-1でしか割ってないので、そ
れはそれで問題である、かも知れない、けど[奥野]は自由度の説明がとても丁寧)。
ExcelのCOVARは、nで割っていた。VARはn-1だ。STDEVもn-1。そして、共分
散が nで割る母集団の共分散しかないことにWebでいろいろ文句をつけられて
いた。
この本が読みにくい理由の一つは、記号の説明がいい加減なことにある。(少
なくとも第1章は)。
xij って、i={男,女}で、j={1,2,3,4,5}だよね?とか、
sxeAって、xがなんで、eがなんで、Aがなにか、書いてくれ、とか。思考が
ストップしまくりなんだよ。
また、式の変形の見通しが悪い。ほとんど一番最初に近い、9ページの
y'i=a+b*yi
1/n Σ(yi-y'i)^2=s_y^2(1-rxy^2)
からして、一瞬ではわからない。リファーされている、もっと先(38ページ)の
式(2.18)を見ても(違う記号と違う定義が登場し)やっぱりわからない。手を
(かなり)動かせば見えてくるわけだけど。途中のキーとなる式 (a=-b,
b=sxy/sx^2)が1行書いてあればずっと見易いのに。このキーとなる(と私に思
える)式は、34ページあたりで登場する。
ちなみに、この34ページのa,bの導出では、微分して0とおいた結果から bの表
式が導かれるが、そのbの式を元の式に代入して微分して0と置くとbの表式が
導かれる、という意味不明(というかあたりまえ)の論を展開している。
奥野「多変量解析法」もなのだが、概論的にまとめを第1章にもってきて、細
かい計算と実例を2章以降にもってくる、という方法は、実務で使いたい人に
とっては嬉しいのかも知れないけど、こうも見通しがわるくっちゃね。
ここまでいろいろ多変量解析の本を見てきたけど、多変量解析というのは、
現在、数学、物理学、化学、地学、工学、医学、社会学、経済学、文学、
etc.と、いろいろな分野で使われている。道具として利用したい人向けには
証明抜きで絵をたくさん使って、という本になる。それはそれで、(正しいこ
とが書いてあれば)いいんだけど。どうも、ちゃんと理論を説明して、という
方針の多変量解析の本は現代日本にはほとんどないんじゃなかろうか。
奥野「多変量解析法」も、定義が後で出てくるし、前提知識がよくわからな
いし、わかりにくいのだけど、それは、おそらく数ページの「前提知識」の
サマリを作れば、それで解決しそう。でもこの本は。。。。
この本は、もう読まない。
2005/03/22