統計学は多くの学問分野とかかわって発展してきた学問であり,K. Pearson注1)は著書“The Grammar of Science”の中で「統計学は科学の文法である」と述べている。近年におけるビッグデータ解析においても統計学は中心的な役割を担っている。
本稿では,このような統計学の発展の歴史,活用と誤用,およびその根幹をなす考え方(哲学)について述べている4つの著作を取り上げ,簡単に紹介する。なお,ここで取り上げている書籍は専門的知識を仮定せず,専門外の読者でも十分に理解可能な形で書かれている本ばかりである。端的にいえば難しい式は一切使われていない。にもかかわらず,統計学の本質的な考え方について深い識見に基づいて書かれており,科学に携わる方々にはぜひ一読を薦めたい本である。
本書では,統計学の発展をさまざまな分野とのかかわりを通して解説している。著者のデイヴィッド・サルツブルグは著名な生物統計学者であるが,本書は生物統計学のみならず現代統計学の重要な成果を研究者の逸話を交えて書いている統計学の歴史書である。いくつか例をあげると,R. Fisher注2),K. Pearson,F. Galton注3),W. Gosset注4)などの統計学の発展の契機となった重要な業績について,エピソードを入れて説明している。原著名の“The Lady Tasting Tea”は“The Design of Experiments”を著したR. Fisherの有名な逸話であり,おいしいミルクティーを淹(い)れるのに「ミルクが先か,紅茶が先か」を実験によって検証した例である。
本書は29章からなる。以下に本書の章名を列挙しておく。「紅茶の違いのわかる婦人」「歪んだ分布」「かの親愛なるゴセット氏」「厩肥(きゅうひ)の山を調べ上げる」「『収量変動の研究』」「『百年に一度の洪水』」「フィッシャーの勝利」「死に至る分量」「ベル型曲線」「当てはまりのよさを検定すること」「仮説検定」「『信用』詐欺」「ベイズの異説」「数学のモーツァルト」「下から見上げた眺め」「母数を取り除く」「全体より部分が優れているとき」「喫煙はがんの原因か」「最高の人を求めるのであれば……」「ただ、純朴なテキサス農場ボーイとして」「天才誕生」「統計学のピカソ」「悪影響の扱い方」「産業を再生した男」「黒ずくめ女史のアドバイス」「マルチンゲールの行進」「治療の意図」「コンピュータは自分自身に向かってゆく」「隠れた欠点のある崇拝物」。
各章のタイトルからもわかるように,理解しやすい例をあげながら重要な概念を丁寧に解説しており,初学者にとっても,一通りの知識をもっている実務家,研究者にとっても読むべき内容を含む本となっている。
統計学の歴史は他分野とのかかわりの中で積み上げられ,さまざまな学問分野の発展に寄与している。しかし,統計学は必ずしも正しく用いられてきたわけではなく,誤用あるいは悪用と言わざるをえないものも多数存在する。
進化生物学者であるJ. Gouldの本書では,知能の数量化に関して議論しており,科学的と称して行われた数々の実験やその結果による主張に対して,データ解析を用いて批判を繰り広げている。それは,生物学的決定論への痛烈な批判であり,社会的差別の根源と科学の在り方に対する問いかけとなっている。
本書は7章で構成されており,章名は次のとおりである。「序文」「ダーウィン以前のアメリカにおける人種多起源論と頭蓋計測学―白人より劣等で別種の黒人とインディアン」「頭の計測―ポール・ブロカと頭蓋学の全盛時代」「身体を測る―望ましくない人びとの類猿性の二つの事例」「IQの遺伝決定論―アメリカの発明」「バートの本当の誤り―因子分析および知能の具象化」「否定しがたい結論」。
著者は,「本書は,『単一で直線的にランクづけできる生得的でほんのわずかしか変化しない知能』という理論の起源と擁護の歴史に込められた根深く根源的な誤謬(ごびゅう)を年代的に取り上げたものである」と述べている。この主張の是非についてここで断じることはしないが,本書で取り上げられている科学の名のもとに行われてきた差別についてはよく考えてみる必要があるだろう。「科学は我々が考えているほど客観的なのか」という問いかけには今一度真摯(しんし)に向き合う必要がある。
逆の立場(と言ってもよいだろう)で書かれた書籍も紹介しておく。R. J. Herrnstein & C. Murrayの“Bell Curve: Intelligence and Class Structure in American Life”注5)である。本書と併せて目を通してみてはいかがだろうか。
この本は,E. Soberの“Evidence and Evolution: The Logic behind the Science”の第1章の翻訳である。原著は「生物進化に関するダーウィンの自然選択説,共通祖先説が他の競合仮説に対してどのように検証され優位とされているか」について書かれたものであり,第1章はその検証手段である統計学について哲学的に分析したものである。
Soberは確率と統計の哲学的論争に造詣(ぞうけい)が深く,本書は,翻訳者の松王政浩氏も訳者解説で述べているとおり,唯一の日本語によるまとまった「統計の哲学」の本である。
本書では,統計学者R. Royallが“Statistical Evidence: A Likelihood Paradigm”注6)の中で述べている3つの問い,(1)現在の証拠から何がわかるか,(2)何を信じるべきか,(3)何をするべきか,の解説から解き始めている。そして,これらの問いが統計的推論の本質であるいくつかの考え方とどのようなかかわりをもつのかを柱に論を進めている。本書では,統計学の基本的な考え方を「ベイズ主義」「尤度(ゆうど)主義」「頻度主義」に分け,それぞれについて丁寧に解説している。各節のタイトルは,「ロイヤルの3つの問い」「ベイズ主義の基本」「尤度主義」「頻度主義I―有意検定と確率論的モーダス・トレンス」「頻度主義II―ネイマン-ピアソンの仮説検定」「テストケース―停止規則」「頻度主義III―モデル選択理論」「第2のテストケース―偶然の一致についての推論」「結語」となっている。
本書で扱っているテーマは通例,頻度主義とベイズ主義(順番もこの順番)として取り上げられることが多く,尤度主義はベイズ主義との関係の中で説明される。あるいは,頻度主義をNeyman流とFisher流に分け,ベイズ主義と対比して解説しているものもある。それらに対して,尤度主義として1つの立場を定め解説しているところが本書の特徴である。
統計学の歴史において,頻度主義とベイズ主義の対立(?)は非常に有名なものである。本書では,ベイズ統計学に焦点を絞り,その歴史と趨勢(すうせい)についてまとめている。
誕生から,激しい批判に晒(さら)されてきたベイズ統計学であるが,常に擁護(ようご)者が存在し,方法論として確立してきた。近年ではベイズ統計学はデータを扱うあらゆる分野で用いられており,統計学の理論でもっとも応用されている理論といっても過言ではない状態である。
本書は以下の5部17章で構成され,各章のタイトルは以下のとおりである。
第1部:黎明(れいめい)期の毀誉褒貶(きよほうへん)「発見者に見捨てられた大発見」「『ベイズの法則』を完成させた男」「ベイズの法則への激しい批判」
第2部:第ニ次大戦時代「ベイズ、戦争の英雄となる」「再び忌(い)むべき存在となる」
第3部:ベイズ再興を志した人々「保険数理士の世界からはじまった反撃」「ベイズを体系化し哲学とした三人」「ベイズ、肺がんの原因を発見する」「冷戦下の未知のリスクをはかる」「ベイズ派の巻き返しと論争の激化」
第4部:ベイズが実力を発揮しはじめる「意思決定にベイズを使う」「フェデラリスト・ペーパーズを書いたのは誰か」「大統領選の速報を支えたベイズ」「スリーマイル島原発事故を予見」「海に消えた水爆や潜水艦を探す」
第5部:何がベイズに勝利をもたらしたか「決定的なブレークスルー」「世界を変えつつあるベイズ統計学」
今日のベイズ統計学の隆盛をもたらしたものが何かといえば,いろいろなものがあげられるだろうが,マルコフ連鎖モンテカルロ法(Markov chain Monte Carlo methods: MCMC)注7)をあげる人が多いだろう。ベイズ統計学を実際の問題に適用するうえでの大きな問題は計算量の問題であった。積分計算にMCMCを利用することによりこの問題が解決され,あらゆる分野にベイズ統計学が利用されるようになったのである。
本書はベイズ統計学の理論書ではないが,その根幹をなす考え方についてさまざまな事例をもとに解説している。統計学の専門家の方にも得るところが多いことは間違いない本である。
以上,本稿では4つの統計学に関する書籍を紹介した。図らずもすべての書籍が統計の専門家以外の著作である。これは,統計学がいかに他分野とかかわりが深いかということを表している。特に,統計の哲学についての2つの書籍は進化生物学者の手によるものであり,この分野において統計学が重要な役割を果たしているのがうかがえる。このような統計学に対して,常に他分野の補助的な役割を果たすのみの学問なのか? という問いかけがある。アメリカ統計学会の会長を務めたJ. Cornfieldは“A Statistician's Apology”の中で「統計学は科学の同衾(どうきん)者(Statistics –bedfellow of the sciences)」であると述べている。誰も「統計学は科学の女王」とは言ってくれないだろうが,だとすれば何かといえば,相応(ふさわ)しい言葉は同衾者だと主張している。女王なのか同衾者なのかはともかく,今後も統計学は孤高の学問としてではなく他の分野とかかわりながら発展していくだろう。読者の方々にもこれまでもそしてこれからもどこかで統計学との接点があるだろう。本稿で取り上げた本は今後の統計学との関係を少し違ったものにしてくれる本になることを確信している。
1992年九州大学大学院総合理工学研究科修士課程修了。博士(工学)。鹿児島大学理学部助手,同助教授,同志社大学文化情報学部助教授を経て,2008年より同志社大学文化情報学部教授。計算機統計学,多変量解析を専門とし,大規模複雑データの解析法に関する研究に従事。日本計算機統計学会理事,コンピュータ利用教育学会副会長。著書に『Data Analysis of Asymmetric Structures Advanced Approaches in Computational Statistics (Statistics: A Series of Textbooks and Monographs)』(CRC Press),『関連性データの解析法-多次元尺度構成法とクラスター分析法-』(共立出版),『確率と統計の基礎I・II』(ミネルヴァ書房)。