2025 Volume 74 Issue J-STAGE-1 Pages 51-58
ベイズ統計は,18世紀にトーマス・ベイズにより発案された逆確率論を原点として発展した確率的推論である。一般的な統計学ともっとも異なる点は,標本から得られる(多数の)頻度に基づかない確率(事前確率)から事象の生起する確率(事後確率)を推定する点にある。したがって,推定(事後確率)の信憑性と信頼性は最初に仮定される事前確率と仮説の元で結果が生起する尤度の設定に依存しており,その主観的なプロセスが原因となり完全否定された時期があった。しかし,主観確率の正当性が数学的に証明された,現在ではベータ分布や正規分布などの確率変数の分布を事前確率とすることにより,コンピュータ通信におけるフィルタリング機能や,公衆衛生事業である死亡率,出生率の推定など多方面で応用されている。本セクションではベイズ統計の全容は網羅できていないが,確率記号を使うことなくベイズ統計の基本となるベイズ公式の仕組みを面積図により解説した。また,事前分布として仮定した一様分布がより複雑なベータ分布に更新されていく仕組みと事後確率の期待値について解説した。
日常的に我々が利用している統計学的手法やその考え方は,19世紀の終わりから20世紀初頭にかけて,ネイマン,ピアソンそしてフィッシャーらによってほぼ完成された統計学を基本としている(以降,これを一般的な統計学とよぶ)。これに対して,ベイズ統計は,イギリス人トーマス・ベイズ(1702~1761)によって発案されたベイズ逆確率論をその原点としている。ベイズの没後,プライスにより逆確率論に関するベイズの未発表論文が発見され,その後,数学者ラプラスにより現在のベイズの公式が導かれ発表された。
ラプラスの功績によりベイズ統計の考え方が世界中に広まり,様々な考察や応用が試みられた。しかし20世紀初頭,フィッシャーやネイマンらの痛烈な批判により,ベイズ統計は表舞台からほぼ完全に姿を消すことになる。これは,ベイズ統計で仮定する事前確率が主観確率に基づくことに起因している。言い換えると,ベイズ統計の「主観性」,「思想性」,「恣意性」が,客観的な事実と理論を基本とする当時の科学界から完全否定される原因となった。
しかし,第二次世界大戦中,数学者チューリングにより,ベイズ統計の考え方が暗号解読に極めて有用であることが実証された。戦後,この事実が公表され,1954年,サベージにより発表された「統計学の基礎」において,主観確率の正当性が数学的に証明されることによりベイズ統計が再び表舞台に登場するにいたった。
現在,ベイズ統計はIT,医療,ビジネス,またAIの分野で必須のツールとされており,今後もベイズ統計は様々な分野で利用されていくものと期待されている。なお,以下ではベイズ逆確率の理論に基づき注目する事象の確率を求めるプロセスをベイズ推定,求めた確率から事象の生起を判断するプロセス全体をベイズ統計と表現することとする。
以下の例について考える。
例1.
外見からは区別できない2つのツボAとBがある。ただし,ツボAには白球が9個,黒球が1個,ツボBには白球3個,黒球7個が入っていることがわかっている。今,任意に選んだツボから1個取り出したところ黒球であった。任意に選んだツボはA,Bどちらであると推定できるか。
一般的な統計学では,それぞれのツボから黒球が選ばれる確率を比較するが,ベイズ統計では黒球が取り出されたという結果から,その結果を生み出した原因を逆に推定するというプロセスをたどる。まず,外観からは区別できない2つのツボから任意に選ばれた1つのツボであるので,ツボAあるいはツボBである確率は「理由不十分の原理」から,それぞれ0.5であると仮定する。これを事前確率という。「理由不十分」であるので,例えば,ツボBに当たりをつけて事前確率を0.4:0.6と仮定することも許容される。これが「主観的」あるいは「恣意的」であると非難された一要因である。
Figure 1AのようにツボAとツボBから成る全世界を四角形で表すと,理由不十分の原理により世界を2等分することができる。これを可能世界という。ここで,四角形の面積は確率として読み替えることができ,黒球が取り出されたツボがAである確率;p(ツボA)とBである確率;p(ツボB)は等しく,その和は1であることを意味している。次に,ツボAであるとき,黒球が選ばれる条件付確率;p(黒|A)は0.1であり,白球が出る条件付確率;p(白|A)は0.9となる。同様にツボBではp(黒|B) = 0.7,p(白|B) = 0.3となる。これを図示するとFigure 1Bとなる。つまり,球が選ばれる前の可能世界は4つに分岐している。( )内を面積=確率として4つの可能世界をまとめると,
① ツボA かつ 黒球 (0.1 × 0.5 = 0.05)
② ツボA かつ 白球 (0.9 × 0.5 = 0.45)
③ ツボB かつ 黒球 (0.7 × 0.5 = 0.35)
④ ツボB かつ 白球 (0.3 × 0.5 = 0.15)
0.05 + 0.45 + 0.35 + 0.15 = 1
4つの可能世界の確率の和が1であることが確認できる。
2. 正規化条件と事後確率試行前は4つの可能世界を考える必要があったが,黒球が選ばれたことから可能世界②と④は除外され(Figure 1C),黒球は可能世界①か③のいずれかから選ばれたことになる。前述のごとく四角形の面積は確率に置き換えることができ,①と③の確率の比は0.05:0.35となる。しかし,その和は0.40であり,黒球が①と③の世界のいずれかから出現したならば,その確率の和が1でなければならない条件(正規化条件)と矛盾する。この場合,
したがって,
結局,ツボAである確率は0.125,ツボBである確率は0.875と推定され,これを事後確率,あるいはベイズ逆確率という。確率の大きさより任意に選ばれたツボはBと推定することが妥当な判断となる。
3. ベイズの公式以上までのことを確率記号で表現すると,Figure 2において事象Aのもとで事象Bが起こる確率,すなわち条件付確率
p(B|A)は,
(i) |
で定義される。つまり,事象Aを全体と考えたときの事象Bの生起する確率である。また,(i)式の両辺にp(A)を乗じると,
(ii) |
が得られる(確率の乗法定理)。これを用いてFigure 1の①と③を表すと,
① = p(A)p(黒|A)
③ = p(B)p(黒|B)
であるので,正規化した①と③の比は,
右辺の第1項がツボAの事後確率,第2項がBの事後確率である。
ここで,事後確率の分母は試行の結果(ツボAおよびBから黒球が選ばれる)が得られる確率である。一方,分子はツボAあるいはBから黒球が得られたと仮定したときの条件付確率である。そこでFigure 2の事象Aを仮定した事象H,事象Bを試行の結果としての事象Dとすると(ii)式より,
したがって,
(iii) |
となり,これをベイズの公式という。ここでp(D|H)を尤度という。左辺は結果の元で仮説が生起する確率(事後確率)を表している。また分母のp(D)は試行結果が得られる確率であるので,例1では,
(iv) |
として計算される。つまりベイズの公式(あるいは定理)は,得られた結果からそれを生み出した原因の確率を推定していることになり,このことからベイズ逆確率とよばれる。例1について(iii)式を用いて選ばれたツボがBである事後確率を計算すると
面積図から求めた確率と一致している。
4. ベイズ更新例1について,選んだ球をもとのツボに戻し,もう一度同じツボから球を取り出す試行を考える。ツボAかBを面積図から推定する場合,1回目と2回目の色の組み合わせは,「黒→黒」「黒→白」「白→黒」「白→白」となり,事前確率を0.5としたツボAとBの可能世界はそれぞれ4個,合計8個に分岐する(Figure 3)。
( )内の数値は各可能世界の確率(面積)を示す。
2回目の試行の結果も黒球であった場合,上述の考え方より白球を含む可能世界は消失し,①と⑤の可能世界が残る。したがって,その確率の比は,
正規化条件を復元すると,
黒球が2回連続出たことから,ツボBの事後確率は0.875から0.98に上昇している。
一方,1回目の試行結果からツボAとBの事後確率がわかっているので,これを2回目の試行の事前確率として利用することができる。これをベイズ推定の逐次合理性によるベイズ更新という。すなわち,Figure 4に示すように,1回目の事後確率0.125:0.875を事前確率として可能世界を考えると,2回目の結果も黒球であったことから,可能世界②と④が消えて①と③の可能世界が残る。その確率の比(①:③)を正規化すると,
( )内の数値は各可能世界の確率(面積)を示す。
と,事前確率を0.5:0.5とした先の結果と一致している。また,ベイズの公式により選ばれたツボがBである確率を求めると,
と,面積図からの結果と一致している。ちなみに,ベイズ公式の分母を面積図から考えると,これは2つの比率の和を1とするための,つまり正規化条件を復元するための役割を担っている。
5. 実例例2.
疾患Dを診断するための検査法Tについて,その感度と特異度はそれぞれ98%,95%であることが知られている。疾患Dの有病率が3%のとき,検査法Tで陽性と判定された被検者が,真に疾患群Dに属している(罹患している)確率を求めなさい。
被検者が疾患Dに罹患しているか否かは不明であるので,理由不十分の原理より事前確率を0.5と設定することもできるが,この場合は有病率を事前確率として利用することができる。すなわち,疾患Dに罹患している事前確率;p(Hd) = 0.03であり,罹患していない確率;p(Hh) = 0.97である。したがって,(iii)式より罹患している確率;p(Hd|D)は,
と,約38%と推定できる。Figure 5に面積図による解法を示した。なお,上式を具体的に書き直すと次式となる。
以上までの例は,可能世界と事前確率を,ツボAあるいはB,疾患あるいは非疾患など,有限個のタイプについて考えた。
しかし,次に示す例では無限個のタイプを仮定する必要がある。
例3.
使い込まれたコインでコイン投げをしたところ,「表」がでた。さらに続けて投げたとき,再度「表」がでる確率を求めなさい。
一般的な統計学ではコインの「表」と「裏」がでる確率は等しく0.5と仮定し,また1回目とは独立した2回目の試行であるので,「表」のでる確率は0.5であると推定する。しかし,ベイズ統計ではコインの表面に摩耗があったり,形状に微妙な歪があるなどの可能性を考え,「表」のでやすい,またはでにくいコインを仮定する。これもベイズ統計が「主観的」「恣意的」であると批判された要因である。したがって,コインの存在する可能世界を仮定するためには,「表」のでやすい,あるいはでにくいコインのタイプを確率pで設定し,0 ≤ p ≤ 1の範囲で無限個のタイプを考慮し事前確率を設定する必要がある。その前に,仮にコインのタイプを「表」のでやすさの確率が0.2,0.4,0.5,0.6,0.8である5つに限定することが許されるならば,理由不十分の原理のもとでFigure 6Aに示す10個の可能世界を仮定することができる。最初の試行で「表」がでたことから,「裏」の可能世界は消失し,正規化条件を復元した可能世界を再築するとFigure 6Bとなる。ここで「表」のでる可能世界の確率の和が次の試行で再度「表」のでる期待値となる。
A:事前確率,B:事後確率
試行前は「表」と「裏」のでる確率は等しく0.5であったが,最初の試行で「表」がでたことにより,次の試行で「表」がでる確率が0.58に上昇している。
2. ベータ分布Figure 6において,「表」のでやすさの確率(タイプ)の種類を無限にまで増やすと,可能世界を表す長方形は線分となる。これにより,「表」のでやすさの確率pについて0以上1以下のすべてのpについて対応することができる(Figure 7A)。ただし,Figure 6のように可能世界を長方形で表現できる場合は,その面積が確率に対応していたが,連続的に無限個存在するpは線分となるために面積は0である。したがって,Figure 7の縦軸は確率ではなく確率密度で定義されている。つまり,pの範囲を指定することによりその範囲の面積が確率に対応することになる。なお,確率密度でタイプを設定する場合は「事前確率」を「事前分布」という。
Figure 7Aのようにどのxに対しても一定のyを示す分布を一様分布という。xの値は「表」のでやすさpのタイプなので,すべてのタイプの確率密度は等しく,0 ≤ p ≤ 1の範囲の面積を1とするためには(正規化条件),確率密度は1となる。ここで,一様分布は次の一般式で定義されるベータ分布の一種である。ベータ分布とは連続確率分布の一つで,ある現象の生起数をα,非生起数をβとすると,その現象の生起する確率pの分布を意味する。kを定数とすると,
(i) |
αとβは1以上の自然数でベータ分布のパラメータである。α=1,β=1のとき(ⅰ)式より,
kは定数であるので一様分布となる。上述のごとくFigure 7Aの長方形の面積は正規化条件から1であるので,k = 1と決まる。
3. ベータ分布の例(1)α = 2,β = 1のベータ分布(Figure 7B)
(i)式より,
正規化条件より定数kは,
k = 2。したがって,y = 2x
(2)α = 1,β = 2のベータ分布(Figure 7C)
(i)式より,
正規化条件より定数kは,
k = 2。したがって,y = 2 − 2x
(3)α = 2,β = 2のベータ分布(Figure 7D)
(i)式より,
正規化条件より定数kは,
k = 6。したがって,y = −6x2 + 6x
4. ベータ分布の導入先の解説では,「表」のでやすさの確率pのタイプを5つに限定したが,これを0以上1以下の無限個のタイプに拡張すると,その事前分布はFigure 7Aに示すα = 1,β = 1のベータ分布(一様分布)となる。塗りつぶしている範囲が「表」がでる事前分布であり,その面積が確率に対応している。したがって,試行を行う前は「表」と「裏」のでる確率は0.5と仮定していることになる。
1回目の試行で「表」がでたことから,Figure 7Aの「裏」の可能世界は消滅し,正規化条件を復元すると事後分布はFigure 7Bに示すベータ分布となる。ここで,0 ≤ x ≤ 1の範囲におけるベータ分布の期待値は次式で与えられる。
そして,この期待値が次の試行において注目する結果が生起する確率の推定値となる。
試行前の「表」が出る確率は,
「表」と「裏」のでる確率は等しいが,「表」がでたことによりFigure 7Bの事後分布が得られると,次も「表」のでる確率の期待値は,
α = 2,β = 1であるので,
と推定できる。「表」がでる確率のタイプを5種類に限定して推定した結果0.58よりも大きな値となっているが,これはベータ分布によりすべての確率のタイプを事前分布として推定したからと考えることができる。
ちなみに,2回続けて「表」がでた後,再度「表」がでる確率を推定すると,事前分布はy = 2xであり,事後分布はy = tx2となる。正規化条件を復元すると,
より,t = 3
事後分布
α = 3,β = 1のベータ分布であるので,その期待値は,
と推定できる。
ベイズ推定では,事前分布がベータ分布であるならば事後分布もベータ分布になる性質がある。このときの事前分布を共役事前分布という。より汎用性のあるベイズ推定では事前分布として正規分布を仮定する。
面積図によるベイズの公式の解説は文献1)を参考とした。また,ベータ分布の導入に必要な数学的な展開は文献2),3),4)を参考とした。
本論文に関連し,開示すべきCOI 状態にある企業等はありません。