まとまり日記

私はこういうときでも自分がいじけなかったこと、力むことなくそういう風に育ったのが母への感謝なのである。これは大きかった。恥ずかしさの容量が大きいのは強いのだ。見栄を張らないで生きること、これは何よりも大きな糧である。(森信雄)

ベイズ主義のAベイズC (1)

前に紹介したソーバー先生の本

Evidence and Evolution: The Logic Behind the Science

Evidence and Evolution: The Logic Behind the Science

の第一章第二節(The ABCs of Bayesianism)ではベイズ主義を紹介している。これは統計学の哲学の中で最もよく知られている立場のひとつだ*1ベイズ主義は以下のベイズの定理に基づいている。

\Pr(H|e)=\frac{\Pr(e|H)\Pr(H)}{\Pr(e)} (ベイズの定理)

ここでHは仮説、eは証拠を表す。Pr(H)は仮説Hが正しい確率で専門用語(業界用語)では、テストの前に仮説がもっていた確率という意味で事前確率(prior probability, or just prior)と呼ばれる。これに対してPr(H|e)は、証拠が得られた後の仮説についての確率で、専門用語では事後確率(posterior probability)である。また、Pr(e|H)は、仮説が正しいときに、手元の証拠が得られる確率で、尤度と呼ばれる。

言い換えると、上の式は、事前確率・証拠の確率・仮説の尤度がわかれば仮説の事後確率がわかると主張していることになる。

このベイズの定理と統計学の哲学上の立場としてのベイズ主義は区別される必要がある。ベイズ主義は反対者がそれなりに多い立場だが、ベイズの定理が成り立つことについては、反対する人はいない。これは、ベイズの定理が標準的な条件付き確率の定義と確率の公理から導出されるにすぎないからである。

しかしベイズ主義者は、この定理を用いて科学者が証拠と仮説について行っていることを解釈・説明したり、さらには科学者が証拠と仮説についてどういうことをするべきか主張しようとする。このようにベイズの定理を「応用」しようとしたときに、議論が出てくる。*2

ベイズの定理の応用例

ベイズの定理によってどのように仮説の事後確率が導出されるか、例を使ってみてみよう。

結核の例について考える。Sさんが結核の検査を受けて(感染を疑わせる)陽性の反応がでたとする。このとき、Sさんが実際に結核に感染している確率の値はいくつになるだろうか。ここで

  • 仮説H:「Sさんは結核に感染している」
  • 証拠e:「Sさんは結核検査で陽性の反応が出た」

とすると、われわれが知りたいのは、手元にeがあるときのHの確率、つまりPr(H|e)だ。もしベイズの定理を用いてこの確率を計算したいとすると、必要なのは

  • 仮説の尤度Pr(e|H)
  • 仮説の確率Pr(H)
  • 証拠の確率Pr(e)

である。ここでこうした確率が何を意味しているかもう少しひらたく説明すると、

  • 仮説の尤度:結核に感染しているときに検査でそれが検出される確率
  • 仮説の確率:Sさんが属する母集団のなかで結核に感染している人の割合
  • 証拠の確率:Sさんが属する母集団全体(結核に感染していない人も含む)の中で検査で陽性の反応が出る人の割合

ということになる。ここでこうした確率の値が次のようだったとしよう。

  • 仮説の尤度Pr(e|H)=0.95
  • 仮説の確率Pr(H)=0.0001
  • 証拠の確率Pr(e)=0.01

この場合、Sさんが実際に結核に感染している確率の値は、

\Pr(H|e)=\frac{\Pr(e|H)\Pr(H)}{\Pr(e)}=\frac{0.95\times 0.0001}{0.01}=0.0095

となる。

上の計算は以下のようにも解釈できる。検査を受ける前のSさんについて結核に感染している確率を考えてみると、それはSさんの属する母集団の他の人とまったく変わらないだろう。*3 するとこの確率は事前確率Pr(H)=0.0001ということになる。検査結果が出た後には、ベイズの定理に基づく計算によって、それは事後確率Pr(H|e)=0.0095になったことになる。

こうした「事前確率→事後確率」の変化はベイズ的条件化(the Bayesian conditionalization)と呼ばれる。ベイズ主義の基本的な主張は、証拠が入るたびにこうした条件化を繰り返し行うことで、より多くの証拠に基づいた仮説の事後確率が手にはいる、というものだ。

さて上の式に加えて、Sさんが実際に結核に感染していない確率の値を考えてみる。

\Pr(\neg H|e)=\frac{\Pr(e|\neg H)\Pr(\neg H)}{\Pr(e)}

この二つの式を比べると、分母のPr(e)が約分されて消えるので、次のようになる。

\frac{\Pr(H|e)}{\Pr(\neg H|e)}=\frac{\Pr(e|H)}{\Pr(e|\neg H)}\times\frac{\Pr(H)}{\Pr(\neg H)}

これは、事後確率の比は、尤度の比に事前確率の比を掛けたものになるということだ。この式を見ると、何が信念の改訂において大切かが見えてくる。もし、尤度が仮説「Sさんは結核に感染している」と対抗仮説「Sさんは結核に感染していない」で等しいなら、
\frac{\Pr(e|H)}{\Pr(e|\neg H)}=1
となるので、事後確率の比は事前確率の比に等しくなる。つまり事後確率の比が事前確率の比から変化するかどうかは尤度の差にかかってくるわけだ。

われわれは何を信じるべきか

ベイズ主義は以前のエントリで述べた三つの問

  1. 証拠は何を言っているか
  2. われわれは何を信じるべきか
  3. それを受けてどう行動すべきか

の中では二つ目の問――われわれは何を信じるべきか――に関わることに注意しよう。条件化によって出てくる事後確率は、仮説そのものに関わる値である。仮説に対する事後確率が高ければ、われわれは仮説を信じるべきだし、低ければそうではない。これは前に述べた確立された理論に都合の悪い証拠が出てきたときことを考えるとよい。「理論Hに都合の悪い証拠e」とは、eに対する理論Hの尤度が低い証拠だと考えるとよい(言い換えると、理論からの予測とは反するような観察や実験結果が出た場合である)。これが証拠の確率を下回るなら、事後確率は事前確率よりも低くなる。しかしもし事前確率がはじめから極めて高かったならば(たとえばPr(H)=0.99999)、不利な証拠による条件下を経た後も事後確率も十分高いままであることはありうる。

*1:なお、ソーバー先生がタイトルのようなだじゃれを言っているわけではありません。

*2:なお、統計学の哲学は立場同士が互いにハッキリ対立しているため、すべての立場が納得する中立的な解説をすることは簡単ではない。ソーバーは、この章ではハッキリ述べている訳ではないが、モデル選択理論(AIC)に一番シンパシーを抱いている様子であり、このエントリでは一応ソーバーの記述に沿って解説していくので、ベイズ主義者には以下の記述はフェアではないように映るかもしれない。が、このエントリの目的はベイズ主義を簡単に解説することなので、そこを理解して頂ければ幸いである。

*3:ここではSさんは結核の自覚症状を認識していないものとする。