ベイズの定理がわかりにくい理由

ベイズの定理は、「条件付き確率」を含む確率の基本的な公式を組み合わせることによって簡単に得られるものであるにもかかわらず、実践的にも非常に役立つものとして脚光を浴びている。しかし、この単純な定理が、私達にとててゃ非常に分かりにくいと言われている。その理由として考えられるのが、私達が物事を考えるときに無意識的に用いている時間の順序を逆にして考える必要があるからだと思われる。そもそも公式として表されるベイズの定理には時間概念はないのだが、私達がそれに関する事象を考える際に時間の問題が出てくるのである。


例えば、ある確率でAさんが自分のことを好きだとすると(事前確率)、Aさんがデートの誘いに応じてくれる確率はどれくらいだろうか(条件付き確率)と考えるのは、時間的順序に沿った思考であり、わかりやすい。しかし、ベイズの定理が活躍するのは、Aさんがデートの誘いに応じてくれたならば、Aさんが自分のことを好きな確率はどれくらいか、を問うような場合である。この場合、先の問いと比較して、暗黙的な時間的順序が逆になっているので分かりにくいのだと思われる。前者の例では、事前確率を所与として、時間的順序にそって考えていくのに対して、後者の場合は、条件付き確率を所与として、時間的順序を遡って事前確率を推測するわけである。


すでに述べたとおり、上記の時間的順序は、私達が思考するときに暗黙的に用いるものであって、ベイズの定理にも登場しないし、上記の問題を解くときには必須でない。これを逆手にとるならば、ベイズの定理を理解するコツは、私達が無意識的に用いようとする時間的順序を無視して、時間を考慮しないで解いてみることであると思われる。具体的に考えてみよう。まず、下の2つは、両方とも(Aさんが自分のことを好きで、かつデートに応じてくれる確率)なので、同値である。戦術のとおり確率論的に時間的概念は関係ないが、上のほうが直感的な時間的順序が自然である。

  • (Aさんが自分を好きな確率) X (Aさんが自分を好きな場合にデートに応じてくれる確率)
  • (Aさんがデートに応じてくれる確率) X (Aさんがデートに応じてくれた場合にAさんが自分を好きな確率)


上記の場合、掛け算の順序を変えても変わらないので、2つが同値であることを含めて書き直すと、以下のとおりである。ここでは時間的順序を無視して単純に数学的な操作として考えればよい。

  • (Aさんが自分を好きな場合にデートに応じてくれる確率) X (Aさんが自分を好きな確率)
  • =(Aさんがデートに応じてくれた場合にAさんが自分を好きな確率) X (Aさんがデートに応じてくれる確率)


あとは、右辺の2番めを左辺に持っていくだけで(両辺を右辺の2番めの項で割れば)、ベイズの定理による推論が導かれるのである。

  • Aさんがデートに応じてくれた場合にAさんが自分を好きな確率
  • = {(Aさんが自分を好きな場合にデートに応じてくれる確率) X (Aさんが自分を好きな確率)}/ (Aさんがデートに応じてくれる確率)


この定理は「Aさんがデートに応じてくれた」という事象が起こったときに、ではAさんが自分を好きな確率はどれくらいなのだろうという推論をすることなので、より現実の場面に知りたい推論にフィットする定理だといえよう。そして、はじめに想定した(デートに誘う前に想定していた)「Aさんが自分を好きである確率(事前確率)」を、デートに応じてくれたという事実を用いて推論した結果(デートに応じてくれたときに自分を好きな確率)によって修正することを繰り返すことによって、より適切な事前確率に近づいていけるという性質を持っている(事前確率をベイズの定理による推論結果に置き換える)。つかり、新たに加わったデータを使って確率を修正していくことにより、だんだんと事前確率に自信が持てるようになるプロセスの理解に適用可能なのである。