確率の話をしてみよう2 (確率分布)
「時間目に子供が生まれる(もしくは一人目の子供が生まれる)確率をとすると、問題文から
となるという所まできた。
次に我々が考えるのは「数列はどのような数列か?」と言うことである。*1
元になった議論が採用した方針を確認してみよう。
「そこで面倒だから、どの時間帯にも同程度に産まれる可能性があると思いましょう」というのが「性質を推定したモデル」なのであるが…ここでまだ問題がある。「どの時間帯にも同程度に産まれる可能性がある」とはどういうことなのであろうか?
とりあえず、「30で割って良い」というのが意見としてあげられている。このモデルは「が一定」というものである。このモデルがいかなるものか考えてみよう。
あなたが分娩室の前で待っているとしよう。*2
「一時間目」に子供が生まれる確率は87%の30分の1(2.9%)である。
では「二時間目になって子供が生まれるのを分娩室前で待っているあなた」が「この時間帯に子供が生まれると期待して良い可能性」はいくらであろうか?その確率は87%の30分の1よりも確実に大きくなる。
なぜ30分の一ではないか?それは「あなたが最初の一時間の間に生まれなかったことを確認した」の分の可能性が、残りの29時間に配分された結果である。
はっきり言って、これは分かりにくい。この問題は「くじ引き」で考えた方がわかりやすいと思う。
以下のようなモデルは、「全体の確率を30で割る」モデルの典型である。*3
- ある箱にくじが30本入っている。この中に当たりのある可能性は87%であり、当たりは最高でも一本しかない。
- くじを一本ずつひく。どの一本のくじも当たりの可能性は等しく87%の30分の一である。
ここまではわかりやすいだろう。
では、くじを一本ひいて、外れと分かったとしよう。次のくじが当たりである確率はどれだけだろう?
どのくじも等しく「87%の29分の1」の確率で当たるはずだ。なぜなら「箱の中に当たりがある可能性87%」という前提が変わっていないからだ。(以降、「くじ引き型」といった場合にはこのようなモデルを意味するものとする。)
このモデルは間違っていた。そもそも、「87%で当たりの入っているくじ引きの箱」というモデルに対して、条件付き確率を適用することはできないのだ。なぜなら、87%は「現状を正確に推測している確度」であって、今から起こる事柄の確率ではないのだ…。立て続けに外れを引き続けた場合、我々は「最初に87%入っていた」という推測を修正するべきなのだ。条件付き確率を適用するには「87%で当たりになる抽選券が一枚だけ必ず入っているくじ引きの箱」が必要だ。したがって、我々が観測した「子供が生まれなった」という事象は「抽選券をひいたが外れた」「そもそも抽選券をひかなかった」の二つの可能性から構成されていることになる。「抽選券をひいて外れたなら、以降の確率は0」「抽選券をひいていないなら、抽選券をひく確率が29分の1」だ。だがこのモデルにも問題がある。我々は「観測した事象がどちらなのか」をどうやって知れば良いのか?計算するには常にこの両者の場合分けが必要だ。
観測した事象を確実なものにするには、「必ず一本は当たりが入っている」状況を作るしかない。私が思いつく限り一番簡単なのは当たりが1本だけ入った1000本のくじを用意し、そのうち130本を別の箱に移すことだ。その後残った870本を29本ずつひく。ずいぶんとむちゃくちゃだが、そうするしかない。別の箱に入った130本の意味がなんなのか、「とにかく13%分の本数だから」という以外考えることができないが。
分娩室の前に居るあなたに適用されるのもこのルールだ。
「30で割っていい」という人たちの意見では「生まれなかった分、生まれる可能性が増えるのは当然だ」となっている。
だが、待ってくれ!我々は「どの時間帯にも同程度に産まれる可能性がある」と仮定したのではなかっただろか?なぜ「同程度」と仮定した計算から「後になるほど生まれる可能性が高い」という結果が生まれるのか?
これは、「可能性」の定義がちゃんとなされていないのが原因である。
我々が困惑した「後になるほど生まれる可能性が高い」という表現は厳密に言うと次のようになる。「それまでに子供が生まれていなかった場合、その時間帯に子供が生まれる可能性は高い」というものなのだ。
これは「条件付きの確率」などと呼ばれる値である。