モンティ・ホール問題の解法
英語版の「Monty Hall problem - Wikipedia, the free encyclopedia」は日本語版のサイトと内容が異なるようだが、私は英語が苦手なので、ここでは日本語版のサイトの方について考察する。
ここで紹介されているモンティ・ホール問題は次の通りである。
プレイヤーは、三つのドアを見せられる。ドアの一つの後ろにはプレイヤーが獲得できる景品があり、一方、他の二つのドアにはヤギ(景品がなく、ハズレであることを意味している)が入っている。ショーのホストは、それぞれのドアの後ろに何があるか知っているのに対し、もちろんプレイヤーは知らない。
プレイヤーが第一の選択をした後、ホストのモンティは他の二つのドアのうち一つをあけ、ヤギをみせる。そしてホストはプレイヤーに、初めの選択のままでよいか、もう一つの閉じているドアに変更するか、どちらかの選択権を提供する。プレイヤーは、選択を変更すべきだろうか?
(「モンティ・ホール問題 - Wikipedia」)
正式な解法はベイズの定理を用いる方法だろう。
モンティがヤギの入っているドア(B)を開いた後の三つのドア(A、B、C)の事後確率をP(A|"-B")、P(B|"-B")、P(C|"-B")とすると、P(A|"-B")とP(C|"-B")を求めて、P(A|"-B")よりP(C|"-B")の方が大きければ「選択を変更すべき」という答になる。
モンティがヤギの入っているドアを開く前の三つのドア(A、B、C)の事前確率をP(A)、P(B)、P(C)とする。Aに景品が入っている時にモンティがA、B、Cのドアを開けてヤギを見せる確率をP("-A"|A)、P("-B"|A)、P("-C"|A)とする。同様にB、Cに景品が入っている時にモンティがA、B、Cのドアを開けてヤギを見せる確率をP("-A"|B)、P("-B"|B)、P("-C"|B)、P("-A"|C)、P("-B"|C)、P("-C"|C)とする。
するとP(A|"-B")とP(C|"-B")は次の式(ベイズの定理)で求められる。
P(A|"-B") = P(A)P("-B"|A)/(P(A)P("-B"|A)+P(B)P("-B"|B)+P(C)P("-B"|C))
P(C|"-B") = P(C)P("-B"|C)/(P(A)P("-B"|A)+P(B)P("-B"|B)+P(C)P("-B"|C))
この式に、次の値を代入する。ただし、プレーヤが選んだドアをAとする。
P(A) = P(B) = P(C) = 1/3
P("-B"|A) = 1/2 (∵ P("-B"|A)+P("-C"|A)=1、P("-B"|A)=P("-C"|A))
P("-B"|B) = 0
P("-B"|C) = 1
するとP(A|"-B")とP(C|"-B")は次のようになる。
P(A|"-B") = (1/6)/(1/6 + 0 + 1/3) = 1/3
P(C|"-B") = (1/3)/(1/6 + 0 + 1/3) = 2/3
P(A|"-B")よりP(C|"-B")の方が大きいので、プレーヤーはドアをAからCに変更すべきである。
ベイズの定理を知らない場合は、次のように場合分けして条件つき確率を求める。ここではプレーヤーが選んだドアをAとする。
ケース | 当たりは? | ヒント | 確率計算 | 確率 |
---|---|---|---|---|
ア | Aが○ | 「Aは×」 | (1/3)*(0) | 0 |
イ | 「Bは×」 | (1/3)*(1/2) | 1/6 | |
ウ | 「Cは×」 | (1/3)*(1/2) | 1/6 | |
コ | Bが○ | 「Aは×」 | (1/3)*(0) | 0 |
サ | 「Bは×」 | (1/3)*(0) | 0 | |
シ | 「Cは×」 | (1/3)*(1) | 1/3 | |
テ | Cが○ | 「Aは×」 | (1/3)*(0) | 0 |
ト | 「Bは×」 | (1/3)*(1) | 1/3 | |
ナ | 「Cは×」 | (1/3)*(0) | 0 | |
各ケースの確率の合計= | 1 |
簡略化して書いてあるが「○」とは景品が入っていることを表し「X」は景品ではなくヤギが入っていることを表す。「ヒント」とはモンティがドアを開いたことで得られた情報のことである。
得られたヒントは「Bは×」(この問題では「Cは×」でも同じ)だったので、ヒントが「Bは×」のケースの中で「Aが○」「Cが○」の割合(条件つき確率P(A|"-B")、P(C|"-B"))を計算し、P(A|"-B")よりP(C|"-B")の方が大きければ「選択を変更すべき」という答になる。
P(A|"-B")とP(C|"-B")は次のように計算する。
P(A|"-B") = (イ)/(イ + サ + ト)
P(C|"-B") = (ト)/(イ + サ + ト)
実際に各確率を当てはめて計算すると次のようになる。
P(A|"-B") = (1/6)/(1/6 + 0 + 1/3) = 1/3
P(C|"-B") = (1/3)/(1/6 + 0 + 1/3) = 2/3
P(A|"-B")よりP(C|"-B")の方が大きいので、プレーヤーはドアをAからCに変更すべきである。
上の式を見て分かるように、ベイズの定理の式とそっくりである。そもそもベイズの定理の式の分母は「Bは×」というヒントが得られる確率の合計であり、分子はそれぞれのドアに景品があってしかも「Bは×」というヒントが得られる確率である。上のように場合分けして条件つき確率を求める方法はベイズの定理を使っているようなものである。
ところで、「モンティ・ホール問題 - Wikipedia」には次のような解法も載っている。
次のように考えることもできる。プレイヤーが初めに選んだドアをA、残りのドアをB、Cとする。プレイヤーが初めのドアを選んだ時点で、それぞれのドアに景品がある確率と、モンティがそれぞれのドアを開ける確率を表にすると次のようになる。
ここでモンティがBのドアを開ける確率は全体の1/2であるが、これは、Aのドアに景品があってモンティがBのドアを開ける確率 (1/6)、Bのドアに景品があってモンティがBのドアを開ける確率(0)、Cのドアに景品があってモンティがBのドアを開ける確率 (1/3)の合計である。表を良く見れば分かるとおり、もしモンティがBのドアを開けたならば、A(プレイヤーが初めに選んだドア)の後ろに景品がある確率に比べ、Cの後ろに景品がある確率が2倍なのは明らかである。
プレイヤーが初めのドアを選んだ時点の確率 モンティが開けるドア 合計 A(プレイヤー) B C 景品があるドア A 0 1/6 1/6 1/3 B 0 0 1/3 1/3 C 0 1/3 0 1/3 合計 0 1/2 1/2 1
(「モンティ・ホール問題 - Wikipedia」)
この解法はベイズの定理に従ったものであるとも言えるし、場合分けして解いているとも言える。上の私の表の各ケース名を当てはめると次のようになる。
モンティが開けるドア | 合計 | ||||
A(プレイヤー) | B | C | |||
景品があるドア | A | ア | イ | ウ | 1/3 |
B | コ | サ | シ | 1/3 | |
C | テ | ト | ナ | 1/3 | |
合計 | 0 | 1/2 | 1/2 | 1 |
「モンティが開けるドア」がBであるケースの合計確率がベイズの定理による解法の分母であって、その列の「景品のあるドア」の確率がベイズの定理による解法の分子である。モンティがBのドアを開けて景品がないことを示した後のA、Cに景品がある確率(P(A|"-B")、P(C|"-B"))は次のようになる。
P(A|"-B") = (イ)/(イ + サ + ト)
P(C|"-B") = (ト)/(イ + サ + ト)
実際に各確率を当てはめて計算すると次のようになる。
P(A|"-B") = (1/6)/(1/6 + 0 +1/3) = 1/3
P(C|"-B") = (1/3)/(1/6 + 0 +1/3) = 2/3
P(A|"-B")よりP(C|"-B")の方が大きいので、プレーヤーはドアをAからCに変更すべきである。
もしかしたら、この解法が一番分かりやすいかもしれない。
慎重な人はプレーヤーが選ぶドアも含めて場合分けしても良いかもしれない。その必要がないことは証明できると思うが面倒なので省略する。
ケース | 当たりは? | ドアの選択 | ヒント | 確率計算 | 確率 |
---|---|---|---|---|---|
ア | Aが○ | Aを選ぶ | 「Aは×」 | (1/3)*(1/3)*(0) | 0 |
イ | 「Bは×」 | (1/3)*(1/3)*(1/2) | 1/18 | ||
ウ | 「Cは×」 | (1/3)*(1/3)*(1/2) | 1/18 | ||
エ | Bを選ぶ | 「Aは×」 | (1/3)*(1/3)*(0) | 0 | |
オ | 「Bは×」 | (1/3)*(1/3)*(0) | 0 | ||
カ | 「Cは×」 | (1/3)*(1/3)*(1) | 1/9 | ||
キ | Cを選ぶ | 「Aは×」 | (1/3)*(1/3)*(0) | 0 | |
ク | 「Bは×」 | (1/3)*(1/3)*(1) | 1/9 | ||
ケ | 「Cは×」 | (1/3)*(1/3)*(0) | 0 | ||
コ | Bが○ | Aを選ぶ | 「Aは×」 | (1/3)*(1/3)*(0) | 0 |
サ | 「Bは×」 | (1/3)*(1/3)*(0) | 0 | ||
シ | 「Cは×」 | (1/3)*(1/3)*(1) | 1/9 | ||
ス | Bを選ぶ | 「Aは×」 | (1/3)*(1/3)*(1/2) | 1/18 | |
セ | 「Bは×」 | (1/3)*(1/3)*(0) | 0 | ||
ソ | 「Cは×」 | (1/3)*(1/3)*(1/2) | 1/18 | ||
タ | Cを選ぶ | 「Aは×」 | (1/3)*(1/3)*(1) | 1/9 | |
チ | 「Bは×」 | (1/3)*(1/3)*(0) | 0 | ||
ツ | 「Cは×」 | (1/3)*(1/3)*(0) | 0 | ||
テ | Cが○ | Aを選ぶ | 「Aは×」 | (1/3)*(1/3)*(0) | 0 |
ト | 「Bは×」 | (1/3)*(1/3)*(1) | 1/9 | ||
ナ | 「Cは×」 | (1/3)*(1/3)*(0) | 0 | ||
ニ | Bを選ぶ | 「Aは×」 | (1/3)*(1/3)*(1) | 1/9 | |
ヌ | 「Bは×」 | (1/3)*(1/3)*(0) | 0 | ||
ネ | 「Cは×」 | (1/3)*(1/3)*(0) | 0 | ||
ノ | Cを選ぶ | 「Aは×」 | (1/3)*(1/3)*(1/2) | 1/18 | |
ハ | 「Bは×」 | (1/3)*(1/3)*(1/2) | 1/18 | ||
ヒ | 「Cは×」 | (1/3)*(1/3)*(0) | 0 | ||
各ケースの確率の合計= | 1 |
プレーヤーがAを選んで「Bは×」というヒントを得た場合は「Aが○」「Cが○」の条件つき確率を計算してCに変更すべきかどうかが問われ、プレーヤーがAを選んで「Cは×」というヒントを得た場合は「Aが○」「Bが○」の条件つき確率を計算してBに変更すべきかどうかが問われ、プレーヤーがBを選んで「Aは×」というヒントを得た場合は「Bが○」「Cが○」の条件つき確率を計算してCに変更すべきかどうかが問われ、プレーヤーがBを選んで「Cは×」というヒントを得た場合は「Bが○」「Aが○」の条件つき確率を計算してAに変更すべきかどうかが問われ、プレーヤーがCを選んで「Aは×」というヒントを得た場合は「Cが○」「Bが○」の条件つき確率を計算してBに変更すべきかどうかが問われ、プレーヤーがCを選んで「Bは×」というヒントを得た場合は「Cが○」「Aが○」の条件つき確率を計算してAに変更すべきかどうかが問われる。
最初にどのドアを選択しても、ドアを変更した場合に当たる確率(上の表で「ドアの選択」と「当たりは?」が違うドアのケース)、変更しない場合に当たる確率(上の表で「ドアの選択」と「当たりは?」が同じドアのケース)は次のような同じ式になる。
ドアを変更して当たる確率:(1/9)/(1/18 + 0 + 1/9) = 2/3
ドアを変更せず当たる確率:(1/18)/(1/18 + 0 + 1/9) = 1/3
ドアを変更した方が景品の得られる確率が高いことがわかる。
場合分けした様子を円グラフで表すと次のようになる。1周(360度)が確率1であり、各ケースで分け合い、「扇の角度÷360」が各ケースの確率になる。角度の比が確率の比である。内側が事前確率で外側に行くに連れて場合分けされている。樹形図の枝別れに相当する。
さて、「モンティ・ホール問題 - Wikipedia」には次のように書いてある。
また、ドアが3個ではなく100個である場合を考えるとより直感的に分かりやすくなるだろう。プレイヤーが一つのドアを選んだのち、モンティは後ろにヤギのいる98個のドアを開ける。明らかに、モンティが開けなかったもう一つのドアに景品がある可能性が極めて高い(正確には 99/100)。
ドア数が増えた場合の正式な解法もベイズの定理を使うのだが、上記のモンティ・ホール問題の解法と少し違うので、この後に「Nドア問題の解法」というタイトルで私のブログに書こうと思う。→【Nドア問題の解法】(2006/9/17)
参考文献
(1)「考えることの科学〜推論の認知心理学への招待〜」(市川伸一著、中公新書)
(2)「確率の理解を探る〜3囚人問題とその周辺〜」(市川伸一著、共立出版)
これまでの「三囚人問題、モンティ・ホール問題(モンティ・ホール・ジレンマ)」関連記事
【三つの扉、三枚の封筒】
【三囚人問題の図解】
【変形三択問題】
【三囚人問題と変形三囚人問題】
【金の玉はどこだ!問題】
【モンティ・ホール問題】
コメント 0
コメントの受付は締め切りました