モンティ・ホール問題
3つのドアのうち、当たりは1つ。1つのドアが外れとわかった場合、直感的には残り2枚の当たりの確率はそれぞれ1/2になるように思える
モンティ・ホール問題(モンティ・ホールもんだい、Monty Hall problem)は確率論の問題で、ベイズの定理における事後確率、あるいは主観確率の例題のひとつとなっている。モンティ・ホール (Monty Hall、本名 Monte Halperin) が司会を務めるアメリカのゲームショー番組、「Let's make a deal」の中で行われたゲームに関する論争に由来する。 一種の心理トリックになっており、確率論から導かれる結果を説明されても、なお納得しない者が少なくないことから、ジレンマあるいはパラドックスとも称される。「直感で正しいと思える解答と、論理的に正しい解答が異なる問題」の適例とされる。
なお、モンティ・ホール問題と実質的に同型である3囚人問題については、かつて日本で精力的に研究された。
目次
概要
「プレイヤーの前に3つのドアがあって、1つのドアの後ろには景品の新車が、2つのドアの後ろには、はずれを意味するヤギがいる。プレイヤーは新車のドアを当てると新車がもらえる。プレイヤーが1つのドアを選択した後、モンティが残りのドアのうちヤギがいるドアを開けてヤギを見せる。
ここでプレイヤーは、最初に選んだドアを、残っている開けられていないドアに変更してもよいと言われる。プレイヤーはドアを変更すべきだろうか?」
1990年9月9日発行、ニュース雑誌Paradeにて、マリリン・ボス・サヴァントが連載するコラム欄「マリリンにおまかせ」において上記の読者投稿による質問に「正解は『ドアを変更する』である。なぜなら、ドアを変更した場合には景品を当てる確率が2倍になるからだ」と回答したところ、読者から「彼女の解答は間違っている」との約1万通の投書が殺到したことにより、この問題が知られるようになった。投書には1000人近い博士号保持者からのものも含まれており「ドアを変えても確率は五分五分(2分の1)であり、3分の2にはならない」と主張。同年12月2日、サヴァントは数通の反論の手紙を紹介した。
- ジョージ・メイソン大学 ロバート・サッチス博士「プロの数学者として、一般大衆の数学的知識の低さに憂慮する。自らの間違いを認める事で現状が改善されます」
- フロリダ大学 スコット・スミス博士「君は明らかなヘマをした(中略)世界最高の知能指数保有者自らが数学的無知をこれ以上世間に広める愚行を直ちに止め、恥を知るように!」
サヴァントは、より簡易にした表を掲載「ドアを変えれば勝てるのは3回の内2回、負けるのは3回の内1回だけ、しかしドアを変えなければ勝てるのは3回の内1回だけ」と述べる。この問題に関する1991年2月17日付、3回目の記事の段階でサヴァントに対する反論は9割程度を占める。
- E・レイ・ボボ博士「(前略)現在、憤懣やるかたない数学者を何人集めれば、貴女の考えを改める事が可能でしょうか?」
「現実が直観と反する時、人々は動揺する」とサヴァントはコラムで反論の声に応じ、下記の説明を試みる。
司会者がドアを開けてみせた直後にUFOがステージに到着して宇宙人が出てきたと仮定する。人間の出場者が最初に選んだ扉を宇宙人は知らずに司会者がまだ開けられていない2つの扉のどちらかを選択するよう宇宙人に勧めると、この時の確率が五分五分になる。しかし、それは宇宙人が本来の出場者が司会者から得たヒントを知らないためである。仮に景品が扉2にある場合司会者は扉3を開ける。扉3に景品がある場合は扉2を開ける。つまり景品が扉2または扉3にあるなら、出場者が扉の選択を変えれば勝利する。『どちらかでも勝てるのです!』でも扉を変えなければ、扉1に賞品がある場合しか勝てないのです。
サヴァントの再再々解説でも大論争へと発展、「彼女こそ間違っている」という感情的なジェンダー問題にまで飛び火した。
アンドリュー・ヴァージョニがモンティーホールジレンマをモンテカルロ法を使って自前のパーソナルコンピュータで数百回のシミュレーションを行うと、結果はサヴァントの答えと一致。ポール・エルデシュは「あり得ない」と主張したしていたがヴァージョニがコンピューターで弾き出した答えを見せられサヴァントが正しかったと認める[1]。しかし、これはゲームの暗黙のルール(後述のゲームのルールを参照)について誤解があったと思われている。後、カール・セーガンら著名人らがモンティーホール問題を解説、サヴァントの答えに反論を行なっていた人々は、誤りを認める。
サヴァントは、「最も高い知能指数を有する者が、子供でもわかる些細な間違いを新聞で晒した」等の数多くの非難に対して3回のコラムをこの問題にあて、激しい反論の攻撃に耐えて持論を擁護し通し、証明した[2]。それによると、ドアの数を100万に増やした例まで挙げて説明しても正しく理解してもらえなかったとのことである。もっとも、この本の7頁に書かれている「したがって、あなたが選んだ貝殻が当たる確率を変えるような情報は何も得られません。」という内容は誤りであろう。新たな情報が得られたこと自体は事実だからである。
なお、サヴァントの本の183頁以降に、ミズーリ大学のドナルド・グランバーグ教授が補遺を記載している。それによると、モンティホールジレンマに関しては、コラムでの議論ののちに、「アメリカン・スタティスティシャン」「アメリカン・マスマティカル・マンスリー」「マスマティカル・サイエンティスト」「マスマティクス・ティーチャー」「ニューヨークタイムズ」等の媒体で細部まで議論され、その結果、サヴァントの解答は基本的に正しいとされたとのことである[3]。
ゲームのルール
- (1) 3つのドア (A, B, C) に(景品、ヤギ、ヤギ)がランダムに入っている。
- (2) プレイヤーはドアを1つ選ぶ。
- (3) モンティは残りのドアのうち1つを必ず開ける。
- (4) モンティの開けるドアは、必ずヤギの入っているドアである。
- (5) モンティはプレーヤーにドアを選びなおしてよいと必ず言う。
このうち (3) と (4) の条件がミソである(ベイズの定理でいう事後確率が有効になる)。 もし(3) が決められていなければ、例えば開けるかどうかモンティが決められるなら、このゲームはプレイヤーとモンティの心理戦であり、確率の問題ではない。 また、(4)の条件次第では答えが逆になったり、答えを定めることができなくなる。つまり、モンティが景品を出してしまう可能性があるなら、問題の大前提が変わってしまう。
大騒ぎとなった原因のひとつは、ルールに対する数学的な説明が無く「解釈」の余地があったことで、数学的に正しいルールが決まるまで決着が付かなかった(ちなみに番組名の make a deal は取引する、駆け引きするの意)。 事後確率の例題としては、ルールはもちろん守られており、司会者モンティとプレーヤーの参加者はルールを事前に把握して、その他の者は番組の視聴者(である)という大前提があるが、この前提がプロ数学者らの盲点を突く事になる。エルデシュはこの問題の解答を最初に間違いだと断定、立腹して外出する。一時間程経過してから帰って来るはずの時間ではないエルデシュがカンカンに怒って帰ってきてこの問題(と解)をエルデシュに教えた弟子を「君は何故選択を変更するのか言ってくれなかった!どうして言わなかった!」と苛立った様子で問い詰める。これには弟子も説明が出来なく師に謝罪。エルデシュは益々不機嫌になったという。
直感と理論の乖離
この問題を巡る人々の反応は、冒頭のエピソードにある様に『どちらを選んでも変わらない』とする意見が多かった。
実際、ドアが2つになった時点でプレーヤーが改めてコイントスによって決めなおしたと仮定すれば、景品を得る確率は1/2となる。 しかし、2枚のドアの価値はルール(1) - (4)を経ることによって等価ではなくなっており、プレーヤーの論理的思考によって確率の高い(価値のある)選択をすることが可能となっている。つまり、『どちらを選んでも変わらない』は誤りである。
以下のように考えると直感でも理解しやすい。
ハズレに色を付ける方法
- ドアの位置は考えなくても良い。
- 最初の選択で発生するのが3パターン(当たりか、ハズレ(青)か、ハズレ(赤))だと覚えておく
最初の選択 残りのドアの中身(位置は考えなくていい) ↓ ↓ A 「当たり」 ・ ハズレ(青)・ ハズレ(赤) B ハズレ(青)・ 「当たり」 ・ ハズレ(赤) C ハズレ(赤)・ ハズレ(青)・ 「当たり」
- 最初の選択で当たりを引けるケースは1つ(A)、ハズレを引いてしまうケースは2つ(B,C)ある。
- 2回目の選択ではハズレが1つ除外されているため、当たりをひくケースは2つ(B,C)。ハズレを引くケースは1つ(A)となる。
ポイント
- 最初に自分がハズレを引いていれば、2回目はドアを変えれば確実に当たりが出る(残りのハズレが除外されているため)。
- 最初に当たりを引いているケースは1つしかないが、ハズレを引いているケースは2つあるので、変えるほうが得である。
ワナ
- 「最初にハズレを引くケースは1つ多い」を忘れていると、2回目の確率が50%に見えてしまうこと。
- 最初にハズレを引くケースは2つあるので、確率は50%ではない。
ドアに印を付ける方法
- そのドアに景品が入っていることを ○ で示す。
- ドア A,B,C が ○ である確率は、それぞれ 1/3 である。
- 「ドア A が ○ である確率」は 1/3 であるが、「B または C が ○ である確率」は 2/3 である。
- ドア C を開いたあとでも、「B または C が ○ である確率」は 2/3 である。
- ドア C を開いて、C が ○ ではないと判明したあとでは、「B が ○ である確率」は、「B または Cが ○ である確率」と等しい[4]。その確率は 2/3 である。
- 「A が ○ である確率」は 1/3 であるが、「B が ○ である確率」は 2/3 である。
最初にハズレのドアを選ぶ方法
- 当たりのドアを選ぼうとせず、わざとハズレのドアを選ぶ。
- その後モンティが、もう一つのハズレのドアがどれかを教えてくれるので、残ったドアが当たりのドアである。
- 当たりのドアがどれか判明したので、最初に選んだハズレのドアから当たりのドアに変更する。
最初にハズレのドアを選ぶことができれば、上記手順で確実に当たりのドアを開けることができる。最初にハズレのドアを選ぶことができる確率は2/3であるので、この手順に従えば(つまりドアを変更すれば)2/3の確率で当たりのドアを開けることができる。
この1.の「当たりのドアを選ぶ」か「ハズレのドアを選ぶ」かは気持ちの問題であり、確率的な影響はまったくないことに注意を要する。3.でドアを変更することへの抵抗感をなくす効果しか持っていない。
よって2.においてモンティが「もう一つのハズレのドアがどれかを教えてくれる」のではなくモンティも当てようとする(モンティが当てたらプレイヤーは自動的に外れる)場合には、1/3の確率で2.でモンティが当ててしまうので、3.にたどり着くのはモンティが2/3の確率で外した場合に限る。この場合3.にたどり着いた時点で残る確率は、変更すると当たる確率1/3(2/3だった確率のうち1/3をモンティが使って(そして外して)しまった)と、変更すると外れる確率1/3とになり、ドアを変更してもしなくても確率は等しいという直感通りの確率になる。
つまり、2.でモンティが2/3の確率のうち1/3を使ってハズレのドアを開けてしまうのではなく、確実に(確率を減らさずに)ハズレのドアを開けることが直感通りにならない要因である。
これを変形させた考え方もできる。
- 最初プレイヤーがあたりを引く確率は1/3である。
- ドアを変更しない場合はそのまま1/3の確率である(変更しないのであればモンティがドアを開こうが開くまいが確率は変わらない)
- モンティがドアを開けた後にドアを変更する場合、最初に選択したドアがハズレであれば変更後のドアはあたりが確定である。つまり、最初に選択したドアがはずれである確率=ドアを変更した場合にあたりを引く確率である。
- 最初の選択であたりを引く確率は1/3、はずれを引く確率は2/3である。
- ゆえに、ドアを変更した場合のあたりを引く確率は2/3と考えられる。
100枚のドアを使う方法
- ゲームには100枚のドアが使われるとする。プレイヤーが最初のドアを選んだとき、このドアの当たりの確率は100分の1である。
- モンティが残り99枚のドアのうち98枚を開けてヤギを見せる。
- プレーヤーは2回目の選択をする。
最初にプレイヤーが選んだ1枚のドアと「正解を知っているモンティが開こうとしなかった、残り99枚のうちで、ただ1枚のドア」の確率が相違していることは、直感で理解が可能であろう。
その他の方法
あるいは、こう考えることもできる。
- プレイヤーは1回目の選択をする。この時点では確率は全て等しい。
- 番組側は残りのドアをひとまとめにし、どれを開けても結果は共通と宣言する。
- プレーヤーは2回目の選択をする。
プレーヤーが最初に選択することにより、ひとまとめの対象から(番組側から見てランダムに)外されたドアと、残りすべてのドアでは、価値が等しくないことは明らかである。
また、確率論の基になっている統計の考え方を呼び起こすことで、理解を助けられた実験がある[5][6]。
パラドックス
この問題はパラドックスであるといわれることがある。最初からドアが1つ開いた状態で、2つのドアから1つを選ぶという問題であったなら、確率は 1/2 である。それに対して、このゲームによってドアが1つ開いた状態になった場合には、確率は 1/3 と 2/3 になる。このように確率が異なることがパラドックスといわれる理由である。
しかし、これは確率の計算に矛盾があるわけではないので、擬似パラドックスである。ドアが2択になった経緯を知っているか知らないかの情報の差がドアの評価に影響しているだけである。 (単純な話、「最初にプレーヤーがドアを選択する時点での確率」と考えると理解しやすい。なお、1つドアが初めから開いた状態=単なる2択問題であり、モンティ・ホール問題は成立し得ない。)
計算
開けるドアを変更すると、プレイヤーが景品を獲得する確率が2倍になる根拠は以下のようになる。プレイヤーが初めに選んだドアをA、残りのドアをB、Cとする。プレイヤーが初めのドアを選んだ時点で、それぞれのドアに景品がある確率と、モンティがそれぞれのドアを開ける確率を表にすると次のようになる。
モンティが開けるドア | 合計 | ||||
A(プレイヤー) | B | C | |||
景品があるドア | A | 0 | 1/6 | 1/6 | 1/3 |
B | 0 | 0 | 1/3 | 1/3 | |
C | 0 | 1/3 | 0 | 1/3 | |
合計 | 0 | 1/2 | 1/2 | 1 |
ここでモンティがBのドアを開ける確率は全体の1/2であるが、これは、Aのドアに景品があってモンティがBのドアを開ける確率 (1/6)、Bのドアに景品があってモンティがBのドアを開ける確率 (0)、Cのドアに景品があってモンティがBのドアを開ける確率 (1/3) の合計である。表をよく見れば分かるとおり、もしモンティがBのドアを開けたならば、A(プレイヤーが初めに選んだドア)の後ろに景品がある確率に比べ、Cの後ろに景品がある確率が2倍なのは明らかである。
また、当たりのドアを選ぶ確率は 1/3、ハズレのドアを選ぶ確率は 2/3 である。当たりを選んだとき第2のドアで当たる確率は 0%、ハズレを選んだとき第2のドアで当たる確率は 100% である。したがって、
- 第2のドアで当たる確率 = (1/3)×0 + (2/3)×1 = 2/3
同様にして、
- 最初のドアで当たる確率 = (1/3)×1 + (2/3)×0 = 1/3
この結果を次のように考えることができる。第2のドアに替えた場合、最初に当たりだとハズレになり、逆にハズレだと当たりになる。したがって、最初のドアで「当たり、ハズレ、ハズレ」が起こっていたものが、第2のドアでは「ハズレ、当たり、当たり」が起こることになる。すなわち、第2のドアでは「当たり」と「ハズレ」の確率が完全に逆転する。
最初のドアでは「ハズレ」の方が多いので、当然「当たり」の方が多くなる第2のドアを選択すべきである。当たる確率は 1/3 から 2/3 へ増加し、1/3 増えることになる。
シミュレーション
簡単なシミュレーションによって答えを導くこともできる(図)。 グラフでは、変更したドアに景品があった回数の累計が、変更しなかった場合の約2倍となっている。
変形問題
ルールを変更することで例題の理解を助けたり、統計論の別の課題を説明する試みが行われている。
変更ルール1
(4) モンティは景品のあるドアを知っている。どちらを開けるかコイントスで決めるが、選んだドアが景品の場合はもう片方のドアに変更する。
このルールは結局ドアの選び方に変化はないので、解答は「開けるドアを変更する」である。
変更ルール2
(4) モンティは景品のあるドアを知らない。どちらを開けるかコイントスで決めるが、選んだドアが景品の場合は番組スタッフが中身を入れ替える。
これは、前のルールで最後にモンティがドアの選択を変更していたところをスタッフが代わりにやっているだけであり、解答は「開けるドアを変更する」である。
このルールではドアを変更したほうがよいことが直感的に分かる。残ったドアに景品が移動してくることはあっても、出ていくことはないからである。数値で示すと、プレイヤーが最初から正解していた確率は 1/3、モンティが正解して景品が移動した確率も 1/3、二人ともハズレであった確率も 1/3 である。景品は必ず最後の扉に移動するので、最後の扉に景品がある確率は 2/3 である。
変更ルール3
(4) モンティはどちらを開けるかコイントスで決め、中身にかかわらず開ける。
モンティが景品を出してしまった場合はゲーム終了と仮定して、モンティがヤギを出したらプレイヤーはドアを変更すべきだろうか?この場合の正解はどっちを選んでも確率は 1/2 となり、変更してもしなくてもよいのである。
モンティが景品を出す確率は1/3、ヤギを出す確率は 2/3 である。景品を出したらゲームは終了するので、ヤギを出した2/3の内訳を考えると、プレイヤーが選んだドアに景品がある確率1/3と、最後のドアにある確率1/3になる。 この場合、プレイヤーもモンティも正解に関係なくドアを選ぶので、先に景品を入れる必要はなく、後から景品の位置をランダムに決めても結果は等価となる。
変更ルール4
(3) モンティは景品のあるドアを知っている。コイントスでヤギのドアの片方を選び、プレイヤーの選択にかかわらず開ける。
モンティがプレーヤーの選んだドアを選んだ場合はゲーム終了と仮定して、モンティがヤギを出したらプレイヤーはドアを変更すべきだろうか?この場合も変更ルール3同様、変更してもしなくてもよいのである。
変更ルール5
(3) モンティは景品のあるドアを知っている。プレイヤーが景品のあるドアを選んだ時に限り、ドアを開ける。
このように変更すると、モンティがドアを開けない場合がある。もし、偶然にもモンティがドアを開けたとすると、プレイヤーはドアを変更すべきだろうか?この場合は当然答えは「開けるドアを変更しない」である。 このことから、モンティがドアを必ず開けるというルールは非常に重要だということが分かる。
悪魔モンティ
(5) モンティは景品のあるドアを知っていて、プレイヤーが景品のあるドアを選んだ時だけ、変更してよいという[7]。
天使モンティ
(5) モンティは景品のあるドアを知っていて、プレイヤーがヤギのいるドアを選んだ時だけ、変更してよいという[7]。
心理戦
プレーヤーとモンティの心理戦を想定した例題も試みられている。駆け引きの内容を数値化することで、統計論的に解を求めることができる。
(5) モンティは景品のあるドアを知っていて、プレイヤーが景品のあるドアを選んだ時は100%、ヤギのいるドアを選んだ時は50%の確率で、プレーヤーが選ばなかったヤギのいるドアを開けて見せ、変更してよいという。
ナッシュ均衡による解では、変更したときに景品を得る確率は1/2となる。つまり、変更してもしなくても変わらない[7]。
数学的解説
もとの例題ではルール (3) と (4) が重要とされるのが一般的だが、実はもう一つ重要な前提がある。それは、「プレイヤーが最初に当たりを選んだ場合に、モンティが残るドアのどちらを開けるかについて "癖がない(ランダムに選ぶ)" ことだ。例えば「出演者が最初に当たりのドアAを選んだ場合は必ずBを開く」という可能性もあるとすれば、「マリリンの解答は間違っている」というのも必ずしも間違いではない。ここで、「癖がない(ランダムに選ぶ)」ことがいかに重要であるか、具体的に説明する。
出演者がドアAを選んだ場合にモンティがドアBを選択する(選択して開ける)確率をxとすると、ドアBが開いた(もちろん外れ)という条件のもとで、ドアAが当たりである確率はx/(1+x)となる(もちろん、ドアCが当たりである確率は1/(1+x)である。)。
計算法
ドアBが開いたということは、プレイヤーがドアCを選択したかドアAを選択したということである。ドアCを選択した場合は必ず(確率1で)ドアBを開き、ドアAを選択した場合は、確率xでドアBを開くのであるから、ドアBが開いたという条件で、ドアAが当たりである確率は、xを1+xで割れば求められる。
よって、確率xが0から1の間の数値を取るとすれば、ドアAが当たりである確率は0から1/2まで変化する(ドアCが当たりである確率は1から1/2まで変化する)。ドアB、Cをランダムに(x=1/2の確率で)選択したときに限って、ドアAが当たりの確率は1/3のまま(ドアCが当たりの確率は当初の1/3から2/3に上がる)となる。マリリンの答えは、この特殊な条件を想定したものである。確かに常識的仮定だが、数学的には当然視できるものではない。
脚注
参考文献
- テンプレート:Cite book
- テンプレート:Cite web
- テンプレート:Cite book
- テンプレート:Cite book
- テンプレート:Cite book
- テンプレート:Cite book - 原タイトル: The man who loved only numbers.
- テンプレート:Cite book - ホフマン 2000の文庫版。
- テンプレート:Cite book
関連項目
外部リンク
- 数字トリック見破り術 - NHK「ためしてガッテン」、2011年7月6日放送
- ネコでもわかるモンティホールジレンマ