「囚人のジレンマ」と「ナッシュ均衡」

ゲーム理論の基礎的な概念の一つである「ナッシュ均衡」を、代表例である「囚人のジレンマ」を用いて解説します。

囚人のジレンマ

AとBという人物が共犯で逮捕され、二人は意思疎通ができない別々の部屋で尋問を受けています。

そんな二人に与えられた条件は、

  • どちらか一人が自白し、もう一人が自白しなかった場合、自白した方は無罪、自白しなかった方は懲役10年
  • 二人とも自白しない場合、互いに懲役2年
  • 二人とも自白した場合、互いに懲役5年

の3つです。

この場合、二人は以下のように考えるでしょう。

自分だけ自白すれば、無罪か。しかし、相手も自白してしまったら、二人とも懲役5年か。
となると、二人とも自白しないで、互いに懲役2年で済ませるのがベストだろうか。
……いや、待てよ。もし、相手が自白してしまったら、自分だけが懲役10年になってしまうぞ。

二人にとってメリットが最大になる選択肢は、お互いが自白せずに懲役2年という選択です。

しかし、お互いに意思疎通をはかることができないため、「自白しない」という選択は、相手が自白してしまい、自分が懲役10年になる可能性を否定できません。自分にとってかなりリスクが高くなってしまいます。ベストな選択とは言えません。

相手がどう出るか様々な思考を巡らせると、最も合理的でリスクの少ない選択肢は「自白する」という選択になります。自白すれば、相手が自白しても、最悪懲役5年で済みますし、もし相手が自白しなかった場合は、自分は無罪になるのです。

よって、AとBは二人とも「自白する」を選択して、二人とも懲役5年の刑を受けることになるわけです。

ここでのポイントは、「お互いに自白しなければ、二人とも懲役2年で済んだ」という点です。

自分のメリット・デメリットを優先させると、結果的に、全体としてのベストな選択をすることができないというわけです。

ナッシュ均衡

このようにお互いが利害関係を重視するあまり、最も効率が良い選択ができず、両者とも合理的な選択だと思える立場で均衡が取れている状態を「ナッシュ均衡」といいます。ゲームに参加する各プレーヤーが、互いに対して最適な戦略を取り合っているのです。このような状況が「均衡」と呼ばれるのは、各プレーヤーが互いに最適な戦略を取り合っているため、これ以上戦略を変更する動機を持たない安定的な状況だと言えるからです。

「ナッシュ均衡」は統合失調症を患った数学者であり、ノーベル経済学賞を受賞をしたジョン・ナッシュが提唱したゲーム理論の一つの概念です。

ジョン・ナッシュの実話を元にした映画「ビューティフル・マインド」は有名ですね。

私も見たのですが、統合失調症の友人が2人いるため、色々と共感できる点が多くてとても面白かったです。

参考

ナッシュ均衡とは - コトバンク
日本大百科全書(ニッポニカ) - ナッシュ均衡の用語解説 - 利害の異なる複数の個人あるいは集団が、互いに拘束的な約束を取り交わすことがないような非協力ゲーム状況において、それぞれが自己利益をもっとも大きくすることだけを目的として戦略を選択した場合に生じる均衡状態。「どのプレイヤーも戦...

 

 

 

コメント

タイトルとURLをコピーしました