アクセス解析
トップページ   ご挨拶   ゲーム理論   囚人のジレンマ   掲示板   ポリシー

ネットワークゲーム・囚人のジレンマ

囚人のジレンマとは

囚人のジレンマとは、ゲーム理論に関係するある事象というか状態のことで、ゲームの参加者 がそれぞれに自分にとっての最高の戦略を選んだにもかかわらず、かえって自分にとって不利な状況に陥ってしまうケースを表します。

具体的にはこんな状態のことを言います。

2人の犯罪者“A”と“B”がつかまり留置された。罪状は窃盗である。2人には窃盗の他に 詐欺の容疑もかかっていたが、そちらは証拠が掴めないでいた。取調べ担当官は“A”と“B”を別々の部屋に入れ、こう語りかけた。

取調官「お前達の現在の罪状は窃盗だ。しかしお前らには詐欺の容疑もかかっている。素直に白状したらどうだ」

“A”「何の話だかわかりませんね」 取締官「自白しないならそれでもいいが、“B”が自白した場合、主犯はお前ということになりお前は罪の殆どをかぶることになる。8年は出てこれない。その代わり“B”の罪状は大幅に酌量され1年程度の拘留になる。」

“A”「…二人そろって自白したら?」

取調官「窃盗と詐欺で5年だ。」

“A”は考えた。もし自分が自白しないまま“B”が自白してしまったら自分ばかりが割を食 うことになる。が、もし自分も“B”も黙っていれば、窃盗のみの罪で3年程度だ。果たして、 “B”は黙っているのか。それならいっそ自分が自白するか。そうすれば主犯は“B”になり、 自分は1年で出られる。しかし“B”も同じことを考えるはずだ。自分だけ助かろうとして自 白する可能性は大きい。だからといって証拠の挙がっていない詐欺の容疑までむざむざと認め てしまうのか。

損得表を作ってみよう。

A\B 黙秘 自白
黙秘 A(3年)B(3年) A(1年)B(8年)
自白 A(1年)B(8年) A(5年)B(5年)

“A”、“B”とも願うことは単純である。相手が黙秘してくれることだ。自分が黙秘しよう が自白しようが、相手が黙っていてくれれば自分の罪が軽くなる。

そして共に黙っていれば詐欺の罪が発覚することも無い。悪くないはずだ。しかしそうはならないのである。なぜか。

理由は2つ考えられる。1つは恐怖である。自分が黙秘して相手が自白してしまった場合、必要以上の罪をかぶる羽目になる。

それだけは避けたい。 もう1つが誘惑である。相手が黙秘しているならば、自分だけが自白してしまえば罪が大幅に免除される。これは魅力的である。 この恐怖と誘惑により結局は自白を選ばざるを得ない。と、こんな具合に「あらゆる条件において最良の結果になる」ように行動したはずなのに結果 はどうもうまくない、というところが「ジレンマ」という所以です。

これを一般的に表にすると

C:協力(Cooperation)、D:裏切り(Defercrion) 効用の条件:S<P<R<T、2R>S+T

Preiyer.1\Player.2
(R,R) (S,T)
(T,S) (P,P)

S:聖人(=Saint) P:制裁(=Punishiment) R:報酬(=Reward) T:誘惑(=Temptation)

囚人のジレンマは社会問題のカプセルといわれ、簡単な1枚の表と説明だけで社会科学の本質を表現しえてい るという点で、その説明力は類例を見出しがたいものがあります。 互いに協調する戦略は妥協点としては悪くないにもかかわらず、実際の状況においてはこの部分には落ち着かない場合が殆どです。

囚人のジレンマにおいては(C,C)はパレート最適(両者にとって望ましい状態ではあ るが、ナッシュ均衡点(互いにベストな状態)ではないからです。囚人のジレンマを拡張して,(C,C)を安定化す る試みがなされてはいるものの、これは大変難しく、完全に成功しているとはいえません。(C,C)が何らかの 意味で優れた戦略であることは自明なのですが。

そこで、事態を(C,C)戦略に導く有効な方法を考えたのが社会心理学者ラパホート(A.Rapoport)です。

TIT-FOR-TAT戦略「繰り返し囚人のジレンマ」 t=1無条件にC t≧3:t-1において相手プレイヤーがCならCt-1において相手プレーヤーがDならD これは、囚人のジレンマを複数回行う場合、最初は無条件に協調する、その後は相手が裏切ったら裏切りを、 協調ならば協調を示す戦略を意味します。この戦略を「しっぺ返し」と呼びます。

政治学者アクセルロッド(R.Axelrod)は、コンピューターを使い繰り返し囚人のジレンマのシミュレートを行いま した。囚人のジレンマの利得表を使用したプログラム同士の対戦を行い、どの戦略が一番好成績を挙げるかを実験をしました。

その結果、「しっぺ返し」は各種の戦略プログラムの中で、もっとも高い得点をあげました。 これによりゲーム理論、政治学、コンピュータサイエンス、生物学、倫理学などの今後の展開に大きな刺激と可能 性が与えられました。

上記の戦略は、森羅愛の生成と維持の長期的効率管理という内容をもち、互いに協力(C戦略)には協力で、裏 切り(D戦略)には裏切りで答えることで、相手が裏切りに出ることは相手自身のためにならないことを行為でシグ ナルするというものです。人は長い付き合いを前提とした場合、「利己的に相手を思いやれる」可能性があるので す。このように、ゲーム理論、とりわけ囚人のジレンマの考え方は我々の意思決定に際して大いに関与していることがわかっています。

 

ゲームに参加する

トップページご挨拶ゲーム理論囚人のジレンマ掲示板ポリシー

新・囚人のジレンマ