• 締切済み
  • すぐに回答を!

ゲーム理論のトリガー戦略について

ぜひ教えてください。次の問題がわからなくて困っています。 ゲーム理論のトリガー戦略についての問題なのですが、 次の利得表において、              B         協調     裏切り    (左:Aの利得、右、Bの利得)   協調  (20、20) (0、30) A 裏切り (30、0)  (10、10) 1回目は必ず協調、それ以降、(t-1)回目に相手が裏切れば、t回目以降は両方とも裏切るという無限回繰り返しゲームにおいて、(どちらも協調)が成立する割引因子aを求めよ。  という問題なのですが、答えは、0.5になるのだそうですが、導出過程がわかりません。どなたか教えていただけませんでしょうか。よろしくお願いします。

共感・応援の気持ちを伝えよう!

  • 回答数1
  • 閲覧数6735
  • ありがとう数23

みんなの回答

  • 回答No.1

クールノー・ナッシュ均衡は(協調,協調)であることは理解しているでしょうか? ここで求める割引因子とは協調しているほうが両者にとってより大きな利得が得ら れる割引率のことです。 Aの行動を考えて見ます。 1回目は『協調』,2回目に『裏切り』とすると,2回目のBの行動はまだ『協調』 です。3回目からBも『裏切り』を選んでくるので,このときの利得は, 20a+30*(a^2)+10*(a^3)+10*(a^4)+.....=P となります。 次に,AもBもずっと『協調』していたときの利得は, 20a+20*(a^2)+20*(a^3)+20*(a^4)+.....=Q Q>Pであればよいのですから,これを等比数列の和の公式で計算すると, a>1/2 となります。このとき両者は無差別になります。

共感・感謝の気持ちを伝えよう!

関連するQ&A

  • ゲーム理論? 全く分からず困っています

    いつもお世話になっております. この度は次の問題について質問させていただきます. 問 企業1と企業2は協調することで共同利潤を極大化し,それを半々にシェアしている.2つの企業は互いに裏切らないように引き金戦略を予告し,牽制し合っている.お互い共同利潤を極大化している場合に各々の利潤はπ/2であるとする.この時以下の問いに答えなさい. (1)割引因子をδ(0<δ<1)として,両者が無期限に協調した場合の各々の利潤を求めなさい. (2)企業2はt-1期までは企業1と協調するけれども,t期に裏切ることにより,利潤πを全て獲得しようと考えている.ただし,企業2はいったん自分が裏切ると,その語は企業1が報復として引き金戦略をとることにより,競争の結果利潤がゼロとなることを知っている.このとき,企業2が無期限に協調するか,あるいはt-1期まで協調した後にt期に裏切るか,両者が無差別となる割引因子を求めなさい. このような問題です.いろいろな図書を調べながら,ずっと考えているのですが(1)(2)ともに全く糸口が見つかりません.そもそもδをどう取り扱っていいのかすらわかりません.お分かりの方がいらっしゃいましたら,ヒントをいただけないでしょうか.何卒よろしくお願いいたします.

  • ゲーム理論

    たぶん囚人のジレンマの問題だと思うのですが、先日の情報検定/除法システム試験/システムデザインに出題されました。 マクシミン戦略が最悪の場合の利益は分かるのですが、 添付した、図の見方が分かりません。 ゲーム理論では,複数のプレイヤが存在し,それぞれの行動が影響を及ぼしあう状 況を「ゲーム」ととらえ,そのゲームにおいて,各人の利益にもとづいて相手の行動 を予測し,意思決定を行う。また,実際の戦略においては,相手の行動(将来の状況) を完全に予測することが不可能であり,将来の不確実性を判断する基準にもとづいて, 戦略を決定する。 <設問1> 2人(X氏・Y氏)がそれぞれ2種類の戦略をとる場合の利得が表1のよ うに予想されるとき,次の記述中の (1) に入れるべき適切な字句を解答群から 選べ。 マクシミン戦略において両者の戦略をそれぞれ変えながら各利得を求めてみる。こ こで,表の各欄において,左側の数値がX氏の利得,右側がY氏の利得とする。 X氏の利得は,戦略x1 をとったとき (1) となり,戦略x2 をとったとき (2) となり,両者を比較してより利得の大きい戦略を選択する。同様にY氏の 利得は,戦略y1 をとったとき (3) となり,戦略y2 をとったとき (4) とな り,両者比較してより利得の大きい戦略を選択する。よって, (5) ことになり, (6) となる。 答えは、1:エ 2:イ 3:ウ 4:ア 5:エ  6:イ です。 この手の問題には素人なので、詳しい解説をよろしくお願いします。

  • 無限繰り返しゲームについて教えてください

     両者がとりうる戦略はこの2つ。   企業b   高価格     低価格 企 (15.15) (0.0) 業  A (30.0)  (5.5)  このゲームが無限に繰り返される状況を考える。割引因子δ(0<δ<1)とし、各企業はトリガー戦略をとることと仮定する。トリガー戦略がこの繰り返しゲームのナッシュ均衡となるための、割引因子δの範囲を求めよ。という問題なのですが、教科書やパソコンで調べても全く分かりません。よかったらどなたか教えてください。おねがいします。

  • ゲーム理論 復習

    手詰まりでわかりません。よろしければ教えてください。 企業1と企業2は互いに代替的な製品を生産し販売している。企業xが設定した製品価格をPx万円(x=1、2)としたとき、それぞれの製品に対する需要量は D1=A&#65293;P1+P2 D2=A&#65293;P2+p1  (Aは正の定数) また各社はそれぞれ生産1あたりにC万円の費用がかかる(A>Cとする)。各社は同時手番でそれぞれの利潤を最大化するように自社製品の価格を設定する。 [1]このゲームを一度だけプレイ (1)企業2の製品価格がP2と予想されるときの企業1の反応関数を求めよ (2)ナッシュ均衡での各社の製品価格として正しいのはどれか。 (3)ナッシュ均衡で各社が獲得する利益はいくらか、 (4)企業1がプライスリーダーとする。企業1が先に戦略を決め、それを見た後で企業2が戦略を決める。そのとき部分ゲーム完全なナッシュ均衡でプレイヤー1が設定する製品価格を求めよ。 (5)(4)のとき企業2の設定する製品価格を求めよ。 [2]上記の手番ゲームが無限回繰り返され、毎回の段階ゲームの結果は次の段階ゲームが始まる前に、各企業に観察されるものとする。各企業は共通の割引因子σ(0<σ<1)を用いて各段階ゲームで割引現在価値を最大にするように戦略を選ぶ。各企業はトリガー戦略(戦略Xと呼ぶ)用いることによって均衡経路上では毎回必ずP=2A+Cという製品価格を実現させようとする。戦略Xでは以下のように指定されている。 ・第一回目の段階ゲームおよび過去に互いに設定し続けて迎えた段階ゲームでは価格をP*に設定する。 ・上記以外の段階ゲームでは(2)で求めた価格を設定する。 今企業2が戦略Xをとると予想したとき、企業1が一回目の段階ゲームで戦略X から逸脱すればP1を(6)に設定することが短期的には最適である。逸脱によって得られる利潤の増加分は(7)である。しかしそれを踏まえ企業2も行動が変化するので、二回目以降の毎回の段階ゲームで企業1の獲得する利潤が、先の逸脱によって、少なくとも(8)万円減る。その結果逸脱によって(9)万円の長期的な損失を発生させる。したがって互いに戦略Xをとり続ける必要十分条件は(10)以上の割引因子をもつことである。 (1)&#65374;(10)に答えよ。 という問題です。長いですが、考え方と解答を教えて頂ければと思います。よろしくお願いします。

  • ゲーム理論の問題です。至急お願いします。

    ゲーム理論の問題です。至急、回答よろしくお願いします。 問1 二人のフ&#12442;レイヤー (1 と 2) か&#12441; 100 円を分け合う問題を考える. フ&#12442;レイヤー 1 は x 円オファーし, その後フ&#12442;レイヤー 2 は受託 (A) か拒否 (R) のと&#12441;ちらかを選ふ&#12441;. x は 0 &#8804; x &#8804; 100 の実数て&#12441;あるとする. フ&#12442;レイヤー 2 か&#12441; A を選んた&#12441;場合, フ&#12442;レイ ヤー 1 の取り分は x 円, フ&#12442;レイヤー 2 の取り分は 100 - x 円とする. フ&#12442;レイヤー 2 か&#12441; R を選んた&#12441;場合, 交渉は決裂し両者の取り分は 0 円となる. フ&#12442;レイヤー 1 の取り分を x1 円, フ&#12442;レイヤー 2 の取り分を x2 円とした場合のフ&#12442;レ イヤー 1 の利得は x1, フ&#12442;レイヤー 2 の利得は x2 + β(x2 - x1) て&#12441;与えられるもの とする (β は正の定数). 部分ケ&#12441;ーム完全均衡における各フ&#12442;レイヤーの利得を求 めなさい. 導出過程も書きなさい. ※ フ&#12442;レイヤー2はAを選んて&#12441;もRを選んて&#12441;も利得か&#12441;同し&#12441;場合Aを選ふ&#12441;とする. 問2 ある財の市場て&#12441; 3 つの企業 1, 2, 3 か&#12441;数量競争を行うとする. 各企業の財を一単 位生産するための費用は30て&#12441;あるとする. 企業1か&#12441;x1, 企業2か&#12441;x2, 企業3か&#12441; x3 生産した場合, 市場価格は p = 120 - (x1 + x2 + x3) て&#12441;与えられるとする. こ の時, 各企業i = 1,2,3の利得は, πi(x1,x2,x3) = [120-(x1 +x2 +x3)]xi -30xi となる. ます&#12441;, 企業 1 か&#12441;最初に生産量を選ひ&#12441;, 企業 2 と企業 3 は企業 1 の生産量 を知った上て&#12441;同時に生産量を決定する. 部分ケ&#12441;ーム完全均衡における各企業の 生産量を求めなさい. 導出過程も書きなさい.

  • 最適戦略は?

    次のような2人でやるゲームを考えます。 (1)Aは100ドルを自由に2つに分けます。例えば72ドルと28ドルのように。100ドルと0ドルでもかまいません。 (2)BはAが分けた後、一方を自分(B)のもの、他方を相手(A)のものと決めることができます。 これが1回のゲームです。A,Bとも多く手に入れようと最善を尽くします。 このゲームをn回するとします。A,Bの役割は変わりません。このときの両者の最適戦略は A:毎回50,50に分ける。 B:どっちとっても同じ。 しかありません。ちっとも面白くないゲームです。 なので、ルールをちょい変えます。 (3)Bはn回のうち1回は選択権をAに譲らないといけません。どの回に譲るかは、その回にAが分けた結果を見てBが決めます。 このときAは最善をつくすとBより多く手に入れることができます。 例 n=2 1回目:Aは75ドル、25ドルに分けます。   ここで、Bの行動は2つに分かれます。  分岐1:Bが選択権を行使して、B=75、A=25ゲット  分岐2:Bが選択権をAに譲る。A=75、B=25ゲット 分岐1後の2回目の場合:Aは100ドル、0ドルに分けます。  Bは選択権を譲らないといけません。(1回は譲る必要があるので) なのでA=100、B=0ゲット 分岐2後の2回目の場合:Aは50ドル、50ドルに分けます。  Bは選択権を行使し、B=50、A=50ゲット どちらの場合も、A=計125ドル、B=計75ドルとなります。 これ、何となくnの式で表すことができそうなのですが、なかなかうまく導き出せません。お知恵拝借いたしたく。 

  • ゲーム理論のトリガー戦略について質問です。

    問題 1\2     A          B A       (5, 5)        (1, 7) B       (7, 1)        (4, 4) 上の基本ゲームを無限に繰り返す。2による戦略「Bから始めるトリガー」に対して、すべての部分ゲームで最適反応となる1の戦略はどのようなものか。また、その時の利得の系列はどうなるか。 どなたか教えてください、お願いしますm(__)m

  • 実際の非反転増幅器の入力インピーダンスの導出過程を教えてください

    今まで理想opアンプを勉強してきたので入力インピーダンス=無限で考えてきたのですが、実際のopアンプを使用した非反転増幅器の入力インピーダンスはどうやって導出すれば良いのでしょうか? 資料には、 非反転増幅回路の入力インピーダンス=Zin*(1+R1*Av/(R1+R2)) Zin:opアンプの入力インピーダンス Av:opアンプの電圧利得 R1:入力抵抗 R2:フィードバック抵抗 とだけ書いてあり、導出過程は省略されています。 分かる方がいましたら教えていただけませんか?

  • ナッシュ均衡について

    ナッシュ均衡について勉強をしております。 以下の2問を 回答に至るまでの論理展開含め 回答してくれる方宜しくお願いします。 (1) 囚人のジレンマゲームとなる数値を 用いてゲームを一つ定義し、 以下の問いに応えよ。 このゲームを無限回に繰り返すとき、 トリガー戦略が ナッシュ均衡である条件は何か。 ただし、 割引因子を δ とする。 (2) 混合戦略を許すとき、 親指ゲームにおけるナッシュ均衡を求めよ。 親指ゲームとは2人で戦うゲームで、 はじめにどちらが親になるか決める。 戦略は、 両者ともに親指を上げるか下げるか の2つである。 ゲームでは同時に親指の上げ下げを行い、 二人で立っている親指の合計が 奇数なら親の勝ち、偶数なら子の勝ち というルールである。

  • ゲーム理論(混合戦略)について

    ゲーム理論(混合戦略)についての質問です。 A_B--(グー)-(チョキ)-(パー)--- (グー) (0,0)(1,-1)(-5,5) (チョキ) (-1,1)(0,0)(2,-2) (パー) (5,-5)(-2,2)(0,0) 次の確率でじゃんけんとする。 プレーヤーA グー:a チョキ:b プレーヤーB グー:X チョキ:Y 上記の場合、 プレーヤーAのベストミックスは(a;1/4 b;5/8 c;1/8) プレーヤーBのベストミックスは(a;1/4 b;5/8 c;1/8) で正しいでしょうか?