• 締切済み

ゲーム理論の混合戦略の求め方

混合戦略についての質問です。 a b A 3,2 0,0 B 0,2 3,1 C 1,0 1,3 このゲームの混合戦略が分かりません。 解答には「A,B,Cをそれぞれ1/2,1/2,0の確率でとる 」という混合戦略が、純粋戦略Cを強く支配するとあるのですが、なぜこうなるのか分かりません。 どなたか分かる方、教えてください。よろしくお願いします。

みんなの回答

  • f272
  • ベストアンサー率46% (7995/17088)
回答No.1

実際に,A,B,Cをそれぞれ1/2,1/2,0の確率でとれば,そのときの期待利得は3/2になって,A,B,Cをそれぞれ0,0,1の確率でとる戦略の場合の期待利得1よりも大きくなります。したがって純粋戦略Cを強く支配すると言えます。もっと言えばA,B,Cをとる確率をそれぞれp,q,1-p-qとしたとき,p+q=1である戦略は純粋戦略Cを強く支配します。 プレイヤ1がA,B,Cをとる確率をそれぞれp,q,1-p-q,プレイヤ2がa,bをとる確率をそれぞれr,1-rとするとき,プレイヤ1の期待利得は 3pr+3q(1-r)+(1-p-q)r+(1-p-q)(1-r)=(3r-1)p+(2-3r)q+1 です。したがって r>1/2のときは(3r-1)>(2-3r)だからp=1,q=0で期待利得が最大 r<1/2のときは(3r-1)<(2-3r)だからp=0,q=1で期待利得が最大 r=1/2のときは(3r-1)=(2-3r)だからp+q=1で期待利得が最大 となります。このときrに関わらずp+q=1は満たされています。 プレイヤ2の期待利得は 2pr+2qr+q(1-r)+3(1-p-q)(1-r)=(5p+4q-3)r+3-3p-2q です。p+q=1のときは(5p+4q-3)>0ですからr=1で期待利得が最大 となります。 つまりプレイヤ1はp+q=1となる戦略をとり,するとプレイヤ2はr=1となる純粋戦略をとることになります。そうすればプレイヤ1はp=1,q=0となる戦略をとることになりますが,プレイヤ2はそれでもr=1となる純粋戦略をとります。最終的には戦力はAaで均衡することになるでしょう。

関連するQ&A

  • ゲーム理論(混合戦略)について

    ゲーム理論(混合戦略)についての質問です。 A_B--(グー)-(チョキ)-(パー)--- (グー) (0,0)(1,-1)(-5,5) (チョキ) (-1,1)(0,0)(2,-2) (パー) (5,-5)(-2,2)(0,0) 次の確率でじゃんけんとする。 プレーヤーA グー:a チョキ:b プレーヤーB グー:X チョキ:Y 上記の場合、 プレーヤーAのベストミックスは(a;1/4 b;5/8 c;1/8) プレーヤーBのベストミックスは(a;1/4 b;5/8 c;1/8) で正しいでしょうか?

  • ゲーム理論

    戦略型ゲームGの混合戦略ナッシュ均衡をすべて求めよ。   a  b   c A 1,3 3,0 2,-1 B 3,0 2,6 0,2 C 0,4 1,0 3,-1 ※被強支配戦略の繰り返し消去に注意

  • ゲーム理論

    混合戦略の範囲でのナッシュ均衡 けんとたけしという2人がいます。 けんとたけしは共に混合戦略をとり、けんが純粋戦略uをとる確率p(0≦p≦1) たけしがとる純粋戦略Lをとる確率q(0≦q≦1) 以上の条件があって けんとたけしがとる戦略によってとる利得は次のようになる。 けん;(u,L)=(a,b) (u,R)=(0,0) たけし;(D,L)=(0,0) (D,R)=(c,d) ただしa,b,c,dは正の定数 このとき 混合戦略の範囲でナッシュ均衡はありますか?

  • 展開型ゲームにおける混合戦略

    展開型ゲームにも混合戦略均衡ってあるんですか?完全・完備情報は仮定されてます。例えばプレイヤーが2人いて始めのプレイヤーはどうやっても行動が観測されてしまうから彼に混合戦略はないですよね?でも後に動くほうは混合戦略を持つことによって前者の行動を規定できるとも思うのですが、考え方・計算の仕方共にはっきりとしません。各自2つの戦略を持っているとして、ノーマルフォームに置き換えると8通りの戦略の組み合わせができるのですが、後者の4つの戦略に確率を振り分けるとpと1-pのように簡単には行きません。考え方をご教示くださいませ。

  • 混合戦略ナッシュ均衡について

       D    E A(2,2)  (4,8) B(5,6)  (3,3) という利得表の同時手番ゲームを考える問題についてなのですが、この場合の純粋戦略って(4,8)(5,6)ですよね。 そして混合戦略ナッシュ均衡を含めて考えた時、プレイヤー1と2の最適反応(赤=1、青=2)を図示したのですが以下のようになりました。(プレイヤー1がAを取る確率p、2がDを取る確率q) 下の図で丸を付けた箇所が均衡なのは知っているんですが、この場合答えの表記の仕方はどうなるんでしょうか・・?また、純粋戦略で求めた以外での混合戦略ナッシュ均衡において実現する量プレイヤーの期待利得を求めよ。との問いもあるのですが、だんだんわからなくなってきました・・。お時間のある方どうぞよろしくお願いいたします。

  • 混合戦略の求め方を教えて下さい!(非ゼロ和ゲーム)

    A,Bの2人がいる非ゼロ和ゲームにおいて (A,B) (ドラマ、ドラマ)=(7,3) (ドラマ、バラエティ)=(4,6) (バラエティ、ドラマ)=(5,5) (バラエティ、バラエティ)=(6,4) という利得行列があります。 これについて、混合戦略を求めたいのですが、 Aがドラマを選択する確率をp、バラエティを1-p Bがドラマを選択する確率をq、バラエティを1-q とすると、 E(A)=7pq+5(1-p)q+4p(1-q)+6(1-p)(1-q) =7pq+5q-5pq+4p-4pq+6-6q-6p+6pq =4pq-q-2p+6 =(4p-1)q-2(p-3) ∴0≦p≦1/4 とここまでは分かったのですが、答えをどう出せばいいのかわかりません。 qの範囲も出した方がいいのでしょうか? そして、このpの範囲は、何の意味があるのでしょうか? どなたか、教えて下さい!!

  • ゲーム理論のトリガー戦略について質問です。

    問題 1\2     A          B A       (5, 5)        (1, 7) B       (7, 1)        (4, 4) 上の基本ゲームを無限に繰り返す。2による戦略「Bから始めるトリガー」に対して、すべての部分ゲームで最適反応となる1の戦略はどのようなものか。また、その時の利得の系列はどうなるか。 どなたか教えてください、お願いしますm(__)m

  • ゲーム理論 

    恥ずかしながら追試ということになってしまいそうなので、期末試験問題を復習しようと考えています。 そこで皆様に解説と回答をお教えいただきたく、質問させていただきます。 以下の文章の正誤を応えよ (1)「後出しじゃんけん」のようなゲームはゲームの木で表現すると、手番の時間的推移がわかりやすく理解しやすい。 (2)ゲームの木を使って表現するとき、同じ情報集合に含まれる意思決定節からは必ず同じ数の枝が出ていなければならない。 (3)男女のジレンマゲームは各プレイヤーが支配戦略を一つずつ持っている。 (4)協調の失敗とは、タカハトゲームのように相互に利益をもたらす戦略の組がナッシュ均衡として実現されないことをいう。 (5)すべての情報集合に意思決定節が一つしか含まれていない情報構造のゲームを、完全情報ゲームという。 (6)囚人のジレンマゲームを逐次手番でプレイすれば、ジレンマを解消できる。 (7)ナッシュ均衡はすべてのプレイヤーが単独で戦略を変更するインセンティヴを持たないことを保証するだけであり、複数のプレイヤーが協力して戦略を変更すれば互いに利得を改善できる可能性がある。 (8)ナッシュ均衡の中にプレイヤーのから脅しによって成立すると解釈できるものが含まれるのは、戦略の組み合わせが均衡経路外に対しても最適反応であることが必須だからである。 (9)いわゆる「ペナルティキック」ゲームには純粋戦略のナッシュ均衡は存在しない。 (10)混合戦略のナッシュ均衡において行動Aと行動Bをランダムに選択しているプレイヤーが、どちらか一方の行動だけを選択する純粋戦略に変更しても、そのプレイヤーの期待利得は変わらない。 自分の回答は ○、×、×、○、×、×、○、○、○、× でした。 特に5~10がよくわからないです。解説と回答よろしくお願いします。

  • ゲーム理論

    数学のテキストの中に、ゲーム理論を扱う部分があり、そこに性比ゲームが出てきました。が、どういうゲームの設定なのかが解説されておらず、いきなり式を展開されて、よく理解できません。 一般的に、性比ゲームというのはどのようなルールの下で行われるゲームなのでしょうか?漠然とした質問ですみません。 それと、いくつかの純戦略をある割合で混合した戦略を用いるゲームで「最適反応はいくつかの純戦略を必ず含む」「強意のナッシュ均衡が存在する場合、それは純戦略である」とあったのですが、それは何故ですか?

  • ゲーム理論のトリガー戦略について

    ぜひ教えてください。次の問題がわからなくて困っています。 ゲーム理論のトリガー戦略についての問題なのですが、 次の利得表において、              B         協調     裏切り    (左:Aの利得、右、Bの利得)   協調  (20、20) (0、30) A 裏切り (30、0)  (10、10) 1回目は必ず協調、それ以降、(t-1)回目に相手が裏切れば、t回目以降は両方とも裏切るという無限回繰り返しゲームにおいて、(どちらも協調)が成立する割引因子aを求めよ。  という問題なのですが、答えは、0.5になるのだそうですが、導出過程がわかりません。どなたか教えていただけませんでしょうか。よろしくお願いします。