• ベストアンサー

混合戦略の求め方を教えて下さい!(非ゼロ和ゲーム)

A,Bの2人がいる非ゼロ和ゲームにおいて (A,B) (ドラマ、ドラマ)=(7,3) (ドラマ、バラエティ)=(4,6) (バラエティ、ドラマ)=(5,5) (バラエティ、バラエティ)=(6,4) という利得行列があります。 これについて、混合戦略を求めたいのですが、 Aがドラマを選択する確率をp、バラエティを1-p Bがドラマを選択する確率をq、バラエティを1-q とすると、 E(A)=7pq+5(1-p)q+4p(1-q)+6(1-p)(1-q) =7pq+5q-5pq+4p-4pq+6-6q-6p+6pq =4pq-q-2p+6 =(4p-1)q-2(p-3) ∴0≦p≦1/4 とここまでは分かったのですが、答えをどう出せばいいのかわかりません。 qの範囲も出した方がいいのでしょうか? そして、このpの範囲は、何の意味があるのでしょうか? どなたか、教えて下さい!!

質問者が選んだベストアンサー

  • ベストアンサー
noname#108554
noname#108554
回答No.5

大きな間違いをしてしまいました。すみません。 playerAが動かせる変数はpなので、E(A)をpでまとめます。すなわち、 E(A)=(4q-2)p-q+6 で、あとはこれを最大にすることを考えるので 4q-2>0でp=1 4q-2<0でp=0 4q-2=0でp=なんでもいい。∴q=1/2 ということで、 >pもqも1/2になりましたが・・・ あってそうですね。

ERIeriERI
質問者

お礼

ありがとうございました テストは無事おわりました。

その他の回答 (4)

回答No.4

ERIeriERIさん、こんばんは。 ゲーム理論については、全く知らないのですが、 下記の参考URLは参考にならないでしょうか。 これによると、 P0={(p1,p2)|0≦p1≦1,0≦p2≦1,p1+p2=1} Q0={(q1,q2)|0≦q1≦1,0≦q2≦1,q1+q2=1} を、各プレーヤーの戦略をとりうる確率の集合とすると、 ここでは、P=(p,1-p)ですが、これがP0の中から選択されたときに Bは、これに対抗して、E(A)が最小となるQ=(q,1-q)をQ0の中で選ぶということになるそうです。 それを、 min{E(P,Q)|Q∈Q0} この最小を minE(P,Q) Q とかくと、Aはこれに対抗して、利益を最大になるように戦略を選ぶので max minE(P,Q) P   Q 一般に、 max minE(P,Q)≦min maxE(P,Q) P   Q       Q   P が成り立つようです。 また、フォン・ノイマンのミニマックス定理より max minE(P,Q)=min maxE(P,Q) P   Q       Q   P となる解が存在し、これを最適戦略というようです。 少しでも参考になればと思ったのですが、ここまでしか分かりません。 「非ゼロ和ゲーム」「ゲーム理論」「利得行列」 などで検索してみますと、参考になりそうなページがいくつかありますので 見てみてください。 試験のほう、頑張ってください。あまりお役に立てずにすみません。

参考URL:
http://ysserve.cs.shinshu-u.ac.jp/Lecture/Optimization1/node8.html
ERIeriERI
質問者

お礼

回答ありがとうございます。 テストは無事終わりました。

noname#6201
noname#6201
回答No.3

ANo.#1の方のご指摘どおりですが、もう少し説明を加えるとAが戦略を立てる場合に、Bがどう出るかを考慮するのが混合戦略なので、Aの期待利得E(A)をBがどう出るかに関する確率qの方程式と考え、方程式の最大化問題と捉えます。 この問題設定はそのまま「ゲーム理論入門」日経文庫―経済学入門シリーズ・武藤 滋夫 (著) にあるのでそちらを参照するのが良いでしょう。 #試験に間に合うのであれば、ですが。

ERIeriERI
質問者

お礼

ありがとうございました、 テストは無事終わりました

noname#108554
noname#108554
回答No.2

どうでもいいつけたしで間違えました。 ×ゼロサムですがコンスタントサムなので本質はゼロサムですね。 ○非ゼロサムですがコンスタントサムなので本質はゼロサムですね。

ERIeriERI
質問者

補足

#3の方の本を借りに行ったのですが、図書館は休館日、本屋にはなかったので、、、 去年違う授業で習った方法でやってみました。 pもqも1/2になりましたが・・・ これで合ってるのでしょうか・・

noname#108554
noname#108554
回答No.1

ゼロサムですがコンスタントサムなので本質はゼロサムですね。 ま、本筋には関係ないのでどうでもいいですが。 それと、なぜいきなり ∴0≦p≦1/4 という結論が出てくるのか分かりませんが、 E(A)=(4p-1)q-2(p-3) がどこで最大になるか考えてみると、 4p-1が正ならq=1 4p-1が負ならq=0 4p-1が0ならqはどの値でも最適戦略 ということで、横軸p、縦軸qとして どこの点で最良戦略が取られているかを図示すれば よいでしょう。

ERIeriERI
質問者

補足

回答ありがとうございます。 混合戦略をあまりよく理解できていないのですが、 明日テストのため、何かパターンがあれば・・・と思っています。 Aの最適戦略を求めるときは、qの最大値を求めればいいということでしょうか? 逆にBのときはpの最大値を求めることになりますか? 確かにこの問題の最後に図示して解答するように と書いてありますので、 図示する方が考えやすいということなのでしょうか。 本質を理解していない上で質問しているので、 何言ってるんだ?とお思いになるかと思いますが。。。 よろしくお願いします。

関連するQ&A

  • 3×2行列の混合戦略のナッシュ均衡の問題

    1 / 2 戦略1 戦略2 戦略1 4,0 2,5 戦略2 1,2 5,1 戦略3 2,6 3,3 この混合戦略のナッシュ均衡を解くことができません。 1が戦略1・2・3をとる確率をそれぞれp、q、1-p-q、2が戦略1・2をとる確率をs、1-sとおいて、期待利得を導くまではできるのです。 1の期待利得 戦略1:4s+2(1-s)=2s+2 戦略2:s+5(1-s)=-4s+5 戦略3:2s+3(1-s)=-s+3 2の期待利得 戦略1:2q+6(1-p-q)=-6p-4q+6 戦略2:5p+q+3(1-p-q)=2p-2q+3 まず1ですが、期待利得が2種類である2×2行列と違って、期待利得が3種類存在します。 また、2については変数がp・qの2種類あるので、どう処理してよいものかわかりません。 支配戦略が存在しないので、消去して2×2行列にするわけでもなさそうです。 ここから先の解法を教えてください。よろしくお願いします。

  • 混合戦略のナッシュ均衡について

    次のような問題です。 プレイヤー1は確率pでUを、確率1-pでDを選択する。 同様に、プレイヤー2は確率qでLを、確率1-qでRを選択する。 (プレイヤー1の利得、プレイヤー2の利得)は UかつL→(1,1) UかつR→(1,0) DかつL→(0,1) DかつR→(-1,-1)である。 このとき、混合戦略でのナッシュ均衡(p*,q*)を求めよ。 プレイヤー1の反応関数を求めるとR1(q)=(2-p)q+1-pとなって、最適なp*が1を超えてしまい、詰まってしまいました。 どのように解けばいいのでしょうか…回答よろしくお願いします。

  • 混合戦略ナッシュ均衡について

       D    E A(2,2)  (4,8) B(5,6)  (3,3) という利得表の同時手番ゲームを考える問題についてなのですが、この場合の純粋戦略って(4,8)(5,6)ですよね。 そして混合戦略ナッシュ均衡を含めて考えた時、プレイヤー1と2の最適反応(赤=1、青=2)を図示したのですが以下のようになりました。(プレイヤー1がAを取る確率p、2がDを取る確率q) 下の図で丸を付けた箇所が均衡なのは知っているんですが、この場合答えの表記の仕方はどうなるんでしょうか・・?また、純粋戦略で求めた以外での混合戦略ナッシュ均衡において実現する量プレイヤーの期待利得を求めよ。との問いもあるのですが、だんだんわからなくなってきました・・。お時間のある方どうぞよろしくお願いいたします。

  • ゲーム理論の混合戦略の求め方

    混合戦略についての質問です。 a b A 3,2 0,0 B 0,2 3,1 C 1,0 1,3 このゲームの混合戦略が分かりません。 解答には「A,B,Cをそれぞれ1/2,1/2,0の確率でとる 」という混合戦略が、純粋戦略Cを強く支配するとあるのですが、なぜこうなるのか分かりません。 どなたか分かる方、教えてください。よろしくお願いします。

  • ゲーム理論

    混合戦略の範囲でのナッシュ均衡 けんとたけしという2人がいます。 けんとたけしは共に混合戦略をとり、けんが純粋戦略uをとる確率p(0≦p≦1) たけしがとる純粋戦略Lをとる確率q(0≦q≦1) 以上の条件があって けんとたけしがとる戦略によってとる利得は次のようになる。 けん;(u,L)=(a,b) (u,R)=(0,0) たけし;(D,L)=(0,0) (D,R)=(c,d) ただしa,b,c,dは正の定数 このとき 混合戦略の範囲でナッシュ均衡はありますか?

  • 混合戦略の期待利得の求め方

    混合戦略に関する問題で期待利得の求め方なのですが たとえば戦略が2つの時は、利得は適当に4と6とでも置きまして 戦略1を選ぶ確立をp、戦略2を選ぶ確立を(1-p)で 4*p+6*(1-p)と成りますよね? 戦略2つまでなら理解できるのですが戦略3つ以上となるとどの様な式になるのでしょうか? 数学に疎くて全く分かりません、先に進めず困っています 分かる方教えてください

  • 展開型ゲームにおける混合戦略

    展開型ゲームにも混合戦略均衡ってあるんですか?完全・完備情報は仮定されてます。例えばプレイヤーが2人いて始めのプレイヤーはどうやっても行動が観測されてしまうから彼に混合戦略はないですよね?でも後に動くほうは混合戦略を持つことによって前者の行動を規定できるとも思うのですが、考え方・計算の仕方共にはっきりとしません。各自2つの戦略を持っているとして、ノーマルフォームに置き換えると8通りの戦略の組み合わせができるのですが、後者の4つの戦略に確率を振り分けるとpと1-pのように簡単には行きません。考え方をご教示くださいませ。

  • ゲーム理論(混合戦略)について

    ゲーム理論(混合戦略)についての質問です。 A_B--(グー)-(チョキ)-(パー)--- (グー) (0,0)(1,-1)(-5,5) (チョキ) (-1,1)(0,0)(2,-2) (パー) (5,-5)(-2,2)(0,0) 次の確率でじゃんけんとする。 プレーヤーA グー:a チョキ:b プレーヤーB グー:X チョキ:Y 上記の場合、 プレーヤーAのベストミックスは(a;1/4 b;5/8 c;1/8) プレーヤーBのベストミックスは(a;1/4 b;5/8 c;1/8) で正しいでしょうか?

  • 純粋戦略ナッシュ均衡について

      D    E    F A(4,4) (0、0) (7,0) B(0,0) (1,1) (0,0) C(0,7) (0,0) (6,6) (プレイヤー1の利得、プレイヤー2の利得) A,B,Cはプレイヤー1の選択、 D,E,Fはプレイヤー2の選択であり、 プレイヤー1と2が同時に独立に選択する場合の、純粋戦略ナッシュ均衡はどうなるのでしょうか? 何冊かテキストのゲーム理論の部分を読んでみましたが、いまいち純粋戦略ナッシュ均衡とはなんなのか理解できないので、どなたか教えていただけると助かります。 問題には、純粋戦略ナッシュ均衡を全て挙げよと書いてあるのですが、ナッシュ均衡は、相手の選択を所与のものとした場合に、他の選択肢を選んでも、利得が増えることのない選択のことですよね? 一つのゲームにいくつもあるものなのでしょうか? 素人な質問ですみませんが、よろしくおねがいいたします。

  • ゲーム理論のトリガー戦略について質問です。

    問題 1\2     A          B A       (5, 5)        (1, 7) B       (7, 1)        (4, 4) 上の基本ゲームを無限に繰り返す。2による戦略「Bから始めるトリガー」に対して、すべての部分ゲームで最適反応となる1の戦略はどのようなものか。また、その時の利得の系列はどうなるか。 どなたか教えてください、お願いしますm(__)m