• ベストアンサー
  • すぐに回答を!

混合戦略の求め方を教えて下さい!(非ゼロ和ゲーム)

A,Bの2人がいる非ゼロ和ゲームにおいて (A,B) (ドラマ、ドラマ)=(7,3) (ドラマ、バラエティ)=(4,6) (バラエティ、ドラマ)=(5,5) (バラエティ、バラエティ)=(6,4) という利得行列があります。 これについて、混合戦略を求めたいのですが、 Aがドラマを選択する確率をp、バラエティを1-p Bがドラマを選択する確率をq、バラエティを1-q とすると、 E(A)=7pq+5(1-p)q+4p(1-q)+6(1-p)(1-q) =7pq+5q-5pq+4p-4pq+6-6q-6p+6pq =4pq-q-2p+6 =(4p-1)q-2(p-3) ∴0≦p≦1/4 とここまでは分かったのですが、答えをどう出せばいいのかわかりません。 qの範囲も出した方がいいのでしょうか? そして、このpの範囲は、何の意味があるのでしょうか? どなたか、教えて下さい!!

共感・応援の気持ちを伝えよう!

  • 回答数5
  • 閲覧数1893
  • ありがとう数6

質問者が選んだベストアンサー

  • ベストアンサー
  • 回答No.5
noname#108554
noname#108554

大きな間違いをしてしまいました。すみません。 playerAが動かせる変数はpなので、E(A)をpでまとめます。すなわち、 E(A)=(4q-2)p-q+6 で、あとはこれを最大にすることを考えるので 4q-2>0でp=1 4q-2<0でp=0 4q-2=0でp=なんでもいい。∴q=1/2 ということで、 >pもqも1/2になりましたが・・・ あってそうですね。

共感・感謝の気持ちを伝えよう!

質問者からのお礼

ありがとうございました テストは無事おわりました。

その他の回答 (4)

  • 回答No.4

ERIeriERIさん、こんばんは。 ゲーム理論については、全く知らないのですが、 下記の参考URLは参考にならないでしょうか。 これによると、 P0={(p1,p2)|0≦p1≦1,0≦p2≦1,p1+p2=1} Q0={(q1,q2)|0≦q1≦1,0≦q2≦1,q1+q2=1} を、各プレーヤーの戦略をとりうる確率の集合とすると、 ここでは、P=(p,1-p)ですが、これがP0の中から選択されたときに Bは、これに対抗して、E(A)が最小となるQ=(q,1-q)をQ0の中で選ぶということになるそうです。 それを、 min{E(P,Q)|Q∈Q0} この最小を minE(P,Q) Q とかくと、Aはこれに対抗して、利益を最大になるように戦略を選ぶので max minE(P,Q) P   Q 一般に、 max minE(P,Q)≦min maxE(P,Q) P   Q       Q   P が成り立つようです。 また、フォン・ノイマンのミニマックス定理より max minE(P,Q)=min maxE(P,Q) P   Q       Q   P となる解が存在し、これを最適戦略というようです。 少しでも参考になればと思ったのですが、ここまでしか分かりません。 「非ゼロ和ゲーム」「ゲーム理論」「利得行列」 などで検索してみますと、参考になりそうなページがいくつかありますので 見てみてください。 試験のほう、頑張ってください。あまりお役に立てずにすみません。

参考URL:
http://ysserve.cs.shinshu-u.ac.jp/Lecture/Optimization1/node8.html

共感・感謝の気持ちを伝えよう!

質問者からのお礼

回答ありがとうございます。 テストは無事終わりました。

  • 回答No.3
noname#6201
noname#6201

ANo.#1の方のご指摘どおりですが、もう少し説明を加えるとAが戦略を立てる場合に、Bがどう出るかを考慮するのが混合戦略なので、Aの期待利得E(A)をBがどう出るかに関する確率qの方程式と考え、方程式の最大化問題と捉えます。 この問題設定はそのまま「ゲーム理論入門」日経文庫―経済学入門シリーズ・武藤 滋夫 (著) にあるのでそちらを参照するのが良いでしょう。 #試験に間に合うのであれば、ですが。

共感・感謝の気持ちを伝えよう!

質問者からのお礼

ありがとうございました、 テストは無事終わりました

  • 回答No.2
noname#108554
noname#108554

どうでもいいつけたしで間違えました。 ×ゼロサムですがコンスタントサムなので本質はゼロサムですね。 ○非ゼロサムですがコンスタントサムなので本質はゼロサムですね。

共感・感謝の気持ちを伝えよう!

質問者からの補足

#3の方の本を借りに行ったのですが、図書館は休館日、本屋にはなかったので、、、 去年違う授業で習った方法でやってみました。 pもqも1/2になりましたが・・・ これで合ってるのでしょうか・・

  • 回答No.1
noname#108554
noname#108554

ゼロサムですがコンスタントサムなので本質はゼロサムですね。 ま、本筋には関係ないのでどうでもいいですが。 それと、なぜいきなり ∴0≦p≦1/4 という結論が出てくるのか分かりませんが、 E(A)=(4p-1)q-2(p-3) がどこで最大になるか考えてみると、 4p-1が正ならq=1 4p-1が負ならq=0 4p-1が0ならqはどの値でも最適戦略 ということで、横軸p、縦軸qとして どこの点で最良戦略が取られているかを図示すれば よいでしょう。

共感・感謝の気持ちを伝えよう!

質問者からの補足

回答ありがとうございます。 混合戦略をあまりよく理解できていないのですが、 明日テストのため、何かパターンがあれば・・・と思っています。 Aの最適戦略を求めるときは、qの最大値を求めればいいということでしょうか? 逆にBのときはpの最大値を求めることになりますか? 確かにこの問題の最後に図示して解答するように と書いてありますので、 図示する方が考えやすいということなのでしょうか。 本質を理解していない上で質問しているので、 何言ってるんだ?とお思いになるかと思いますが。。。 よろしくお願いします。

関連するQ&A

  • 3×2行列の混合戦略のナッシュ均衡の問題

    1 / 2 戦略1 戦略2 戦略1 4,0 2,5 戦略2 1,2 5,1 戦略3 2,6 3,3 この混合戦略のナッシュ均衡を解くことができません。 1が戦略1・2・3をとる確率をそれぞれp、q、1-p-q、2が戦略1・2をとる確率をs、1-sとおいて、期待利得を導くまではできるのです。 1の期待利得 戦略1:4s+2(1-s)=2s+2 戦略2:s+5(1-s)=-4s+5 戦略3:2s+3(1-s)=-s+3 2の期待利得 戦略1:2q+6(1-p-q)=-6p-4q+6 戦略2:5p+q+3(1-p-q)=2p-2q+3 まず1ですが、期待利得が2種類である2×2行列と違って、期待利得が3種類存在します。 また、2については変数がp・qの2種類あるので、どう処理してよいものかわかりません。 支配戦略が存在しないので、消去して2×2行列にするわけでもなさそうです。 ここから先の解法を教えてください。よろしくお願いします。

  • 混合戦略のナッシュ均衡について

    次のような問題です。 プレイヤー1は確率pでUを、確率1-pでDを選択する。 同様に、プレイヤー2は確率qでLを、確率1-qでRを選択する。 (プレイヤー1の利得、プレイヤー2の利得)は UかつL→(1,1) UかつR→(1,0) DかつL→(0,1) DかつR→(-1,-1)である。 このとき、混合戦略でのナッシュ均衡(p*,q*)を求めよ。 プレイヤー1の反応関数を求めるとR1(q)=(2-p)q+1-pとなって、最適なp*が1を超えてしまい、詰まってしまいました。 どのように解けばいいのでしょうか…回答よろしくお願いします。

  • 混合戦略ナッシュ均衡について

       D    E A(2,2)  (4,8) B(5,6)  (3,3) という利得表の同時手番ゲームを考える問題についてなのですが、この場合の純粋戦略って(4,8)(5,6)ですよね。 そして混合戦略ナッシュ均衡を含めて考えた時、プレイヤー1と2の最適反応(赤=1、青=2)を図示したのですが以下のようになりました。(プレイヤー1がAを取る確率p、2がDを取る確率q) 下の図で丸を付けた箇所が均衡なのは知っているんですが、この場合答えの表記の仕方はどうなるんでしょうか・・?また、純粋戦略で求めた以外での混合戦略ナッシュ均衡において実現する量プレイヤーの期待利得を求めよ。との問いもあるのですが、だんだんわからなくなってきました・・。お時間のある方どうぞよろしくお願いいたします。

  • ゲーム理論の混合戦略の求め方

    混合戦略についての質問です。 a b A 3,2 0,0 B 0,2 3,1 C 1,0 1,3 このゲームの混合戦略が分かりません。 解答には「A,B,Cをそれぞれ1/2,1/2,0の確率でとる 」という混合戦略が、純粋戦略Cを強く支配するとあるのですが、なぜこうなるのか分かりません。 どなたか分かる方、教えてください。よろしくお願いします。

  • 展開型ゲームにおける混合戦略

    展開型ゲームにも混合戦略均衡ってあるんですか?完全・完備情報は仮定されてます。例えばプレイヤーが2人いて始めのプレイヤーはどうやっても行動が観測されてしまうから彼に混合戦略はないですよね?でも後に動くほうは混合戦略を持つことによって前者の行動を規定できるとも思うのですが、考え方・計算の仕方共にはっきりとしません。各自2つの戦略を持っているとして、ノーマルフォームに置き換えると8通りの戦略の組み合わせができるのですが、後者の4つの戦略に確率を振り分けるとpと1-pのように簡単には行きません。考え方をご教示くださいませ。

  • 2人ゲームのゲーム値と最適戦略

    行列ゲームの2人ゲーム問題を解いていて最後のところで詰まってしまいました。 得点行列で与えられる2人ゲームのゲーム値と最適戦略を求める問題で、 1 -1 -1 -1 -1 3 -1 2 -1 シンプレックス法を用いて、次のように求めました。 1 0 0 1/2 0 0 1/2 0 0 1 0 1/4 0 1/4 0 1 0 0 0 1/3 1/3 0 0 0 1/2 1/4 1/3 7/12 ゲーム理論の本を読みながらここまで頑張ってみたのですが、 どの部分がゲーム値と最適戦略になるのかが理解できませんでした。 どなたかご教授お願いいたします。

  • ゲーム理論

    混合戦略の範囲でのナッシュ均衡 けんとたけしという2人がいます。 けんとたけしは共に混合戦略をとり、けんが純粋戦略uをとる確率p(0≦p≦1) たけしがとる純粋戦略Lをとる確率q(0≦q≦1) 以上の条件があって けんとたけしがとる戦略によってとる利得は次のようになる。 けん;(u,L)=(a,b) (u,R)=(0,0) たけし;(D,L)=(0,0) (D,R)=(c,d) ただしa,b,c,dは正の定数 このとき 混合戦略の範囲でナッシュ均衡はありますか?

  • 純粋戦略ナッシュ均衡について

      D    E    F A(4,4) (0、0) (7,0) B(0,0) (1,1) (0,0) C(0,7) (0,0) (6,6) (プレイヤー1の利得、プレイヤー2の利得) A,B,Cはプレイヤー1の選択、 D,E,Fはプレイヤー2の選択であり、 プレイヤー1と2が同時に独立に選択する場合の、純粋戦略ナッシュ均衡はどうなるのでしょうか? 何冊かテキストのゲーム理論の部分を読んでみましたが、いまいち純粋戦略ナッシュ均衡とはなんなのか理解できないので、どなたか教えていただけると助かります。 問題には、純粋戦略ナッシュ均衡を全て挙げよと書いてあるのですが、ナッシュ均衡は、相手の選択を所与のものとした場合に、他の選択肢を選んでも、利得が増えることのない選択のことですよね? 一つのゲームにいくつもあるものなのでしょうか? 素人な質問ですみませんが、よろしくおねがいいたします。

  • テストのミクロがわからなくて困っています。助けてください。

    個人A,Bがそれぞれ2種類の戦略を持つゲームの利得行列が    B,1   B,11 A,1 (3,3) (0,4) A,11(4,0)(1,1) この小()は大()で、一まとまりになっていなす。 で与えられている。但し、(a,b)は、個人Aの利得がaで個人Bの利得がbであることを意味する。 (1)戦略11は個人A,Bの支配戦略であることを示せ。 (2)このゲームのナッシュ均衡をすべて求めよ。 (3)このゲームは囚人のジレンマと呼ばれる状況になっていることを説明せよ。 この問題を、どうか教えてください。お願いします。

  • ナッシュ均衡について

    戦略型ゲームG1を以下のように定義する。 ・プレイヤーは1と2の二名 ・プレイヤーi(i=1、2)の戦略集合は0以上1以下の実際の集合。すなわち、{x|x∈R、0≦x≦1} ・各プレイヤーの利得は以下のように決定される: プレイヤーi(i=1、2)が戦略xiを選んだとする。この時x1+x2≦1ならば、xiの値 がそのままプレイヤーiの利得となる。x1+x2>1ならば、両者の利得は0となる。 このゲームの純粋戦略ナッシュ均衡をすべて求めよ。 下の戦略型ゲームG2の混合戦略ナッシュ均衡をすべて求めよ。(被強支配戦略の繰り返し削除に注意)    a b c A(1,3) (3,0) (2,-1) B(3,0) (2,6) (0,2) C(0,4) (1,0) (3,-1) この二つの問題がまったくわかりません。解き方と答えがもしわかる方いましたら教えてください。 お願いします。