• ベストアンサー

混合戦略のナッシュ均衡について

次のような問題です。 プレイヤー1は確率pでUを、確率1-pでDを選択する。 同様に、プレイヤー2は確率qでLを、確率1-qでRを選択する。 (プレイヤー1の利得、プレイヤー2の利得)は UかつL→(1,1) UかつR→(1,0) DかつL→(0,1) DかつR→(-1,-1)である。 このとき、混合戦略でのナッシュ均衡(p*,q*)を求めよ。 プレイヤー1の反応関数を求めるとR1(q)=(2-p)q+1-pとなって、最適なp*が1を超えてしまい、詰まってしまいました。 どのように解けばいいのでしょうか…回答よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.3

質問しても返答がないね! ハッキリいいましょう。あなたの >プレイヤー1の反応関数を求めるとR1(q)=(2-p)q+1-pとなって・・ というのは間違い。プレイヤー1の反応関数は R1(q) = 1  ∀qε[0,1] プレイヤー2の反応関数も同様に R2(p) = 1  ∀pε[0,1] となる。

izakoza023
質問者

お礼

回答ありがとうございます。何度もお答えしていただいたのに返答が遅くなってしまい申し訳有りません。ネットを見れない状態が続いておりました… そもそもにして支配戦略である、というところを見落としておりまして、単純に期待利得を計算し、微分した解=0である、という解き方を行なっていたようです。回答を見て納得しましたし、それを踏まえて自分でも計算を行い(1,1)を導出できました。 度重なる呼びかけにも答えられず本当に申し訳ありませんでした。そして、丁寧に教えていただきありがとうございました。

全文を見る
すると、全ての回答が全文表示されます。

その他の回答 (2)

回答No.2

回答No1にまだ納得できませんか?あなたの、プレイヤー1の反応関数はどうやって導かれたのか、示してくれませんか。正しく導かれたかどうか見てみますから。

全文を見る
すると、全ての回答が全文表示されます。
回答No.1

利得マトリックスを書いてみて、チェックしてください。このゲームには両プレイヤーに支配戦略があり、プレイヤー1の支配戦略はU,プレイヤー2の支配戦略はLです。したがって唯一のナッシュ均衡は互いが支配戦略をとる(U,L)です。プレイヤー1にとっては、相手が戦略をどんなにランダマイズしても、Uをとるのが最適であり、同様にプレイヤー2にとってはLをとるのが最適だからです。したがって、混合戦略の記号を使って書くと、(p,q)=(1,1) が唯一のナッシュ均衡です。 フォーマルに議論するなら、プレイヤー2がLを確率qで、Rを確率1-qでとるとき、プレイヤー1が戦略Uをとれば、期待利得はq + (1-q) =1であり、戦略Dをとれば、期待利得は-(1-q) = q - 1である。よって、プレイヤー1がUを確率pで、Dを確率1-pで混合戦略をとったときの期待利得は EΠ1(p,q)=p + (1-p)(q-1) だ。よって、期待利得をpで微分すると、 ∂EΠ1/∂p = 2 -q>0となり、期待利得はpの増加関数、つまり、pを大きくすればするほど、プレイヤー1の期待利得は大きくなる。つまり、p=1のとき、プレイヤー1の期待利得EΠ1は最大になる。対称性によりプレイヤー2もq=1のとき、プレイヤー2の期待利得EΠ2は最大になる。つまり、(p,q)=(1,1)が一意のナッシュ均衡。

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • 混合戦略ナッシュ均衡について

       D    E A(2,2)  (4,8) B(5,6)  (3,3) という利得表の同時手番ゲームを考える問題についてなのですが、この場合の純粋戦略って(4,8)(5,6)ですよね。 そして混合戦略ナッシュ均衡を含めて考えた時、プレイヤー1と2の最適反応(赤=1、青=2)を図示したのですが以下のようになりました。(プレイヤー1がAを取る確率p、2がDを取る確率q) 下の図で丸を付けた箇所が均衡なのは知っているんですが、この場合答えの表記の仕方はどうなるんでしょうか・・?また、純粋戦略で求めた以外での混合戦略ナッシュ均衡において実現する量プレイヤーの期待利得を求めよ。との問いもあるのですが、だんだんわからなくなってきました・・。お時間のある方どうぞよろしくお願いいたします。

  • 純粋戦略ナッシュ均衡について

      D    E    F A(4,4) (0、0) (7,0) B(0,0) (1,1) (0,0) C(0,7) (0,0) (6,6) (プレイヤー1の利得、プレイヤー2の利得) A,B,Cはプレイヤー1の選択、 D,E,Fはプレイヤー2の選択であり、 プレイヤー1と2が同時に独立に選択する場合の、純粋戦略ナッシュ均衡はどうなるのでしょうか? 何冊かテキストのゲーム理論の部分を読んでみましたが、いまいち純粋戦略ナッシュ均衡とはなんなのか理解できないので、どなたか教えていただけると助かります。 問題には、純粋戦略ナッシュ均衡を全て挙げよと書いてあるのですが、ナッシュ均衡は、相手の選択を所与のものとした場合に、他の選択肢を選んでも、利得が増えることのない選択のことですよね? 一つのゲームにいくつもあるものなのでしょうか? 素人な質問ですみませんが、よろしくおねがいいたします。

  • 3×2行列の混合戦略のナッシュ均衡の問題

    1 / 2 戦略1 戦略2 戦略1 4,0 2,5 戦略2 1,2 5,1 戦略3 2,6 3,3 この混合戦略のナッシュ均衡を解くことができません。 1が戦略1・2・3をとる確率をそれぞれp、q、1-p-q、2が戦略1・2をとる確率をs、1-sとおいて、期待利得を導くまではできるのです。 1の期待利得 戦略1:4s+2(1-s)=2s+2 戦略2:s+5(1-s)=-4s+5 戦略3:2s+3(1-s)=-s+3 2の期待利得 戦略1:2q+6(1-p-q)=-6p-4q+6 戦略2:5p+q+3(1-p-q)=2p-2q+3 まず1ですが、期待利得が2種類である2×2行列と違って、期待利得が3種類存在します。 また、2については変数がp・qの2種類あるので、どう処理してよいものかわかりません。 支配戦略が存在しないので、消去して2×2行列にするわけでもなさそうです。 ここから先の解法を教えてください。よろしくお願いします。

  • ゲーム理論

    混合戦略の範囲でのナッシュ均衡 けんとたけしという2人がいます。 けんとたけしは共に混合戦略をとり、けんが純粋戦略uをとる確率p(0≦p≦1) たけしがとる純粋戦略Lをとる確率q(0≦q≦1) 以上の条件があって けんとたけしがとる戦略によってとる利得は次のようになる。 けん;(u,L)=(a,b) (u,R)=(0,0) たけし;(D,L)=(0,0) (D,R)=(c,d) ただしa,b,c,dは正の定数 このとき 混合戦略の範囲でナッシュ均衡はありますか?

  • ナッシュ均衡について

    戦略型ゲームG1を以下のように定義する。 ・プレイヤーは1と2の二名 ・プレイヤーi(i=1、2)の戦略集合は0以上1以下の実際の集合。すなわち、{x|x∈R、0≦x≦1} ・各プレイヤーの利得は以下のように決定される: プレイヤーi(i=1、2)が戦略xiを選んだとする。この時x1+x2≦1ならば、xiの値 がそのままプレイヤーiの利得となる。x1+x2>1ならば、両者の利得は0となる。 このゲームの純粋戦略ナッシュ均衡をすべて求めよ。 下の戦略型ゲームG2の混合戦略ナッシュ均衡をすべて求めよ。(被強支配戦略の繰り返し削除に注意)    a b c A(1,3) (3,0) (2,-1) B(3,0) (2,6) (0,2) C(0,4) (1,0) (3,-1) この二つの問題がまったくわかりません。解き方と答えがもしわかる方いましたら教えてください。 お願いします。  

  • 数学と戦略

    戦略に関する質問です。 次のような戦略ゲームを考えます。 1、2という人物がいて、1については戦略u,D,2については戦略L,R を取ると考えて 以下戦略のとり方によって利得は次のようになります 左から1、2の取る戦略として (u,L)=(a[1],a[2]),(u,R)=(b[1],b[2]) (D,L)=(c[1],c[2]),(D,R)=(d[1],d[2]) このとき (1)戦略(u,L)がナッシュ均衡である (2)a[1]=c[1]のとき純粋戦略ナッシュ均衡が存在する これらがどうして成り立つのか理解できません。

  • プレイヤーが3人のナッシュ均衡

    プレイヤーが3人の時のナッシュ均衡はどう求めればいいのでしょう? 例えば、 3人が0か1かを選ぶ同時手番ゲームで、 3人の和が奇数だと全員に利得1 3人の和が偶数だと全員に利得0 このときナッシュ均衡は(0,0,1)(0,1,0)(1,0,0)(1,1,1)でいいのでしょうか?

  • ナッシュ均衡の問題です

    数学の課題で、二問構成です。 利得表はなんとかかけそうなのですが、文系脳の自分ではどうしても正解できそうにないのでどうかよろしくお願いいたします。 〈スーパーA と消費者 B のゲームを考える。〉 スーパーは,卵 1 パックを高価格で販売する か,低価格で販売するかを考えている。 消費者 B は,近隣のスーパーの価格を比べて安いところで購入するか、調べないでこのスーパーA で購入するかを選択する。 ・消費者がチラシ比較をしない場合はこのスーパーで購入することになる。 このとき,ス ーパーが高価格つけているとすると,消費者の利得は 1 となり,低価格をつけると 4 の 利得を得るとする。一方,スーパーは高価格のときは 5、低価格のときは 2 の利得を得 る。 消費者がチラシ比較をすると,安いスーパーで購入することになる。したがって、このときスーパーが高価格をつけると,スーパーの利得は 0 となり,低価格をつけた場合は 2 の利得を得る。 消費者側は,スーパーA が高価格をつけていた場合は,チラシ比較を して得したことになるので 2 の利得を得る。 また,低価格をつけていた場合は,チラシ 比較しなくてもよかったので時間を浪費した分,チラシ比較をしたときよりも利得は低くなり 3 となる。 ・消費者がチラシ比較をすると,安いスーパーで購入することになる。 したがって,この ときスーパーが高価格をつけると,スーパーの利得は 0 となり,低価格をつけた場合は 2 の利得を得る。 消費者側は,スーパーA が高価格をつけていた場合は,チラシ比較を して得したことになるので 2 の利得を得る。 また,低価格をつけていた場合は,チラシ 比較しなくてもよかったので時間を浪費した分,チラシ比較をしたときよりも利得は低くなり3となる。 (第一問にスーパーが低下価格をつけ,消費者が価格比較をする場合の利得表を書く問題があります。) (2)混合戦略まで含めたナッシュ均衡を求めよ。また,このゲームのナッシュ均衡はどのように解釈できるか。 混合戦略を考える場合は,消費者がチラシを比較しない確率をp,スー パーが高価格をつける確率をqとして計算すること。

  • ナッシュ均衡について

    ナッシュ均衡について勉強をしております。 以下の2問を 回答に至るまでの論理展開含め 回答してくれる方宜しくお願いします。 (1) 囚人のジレンマゲームとなる数値を 用いてゲームを一つ定義し、 以下の問いに応えよ。 このゲームを無限回に繰り返すとき、 トリガー戦略が ナッシュ均衡である条件は何か。 ただし、 割引因子を δ とする。 (2) 混合戦略を許すとき、 親指ゲームにおけるナッシュ均衡を求めよ。 親指ゲームとは2人で戦うゲームで、 はじめにどちらが親になるか決める。 戦略は、 両者ともに親指を上げるか下げるか の2つである。 ゲームでは同時に親指の上げ下げを行い、 二人で立っている親指の合計が 奇数なら親の勝ち、偶数なら子の勝ち というルールである。

  • 展開型ゲームにおける混合戦略

    展開型ゲームにも混合戦略均衡ってあるんですか?完全・完備情報は仮定されてます。例えばプレイヤーが2人いて始めのプレイヤーはどうやっても行動が観測されてしまうから彼に混合戦略はないですよね?でも後に動くほうは混合戦略を持つことによって前者の行動を規定できるとも思うのですが、考え方・計算の仕方共にはっきりとしません。各自2つの戦略を持っているとして、ノーマルフォームに置き換えると8通りの戦略の組み合わせができるのですが、後者の4つの戦略に確率を振り分けるとpと1-pのように簡単には行きません。考え方をご教示くださいませ。