• ベストアンサー
  • 困ってます

混合戦略のナッシュ均衡について

次のような問題です。 プレイヤー1は確率pでUを、確率1-pでDを選択する。 同様に、プレイヤー2は確率qでLを、確率1-qでRを選択する。 (プレイヤー1の利得、プレイヤー2の利得)は UかつL→(1,1) UかつR→(1,0) DかつL→(0,1) DかつR→(-1,-1)である。 このとき、混合戦略でのナッシュ均衡(p*,q*)を求めよ。 プレイヤー1の反応関数を求めるとR1(q)=(2-p)q+1-pとなって、最適なp*が1を超えてしまい、詰まってしまいました。 どのように解けばいいのでしょうか…回答よろしくお願いします。

共感・応援の気持ちを伝えよう!

  • 回答数3
  • 閲覧数344
  • ありがとう数4

質問者が選んだベストアンサー

  • ベストアンサー
  • 回答No.3

質問しても返答がないね! ハッキリいいましょう。あなたの >プレイヤー1の反応関数を求めるとR1(q)=(2-p)q+1-pとなって・・ というのは間違い。プレイヤー1の反応関数は R1(q) = 1  ∀qε[0,1] プレイヤー2の反応関数も同様に R2(p) = 1  ∀pε[0,1] となる。

共感・感謝の気持ちを伝えよう!

質問者からのお礼

回答ありがとうございます。何度もお答えしていただいたのに返答が遅くなってしまい申し訳有りません。ネットを見れない状態が続いておりました… そもそもにして支配戦略である、というところを見落としておりまして、単純に期待利得を計算し、微分した解=0である、という解き方を行なっていたようです。回答を見て納得しましたし、それを踏まえて自分でも計算を行い(1,1)を導出できました。 度重なる呼びかけにも答えられず本当に申し訳ありませんでした。そして、丁寧に教えていただきありがとうございました。

関連するQ&A

  • 混合戦略ナッシュ均衡について

       D    E A(2,2)  (4,8) B(5,6)  (3,3) という利得表の同時手番ゲームを考える問題についてなのですが、この場合の純粋戦略って(4,8)(5,6)ですよね。 そして混合戦略ナッシュ均衡を含めて考えた時、プレイヤー1と2の最適反応(赤=1、青=2)を図示したのですが以下のようになりました。(プレイヤー1がAを取る確率p、2がDを取る確率q) 下の図で丸を付けた箇所が均衡なのは知っているんですが、この場合答えの表記の仕方はどうなるんでしょうか・・?また、純粋戦略で求めた以外での混合戦略ナッシュ均衡において実現する量プレイヤーの期待利得を求めよ。との問いもあるのですが、だんだんわからなくなってきました・・。お時間のある方どうぞよろしくお願いいたします。

  • 純粋戦略ナッシュ均衡について

      D    E    F A(4,4) (0、0) (7,0) B(0,0) (1,1) (0,0) C(0,7) (0,0) (6,6) (プレイヤー1の利得、プレイヤー2の利得) A,B,Cはプレイヤー1の選択、 D,E,Fはプレイヤー2の選択であり、 プレイヤー1と2が同時に独立に選択する場合の、純粋戦略ナッシュ均衡はどうなるのでしょうか? 何冊かテキストのゲーム理論の部分を読んでみましたが、いまいち純粋戦略ナッシュ均衡とはなんなのか理解できないので、どなたか教えていただけると助かります。 問題には、純粋戦略ナッシュ均衡を全て挙げよと書いてあるのですが、ナッシュ均衡は、相手の選択を所与のものとした場合に、他の選択肢を選んでも、利得が増えることのない選択のことですよね? 一つのゲームにいくつもあるものなのでしょうか? 素人な質問ですみませんが、よろしくおねがいいたします。

  • 3×2行列の混合戦略のナッシュ均衡の問題

    1 / 2 戦略1 戦略2 戦略1 4,0 2,5 戦略2 1,2 5,1 戦略3 2,6 3,3 この混合戦略のナッシュ均衡を解くことができません。 1が戦略1・2・3をとる確率をそれぞれp、q、1-p-q、2が戦略1・2をとる確率をs、1-sとおいて、期待利得を導くまではできるのです。 1の期待利得 戦略1:4s+2(1-s)=2s+2 戦略2:s+5(1-s)=-4s+5 戦略3:2s+3(1-s)=-s+3 2の期待利得 戦略1:2q+6(1-p-q)=-6p-4q+6 戦略2:5p+q+3(1-p-q)=2p-2q+3 まず1ですが、期待利得が2種類である2×2行列と違って、期待利得が3種類存在します。 また、2については変数がp・qの2種類あるので、どう処理してよいものかわかりません。 支配戦略が存在しないので、消去して2×2行列にするわけでもなさそうです。 ここから先の解法を教えてください。よろしくお願いします。

その他の回答 (2)

  • 回答No.2

回答No1にまだ納得できませんか?あなたの、プレイヤー1の反応関数はどうやって導かれたのか、示してくれませんか。正しく導かれたかどうか見てみますから。

共感・感謝の気持ちを伝えよう!

  • 回答No.1

利得マトリックスを書いてみて、チェックしてください。このゲームには両プレイヤーに支配戦略があり、プレイヤー1の支配戦略はU,プレイヤー2の支配戦略はLです。したがって唯一のナッシュ均衡は互いが支配戦略をとる(U,L)です。プレイヤー1にとっては、相手が戦略をどんなにランダマイズしても、Uをとるのが最適であり、同様にプレイヤー2にとってはLをとるのが最適だからです。したがって、混合戦略の記号を使って書くと、(p,q)=(1,1) が唯一のナッシュ均衡です。 フォーマルに議論するなら、プレイヤー2がLを確率qで、Rを確率1-qでとるとき、プレイヤー1が戦略Uをとれば、期待利得はq + (1-q) =1であり、戦略Dをとれば、期待利得は-(1-q) = q - 1である。よって、プレイヤー1がUを確率pで、Dを確率1-pで混合戦略をとったときの期待利得は EΠ1(p,q)=p + (1-p)(q-1) だ。よって、期待利得をpで微分すると、 ∂EΠ1/∂p = 2 -q>0となり、期待利得はpの増加関数、つまり、pを大きくすればするほど、プレイヤー1の期待利得は大きくなる。つまり、p=1のとき、プレイヤー1の期待利得EΠ1は最大になる。対称性によりプレイヤー2もq=1のとき、プレイヤー2の期待利得EΠ2は最大になる。つまり、(p,q)=(1,1)が一意のナッシュ均衡。

共感・感謝の気持ちを伝えよう!

関連するQ&A

  • ナッシュ均衡について

    戦略型ゲームG1を以下のように定義する。 ・プレイヤーは1と2の二名 ・プレイヤーi(i=1、2)の戦略集合は0以上1以下の実際の集合。すなわち、{x|x∈R、0≦x≦1} ・各プレイヤーの利得は以下のように決定される: プレイヤーi(i=1、2)が戦略xiを選んだとする。この時x1+x2≦1ならば、xiの値 がそのままプレイヤーiの利得となる。x1+x2>1ならば、両者の利得は0となる。 このゲームの純粋戦略ナッシュ均衡をすべて求めよ。 下の戦略型ゲームG2の混合戦略ナッシュ均衡をすべて求めよ。(被強支配戦略の繰り返し削除に注意)    a b c A(1,3) (3,0) (2,-1) B(3,0) (2,6) (0,2) C(0,4) (1,0) (3,-1) この二つの問題がまったくわかりません。解き方と答えがもしわかる方いましたら教えてください。 お願いします。  

  • ゲーム理論

    混合戦略の範囲でのナッシュ均衡 けんとたけしという2人がいます。 けんとたけしは共に混合戦略をとり、けんが純粋戦略uをとる確率p(0≦p≦1) たけしがとる純粋戦略Lをとる確率q(0≦q≦1) 以上の条件があって けんとたけしがとる戦略によってとる利得は次のようになる。 けん;(u,L)=(a,b) (u,R)=(0,0) たけし;(D,L)=(0,0) (D,R)=(c,d) ただしa,b,c,dは正の定数 このとき 混合戦略の範囲でナッシュ均衡はありますか?

  • 数学と戦略

    戦略に関する質問です。 次のような戦略ゲームを考えます。 1、2という人物がいて、1については戦略u,D,2については戦略L,R を取ると考えて 以下戦略のとり方によって利得は次のようになります 左から1、2の取る戦略として (u,L)=(a[1],a[2]),(u,R)=(b[1],b[2]) (D,L)=(c[1],c[2]),(D,R)=(d[1],d[2]) このとき (1)戦略(u,L)がナッシュ均衡である (2)a[1]=c[1]のとき純粋戦略ナッシュ均衡が存在する これらがどうして成り立つのか理解できません。

  • ナッシュ均衡の問題です

    数学の課題で、二問構成です。 利得表はなんとかかけそうなのですが、文系脳の自分ではどうしても正解できそうにないのでどうかよろしくお願いいたします。 〈スーパーA と消費者 B のゲームを考える。〉 スーパーは,卵 1 パックを高価格で販売する か,低価格で販売するかを考えている。 消費者 B は,近隣のスーパーの価格を比べて安いところで購入するか、調べないでこのスーパーA で購入するかを選択する。 ・消費者がチラシ比較をしない場合はこのスーパーで購入することになる。 このとき,ス ーパーが高価格つけているとすると,消費者の利得は 1 となり,低価格をつけると 4 の 利得を得るとする。一方,スーパーは高価格のときは 5、低価格のときは 2 の利得を得 る。 消費者がチラシ比較をすると,安いスーパーで購入することになる。したがって、このときスーパーが高価格をつけると,スーパーの利得は 0 となり,低価格をつけた場合は 2 の利得を得る。 消費者側は,スーパーA が高価格をつけていた場合は,チラシ比較を して得したことになるので 2 の利得を得る。 また,低価格をつけていた場合は,チラシ 比較しなくてもよかったので時間を浪費した分,チラシ比較をしたときよりも利得は低くなり 3 となる。 ・消費者がチラシ比較をすると,安いスーパーで購入することになる。 したがって,この ときスーパーが高価格をつけると,スーパーの利得は 0 となり,低価格をつけた場合は 2 の利得を得る。 消費者側は,スーパーA が高価格をつけていた場合は,チラシ比較を して得したことになるので 2 の利得を得る。 また,低価格をつけていた場合は,チラシ 比較しなくてもよかったので時間を浪費した分,チラシ比較をしたときよりも利得は低くなり3となる。 (第一問にスーパーが低下価格をつけ,消費者が価格比較をする場合の利得表を書く問題があります。) (2)混合戦略まで含めたナッシュ均衡を求めよ。また,このゲームのナッシュ均衡はどのように解釈できるか。 混合戦略を考える場合は,消費者がチラシを比較しない確率をp,スー パーが高価格をつける確率をqとして計算すること。

  • 展開型ゲームにおける混合戦略

    展開型ゲームにも混合戦略均衡ってあるんですか?完全・完備情報は仮定されてます。例えばプレイヤーが2人いて始めのプレイヤーはどうやっても行動が観測されてしまうから彼に混合戦略はないですよね?でも後に動くほうは混合戦略を持つことによって前者の行動を規定できるとも思うのですが、考え方・計算の仕方共にはっきりとしません。各自2つの戦略を持っているとして、ノーマルフォームに置き換えると8通りの戦略の組み合わせができるのですが、後者の4つの戦略に確率を振り分けるとpと1-pのように簡単には行きません。考え方をご教示くださいませ。

  • ナッシュ均衡について

    ナッシュ均衡について勉強をしております。 以下の2問を 回答に至るまでの論理展開含め 回答してくれる方宜しくお願いします。 (1) 囚人のジレンマゲームとなる数値を 用いてゲームを一つ定義し、 以下の問いに応えよ。 このゲームを無限回に繰り返すとき、 トリガー戦略が ナッシュ均衡である条件は何か。 ただし、 割引因子を δ とする。 (2) 混合戦略を許すとき、 親指ゲームにおけるナッシュ均衡を求めよ。 親指ゲームとは2人で戦うゲームで、 はじめにどちらが親になるか決める。 戦略は、 両者ともに親指を上げるか下げるか の2つである。 ゲームでは同時に親指の上げ下げを行い、 二人で立っている親指の合計が 奇数なら親の勝ち、偶数なら子の勝ち というルールである。

  • ナッシュ均衡を求める練習問題について

    現在、武藤滋夫氏の著書、「ゲーム理論入門」を呼んでいます。 練習問題でどうしても納得のいかない部分があったので、分かる方がいましたら解説をしていただきたいと思い、質問させていただきました。 練習問題の概要は以下の通りです。 ------------------------------- 1.A、B両氏が協力して100万円の儲けを得た。 2.それぞれの取り分は、お互いが欲しいと思う金額(100万円以内)を書いた紙を第三者に提出して決めることにする。 3.もし、両者の希望額の合計が100万円に満たない場合、それぞれは希望額を受け取る。余った金額は福祉団体へ寄付する 4.もし、両者の希望額の合計が100万円を超えた場合、全額福祉団体へ寄付する。 問い)2人はそれぞれどれだけの金額を書けばよいか。この状況を戦略形ゲームとして表現し、純粋戦略でのナッシュ均衡をすべて求めよ。 ----------------------------------- それに対して、僕は以下のように解答しました。 -------------------------------------- Aの書いた金額をx、Bの書いた金額をyとすると、 Aの利得 = x ( x + y <= 100)       0 ( x + y > 100) Bの利得 = y (x + y <= 100)       0 (x + y > 100) となる。 Bの書いた金額yを固定すると、Aの利得が最大になるのは x = 100 - y の時であり、同様にAの書いた金額xを固定すれば、 y = 100 - x が Bの最大の利得である。 つまり、x + y = 100 となる(x, y)の組であれば、A,Bどちらも最適反応戦略であり、ナッシュ均衡である。 --------------------------------------- しかし、本書の解答には、この均衡の他に (x, y) = (100, 100) がナッシュ均衡であると書いてあります。 なぜこの組がナッシュ均衡になっているのかがわかりません。 分かる方がいましたら、ぜひ解答をお願いします。

  • ゲーム理論の混合戦略の求め方

    混合戦略についての質問です。 a b A 3,2 0,0 B 0,2 3,1 C 1,0 1,3 このゲームの混合戦略が分かりません。 解答には「A,B,Cをそれぞれ1/2,1/2,0の確率でとる 」という混合戦略が、純粋戦略Cを強く支配するとあるのですが、なぜこうなるのか分かりません。 どなたか分かる方、教えてください。よろしくお願いします。

  • 混合戦略の期待利得の求め方

    混合戦略に関する問題で期待利得の求め方なのですが たとえば戦略が2つの時は、利得は適当に4と6とでも置きまして 戦略1を選ぶ確立をp、戦略2を選ぶ確立を(1-p)で 4*p+6*(1-p)と成りますよね? 戦略2つまでなら理解できるのですが戦略3つ以上となるとどの様な式になるのでしょうか? 数学に疎くて全く分かりません、先に進めず困っています 分かる方教えてください

  • 情報経済学、ミクロ経済学の問題について2

    ミクロ経済、 情報経済論について質問です。 1.画像の利得表のとき プレイヤー1が戦略A、プレイヤー2が戦略Cをとるときの(4,2)の意味を説明せよ 2.ナッシュ均衡の定義を述べ、上の利得表のナッシュ均衡を求めよ。 3.この利得表を例に支配戦略について説明せよ。 4.最適反応戦略とは何かを説明せよ。 ノートや本を見ても 難しくて解けませんでした。 どうか答えを よろしくお願いいたします。