• 締切済み

展開型ゲームにおける混合戦略

展開型ゲームにも混合戦略均衡ってあるんですか?完全・完備情報は仮定されてます。例えばプレイヤーが2人いて始めのプレイヤーはどうやっても行動が観測されてしまうから彼に混合戦略はないですよね?でも後に動くほうは混合戦略を持つことによって前者の行動を規定できるとも思うのですが、考え方・計算の仕方共にはっきりとしません。各自2つの戦略を持っているとして、ノーマルフォームに置き換えると8通りの戦略の組み合わせができるのですが、後者の4つの戦略に確率を振り分けるとpと1-pのように簡単には行きません。考え方をご教示くださいませ。

  • czt
  • お礼率100% (2/2)

みんなの回答

noname#78613
noname#78613
回答No.1

>展開型ゲームにも混合戦略均衡ってあるんですか? あると思います。というのも、後手のプレイヤーが先手のプレイヤーの戦略に 関わらず同じ混合戦略を用いると仮定してしまえば、混合戦略を含めた ノーマルフォームのゲームに書き直せるからです。 そのような仮定がなくても、混合戦略の均衡はあります。くだらない例 ですが、各プレイヤーがどんな戦略を選んでもそれぞれ1の利得を得る というゲームを考えてみてください。すると、各プレイヤーがどんな 混合戦略を選んでもその組み合わせはベイジアン・ナッシュ均衡になります。 >始めのプレイヤーはどうやっても行動が観測されてしまうから彼に混合戦略 はないですよね? 始めのプレイヤーにも混合戦略を考えることはできると思います。先ほどの 例でみましたよね。 >考え方・計算の仕方共にはっきりとしません。 純粋戦略しか採れないケースであれば8通りの戦略の組み合わせというのは 正しいのですが、混合戦略のケースであれば違います。 先手プレイヤーの純粋戦略を1,2、後手プレイヤーの純粋戦略をa,bと 呼びましょう。すると、先手プレイヤーの戦略は確率qで戦略1をとり、 確率1-qで戦略bをとる、になります。一方、後手プレイヤーの戦略は 先手プレイヤーが戦略1を選んだ場合確率p1で戦略aを、確率1-p1で戦略b をとり、先手プレイヤーが戦略2を選んだ場合確率p2で戦略aを、確率1-p2で 戦略bをとる、になります。 つまり、q、p1、p2を所与とすれば、戦略の組み合わせは1通りになります。 もちろん、それぞれ0から1の値を自由にとることができるので、戦略の 組み合わせの数は無限になります。

czt
質問者

お礼

大変わかりやすく且つ丁寧に解説していただき感謝します。不審点が解決されました。 ありがとうポイントなるものを進呈したいのですがやり方がわかりませぬ‥

関連するQ&A

  • 混合戦略ナッシュ均衡について

       D    E A(2,2)  (4,8) B(5,6)  (3,3) という利得表の同時手番ゲームを考える問題についてなのですが、この場合の純粋戦略って(4,8)(5,6)ですよね。 そして混合戦略ナッシュ均衡を含めて考えた時、プレイヤー1と2の最適反応(赤=1、青=2)を図示したのですが以下のようになりました。(プレイヤー1がAを取る確率p、2がDを取る確率q) 下の図で丸を付けた箇所が均衡なのは知っているんですが、この場合答えの表記の仕方はどうなるんでしょうか・・?また、純粋戦略で求めた以外での混合戦略ナッシュ均衡において実現する量プレイヤーの期待利得を求めよ。との問いもあるのですが、だんだんわからなくなってきました・・。お時間のある方どうぞよろしくお願いいたします。

  • 混合戦略のナッシュ均衡について

    次のような問題です。 プレイヤー1は確率pでUを、確率1-pでDを選択する。 同様に、プレイヤー2は確率qでLを、確率1-qでRを選択する。 (プレイヤー1の利得、プレイヤー2の利得)は UかつL→(1,1) UかつR→(1,0) DかつL→(0,1) DかつR→(-1,-1)である。 このとき、混合戦略でのナッシュ均衡(p*,q*)を求めよ。 プレイヤー1の反応関数を求めるとR1(q)=(2-p)q+1-pとなって、最適なp*が1を超えてしまい、詰まってしまいました。 どのように解けばいいのでしょうか…回答よろしくお願いします。

  • ゲーム理論 

    恥ずかしながら追試ということになってしまいそうなので、期末試験問題を復習しようと考えています。 そこで皆様に解説と回答をお教えいただきたく、質問させていただきます。 以下の文章の正誤を応えよ (1)「後出しじゃんけん」のようなゲームはゲームの木で表現すると、手番の時間的推移がわかりやすく理解しやすい。 (2)ゲームの木を使って表現するとき、同じ情報集合に含まれる意思決定節からは必ず同じ数の枝が出ていなければならない。 (3)男女のジレンマゲームは各プレイヤーが支配戦略を一つずつ持っている。 (4)協調の失敗とは、タカハトゲームのように相互に利益をもたらす戦略の組がナッシュ均衡として実現されないことをいう。 (5)すべての情報集合に意思決定節が一つしか含まれていない情報構造のゲームを、完全情報ゲームという。 (6)囚人のジレンマゲームを逐次手番でプレイすれば、ジレンマを解消できる。 (7)ナッシュ均衡はすべてのプレイヤーが単独で戦略を変更するインセンティヴを持たないことを保証するだけであり、複数のプレイヤーが協力して戦略を変更すれば互いに利得を改善できる可能性がある。 (8)ナッシュ均衡の中にプレイヤーのから脅しによって成立すると解釈できるものが含まれるのは、戦略の組み合わせが均衡経路外に対しても最適反応であることが必須だからである。 (9)いわゆる「ペナルティキック」ゲームには純粋戦略のナッシュ均衡は存在しない。 (10)混合戦略のナッシュ均衡において行動Aと行動Bをランダムに選択しているプレイヤーが、どちらか一方の行動だけを選択する純粋戦略に変更しても、そのプレイヤーの期待利得は変わらない。 自分の回答は ○、×、×、○、×、×、○、○、○、× でした。 特に5~10がよくわからないです。解説と回答よろしくお願いします。

  • 3×2行列の混合戦略のナッシュ均衡の問題

    1 / 2 戦略1 戦略2 戦略1 4,0 2,5 戦略2 1,2 5,1 戦略3 2,6 3,3 この混合戦略のナッシュ均衡を解くことができません。 1が戦略1・2・3をとる確率をそれぞれp、q、1-p-q、2が戦略1・2をとる確率をs、1-sとおいて、期待利得を導くまではできるのです。 1の期待利得 戦略1:4s+2(1-s)=2s+2 戦略2:s+5(1-s)=-4s+5 戦略3:2s+3(1-s)=-s+3 2の期待利得 戦略1:2q+6(1-p-q)=-6p-4q+6 戦略2:5p+q+3(1-p-q)=2p-2q+3 まず1ですが、期待利得が2種類である2×2行列と違って、期待利得が3種類存在します。 また、2については変数がp・qの2種類あるので、どう処理してよいものかわかりません。 支配戦略が存在しないので、消去して2×2行列にするわけでもなさそうです。 ここから先の解法を教えてください。よろしくお願いします。

  • ゲーム理論

    混合戦略の範囲でのナッシュ均衡 けんとたけしという2人がいます。 けんとたけしは共に混合戦略をとり、けんが純粋戦略uをとる確率p(0≦p≦1) たけしがとる純粋戦略Lをとる確率q(0≦q≦1) 以上の条件があって けんとたけしがとる戦略によってとる利得は次のようになる。 けん;(u,L)=(a,b) (u,R)=(0,0) たけし;(D,L)=(0,0) (D,R)=(c,d) ただしa,b,c,dは正の定数 このとき 混合戦略の範囲でナッシュ均衡はありますか?

  • ゲーム理論

    数学のテキストの中に、ゲーム理論を扱う部分があり、そこに性比ゲームが出てきました。が、どういうゲームの設定なのかが解説されておらず、いきなり式を展開されて、よく理解できません。 一般的に、性比ゲームというのはどのようなルールの下で行われるゲームなのでしょうか?漠然とした質問ですみません。 それと、いくつかの純戦略をある割合で混合した戦略を用いるゲームで「最適反応はいくつかの純戦略を必ず含む」「強意のナッシュ均衡が存在する場合、それは純戦略である」とあったのですが、それは何故ですか?

  • ゲーム理論

    ゲーム理論の練習問題の解答解説お願いします。 プレイヤー:スミス社、ジョーンズ社 各プレイヤーのアクション: 大小 利得:両方とも大なら各々5、両社とも小なら各々1、一方が大で他方が小なら各々-1 (1)このゲームが同時手番で行われるとき、その標準形を示せ (2)空欄に適切な文字を埋めよ (*)とは、各プレイヤーの最適反応の組み合わせである。最適反応とは、相手の戦略にたいして(*)が、最大になる戦略である。上記のゲームにおいて、スミス社にとってもジョーンズ社にとっても、相手の大という戦略に対する最適反応は(*)であり、相手の小という戦略に対する最適反応は(*)である。したがってこのゲームは(*)は(*)である。 (3)このゲームが逐次的手番(スミス社が先にアクションを選ぶ)で行われるとした場合の展開形と均衡経路を示せ。

  • ナッシュ均衡について

    戦略型ゲームG1を以下のように定義する。 ・プレイヤーは1と2の二名 ・プレイヤーi(i=1、2)の戦略集合は0以上1以下の実際の集合。すなわち、{x|x∈R、0≦x≦1} ・各プレイヤーの利得は以下のように決定される: プレイヤーi(i=1、2)が戦略xiを選んだとする。この時x1+x2≦1ならば、xiの値 がそのままプレイヤーiの利得となる。x1+x2>1ならば、両者の利得は0となる。 このゲームの純粋戦略ナッシュ均衡をすべて求めよ。 下の戦略型ゲームG2の混合戦略ナッシュ均衡をすべて求めよ。(被強支配戦略の繰り返し削除に注意)    a b c A(1,3) (3,0) (2,-1) B(3,0) (2,6) (0,2) C(0,4) (1,0) (3,-1) この二つの問題がまったくわかりません。解き方と答えがもしわかる方いましたら教えてください。 お願いします。  

  • ゲーム理論 復習

    手詰まりでわかりません。よろしければ教えてください。 企業1と企業2は互いに代替的な製品を生産し販売している。企業xが設定した製品価格をPx万円(x=1、2)としたとき、それぞれの製品に対する需要量は D1=A-P1+P2 D2=A-P2+p1  (Aは正の定数) また各社はそれぞれ生産1あたりにC万円の費用がかかる(A>Cとする)。各社は同時手番でそれぞれの利潤を最大化するように自社製品の価格を設定する。 [1]このゲームを一度だけプレイ (1)企業2の製品価格がP2と予想されるときの企業1の反応関数を求めよ (2)ナッシュ均衡での各社の製品価格として正しいのはどれか。 (3)ナッシュ均衡で各社が獲得する利益はいくらか、 (4)企業1がプライスリーダーとする。企業1が先に戦略を決め、それを見た後で企業2が戦略を決める。そのとき部分ゲーム完全なナッシュ均衡でプレイヤー1が設定する製品価格を求めよ。 (5)(4)のとき企業2の設定する製品価格を求めよ。 [2]上記の手番ゲームが無限回繰り返され、毎回の段階ゲームの結果は次の段階ゲームが始まる前に、各企業に観察されるものとする。各企業は共通の割引因子σ(0<σ<1)を用いて各段階ゲームで割引現在価値を最大にするように戦略を選ぶ。各企業はトリガー戦略(戦略Xと呼ぶ)用いることによって均衡経路上では毎回必ずP=2A+Cという製品価格を実現させようとする。戦略Xでは以下のように指定されている。 ・第一回目の段階ゲームおよび過去に互いに設定し続けて迎えた段階ゲームでは価格をP*に設定する。 ・上記以外の段階ゲームでは(2)で求めた価格を設定する。 今企業2が戦略Xをとると予想したとき、企業1が一回目の段階ゲームで戦略X から逸脱すればP1を(6)に設定することが短期的には最適である。逸脱によって得られる利潤の増加分は(7)である。しかしそれを踏まえ企業2も行動が変化するので、二回目以降の毎回の段階ゲームで企業1の獲得する利潤が、先の逸脱によって、少なくとも(8)万円減る。その結果逸脱によって(9)万円の長期的な損失を発生させる。したがって互いに戦略Xをとり続ける必要十分条件は(10)以上の割引因子をもつことである。 (1)~(10)に答えよ。 という問題です。長いですが、考え方と解答を教えて頂ければと思います。よろしくお願いします。

  • ナッシュ均衡について

    ナッシュ均衡について勉強をしております。 以下の2問を 回答に至るまでの論理展開含め 回答してくれる方宜しくお願いします。 (1) 囚人のジレンマゲームとなる数値を 用いてゲームを一つ定義し、 以下の問いに応えよ。 このゲームを無限回に繰り返すとき、 トリガー戦略が ナッシュ均衡である条件は何か。 ただし、 割引因子を δ とする。 (2) 混合戦略を許すとき、 親指ゲームにおけるナッシュ均衡を求めよ。 親指ゲームとは2人で戦うゲームで、 はじめにどちらが親になるか決める。 戦略は、 両者ともに親指を上げるか下げるか の2つである。 ゲームでは同時に親指の上げ下げを行い、 二人で立っている親指の合計が 奇数なら親の勝ち、偶数なら子の勝ち というルールである。