• 締切済み
  • すぐに回答を!

展開型ゲームにおける混合戦略

展開型ゲームにも混合戦略均衡ってあるんですか?完全・完備情報は仮定されてます。例えばプレイヤーが2人いて始めのプレイヤーはどうやっても行動が観測されてしまうから彼に混合戦略はないですよね?でも後に動くほうは混合戦略を持つことによって前者の行動を規定できるとも思うのですが、考え方・計算の仕方共にはっきりとしません。各自2つの戦略を持っているとして、ノーマルフォームに置き換えると8通りの戦略の組み合わせができるのですが、後者の4つの戦略に確率を振り分けるとpと1-pのように簡単には行きません。考え方をご教示くださいませ。

  • czt
  • お礼率100% (2/2)

共感・応援の気持ちを伝えよう!

  • 回答数1
  • 閲覧数863
  • ありがとう数3

みんなの回答

  • 回答No.1
noname#78613
noname#78613

>展開型ゲームにも混合戦略均衡ってあるんですか? あると思います。というのも、後手のプレイヤーが先手のプレイヤーの戦略に 関わらず同じ混合戦略を用いると仮定してしまえば、混合戦略を含めた ノーマルフォームのゲームに書き直せるからです。 そのような仮定がなくても、混合戦略の均衡はあります。くだらない例 ですが、各プレイヤーがどんな戦略を選んでもそれぞれ1の利得を得る というゲームを考えてみてください。すると、各プレイヤーがどんな 混合戦略を選んでもその組み合わせはベイジアン・ナッシュ均衡になります。 >始めのプレイヤーはどうやっても行動が観測されてしまうから彼に混合戦略 はないですよね? 始めのプレイヤーにも混合戦略を考えることはできると思います。先ほどの 例でみましたよね。 >考え方・計算の仕方共にはっきりとしません。 純粋戦略しか採れないケースであれば8通りの戦略の組み合わせというのは 正しいのですが、混合戦略のケースであれば違います。 先手プレイヤーの純粋戦略を1,2、後手プレイヤーの純粋戦略をa,bと 呼びましょう。すると、先手プレイヤーの戦略は確率qで戦略1をとり、 確率1-qで戦略bをとる、になります。一方、後手プレイヤーの戦略は 先手プレイヤーが戦略1を選んだ場合確率p1で戦略aを、確率1-p1で戦略b をとり、先手プレイヤーが戦略2を選んだ場合確率p2で戦略aを、確率1-p2で 戦略bをとる、になります。 つまり、q、p1、p2を所与とすれば、戦略の組み合わせは1通りになります。 もちろん、それぞれ0から1の値を自由にとることができるので、戦略の 組み合わせの数は無限になります。

共感・感謝の気持ちを伝えよう!

質問者からのお礼

大変わかりやすく且つ丁寧に解説していただき感謝します。不審点が解決されました。 ありがとうポイントなるものを進呈したいのですがやり方がわかりませぬ‥

関連するQ&A

  • 混合戦略ナッシュ均衡について

       D    E A(2,2)  (4,8) B(5,6)  (3,3) という利得表の同時手番ゲームを考える問題についてなのですが、この場合の純粋戦略って(4,8)(5,6)ですよね。 そして混合戦略ナッシュ均衡を含めて考えた時、プレイヤー1と2の最適反応(赤=1、青=2)を図示したのですが以下のようになりました。(プレイヤー1がAを取る確率p、2がDを取る確率q) 下の図で丸を付けた箇所が均衡なのは知っているんですが、この場合答えの表記の仕方はどうなるんでしょうか・・?また、純粋戦略で求めた以外での混合戦略ナッシュ均衡において実現する量プレイヤーの期待利得を求めよ。との問いもあるのですが、だんだんわからなくなってきました・・。お時間のある方どうぞよろしくお願いいたします。

  • ゲーム理論 

    恥ずかしながら追試ということになってしまいそうなので、期末試験問題を復習しようと考えています。 そこで皆様に解説と回答をお教えいただきたく、質問させていただきます。 以下の文章の正誤を応えよ (1)「後出しじゃんけん」のようなゲームはゲームの木で表現すると、手番の時間的推移がわかりやすく理解しやすい。 (2)ゲームの木を使って表現するとき、同じ情報集合に含まれる意思決定節からは必ず同じ数の枝が出ていなければならない。 (3)男女のジレンマゲームは各プレイヤーが支配戦略を一つずつ持っている。 (4)協調の失敗とは、タカハトゲームのように相互に利益をもたらす戦略の組がナッシュ均衡として実現されないことをいう。 (5)すべての情報集合に意思決定節が一つしか含まれていない情報構造のゲームを、完全情報ゲームという。 (6)囚人のジレンマゲームを逐次手番でプレイすれば、ジレンマを解消できる。 (7)ナッシュ均衡はすべてのプレイヤーが単独で戦略を変更するインセンティヴを持たないことを保証するだけであり、複数のプレイヤーが協力して戦略を変更すれば互いに利得を改善できる可能性がある。 (8)ナッシュ均衡の中にプレイヤーのから脅しによって成立すると解釈できるものが含まれるのは、戦略の組み合わせが均衡経路外に対しても最適反応であることが必須だからである。 (9)いわゆる「ペナルティキック」ゲームには純粋戦略のナッシュ均衡は存在しない。 (10)混合戦略のナッシュ均衡において行動Aと行動Bをランダムに選択しているプレイヤーが、どちらか一方の行動だけを選択する純粋戦略に変更しても、そのプレイヤーの期待利得は変わらない。 自分の回答は ○、×、×、○、×、×、○、○、○、× でした。 特に5~10がよくわからないです。解説と回答よろしくお願いします。

  • ゲーム理論

    ゲーム理論の練習問題の解答解説お願いします。 プレイヤー:スミス社、ジョーンズ社 各プレイヤーのアクション: 大小 利得:両方とも大なら各々5、両社とも小なら各々1、一方が大で他方が小なら各々-1 (1)このゲームが同時手番で行われるとき、その標準形を示せ (2)空欄に適切な文字を埋めよ (*)とは、各プレイヤーの最適反応の組み合わせである。最適反応とは、相手の戦略にたいして(*)が、最大になる戦略である。上記のゲームにおいて、スミス社にとってもジョーンズ社にとっても、相手の大という戦略に対する最適反応は(*)であり、相手の小という戦略に対する最適反応は(*)である。したがってこのゲームは(*)は(*)である。 (3)このゲームが逐次的手番(スミス社が先にアクションを選ぶ)で行われるとした場合の展開形と均衡経路を示せ。

  • 常に前向きな人と立ち止まってしまう人の違い

    世の中には二通りの人間がいると思います。常に前向きで失敗を恐れず目標や夢に行動できる人間とリスクを恐れ、考えてばかりで行動なかなか出来ない人。 なぜ同じ人間でもこういった考え方の差が出てしまうのでしょうか? また後者の人間が前者のような人間になるにはどうしたらいいでしょうか?

  • 前にも似たような質問をしたんですが…。

    前にも似たような質問をしたんですが…。 やっぱりちょっと恐怖症なのかと最近実感するんですが。… 不安や恐怖ってゆうのはどうすればなくなるんでしょうか? 自分の考え方では… 一つとして考えるより先に行動するってことをやっているんですが… それよりも落ち着いて恐怖に立ち向かって慣れたほうがいいんでしょうか? ほんとに困っています。 前者か後者どちらがいいという回答でもよいので回答お願いします…。

  • 混合戦略のナッシュ均衡について

    次のような問題です。 プレイヤー1は確率pでUを、確率1-pでDを選択する。 同様に、プレイヤー2は確率qでLを、確率1-qでRを選択する。 (プレイヤー1の利得、プレイヤー2の利得)は UかつL→(1,1) UかつR→(1,0) DかつL→(0,1) DかつR→(-1,-1)である。 このとき、混合戦略でのナッシュ均衡(p*,q*)を求めよ。 プレイヤー1の反応関数を求めるとR1(q)=(2-p)q+1-pとなって、最適なp*が1を超えてしまい、詰まってしまいました。 どのように解けばいいのでしょうか…回答よろしくお願いします。

  • ゲーム理論の混合戦略の求め方

    混合戦略についての質問です。 a b A 3,2 0,0 B 0,2 3,1 C 1,0 1,3 このゲームの混合戦略が分かりません。 解答には「A,B,Cをそれぞれ1/2,1/2,0の確率でとる 」という混合戦略が、純粋戦略Cを強く支配するとあるのですが、なぜこうなるのか分かりません。 どなたか分かる方、教えてください。よろしくお願いします。

  • ゲーム理論(混合戦略)について

    ゲーム理論(混合戦略)についての質問です。 A_B--(グー)-(チョキ)-(パー)--- (グー) (0,0)(1,-1)(-5,5) (チョキ) (-1,1)(0,0)(2,-2) (パー) (5,-5)(-2,2)(0,0) 次の確率でじゃんけんとする。 プレーヤーA グー:a チョキ:b プレーヤーB グー:X チョキ:Y 上記の場合、 プレーヤーAのベストミックスは(a;1/4 b;5/8 c;1/8) プレーヤーBのベストミックスは(a;1/4 b;5/8 c;1/8) で正しいでしょうか?

  • wiki掲載の「人体に対する放射線の影響」について

    国民の関心事となっている放射線被曝について自分なりに調べていたのですが よくわからなくなってしまったのでお分かりになる方教えて下さい。 Wikipediaの「被曝」のページ(http://ja.wikipedia.org/wiki/%E8%A2%AB%E6%9B%9D)の 下の方にある「人体に対する放射線の影響」の表の記載についてです。 他のサイトで、「ミリシーベルトやマイクロシーベルトと言っても、それが毎分であるのか、毎時であるのか、 毎年であるのかで大きく異なる」という事や、「省略されている場合は毎時であると考えてよい」という事を読んでいたので、 この表の「単位はミリシーベルト (mSv)」というのも毎時での数値なのだと思って見ていたのですが、 0.1 - 0.3・・・胸部X線撮影。 4・・・胃のX線撮影。 7 - 20・・・X線CTによる撮像。 という数値は毎時の放射線量であると思われるのですが、 0.05・・・原子力発電所の事業所境界での1年間の線量。 2.4・・・一年間に自然環境から人が受ける放射線の世界平均。 50・・・放射線業務従事者(妊娠可能な女子を除く)が1年間にさらされてよい放射線の限度。 という数値は「1年間(つまり毎年)の放射線量なのでは?」と思ってしまいました。 そうだとすると「毎時ミリシーベルトと毎年ミリシーベルトが同じ表にあるのは勘違いを招くのでは?」と思ったのですが、 私の認識や考え方が誤っているのでしょうか? また、「○○の場所で2.4ミリシーベルトの放射線量が観測されました」という観測結果に対して、 テレビの出演者が「人間は一年間に自然環境から2.4ミリシーベルトの放射線量を浴びている。 それと同じ数値なので大した放射線量ではない」と言っていたと思うのですが、 前者は毎時での放射線量、後者は毎年での放射線量で、1年間=365日=8760時間なので 「前者と後者では8760倍もの放射線量の濃度差があるのではないのか?」と思ってしまったのですが、 これも私の認識や考え方が誤っているのでしょうか? 何か根本的な考え違いを私がしているのではないかと思うのですが、この事に回答出来そうな人が 周りにいないのでここで質問させて頂きました。 回答よろしくお願い致します。

  • ゲーム理論 復習

    手詰まりでわかりません。よろしければ教えてください。 企業1と企業2は互いに代替的な製品を生産し販売している。企業xが設定した製品価格をPx万円(x=1、2)としたとき、それぞれの製品に対する需要量は D1=A-P1+P2 D2=A-P2+p1  (Aは正の定数) また各社はそれぞれ生産1あたりにC万円の費用がかかる(A>Cとする)。各社は同時手番でそれぞれの利潤を最大化するように自社製品の価格を設定する。 [1]このゲームを一度だけプレイ (1)企業2の製品価格がP2と予想されるときの企業1の反応関数を求めよ (2)ナッシュ均衡での各社の製品価格として正しいのはどれか。 (3)ナッシュ均衡で各社が獲得する利益はいくらか、 (4)企業1がプライスリーダーとする。企業1が先に戦略を決め、それを見た後で企業2が戦略を決める。そのとき部分ゲーム完全なナッシュ均衡でプレイヤー1が設定する製品価格を求めよ。 (5)(4)のとき企業2の設定する製品価格を求めよ。 [2]上記の手番ゲームが無限回繰り返され、毎回の段階ゲームの結果は次の段階ゲームが始まる前に、各企業に観察されるものとする。各企業は共通の割引因子σ(0<σ<1)を用いて各段階ゲームで割引現在価値を最大にするように戦略を選ぶ。各企業はトリガー戦略(戦略Xと呼ぶ)用いることによって均衡経路上では毎回必ずP=2A+Cという製品価格を実現させようとする。戦略Xでは以下のように指定されている。 ・第一回目の段階ゲームおよび過去に互いに設定し続けて迎えた段階ゲームでは価格をP*に設定する。 ・上記以外の段階ゲームでは(2)で求めた価格を設定する。 今企業2が戦略Xをとると予想したとき、企業1が一回目の段階ゲームで戦略X から逸脱すればP1を(6)に設定することが短期的には最適である。逸脱によって得られる利潤の増加分は(7)である。しかしそれを踏まえ企業2も行動が変化するので、二回目以降の毎回の段階ゲームで企業1の獲得する利潤が、先の逸脱によって、少なくとも(8)万円減る。その結果逸脱によって(9)万円の長期的な損失を発生させる。したがって互いに戦略Xをとり続ける必要十分条件は(10)以上の割引因子をもつことである。 (1)~(10)に答えよ。 という問題です。長いですが、考え方と解答を教えて頂ければと思います。よろしくお願いします。