• ベストアンサー

混合戦略の期待利得の求め方

混合戦略に関する問題で期待利得の求め方なのですが たとえば戦略が2つの時は、利得は適当に4と6とでも置きまして 戦略1を選ぶ確立をp、戦略2を選ぶ確立を(1-p)で 4*p+6*(1-p)と成りますよね? 戦略2つまでなら理解できるのですが戦略3つ以上となるとどの様な式になるのでしょうか? 数学に疎くて全く分かりません、先に進めず困っています 分かる方教えてください

質問者が選んだベストアンサー

  • ベストアンサー
  • Tacosan
  • ベストアンサー率23% (3656/15482)
回答No.1

単に「利得の期待値」を求めるだけです. つまり個々の戦略に対して「その戦略を選ぶ確率」と「その戦略を選んだときの利得」の積を計算し, それをすべての戦略に対して加えるだけ.

syokou8
質問者

お礼

回答ありがとうございました

関連するQ&A

  • 3×2行列の混合戦略のナッシュ均衡の問題

    1 / 2 戦略1 戦略2 戦略1 4,0 2,5 戦略2 1,2 5,1 戦略3 2,6 3,3 この混合戦略のナッシュ均衡を解くことができません。 1が戦略1・2・3をとる確率をそれぞれp、q、1-p-q、2が戦略1・2をとる確率をs、1-sとおいて、期待利得を導くまではできるのです。 1の期待利得 戦略1:4s+2(1-s)=2s+2 戦略2:s+5(1-s)=-4s+5 戦略3:2s+3(1-s)=-s+3 2の期待利得 戦略1:2q+6(1-p-q)=-6p-4q+6 戦略2:5p+q+3(1-p-q)=2p-2q+3 まず1ですが、期待利得が2種類である2×2行列と違って、期待利得が3種類存在します。 また、2については変数がp・qの2種類あるので、どう処理してよいものかわかりません。 支配戦略が存在しないので、消去して2×2行列にするわけでもなさそうです。 ここから先の解法を教えてください。よろしくお願いします。

  • 混合戦略ナッシュ均衡について

       D    E A(2,2)  (4,8) B(5,6)  (3,3) という利得表の同時手番ゲームを考える問題についてなのですが、この場合の純粋戦略って(4,8)(5,6)ですよね。 そして混合戦略ナッシュ均衡を含めて考えた時、プレイヤー1と2の最適反応(赤=1、青=2)を図示したのですが以下のようになりました。(プレイヤー1がAを取る確率p、2がDを取る確率q) 下の図で丸を付けた箇所が均衡なのは知っているんですが、この場合答えの表記の仕方はどうなるんでしょうか・・?また、純粋戦略で求めた以外での混合戦略ナッシュ均衡において実現する量プレイヤーの期待利得を求めよ。との問いもあるのですが、だんだんわからなくなってきました・・。お時間のある方どうぞよろしくお願いいたします。

  • 混合戦略のナッシュ均衡について

    次のような問題です。 プレイヤー1は確率pでUを、確率1-pでDを選択する。 同様に、プレイヤー2は確率qでLを、確率1-qでRを選択する。 (プレイヤー1の利得、プレイヤー2の利得)は UかつL→(1,1) UかつR→(1,0) DかつL→(0,1) DかつR→(-1,-1)である。 このとき、混合戦略でのナッシュ均衡(p*,q*)を求めよ。 プレイヤー1の反応関数を求めるとR1(q)=(2-p)q+1-pとなって、最適なp*が1を超えてしまい、詰まってしまいました。 どのように解けばいいのでしょうか…回答よろしくお願いします。

  • 展開型ゲームにおける混合戦略

    展開型ゲームにも混合戦略均衡ってあるんですか?完全・完備情報は仮定されてます。例えばプレイヤーが2人いて始めのプレイヤーはどうやっても行動が観測されてしまうから彼に混合戦略はないですよね?でも後に動くほうは混合戦略を持つことによって前者の行動を規定できるとも思うのですが、考え方・計算の仕方共にはっきりとしません。各自2つの戦略を持っているとして、ノーマルフォームに置き換えると8通りの戦略の組み合わせができるのですが、後者の4つの戦略に確率を振り分けるとpと1-pのように簡単には行きません。考え方をご教示くださいませ。

  • 混合戦略の求め方を教えて下さい!(非ゼロ和ゲーム)

    A,Bの2人がいる非ゼロ和ゲームにおいて (A,B) (ドラマ、ドラマ)=(7,3) (ドラマ、バラエティ)=(4,6) (バラエティ、ドラマ)=(5,5) (バラエティ、バラエティ)=(6,4) という利得行列があります。 これについて、混合戦略を求めたいのですが、 Aがドラマを選択する確率をp、バラエティを1-p Bがドラマを選択する確率をq、バラエティを1-q とすると、 E(A)=7pq+5(1-p)q+4p(1-q)+6(1-p)(1-q) =7pq+5q-5pq+4p-4pq+6-6q-6p+6pq =4pq-q-2p+6 =(4p-1)q-2(p-3) ∴0≦p≦1/4 とここまでは分かったのですが、答えをどう出せばいいのかわかりません。 qの範囲も出した方がいいのでしょうか? そして、このpの範囲は、何の意味があるのでしょうか? どなたか、教えて下さい!!

  • イメージ戦略

    イメージ戦略に興味があります。題材としてたとえば、今は休止中のDAY AFTER TOMMOROWのmosonoさんのマスコミでのイメージ戦略が以前と違うのを確立されている気がします。このさきどういう戦略とられるのでしょうか。2つともそれぞれイメージが確立されています。 1.再び音楽に行く。 2.バラエティーのほうがむしろ活躍の場である。 どう思われますか。

  • 純粋戦略ナッシュ均衡について

      D    E    F A(4,4) (0、0) (7,0) B(0,0) (1,1) (0,0) C(0,7) (0,0) (6,6) (プレイヤー1の利得、プレイヤー2の利得) A,B,Cはプレイヤー1の選択、 D,E,Fはプレイヤー2の選択であり、 プレイヤー1と2が同時に独立に選択する場合の、純粋戦略ナッシュ均衡はどうなるのでしょうか? 何冊かテキストのゲーム理論の部分を読んでみましたが、いまいち純粋戦略ナッシュ均衡とはなんなのか理解できないので、どなたか教えていただけると助かります。 問題には、純粋戦略ナッシュ均衡を全て挙げよと書いてあるのですが、ナッシュ均衡は、相手の選択を所与のものとした場合に、他の選択肢を選んでも、利得が増えることのない選択のことですよね? 一つのゲームにいくつもあるものなのでしょうか? 素人な質問ですみませんが、よろしくおねがいいたします。

  • 国家戦略室って何をやっているのでしょうか?

    民主党が政権を取った時、国家戦略室にずいぶんと期待した一人です。 しかし、初代が菅直人。まったくの空き家状態。 やっと、今、何かはじめてるようですが、国民庶民が期待したものとは大きくかけ離れている感がいがめません。 国家戦略というぐらいですから「国の在り方」から「これからの日本のビジョン」を示して、各省庁へその方針の元、伝達するぐらいの組織を期待していたのですが、どうも小手先の組織にしか見えません。 今の「国家戦略室」の現状をご存知の方がいれば、教えてください。 また、皆さんが思い描く「国家戦略室」(機能すれば、局、庁、省へ昇格していくのが筋だと考えてますが)を、教えてくだされば、幸いです。 よろしくお願いいたします。

  • ゲーム理論のトリガー戦略について質問です。

    問題 1\2     A          B A       (5, 5)        (1, 7) B       (7, 1)        (4, 4) 上の基本ゲームを無限に繰り返す。2による戦略「Bから始めるトリガー」に対して、すべての部分ゲームで最適反応となる1の戦略はどのようなものか。また、その時の利得の系列はどうなるか。 どなたか教えてください、お願いしますm(__)m

  • 期待値

    X  1 2 3 4 5 確率 p q p p q ある確率変数Xの確率分布が右の表で与えられている Xの期待値が3.2であるときP、Qの値を求めよ。 この問題で8p+7q=3.2 という式まではでてくるのですが最終的な値がどうしてもでないので、どなたかわかる方は解説よろしくおねがいいたします