• ベストアンサー
  • すぐに回答を!

ゲーム理論

N 人のプレイヤーによる次のようなゲームを考える(N ≥ 2).各プレイヤーにはまず最 初に 1000 円が与えられる.各プレイヤーは,これを保持する(R)か,募金する(C)かを同時 手番で選択する.募金されたお金は合計して 2 倍に増額された後,Rを選んだかCを選んだかに関 わらず,すべてのプレイヤーに均等に山分けされる. 1.一般に N ≥ 3 のとき,ナッシュ均衡になる戦略の組をすべて明らかにしなさい. 2.なぜ 1.で述べた戦略の組はナッシュ均衡になるのか.「支配戦略」という言葉を用いて,直 観的に説明しなさい. 3.このゲームを実際に被験者にプレイさせる実験を行うと,必ずしも1.のようなナッシュ均衡の 戦略がとられないという結果がしばしば観察されるという。実験の結果がナッシュ均衡 に一致しないとすれば,それはなぜだと考えられるか.自分の考えを述べなさい. 以上です。1.は3人以上のプレイヤーのナッシュ均衡の考え方、表記の仕方がわからず苦戦しています。2.は支配戦略=相手がどの戦略できても最適である戦略、という言葉を1.を踏まえた上でどう使えばいいのかわからずにまた苦戦中、3.はおそらくフリーライダーの話でせめていけばいいのかな、と思いながらもどう書けばいいのかわからない状態です。 どうかお力添え頂ければと思います。よろしくお願い致します。

noname#203608
noname#203608

共感・応援の気持ちを伝えよう!

質問者が選んだベストアンサー

  • ベストアンサー
  • 回答No.2

プレイヤーiの戦略をx(i)と書くと、x(i)∈{R,C}, i =1,2,3.となりますね。プレイヤ―の数が2人の場合は利得表を作ると便利ですが、3人以上の場合はあまりうまくいかない。プレイヤーの利得関数は、プレイヤー1の利得(pay-off)をP(i)と書くと P(1) = 2[x(1) + x(2) + x(3)]/3 - x(1) = [2x(2) + 2x(3) )- x(1)]/3 と書けるが(なぜ?)、プレイヤー2,3の利得も同様に       P(2) = [2x(3) + 2 x(1) - x(2)]/3    P(3) = [2x(1) + 2x(2) - x(3)]/3 となる。ただし、利得を計算するとき、R=0、C =1000と計算する。この利得関数をながめるとすぐわかるように、各プレイヤーiにとって、ほかのプレイヤーの戦略が何であっても、それらの戦略を所与とするとき、x(i)=Rを選択すれば、利得は最大化される(なぜ?)したがって、このゲームには各プレイヤーに支配戦略が存在し、x(i)=Rである。支配戦略があるとき、誰もが支配戦略を選択するので、ナッシュ均衡は支配戦略の組      (x(1),x(2),x(3) = (R,R,R) となり、各プレイヤーの利得はゼロである。つまり、全員が「保持」を選ぶ結果、自分の取り分は配分された1000円以上には増えないことになる。(皆が協力してCを選択するなら、すなわち、x(1)=x(2)=x(3)=Cなら、各プレイヤーの利得はP(1)=P(2) =P(3)=2000/3、配分された1000円にこれだけの金額を余計に得られるのに利己的に行動する結果、最適でない結果におちいってまう(囚人のジレンマ)。プレイヤーの数をN≧3の場合も同じように分析できる。

共感・感謝の気持ちを伝えよう!

質問者からの補足

2*(全員分の戦略で支払われた金額の合計)/人数の合計-プレイヤー1がその戦略で支払った金額=二倍された後の資金が一人一人に配分されるときの金額-プレイヤー1の支払った金額=収入-費用=利得  ということですね。 そして全員が出資すれば多くの利益を得られるのにも関わらず、Rをとれば絶対に損はしないわけだから(もしほかのプレイヤーが出資すれば自分が得するし、全員が保持Rを選択しても損はしない)のでナッシュ均衡は  (x(1),x(2),x(3) = (R,R,R) になるという解釈でしょうか。

その他の回答 (3)

  • 回答No.4

以下の回答2に対する補足質問に答えましょう。 > 1/2|  R    | C ---|--------------|---------   R |(1000,1000)  |(2000,1000)   | | ---|--------------|----------- C |(1000,2000) |(2000,2000) という利得表になると思います。 いいえ、N=2のときは以下のような利得表になるはずです。 R C R 0, 0 1000, 0 C 0, 1000 1000, 1000 (注。表がうまく書けません。一番上の欄はRとCが並び、そのRの下には(0,0)、(0,1000)と縦にならび、Cの下には(1000,0)と(1000,1000)と縦にならびます。原稿の段階ではこのように書かれているのですが、「確認する」のボタンを押すと、乱れてしまいます!!) 回答2で書いたように、利得関数はこの場合 P(1) = 2[x(1) + x(2)]/2 - x(1) = x(2) P(2) = 2[x(2) + x(1)]/2 - x(2) = x(1) となるからです。したがって、私の表のようになるのです(N=2のときは右辺の分母が2に変わることをお忘れなく!) この場合は、ナッシュ均衡は(R,R), (R,C), (C,R), (C,C)の4つあります。つまり、どの組もナッシュ均衡です。だから、問題でプレイヤーの数はN≧3と設定してあるのです。Nが3以上の場合はナッシュ均衡は一意に定まります。回答2を見てください。

共感・感謝の気持ちを伝えよう!

質問者からのお礼

やはり全部ナッシュ均衡なのですね… 実は質問した問題の前にプレイヤーが2人のときのナッシュ均衡をもとめよ、という問題がありまして、そこでもすべてナッシュ均衡なのでは、と思ったもののうまく説明できていませんでした。 わかりやすい説明で、非常に助かりました。また質問することがあるかと思いますので、よろしくお願い致します

  • 回答No.3

>1.は3人以上のプレイヤーのナッシュ均衡の考え方、表記の仕方がわからず苦戦しています。 戦略の組は、各プレイヤーの戦略が互いにほかのプレイヤーの戦略の最適反応となっているとき、ナッシュ均衡といいます。 あるいは同じことですが、戦略の組は、各プレイヤーが自分だけその組から逸脱しても、自分の利得が増えないとき、ナッシュ均衡です。この定義はプレイヤーの数が2人であっても、3人であっても、N(≧3)人であっても変わりません。ナッシュ均衡の表記は戦略の組で表わします。たとえば、回答2で書いたように、x(i)がプレイヤーiの戦略とするなら、(x(1),x(2),・・・,x(N))で表わします。したがって、戦略の組(x(1),x(2),・・・,x(N))=(R,R,・・・,R)は、すべてのプレイヤーが戦略Rをとることを意味しています。 >2.は支配戦略=相手がどの戦略できても最適である戦略、という言葉を1.を踏まえた上でどう使えばいいのかわからずにまた苦戦中 あるゲームで、あるプレイヤーに支配戦略があるなら、ほかのプレイヤーがどんな戦略を選択しても、当該プレイヤーの最適反応は支配戦略だから、支配戦略をかならずとることになります。

共感・感謝の気持ちを伝えよう!

質問者からのお礼

表がおかしくなっていますが、仕切りの線は無視していただけるとわかりやすいかと思います。すみません……

質問者からの補足

>戦略の組は、各プレイヤーが自分だけその組から逸脱しても、自分の利得が増えないとき、ナッシュ均衡です。この定義はプレイヤーの数が2人であっても、3人であっても、N(≧3)人であっても変わりません。 このゲームのプレイヤーが二人であるときを考えた時          1/2|  R    | C ---|--------------|---------   R |(1000,1000)  |(2000,1000)   | | ---|--------------|----------- C |(1000,2000) |(2000,2000) という利得表になると思います。 この場合、「各プレイヤーが自分だけその組から逸脱しても、自分の利得が増えない」という意味ではナッシュ均衡はどう考えればいいのでしょうか。各プレイヤーはどの組み合わせにおいても相手の戦略に依存してしており、その意味では全部が「各プレイヤーが自分だけその組から逸脱しても、自分の利得が増えない」ように見えるのですが……

  • 回答No.1

#1を解くためには、(1)各プレイヤーの戦略は何か?(2)各プレイヤーの戦略集合は?そして、(3)各プレイヤーの利得は自分の戦略とほかのプレイヤーの戦略を用いてどういう風に表わせるか(つまり、各プレイヤーの利得関数はどうなるか)?がわからないと、このゲームのナッシュ均衡は求められない!まず、この3つの問についてプレイヤーの数が3人のとき―3人のプレイヤーをプレイヤー1、プレイヤー2、プレイヤー3とするとき―答えてみてください。(これができればN(≧3)人以上のプレイヤーに拡張するのは簡単です。)

共感・感謝の気持ちを伝えよう!

質問者からの補足

なるほど…利得関数を求めるのですね… しかし2人より多い利得関数の求め方がわからないのですが… Pi={R,C}、Pii={R,C}、Piii={R,C}で表をかいてみたんですが、全部で2×2×2=8パターンあり、そのぶんの各プレイヤーの利得をまとめてみました。 その後はどうしたらいいですか?

関連するQ&A

  • ゲーム理論 

    恥ずかしながら追試ということになってしまいそうなので、期末試験問題を復習しようと考えています。 そこで皆様に解説と回答をお教えいただきたく、質問させていただきます。 以下の文章の正誤を応えよ (1)「後出しじゃんけん」のようなゲームはゲームの木で表現すると、手番の時間的推移がわかりやすく理解しやすい。 (2)ゲームの木を使って表現するとき、同じ情報集合に含まれる意思決定節からは必ず同じ数の枝が出ていなければならない。 (3)男女のジレンマゲームは各プレイヤーが支配戦略を一つずつ持っている。 (4)協調の失敗とは、タカハトゲームのように相互に利益をもたらす戦略の組がナッシュ均衡として実現されないことをいう。 (5)すべての情報集合に意思決定節が一つしか含まれていない情報構造のゲームを、完全情報ゲームという。 (6)囚人のジレンマゲームを逐次手番でプレイすれば、ジレンマを解消できる。 (7)ナッシュ均衡はすべてのプレイヤーが単独で戦略を変更するインセンティヴを持たないことを保証するだけであり、複数のプレイヤーが協力して戦略を変更すれば互いに利得を改善できる可能性がある。 (8)ナッシュ均衡の中にプレイヤーのから脅しによって成立すると解釈できるものが含まれるのは、戦略の組み合わせが均衡経路外に対しても最適反応であることが必須だからである。 (9)いわゆる「ペナルティキック」ゲームには純粋戦略のナッシュ均衡は存在しない。 (10)混合戦略のナッシュ均衡において行動Aと行動Bをランダムに選択しているプレイヤーが、どちらか一方の行動だけを選択する純粋戦略に変更しても、そのプレイヤーの期待利得は変わらない。 自分の回答は ○、×、×、○、×、×、○、○、○、× でした。 特に5~10がよくわからないです。解説と回答よろしくお願いします。

  • ゲーム理論

    戦略型ゲームGの混合戦略ナッシュ均衡をすべて求めよ。   a  b   c A 1,3 3,0 2,-1 B 3,0 2,6 0,2 C 0,4 1,0 3,-1 ※被強支配戦略の繰り返し消去に注意

  • ゲーム理論

    戦略型ゲームGを以下のように定義する。 ・プレイヤーは1と2の2名。 ・プレイヤーi(i=1,2)の戦略集合は0以上1以下の実数の集  合、すなわち、{X|X∈R,0≦X≦1} ・各プレイヤーの利得は以下のように決定される。  プレイヤーi(i=1,2)が戦略Xiを選んだとする。このとき  X1+X2≦1ならば、Xiの値がそのままプレイヤーiの利得とな る。X1+X2>1ならば、両者とも利得は0となる。 このゲームGの純粋戦略ナッシュ均衡をすべて求めよ。 この解き方と解答を教えてください。

  • ゲーム理論

    ゲーム理論の練習問題の解答解説お願いします。 プレイヤー:スミス社、ジョーンズ社 各プレイヤーのアクション: 大小 利得:両方とも大なら各々5、両社とも小なら各々1、一方が大で他方が小なら各々-1 (1)このゲームが同時手番で行われるとき、その標準形を示せ (2)空欄に適切な文字を埋めよ (*)とは、各プレイヤーの最適反応の組み合わせである。最適反応とは、相手の戦略にたいして(*)が、最大になる戦略である。上記のゲームにおいて、スミス社にとってもジョーンズ社にとっても、相手の大という戦略に対する最適反応は(*)であり、相手の小という戦略に対する最適反応は(*)である。したがってこのゲームは(*)は(*)である。 (3)このゲームが逐次的手番(スミス社が先にアクションを選ぶ)で行われるとした場合の展開形と均衡経路を示せ。

  • ゲーム理論の問題です

    プレイヤーは1と2の2名です。 ・プレイヤーi(i=1、2)の戦略集合は0以上1以下の実際の集合。すなわち、{x|x∈ R、0≦x≦1} ・各プレイヤーの利得は以下のように決定される: プレイヤーi(i=1、2)が戦略xiを選んだとする。この時x1+x2≦1ならば、xiの値 がそのままプレイヤーiの利得となる。x1+x2>1ならば、両者の利得は0となる。 このゲームの純粋戦略ナッシュ均衡をすべて求めよ。

  • ゲーム理論

    混合戦略の範囲でのナッシュ均衡 けんとたけしという2人がいます。 けんとたけしは共に混合戦略をとり、けんが純粋戦略uをとる確率p(0≦p≦1) たけしがとる純粋戦略Lをとる確率q(0≦q≦1) 以上の条件があって けんとたけしがとる戦略によってとる利得は次のようになる。 けん;(u,L)=(a,b) (u,R)=(0,0) たけし;(D,L)=(0,0) (D,R)=(c,d) ただしa,b,c,dは正の定数 このとき 混合戦略の範囲でナッシュ均衡はありますか?

  • ゲーム理論

    数学のテキストの中に、ゲーム理論を扱う部分があり、そこに性比ゲームが出てきました。が、どういうゲームの設定なのかが解説されておらず、いきなり式を展開されて、よく理解できません。 一般的に、性比ゲームというのはどのようなルールの下で行われるゲームなのでしょうか?漠然とした質問ですみません。 それと、いくつかの純戦略をある割合で混合した戦略を用いるゲームで「最適反応はいくつかの純戦略を必ず含む」「強意のナッシュ均衡が存在する場合、それは純戦略である」とあったのですが、それは何故ですか?

  • ゲーム理論 復習

    手詰まりでわかりません。よろしければ教えてください。 企業1と企業2は互いに代替的な製品を生産し販売している。企業xが設定した製品価格をPx万円(x=1、2)としたとき、それぞれの製品に対する需要量は D1=A-P1+P2 D2=A-P2+p1  (Aは正の定数) また各社はそれぞれ生産1あたりにC万円の費用がかかる(A>Cとする)。各社は同時手番でそれぞれの利潤を最大化するように自社製品の価格を設定する。 [1]このゲームを一度だけプレイ (1)企業2の製品価格がP2と予想されるときの企業1の反応関数を求めよ (2)ナッシュ均衡での各社の製品価格として正しいのはどれか。 (3)ナッシュ均衡で各社が獲得する利益はいくらか、 (4)企業1がプライスリーダーとする。企業1が先に戦略を決め、それを見た後で企業2が戦略を決める。そのとき部分ゲーム完全なナッシュ均衡でプレイヤー1が設定する製品価格を求めよ。 (5)(4)のとき企業2の設定する製品価格を求めよ。 [2]上記の手番ゲームが無限回繰り返され、毎回の段階ゲームの結果は次の段階ゲームが始まる前に、各企業に観察されるものとする。各企業は共通の割引因子σ(0<σ<1)を用いて各段階ゲームで割引現在価値を最大にするように戦略を選ぶ。各企業はトリガー戦略(戦略Xと呼ぶ)用いることによって均衡経路上では毎回必ずP=2A+Cという製品価格を実現させようとする。戦略Xでは以下のように指定されている。 ・第一回目の段階ゲームおよび過去に互いに設定し続けて迎えた段階ゲームでは価格をP*に設定する。 ・上記以外の段階ゲームでは(2)で求めた価格を設定する。 今企業2が戦略Xをとると予想したとき、企業1が一回目の段階ゲームで戦略X から逸脱すればP1を(6)に設定することが短期的には最適である。逸脱によって得られる利潤の増加分は(7)である。しかしそれを踏まえ企業2も行動が変化するので、二回目以降の毎回の段階ゲームで企業1の獲得する利潤が、先の逸脱によって、少なくとも(8)万円減る。その結果逸脱によって(9)万円の長期的な損失を発生させる。したがって互いに戦略Xをとり続ける必要十分条件は(10)以上の割引因子をもつことである。 (1)~(10)に答えよ。 という問題です。長いですが、考え方と解答を教えて頂ければと思います。よろしくお願いします。

  • プレイヤーが3人のナッシュ均衡

    プレイヤーが3人の時のナッシュ均衡はどう求めればいいのでしょう? 例えば、 3人が0か1かを選ぶ同時手番ゲームで、 3人の和が奇数だと全員に利得1 3人の和が偶数だと全員に利得0 このときナッシュ均衡は(0,0,1)(0,1,0)(1,0,0)(1,1,1)でいいのでしょうか?

  • 混合戦略ナッシュ均衡について

       D    E A(2,2)  (4,8) B(5,6)  (3,3) という利得表の同時手番ゲームを考える問題についてなのですが、この場合の純粋戦略って(4,8)(5,6)ですよね。 そして混合戦略ナッシュ均衡を含めて考えた時、プレイヤー1と2の最適反応(赤=1、青=2)を図示したのですが以下のようになりました。(プレイヤー1がAを取る確率p、2がDを取る確率q) 下の図で丸を付けた箇所が均衡なのは知っているんですが、この場合答えの表記の仕方はどうなるんでしょうか・・?また、純粋戦略で求めた以外での混合戦略ナッシュ均衡において実現する量プレイヤーの期待利得を求めよ。との問いもあるのですが、だんだんわからなくなってきました・・。お時間のある方どうぞよろしくお願いいたします。