ゲーム値と最適戦略の求め方とは?

このQ&Aのポイント
  • 行列ゲームの2人ゲーム問題を解く際に、ゲーム値と最適戦略を求める方法を紹介します。
  • シンプレックス法を用いてゲーム値と最適戦略を計算する手順を解説します。
  • ゲーム理論の本を読んでも理解できなかった部分について、具体的な例を用いて解説します。
回答を見る
  • ベストアンサー

2人ゲームのゲーム値と最適戦略

行列ゲームの2人ゲーム問題を解いていて最後のところで詰まってしまいました。 得点行列で与えられる2人ゲームのゲーム値と最適戦略を求める問題で、 1 -1 -1 -1 -1 3 -1 2 -1 シンプレックス法を用いて、次のように求めました。 1 0 0 1/2 0 0 1/2 0 0 1 0 1/4 0 1/4 0 1 0 0 0 1/3 1/3 0 0 0 1/2 1/4 1/3 7/12 ゲーム理論の本を読みながらここまで頑張ってみたのですが、 どの部分がゲーム値と最適戦略になるのかが理解できませんでした。 どなたかご教授お願いいたします。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.4

まず、前回の回答の訂正をします。 x1 = 6/13 , x2 = 3/13 , x3 = 4/13 , y1 = 6/13 , y2 = 4/13 , y3 = 3/13 が正しい値です。 そして、この値のとき、均衡状態になります。 もしAさんもBさんもこの値の通りの確率で選択肢を選べば、 f(x1,x2,x3,y1,y2,y3) = 1x1y1 -1x1y2 -1x1y3 -1x2y1 -1x2y2 +3x2y3 -1x3y1 +2x3y2 -1x3y3 ≒ -0.0769 となりますので、Aさんは、ゲーム1回当り、平均で 0.0769 点 程度、損をすることになります。 逆にいえば、Bさんは、ゲーム1回当り、平均で 0.0769 点 程度、得をすることになります。 さて、x1,x2,x3,y1,y2,y3 にいろいろな値を入れてみました。 (ご自分でも試してみて下さい。ただし、x1 + x2 + x3 = 1 , y1 + y2 + y3 = 1 にして下さい。) その結果として、少なくともこの問題に限っては、次のことがわかりました。 ・Bさんが上記の戦略を採用すれば、Aさんがどんな戦略をとったとしても、   Bさんは平均で 0.0769 点 程度、得をする → Bさんにとってはこの戦略が最適 ・Aさんが上記の戦略を採用すれば、Bさんがどんな戦略をとったとしても、   Aさんは平均で 0.0769 点 程度、損をする → Aさんがこの戦略をとるメリットはあまりない ということは、Bさんは、相手の戦略を知らなくても得をすることができます。 (もちろん、相手の戦略を知っていればもっと得ができるでしょう。) しかし、Aさんは、Bさんが正しい戦略をとる限り、勝ち目はありません。 しかも、Bさんが正しい戦略をとらないとしても、 Bさんの戦略をAさんが読めなければ、Aさんは勘で勝負するしかありません。 私がこの問題を最初に見たとき、AさんとBさんの勝率は5分5分だろうと思っていました。 でも、実はこのゲームはBさんが有利なんですね。 yatukoさんのおかげで、私も少し賢くなれました。ありがとうございます。

yatuko
質問者

お礼

分かりやすく書かれていたので、この計算の考え方が理解できたと思います! 自分で頑張って計算してみました。 長々と本当にありがとうございました!!

その他の回答 (3)

回答No.3

>> x1 + x2 + x3 = 13/12 ですから、x1,x2,x3 に 12/13 をかけると、 > のところは、逆数にしてからかけるということでいいのでしょうか? はい、その通りです。x1 + x2 + x3 = 1 になるように、そうします。 > この値がゲーム値ということになるのですか? ではありません。 はっきりはわかりませんが、シンプレックス表にゲーム値は書いていないのかもしれません。 では、リクエストがありましたので、続きを書くことにします。 Aさんは選択肢1,2,3のどれかしか選べませんから、x1 + x2 + x3 = 1 、 同様にBさんについて、 y1 + y2 + y3 = 1 です。 1回ゲームをするときAさんが得られる得点の期待値は、 f(x1,x2,x3,y1,y2,y3) = 1x1y1 -1x1y2 -1x1y3 -1x2y1 -1x2y2 +3x2y3 -1x3y1 +2x3y2 -1x3y3 です。 均衡状態では、x1 + x2 + x3 = 1 を保った状態で x1 を少しだけ増やして x2 を少し減らしても f の値は変わりません。 これを数式で表すと、 ∂f/∂x1 - ∂f/∂x2 = 0 となります。(これは偏微分というものです。) 同様にすると4つの式が得られ、 ∂f/∂x1 - ∂f/∂x2 = 0 ∂f/∂x2 - ∂f/∂x3 = 0 ∂f/∂y1 - ∂f/∂y2 = 0 ∂f/∂y2 - ∂f/∂y3 = 0 が成り立ちます。 計算すると、 ∂f/∂x1 = y1 - y2 - y3 ∂f/∂x2 = - y1 - y2 + 3y3 ∂f/∂x3 = - y1 + 2y2 - y3 ∂f/∂y1 = x1 - x2 - x3 ∂f/∂y2 = - x1 - x2 + 2x3 ∂f/∂y3 = - x1 + 3x2 - x3 となり、これを4つの式に代入すると、 2y1 - 4y3 = 0 -3y2 + 4y3 = 0 2x1 - 3x3 = 0 -4x2 + 3x3 = 0 となります。 これに x1 + x2 + x3 = 1 と y1 + y2 + y3 = 1 を加え、 6変数で6つの式の一次連立方程式を解きます。 その結果、 x1 = 4/13 , x2 = 2/13 , x3 = 3/13 , y1 = 4/13 , y2 = 3/13 , y3 = 2/13 が得られます。 (申し訳ありませんが字数制限上、補足をお願いします。)

yatuko
質問者

補足

長々とありがとうございます。 ここまでの計算の流れはわかりました。 また続きをお願いします!

回答No.2

なぜ+αすると計算がうまくいくのか、 なぜ補足の線形計画問題を解けばよいのかについては、 私にはわかりません。 質問者さんの本を読めばたぶんわかると思うのですが、 そういうわけにもいきませんし… 満足な答えができなくてすいません。 でも、解いた結果のシンプレックス表は、 1x1 + 0x2 + 0x3 = 1/2 0x1 + 0x2 + 1x3 = 1/4 0x1 + 1x2 + 0x3 = 1/3 を表しています。 つまり、x1 = 1/2 , x2 = 1/3 , x3 = 1/4 です。 x1 + x2 + x3 = 13/12 ですから、x1,x2,x3 に 12/13 をかけると、 x1 ' = 6/13 ≒ 0.461 x2 ' = 4/13 ≒ 0.308 x3 ' = 3/13 ≒ 0.231 とすると、x1 ' + x2 ' + x3 ' = 1 となります。 どうもこの解は、 Aさんは 6/13 の確率で選択肢1(1,-1,-1)を選び、 Aさんは 3/13 の確率で選択肢2(-1,-1,3)を選び、 Aさんは 4/13 の確率で選択肢3(-1,2,-1)を選べばよい Bさんは 6/13 の確率で選択肢1(1,-1,-1)を選び、 Bさんは 4/13 の確率で選択肢2(-1,-1,2)を選び、 Bさんは 3/13 の確率で選択肢3(-1,3,-1)を選べばよい ことを表しているようです。 実は、私は別の方法でこの問題を解いて、上記のことがわかりました。 もしBさんが等確率で選択肢1,2,3を選ぶとすれば、 Aさんは選択肢2を選び続けるのが最適です。 でも、Bさんはそのことがわかっていますから、 選択肢3を避け、選択肢1,2のどちらかを選ぶでしょう。 では、AさんとBさんは、どの確率でどの選択肢を選べばいいのでしょうか。 Aさんが選択肢1,2,3を選ぶ確率をそれぞれ x1 , x2 , x3 とします。 Bさんが選択肢1,2,3を選ぶ確率をそれぞれ y1 , y2 , y3 とします。 すると、… この辺で字数制限に引っかかります。 分割投稿は禁止ですが、もし続きをお知りになりたいなら、 コメントして頂ければ回答できると思います。

yatuko
質問者

補足

ありがとうございます! 表の意味が分かりました。 それから少し疑問に思ったのですが、 >x1 + x2 + x3 = 13/12 ですから、x1,x2,x3 に 12/13 をかけると、 のところは、逆数にしてからかけるということでいいのでしょうか? この値がゲーム値ということになるのですか? 続きが気になるので、 よろしければぜひ解説をお願いします。

回答No.1

得点行列とは何でしょうか。 AさんとBさんが対戦して、Aさんが2番目の選択肢、 Bさんが3番目の選択肢を選択したら、 Aさんが+3点、Bさんが-3点になる、という意味で間違いないでしょうか。 それから、シンプレックス法は、制約条件と目的関数があり、 それを解いた結果が質問内容の表になっていると思います。 最初に立てた制約条件と目的関数を、式の形で書いて頂けないでしょうか。

yatuko
質問者

補足

AさんとBさんの得点のその意味で合ってます。 この行列のゲーム値と、AとBの最適戦略を求めたいのです。 まぎらわしく書いてしまい、すみませんでした。 まず問題の行列の成分をすべて+1しました。 解説によると行列の中を0以上なるように+αすると計算がうまくいくと書かれていたので。 それを線形計画問題化したのが下です↓ 2 0 0 0 0 4 0 3 0 2x1<=1 4x3<=1 3x2<=1 x1,x2,x3>=0の下で z=x1+x2+x3  を最大にする ちなみに縦の列ごとにx1,x2,x3と表しています。 そもそもこの考え方とやり方が合っているのかが不安ですが・・・ よろしくお願いいたします。

関連するQ&A

  • 交渉戦略

    交渉戦略についてゲームの理論を用いて説明した本を探しています。 和・洋問いません。

  • 移行戦略について

    こんにちは。こないだ経済関係の本を読んでいたのですが、そこに移行戦略と言う言葉が出てきました。そこで、移行戦略について少し知りたいと思い、詳しい方は次の質問のご回答お願いします。まず移行戦略とは何か?移行戦略を行った国はなぜこの戦略を採用したのか?最後にこの戦略をするにあたってどう言った問題に直面するのか?と言う質問です。よろしくお願いします。

  • ゲーム理論のトリガー戦略について

    ぜひ教えてください。次の問題がわからなくて困っています。 ゲーム理論のトリガー戦略についての問題なのですが、 次の利得表において、              B         協調     裏切り    (左:Aの利得、右、Bの利得)   協調  (20、20) (0、30) A 裏切り (30、0)  (10、10) 1回目は必ず協調、それ以降、(t-1)回目に相手が裏切れば、t回目以降は両方とも裏切るという無限回繰り返しゲームにおいて、(どちらも協調)が成立する割引因子aを求めよ。  という問題なのですが、答えは、0.5になるのだそうですが、導出過程がわかりません。どなたか教えていただけませんでしょうか。よろしくお願いします。

  • ゲーム理論

    数学のテキストの中に、ゲーム理論を扱う部分があり、そこに性比ゲームが出てきました。が、どういうゲームの設定なのかが解説されておらず、いきなり式を展開されて、よく理解できません。 一般的に、性比ゲームというのはどのようなルールの下で行われるゲームなのでしょうか?漠然とした質問ですみません。 それと、いくつかの純戦略をある割合で混合した戦略を用いるゲームで「最適反応はいくつかの純戦略を必ず含む」「強意のナッシュ均衡が存在する場合、それは純戦略である」とあったのですが、それは何故ですか?

  • 純粋戦略ナッシュ均衡について

      D    E    F A(4,4) (0、0) (7,0) B(0,0) (1,1) (0,0) C(0,7) (0,0) (6,6) (プレイヤー1の利得、プレイヤー2の利得) A,B,Cはプレイヤー1の選択、 D,E,Fはプレイヤー2の選択であり、 プレイヤー1と2が同時に独立に選択する場合の、純粋戦略ナッシュ均衡はどうなるのでしょうか? 何冊かテキストのゲーム理論の部分を読んでみましたが、いまいち純粋戦略ナッシュ均衡とはなんなのか理解できないので、どなたか教えていただけると助かります。 問題には、純粋戦略ナッシュ均衡を全て挙げよと書いてあるのですが、ナッシュ均衡は、相手の選択を所与のものとした場合に、他の選択肢を選んでも、利得が増えることのない選択のことですよね? 一つのゲームにいくつもあるものなのでしょうか? 素人な質問ですみませんが、よろしくおねがいいたします。

  • ゲーム理論のトリガー戦略について質問です。

    問題 1\2     A          B A       (5, 5)        (1, 7) B       (7, 1)        (4, 4) 上の基本ゲームを無限に繰り返す。2による戦略「Bから始めるトリガー」に対して、すべての部分ゲームで最適反応となる1の戦略はどのようなものか。また、その時の利得の系列はどうなるか。 どなたか教えてください、お願いしますm(__)m

  • 2人用ボードゲームで良いもの

    連れとよく2人でボードゲームやカードゲームで遊んでいます。 本来は4人で遊ぶラミーキューブや、サンファンを2人で楽しんでいますが、他にも遊びたいと 思っており、何かお勧めのゲームは無いでしょうか? 細かい条件で誠にすみませんが、以下のすべてを満たせるととても嬉しいです。 a. 2人用もしくは、2人でも十分に楽しいもの b. 戦略と運の要素があるもの   思考だけのアブストラクトゲームは片方ばかりが勝つので遊べません c. ウォーゲームのような相手を直接叩くゲーム以外   得点を競い合うものや、協力するもの、何かを作るものなどを希望 d. 60分ぐらいの比較的じっくりと、遊べるもの e. 何度も遊べるゲームのパターンがあるもの 本当にニッチなジャンルですみません。2人用のアグリコラ 牧場の動物達なんかも気になったのですが、b.の運の条件を満たさずに断念しました。カルカソンヌは、持っていますが2人よりも断然4人ぐらいが楽しいので2人の時には遊んでいません。 もし、本当ニッチでこういったジャンルが無いのであれば「無いよ」で構いませんので回答を頂けると助かります。

  • 数学と戦略

    戦略に関する質問です。 次のような戦略ゲームを考えます。 1、2という人物がいて、1については戦略u,D,2については戦略L,R を取ると考えて 以下戦略のとり方によって利得は次のようになります 左から1、2の取る戦略として (u,L)=(a[1],a[2]),(u,R)=(b[1],b[2]) (D,L)=(c[1],c[2]),(D,R)=(d[1],d[2]) このとき (1)戦略(u,L)がナッシュ均衡である (2)a[1]=c[1]のとき純粋戦略ナッシュ均衡が存在する これらがどうして成り立つのか理解できません。

  • ライアーゲームでやっているようなゲームの必勝法の考え方が載っている本が欲しいです

    ライアーゲームでは色々なゲームをやっていて、ああいうゲームの必勝法の考え方が載っている本を探しているんですが、ゲーム理論の本を見ても何となく違う気がします。何か良い本はないでしょうか

  • 次の石とりゲームに必勝法はありますか

    二人で石を取り合うゲームがあります。 ゲームのルールは次の通りです。 ・石の数は60個。 ・二人で交互に石を取り合う。 ・1回の手番で取れる石の数は1個~3個。 ・石がなくなったとき、とった石の数が多いほうが勝ち。 ・ただし、最後の1個は、石30個分として扱う。 このゲームに必勝法はありますか。 もしあるなら、どうしたら勝てますか。 また、最初の石の数が60個ではなく、N個だった場合、 どういう戦略なら勝つことができるのでしょうか。