ゲーム値と最適戦略の求め方とは？

2007/12/12 00:45

このQ&Aのポイント

行列ゲームの２人ゲーム問題を解く際に、ゲーム値と最適戦略を求める方法を紹介します。
シンプレックス法を用いてゲーム値と最適戦略を計算する手順を解説します。
ゲーム理論の本を読んでも理解できなかった部分について、具体的な例を用いて解説します。

yatuko
お礼率57% (4/7)

数学・算数
回答数4
ありがとう数1

みんなの回答 （4）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

kts2371148
ベストアンサー率70% (49/70)

2007/12/21 21:20 回答No.4

まず、前回の回答の訂正をします。 x1 = 6/13 , x2 = 3/13 , x3 = 4/13 , y1 = 6/13 , y2 = 4/13 , y3 = 3/13 が正しい値です。そして、この値のとき、均衡状態になります。もしＡさんもＢさんもこの値の通りの確率で選択肢を選べば、 f(x1,x2,x3,y1,y2,y3) = 1x1y1 -1x1y2 -1x1y3 -1x2y1 -1x2y2 +3x2y3 -1x3y1 +2x3y2 -1x3y3 ≒ -0.0769 となりますので、Ａさんは、ゲーム１回当り、平均で 0.0769 点程度、損をすることになります。逆にいえば、Ｂさんは、ゲーム１回当り、平均で 0.0769 点程度、得をすることになります。さて、x1,x2,x3,y1,y2,y3 にいろいろな値を入れてみました。（ご自分でも試してみて下さい。ただし、x1 + x2 + x3 = 1 , y1 + y2 + y3 = 1 にして下さい。）その結果として、少なくともこの問題に限っては、次のことがわかりました。・Ｂさんが上記の戦略を採用すれば、Ａさんがどんな戦略をとったとしても、　　Ｂさんは平均で 0.0769 点程度、得をする → Ｂさんにとってはこの戦略が最適・Ａさんが上記の戦略を採用すれば、Ｂさんがどんな戦略をとったとしても、　　Ａさんは平均で 0.0769 点程度、損をする → Ａさんがこの戦略をとるメリットはあまりないということは、Ｂさんは、相手の戦略を知らなくても得をすることができます。（もちろん、相手の戦略を知っていればもっと得ができるでしょう。）しかし、Ａさんは、Ｂさんが正しい戦略をとる限り、勝ち目はありません。しかも、Ｂさんが正しい戦略をとらないとしても、Ｂさんの戦略をＡさんが読めなければ、Ａさんは勘で勝負するしかありません。私がこの問題を最初に見たとき、ＡさんとＢさんの勝率は５分５分だろうと思っていました。でも、実はこのゲームはＢさんが有利なんですね。 yatukoさんのおかげで、私も少し賢くなれました。ありがとうございます。

質問者

お礼 2007/12/26 23:09

分かりやすく書かれていたので、この計算の考え方が理解できたと思います！自分で頑張って計算してみました。長々と本当にありがとうございました！！

その他の回答 (3)

kts2371148
ベストアンサー率70% (49/70)

2007/12/17 21:48 回答No.3

>> x1 + x2 + x3 = 13/12 ですから、x1,x2,x3 に 12/13 をかけると、 > のところは、逆数にしてからかけるということでいいのでしょうか？はい、その通りです。x1 + x2 + x3 = 1 になるように、そうします。 > この値がゲーム値ということになるのですか？ではありません。はっきりはわかりませんが、シンプレックス表にゲーム値は書いていないのかもしれません。では、リクエストがありましたので、続きを書くことにします。Ａさんは選択肢１，２，３のどれかしか選べませんから、x1 + x2 + x3 = 1 、同様にＢさんについて、 y1 + y2 + y3 = 1 です。１回ゲームをするときＡさんが得られる得点の期待値は、 f(x1,x2,x3,y1,y2,y3) = 1x1y1 -1x1y2 -1x1y3 -1x2y1 -1x2y2 +3x2y3 -1x3y1 +2x3y2 -1x3y3 です。均衡状態では、x1 + x2 + x3 = 1 を保った状態で x1 を少しだけ増やして x2 を少し減らしても f の値は変わりません。これを数式で表すと、 ∂f/∂x1 - ∂f/∂x2 = 0 となります。（これは偏微分というものです。）同様にすると４つの式が得られ、 ∂f/∂x1 - ∂f/∂x2 = 0 ∂f/∂x2 - ∂f/∂x3 = 0 ∂f/∂y1 - ∂f/∂y2 = 0 ∂f/∂y2 - ∂f/∂y3 = 0 が成り立ちます。計算すると、 ∂f/∂x1 = y1 - y2 - y3 ∂f/∂x2 = - y1 - y2 + 3y3 ∂f/∂x3 = - y1 + 2y2 - y3 ∂f/∂y1 = x1 - x2 - x3 ∂f/∂y2 = - x1 - x2 + 2x3 ∂f/∂y3 = - x1 + 3x2 - x3 となり、これを４つの式に代入すると、 2y1 - 4y3 = 0 -3y2 + 4y3 = 0 2x1 - 3x3 = 0 -4x2 + 3x3 = 0 となります。これに x1 + x2 + x3 = 1 と y1 + y2 + y3 = 1 を加え、６変数で６つの式の一次連立方程式を解きます。その結果、 x1 = 4/13 , x2 = 2/13 , x3 = 3/13 , y1 = 4/13 , y2 = 3/13 , y3 = 2/13 が得られます。（申し訳ありませんが字数制限上、補足をお願いします。）

質問者

補足 2007/12/20 22:57

長々とありがとうございます。ここまでの計算の流れはわかりました。また続きをお願いします！

kts2371148
ベストアンサー率70% (49/70)

2007/12/14 20:36 回答No.2

なぜ＋αすると計算がうまくいくのか、なぜ補足の線形計画問題を解けばよいのかについては、私にはわかりません。質問者さんの本を読めばたぶんわかると思うのですが、そういうわけにもいきませんし… 満足な答えができなくてすいません。でも、解いた結果のシンプレックス表は、 1x1 + 0x2 + 0x3 = 1/2 0x1 + 0x2 + 1x3 = 1/4 0x1 + 1x2 + 0x3 = 1/3 を表しています。つまり、x1 = 1/2 , x2 = 1/3 , x3 = 1/4 です。 x1 + x2 + x3 = 13/12 ですから、x1,x2,x3 に 12/13 をかけると、 x1 ' = 6/13 ≒ 0.461 x2 ' = 4/13 ≒ 0.308 x3 ' = 3/13 ≒ 0.231 とすると、x1 ' + x2 ' + x3 ' = 1 となります。どうもこの解は、Ａさんは 6/13 の確率で選択肢１(1,-1,-1)を選び、Ａさんは 3/13 の確率で選択肢２(-1,-1,3)を選び、Ａさんは 4/13 の確率で選択肢３(-1,2,-1)を選べばよいＢさんは 6/13 の確率で選択肢１(1,-1,-1)を選び、Ｂさんは 4/13 の確率で選択肢２(-1,-1,2)を選び、Ｂさんは 3/13 の確率で選択肢３(-1,3,-1)を選べばよいことを表しているようです。実は、私は別の方法でこの問題を解いて、上記のことがわかりました。もしＢさんが等確率で選択肢１，２，３を選ぶとすれば、Ａさんは選択肢２を選び続けるのが最適です。でも、Ｂさんはそのことがわかっていますから、選択肢３を避け、選択肢１，２のどちらかを選ぶでしょう。では、ＡさんとＢさんは、どの確率でどの選択肢を選べばいいのでしょうか。Ａさんが選択肢１，２，３を選ぶ確率をそれぞれ x1 , x2 , x3 とします。Ｂさんが選択肢１，２，３を選ぶ確率をそれぞれ y1 , y2 , y3 とします。すると、… この辺で字数制限に引っかかります。分割投稿は禁止ですが、もし続きをお知りになりたいなら、コメントして頂ければ回答できると思います。

質問者

補足 2007/12/16 22:39

ありがとうございます！表の意味が分かりました。それから少し疑問に思ったのですが、 >x1 + x2 + x3 = 13/12 ですから、x1,x2,x3 に 12/13 をかけると、のところは、逆数にしてからかけるということでいいのでしょうか？この値がゲーム値ということになるのですか？続きが気になるので、よろしければぜひ解説をお願いします。

kts2371148
ベストアンサー率70% (49/70)

2007/12/13 18:10 回答No.1

得点行列とは何でしょうか。ＡさんとＢさんが対戦して、Ａさんが２番目の選択肢、Ｂさんが３番目の選択肢を選択したら、Ａさんが＋３点、Ｂさんが－３点になる、という意味で間違いないでしょうか。それから、シンプレックス法は、制約条件と目的関数があり、それを解いた結果が質問内容の表になっていると思います。最初に立てた制約条件と目的関数を、式の形で書いて頂けないでしょうか。

質問者

補足 2007/12/14 01:13

ＡさんとＢさんの得点のその意味で合ってます。この行列のゲーム値と、ＡとＢの最適戦略を求めたいのです。まぎらわしく書いてしまい、すみませんでした。まず問題の行列の成分をすべて＋１しました。解説によると行列の中を0以上なるように＋αすると計算がうまくいくと書かれていたので。それを線形計画問題化したのが下です↓ ２　０　００　０　４０　３　０２ｘ1＜＝１４ｘ3＜＝１３ｘ2＜＝１ｘ1,ｘ2,ｘ3＞＝０の下でｚ＝ｘ1＋ｘ2＋ｘ3　を最大にするちなみに縦の列ごとにｘ1,ｘ2,ｘ3と表しています。そもそもこの考え方とやり方が合っているのかが不安ですが・・・よろしくお願いいたします。

ゲーム値と最適戦略の求め方とは？

２人ゲームのゲーム値と最適戦略