• ベストアンサー
  • 困ってます

2人ゲームのゲーム値と最適戦略

行列ゲームの2人ゲーム問題を解いていて最後のところで詰まってしまいました。 得点行列で与えられる2人ゲームのゲーム値と最適戦略を求める問題で、 1 -1 -1 -1 -1 3 -1 2 -1 シンプレックス法を用いて、次のように求めました。 1 0 0 1/2 0 0 1/2 0 0 1 0 1/4 0 1/4 0 1 0 0 0 1/3 1/3 0 0 0 1/2 1/4 1/3 7/12 ゲーム理論の本を読みながらここまで頑張ってみたのですが、 どの部分がゲーム値と最適戦略になるのかが理解できませんでした。 どなたかご教授お願いいたします。

共感・応援の気持ちを伝えよう!

  • 回答数4
  • 閲覧数736
  • ありがとう数1

質問者が選んだベストアンサー

  • ベストアンサー
  • 回答No.4

まず、前回の回答の訂正をします。 x1 = 6/13 , x2 = 3/13 , x3 = 4/13 , y1 = 6/13 , y2 = 4/13 , y3 = 3/13 が正しい値です。 そして、この値のとき、均衡状態になります。 もしAさんもBさんもこの値の通りの確率で選択肢を選べば、 f(x1,x2,x3,y1,y2,y3) = 1x1y1 -1x1y2 -1x1y3 -1x2y1 -1x2y2 +3x2y3 -1x3y1 +2x3y2 -1x3y3 ≒ -0.0769 となりますので、Aさんは、ゲーム1回当り、平均で 0.0769 点 程度、損をすることになります。 逆にいえば、Bさんは、ゲーム1回当り、平均で 0.0769 点 程度、得をすることになります。 さて、x1,x2,x3,y1,y2,y3 にいろいろな値を入れてみました。 (ご自分でも試してみて下さい。ただし、x1 + x2 + x3 = 1 , y1 + y2 + y3 = 1 にして下さい。) その結果として、少なくともこの問題に限っては、次のことがわかりました。 ・Bさんが上記の戦略を採用すれば、Aさんがどんな戦略をとったとしても、   Bさんは平均で 0.0769 点 程度、得をする → Bさんにとってはこの戦略が最適 ・Aさんが上記の戦略を採用すれば、Bさんがどんな戦略をとったとしても、   Aさんは平均で 0.0769 点 程度、損をする → Aさんがこの戦略をとるメリットはあまりない ということは、Bさんは、相手の戦略を知らなくても得をすることができます。 (もちろん、相手の戦略を知っていればもっと得ができるでしょう。) しかし、Aさんは、Bさんが正しい戦略をとる限り、勝ち目はありません。 しかも、Bさんが正しい戦略をとらないとしても、 Bさんの戦略をAさんが読めなければ、Aさんは勘で勝負するしかありません。 私がこの問題を最初に見たとき、AさんとBさんの勝率は5分5分だろうと思っていました。 でも、実はこのゲームはBさんが有利なんですね。 yatukoさんのおかげで、私も少し賢くなれました。ありがとうございます。

共感・感謝の気持ちを伝えよう!

質問者からのお礼

分かりやすく書かれていたので、この計算の考え方が理解できたと思います! 自分で頑張って計算してみました。 長々と本当にありがとうございました!!

その他の回答 (3)

  • 回答No.3

>> x1 + x2 + x3 = 13/12 ですから、x1,x2,x3 に 12/13 をかけると、 > のところは、逆数にしてからかけるということでいいのでしょうか? はい、その通りです。x1 + x2 + x3 = 1 になるように、そうします。 > この値がゲーム値ということになるのですか? ではありません。 はっきりはわかりませんが、シンプレックス表にゲーム値は書いていないのかもしれません。 では、リクエストがありましたので、続きを書くことにします。 Aさんは選択肢1,2,3のどれかしか選べませんから、x1 + x2 + x3 = 1 、 同様にBさんについて、 y1 + y2 + y3 = 1 です。 1回ゲームをするときAさんが得られる得点の期待値は、 f(x1,x2,x3,y1,y2,y3) = 1x1y1 -1x1y2 -1x1y3 -1x2y1 -1x2y2 +3x2y3 -1x3y1 +2x3y2 -1x3y3 です。 均衡状態では、x1 + x2 + x3 = 1 を保った状態で x1 を少しだけ増やして x2 を少し減らしても f の値は変わりません。 これを数式で表すと、 ∂f/∂x1 - ∂f/∂x2 = 0 となります。(これは偏微分というものです。) 同様にすると4つの式が得られ、 ∂f/∂x1 - ∂f/∂x2 = 0 ∂f/∂x2 - ∂f/∂x3 = 0 ∂f/∂y1 - ∂f/∂y2 = 0 ∂f/∂y2 - ∂f/∂y3 = 0 が成り立ちます。 計算すると、 ∂f/∂x1 = y1 - y2 - y3 ∂f/∂x2 = - y1 - y2 + 3y3 ∂f/∂x3 = - y1 + 2y2 - y3 ∂f/∂y1 = x1 - x2 - x3 ∂f/∂y2 = - x1 - x2 + 2x3 ∂f/∂y3 = - x1 + 3x2 - x3 となり、これを4つの式に代入すると、 2y1 - 4y3 = 0 -3y2 + 4y3 = 0 2x1 - 3x3 = 0 -4x2 + 3x3 = 0 となります。 これに x1 + x2 + x3 = 1 と y1 + y2 + y3 = 1 を加え、 6変数で6つの式の一次連立方程式を解きます。 その結果、 x1 = 4/13 , x2 = 2/13 , x3 = 3/13 , y1 = 4/13 , y2 = 3/13 , y3 = 2/13 が得られます。 (申し訳ありませんが字数制限上、補足をお願いします。)

共感・感謝の気持ちを伝えよう!

質問者からの補足

長々とありがとうございます。 ここまでの計算の流れはわかりました。 また続きをお願いします!

  • 回答No.2

なぜ+αすると計算がうまくいくのか、 なぜ補足の線形計画問題を解けばよいのかについては、 私にはわかりません。 質問者さんの本を読めばたぶんわかると思うのですが、 そういうわけにもいきませんし… 満足な答えができなくてすいません。 でも、解いた結果のシンプレックス表は、 1x1 + 0x2 + 0x3 = 1/2 0x1 + 0x2 + 1x3 = 1/4 0x1 + 1x2 + 0x3 = 1/3 を表しています。 つまり、x1 = 1/2 , x2 = 1/3 , x3 = 1/4 です。 x1 + x2 + x3 = 13/12 ですから、x1,x2,x3 に 12/13 をかけると、 x1 ' = 6/13 ≒ 0.461 x2 ' = 4/13 ≒ 0.308 x3 ' = 3/13 ≒ 0.231 とすると、x1 ' + x2 ' + x3 ' = 1 となります。 どうもこの解は、 Aさんは 6/13 の確率で選択肢1(1,-1,-1)を選び、 Aさんは 3/13 の確率で選択肢2(-1,-1,3)を選び、 Aさんは 4/13 の確率で選択肢3(-1,2,-1)を選べばよい Bさんは 6/13 の確率で選択肢1(1,-1,-1)を選び、 Bさんは 4/13 の確率で選択肢2(-1,-1,2)を選び、 Bさんは 3/13 の確率で選択肢3(-1,3,-1)を選べばよい ことを表しているようです。 実は、私は別の方法でこの問題を解いて、上記のことがわかりました。 もしBさんが等確率で選択肢1,2,3を選ぶとすれば、 Aさんは選択肢2を選び続けるのが最適です。 でも、Bさんはそのことがわかっていますから、 選択肢3を避け、選択肢1,2のどちらかを選ぶでしょう。 では、AさんとBさんは、どの確率でどの選択肢を選べばいいのでしょうか。 Aさんが選択肢1,2,3を選ぶ確率をそれぞれ x1 , x2 , x3 とします。 Bさんが選択肢1,2,3を選ぶ確率をそれぞれ y1 , y2 , y3 とします。 すると、… この辺で字数制限に引っかかります。 分割投稿は禁止ですが、もし続きをお知りになりたいなら、 コメントして頂ければ回答できると思います。

共感・感謝の気持ちを伝えよう!

質問者からの補足

ありがとうございます! 表の意味が分かりました。 それから少し疑問に思ったのですが、 >x1 + x2 + x3 = 13/12 ですから、x1,x2,x3 に 12/13 をかけると、 のところは、逆数にしてからかけるということでいいのでしょうか? この値がゲーム値ということになるのですか? 続きが気になるので、 よろしければぜひ解説をお願いします。

  • 回答No.1

得点行列とは何でしょうか。 AさんとBさんが対戦して、Aさんが2番目の選択肢、 Bさんが3番目の選択肢を選択したら、 Aさんが+3点、Bさんが-3点になる、という意味で間違いないでしょうか。 それから、シンプレックス法は、制約条件と目的関数があり、 それを解いた結果が質問内容の表になっていると思います。 最初に立てた制約条件と目的関数を、式の形で書いて頂けないでしょうか。

共感・感謝の気持ちを伝えよう!

質問者からの補足

AさんとBさんの得点のその意味で合ってます。 この行列のゲーム値と、AとBの最適戦略を求めたいのです。 まぎらわしく書いてしまい、すみませんでした。 まず問題の行列の成分をすべて+1しました。 解説によると行列の中を0以上なるように+αすると計算がうまくいくと書かれていたので。 それを線形計画問題化したのが下です↓ 2 0 0 0 0 4 0 3 0 2x1<=1 4x3<=1 3x2<=1 x1,x2,x3>=0の下で z=x1+x2+x3  を最大にする ちなみに縦の列ごとにx1,x2,x3と表しています。 そもそもこの考え方とやり方が合っているのかが不安ですが・・・ よろしくお願いいたします。

関連するQ&A

  • シンプレックス法について

    制約条件は以下のようになります。 max z=3x+2y subject to 2x+3y<=24 3x+y>=15 x+y=7 x,y>=0 最適解をシンプレックス法によって求めよという問題です。 グラフ法だったらものすごく簡単にもとまりますが、シンプレックス法でどうやって解くのかわからないのです。 私はタブローを使うシンプレックス法で解こうとしましたが、表を作ってみましたが、x+y=7という等式 をどう扱うか困りました。 2x+3y+λ1=24 -3x-y+λ2=15 z-3x-2y=0 x+y=7 x,y>=0 基底 x y λ1 λ2 右辺 λ1   2 3 1 0 24 λ2  -3 -1 0 1 15 z   -3 -2 0 0 0 になりますが、x+y=7をどうやって表に入れるのかわかりませんでした。 どなたわかる方がいらっしゃいましたら、ご教授よろしくお願いします!

  • 最適戦略は?

    次のような2人でやるゲームを考えます。 (1)Aは100ドルを自由に2つに分けます。例えば72ドルと28ドルのように。100ドルと0ドルでもかまいません。 (2)BはAが分けた後、一方を自分(B)のもの、他方を相手(A)のものと決めることができます。 これが1回のゲームです。A,Bとも多く手に入れようと最善を尽くします。 このゲームをn回するとします。A,Bの役割は変わりません。このときの両者の最適戦略は A:毎回50,50に分ける。 B:どっちとっても同じ。 しかありません。ちっとも面白くないゲームです。 なので、ルールをちょい変えます。 (3)Bはn回のうち1回は選択権をAに譲らないといけません。どの回に譲るかは、その回にAが分けた結果を見てBが決めます。 このときAは最善をつくすとBより多く手に入れることができます。 例 n=2 1回目:Aは75ドル、25ドルに分けます。   ここで、Bの行動は2つに分かれます。  分岐1:Bが選択権を行使して、B=75、A=25ゲット  分岐2:Bが選択権をAに譲る。A=75、B=25ゲット 分岐1後の2回目の場合:Aは100ドル、0ドルに分けます。  Bは選択権を譲らないといけません。(1回は譲る必要があるので) なのでA=100、B=0ゲット 分岐2後の2回目の場合:Aは50ドル、50ドルに分けます。  Bは選択権を行使し、B=50、A=50ゲット どちらの場合も、A=計125ドル、B=計75ドルとなります。 これ、何となくnの式で表すことができそうなのですが、なかなかうまく導き出せません。お知恵拝借いたしたく。 

  • ゲーム理論

    数学のテキストの中に、ゲーム理論を扱う部分があり、そこに性比ゲームが出てきました。が、どういうゲームの設定なのかが解説されておらず、いきなり式を展開されて、よく理解できません。 一般的に、性比ゲームというのはどのようなルールの下で行われるゲームなのでしょうか?漠然とした質問ですみません。 それと、いくつかの純戦略をある割合で混合した戦略を用いるゲームで「最適反応はいくつかの純戦略を必ず含む」「強意のナッシュ均衡が存在する場合、それは純戦略である」とあったのですが、それは何故ですか?

  • 純粋戦略ナッシュ均衡について

      D    E    F A(4,4) (0、0) (7,0) B(0,0) (1,1) (0,0) C(0,7) (0,0) (6,6) (プレイヤー1の利得、プレイヤー2の利得) A,B,Cはプレイヤー1の選択、 D,E,Fはプレイヤー2の選択であり、 プレイヤー1と2が同時に独立に選択する場合の、純粋戦略ナッシュ均衡はどうなるのでしょうか? 何冊かテキストのゲーム理論の部分を読んでみましたが、いまいち純粋戦略ナッシュ均衡とはなんなのか理解できないので、どなたか教えていただけると助かります。 問題には、純粋戦略ナッシュ均衡を全て挙げよと書いてあるのですが、ナッシュ均衡は、相手の選択を所与のものとした場合に、他の選択肢を選んでも、利得が増えることのない選択のことですよね? 一つのゲームにいくつもあるものなのでしょうか? 素人な質問ですみませんが、よろしくおねがいいたします。

  • ゲーム理論のトリガー戦略について質問です。

    問題 1\2     A          B A       (5, 5)        (1, 7) B       (7, 1)        (4, 4) 上の基本ゲームを無限に繰り返す。2による戦略「Bから始めるトリガー」に対して、すべての部分ゲームで最適反応となる1の戦略はどのようなものか。また、その時の利得の系列はどうなるか。 どなたか教えてください、お願いしますm(__)m

  • 数学と戦略

    戦略に関する質問です。 次のような戦略ゲームを考えます。 1、2という人物がいて、1については戦略u,D,2については戦略L,R を取ると考えて 以下戦略のとり方によって利得は次のようになります 左から1、2の取る戦略として (u,L)=(a[1],a[2]),(u,R)=(b[1],b[2]) (D,L)=(c[1],c[2]),(D,R)=(d[1],d[2]) このとき (1)戦略(u,L)がナッシュ均衡である (2)a[1]=c[1]のとき純粋戦略ナッシュ均衡が存在する これらがどうして成り立つのか理解できません。

  • 移行戦略について

    こんにちは。こないだ経済関係の本を読んでいたのですが、そこに移行戦略と言う言葉が出てきました。そこで、移行戦略について少し知りたいと思い、詳しい方は次の質問のご回答お願いします。まず移行戦略とは何か?移行戦略を行った国はなぜこの戦略を採用したのか?最後にこの戦略をするにあたってどう言った問題に直面するのか?と言う質問です。よろしくお願いします。

  • 混合戦略の求め方を教えて下さい!(非ゼロ和ゲーム)

    A,Bの2人がいる非ゼロ和ゲームにおいて (A,B) (ドラマ、ドラマ)=(7,3) (ドラマ、バラエティ)=(4,6) (バラエティ、ドラマ)=(5,5) (バラエティ、バラエティ)=(6,4) という利得行列があります。 これについて、混合戦略を求めたいのですが、 Aがドラマを選択する確率をp、バラエティを1-p Bがドラマを選択する確率をq、バラエティを1-q とすると、 E(A)=7pq+5(1-p)q+4p(1-q)+6(1-p)(1-q) =7pq+5q-5pq+4p-4pq+6-6q-6p+6pq =4pq-q-2p+6 =(4p-1)q-2(p-3) ∴0≦p≦1/4 とここまでは分かったのですが、答えをどう出せばいいのかわかりません。 qの範囲も出した方がいいのでしょうか? そして、このpの範囲は、何の意味があるのでしょうか? どなたか、教えて下さい!!

  • 2人用ボードゲームで良いもの

    連れとよく2人でボードゲームやカードゲームで遊んでいます。 本来は4人で遊ぶラミーキューブや、サンファンを2人で楽しんでいますが、他にも遊びたいと 思っており、何かお勧めのゲームは無いでしょうか? 細かい条件で誠にすみませんが、以下のすべてを満たせるととても嬉しいです。 a. 2人用もしくは、2人でも十分に楽しいもの b. 戦略と運の要素があるもの   思考だけのアブストラクトゲームは片方ばかりが勝つので遊べません c. ウォーゲームのような相手を直接叩くゲーム以外   得点を競い合うものや、協力するもの、何かを作るものなどを希望 d. 60分ぐらいの比較的じっくりと、遊べるもの e. 何度も遊べるゲームのパターンがあるもの 本当にニッチなジャンルですみません。2人用のアグリコラ 牧場の動物達なんかも気になったのですが、b.の運の条件を満たさずに断念しました。カルカソンヌは、持っていますが2人よりも断然4人ぐらいが楽しいので2人の時には遊んでいません。 もし、本当ニッチでこういったジャンルが無いのであれば「無いよ」で構いませんので回答を頂けると助かります。

  • ゲーム理論

    ゲーム理論の練習問題の解答解説お願いします。 プレイヤー:スミス社、ジョーンズ社 各プレイヤーのアクション: 大小 利得:両方とも大なら各々5、両社とも小なら各々1、一方が大で他方が小なら各々-1 (1)このゲームが同時手番で行われるとき、その標準形を示せ (2)空欄に適切な文字を埋めよ (*)とは、各プレイヤーの最適反応の組み合わせである。最適反応とは、相手の戦略にたいして(*)が、最大になる戦略である。上記のゲームにおいて、スミス社にとってもジョーンズ社にとっても、相手の大という戦略に対する最適反応は(*)であり、相手の小という戦略に対する最適反応は(*)である。したがってこのゲームは(*)は(*)である。 (3)このゲームが逐次的手番(スミス社が先にアクションを選ぶ)で行われるとした場合の展開形と均衡経路を示せ。