• ベストアンサー

将棋ソフトの評価値計算は

どのような基準で計算されてますか?

質問者が選んだベストアンサー

  • ベストアンサー
  • suzukt1
  • ベストアンサー率24% (35/143)
回答No.1

現在の将棋ソフトの多数はルール上指せる手を全て指してみて、評価関数の良いものから順番に幾つかの候補を手を繰り返す手法で、現在の局面からn手進んだ未来の評価関数を見る事で読みを実現しています。 このアプローチで作られた将棋ソフトは既に一般的な棋士よりも強く、 一定の成果を上げることに成功したと言って間違いありません。 しかし、この統計データに頼り切ってニッチな局面を評価仕切れない欠点を突いた作戦も多数存在しています。 機械学習の適用で最も重要な作業の1つである特徴選択にある。特徴とは、機械学習に入力するデータ項目のことであり、この特徴をどう選ぶか、どう作るかによって機械学習の精度は大幅に変化する。 機械学習の手法や特徴の選択は試行錯誤を伴い、一般的に非常に時間がかかる。また、高度なノウハウや大規模な計算機環境が必要とされる場合も多い。 プロ棋士に連勝!将棋ソフト「Ponanza」はなぜここまで強いのかの2ページ目の冒頭で、 ponanzaの開発者である山本氏は「計算資源が足りない。どこかに落ちてないかな」という発言しており、たまたまさくらインターネットの須藤氏が「貸しましょうか?」と応じた事から快進撃が始まりました。 また、やねうらお氏も自身のブログで1台100万以上のPCを何台も購入し、計算資源に当てているそうです。 現在の将棋ソフトはパラメータを微調整しては何十億の局面を覚えさせて、既存ソフトより強いか弱いかを実際に対局させてみて判別するようです。 同じ棋譜を読み込ませても強さが変動する現状はまるで悪夢です。 この現状を「雑巾絞り」「リセマラ」と定義しているようです。 開発者達の工夫 やねうら王ライブラリ VS Aperyライブラリでは、一般的なパソコンでも1日前後で学習が完了するような仕組みを公開してくださっていますし、 機械学習が完了した将棋ソフト同士で何十局も高速で指すフレームワーク等も開発しています。 限られた計算リソースの中で最大の結果を出す為の工夫をされています。 DeepLearning を使ってはどうか? 実際に作ってみた開発者の記事が下記です。 Deep Learningを用いた将棋プログラムGunyanzaを公開しました 一からしっかり動作する将棋ソフトを組み上げる時点でグニャラくんさんの技術力の高さが伺えるものの、どうもちょっとやそっとの努力では強い将棋ソフトに仕上がる事はなさそうです。 そのコメントでは「盤面の状態が組み合わせ爆発している。結果、意味ある評価値を持つ状態の集合が全ての状態に対して少なすぎるので、ほとんど全ての状態で全く学習していない。駒に価値を与えるとか、評価の与え方を緩くしないと」という詳しい方の意見もあります。 囲碁ソフトがプロ棋士に勝利したようですという記事のコメント欄で、 強豪将棋ソフト「やねうら王」の開発者、やねうらお氏は下記のように語っています。 「将棋の評価関数は囲碁に比べるとすこぶる設計しやすくて、計算効率もいまのところDeepLearningでやるよりは2,3桁ぐらい効率がいいので…。」 DeepLearning の効率を調べてみる AlphaGo対李世ドル ・ Wikipediaによると、 「李との対局に使用されるAlphaGoのバージョンは、樊麾との対局と同等のコンピュータパワー(1,202 CPU、176 GPU)を使う」とありました。 1202/32=37.5625ということで、GoogleのクラウドサーバーでCPU32コアのマシンを38台借りると、月額$31,207.50と表示されました。 実際にはこれにGPUが乗っかってくるので想像も付きませんが、毎月の利用料金だけで最低400万以上もするスーパーコンピュータだったのです。 確かに囲碁はチェスや将棋に比べると別次元に1手の自由度が高い為、 囲碁のプロ棋士を打ち負かすソフトは不可能、もしくは後何十年も掛かるのではないかと言われていましたが、化物PCでその何十年かの溝を力押しで埋めた形です。 李世ドル氏の敗北は人間の敗北だという風に報道されていますが、そんな恐ろしい化物マシンに戦いを挑み、 1勝を勝ち取った李世ドル氏の囲碁の腕前を褒め称えるべきですし、そこまでのスーパーコンピューターを何年間も走らせて学習してまだまだ足りない囲碁の奥深さに恐れるべきでしょう。 ということで比較対象としては分からず仕舞いですが、もう少し囲碁ソフトのアルゴリズムが発達すればもっと小規模なマシンでプロ棋士と互角に戦える気がします。 どうもある程度問題定義が出来る分野に於いてDeepLerningは効率が悪いようです。 よろしくお願いいたします!

torasuke999
質問者

お礼

面白すぎて脳みそがビリビリしました! 一目見ただけなので精読させて頂きます! ありがとうございました!

関連するQ&A

  • 仕掛品の評価 計算 方法

    仕掛品の在庫評価方法はどのように評価(計算)したら良いか判りません。原価計算要領書という会社のルールブックには、仕掛品は半製品、製品の評価価格を基準に加工度に乗じて評価すると記載されています。素人的な意見なんですが、仕掛品に対する在庫評価=原料価格+加工コストの合算値という理解ではいけないのでしょうか?お恥ずかしい質問で恐縮ですが宜しくお願いします。因みに製造業の仕事です。

  • 計算式を教えてください。

    電圧9.7KV(基準電圧115V)計算値は?

  • 基準日を100とする計算

    恥ずかしい算数の計算です。基準日を100として、その後の変動を調べるのですが、私はこのようにしています。 (例) 基準日の値 1617.52とすると 100÷1617.52=0.061823 1617.52×0.061823≒100.0 としていました。 ある日の基準が-3.07%の日を100として計算しようとしましたが、同じようにしてもどうしても100.1になってしまいます。計算は同じような手順で 100÷0.0307=3257.32899 -0.0307×3257.32899=100.1となってしまいます。マイナスが付いてなれば100.0になりました。数字に弱いのでなんともよく分かりません。教えていただけないでしょうか?

  • 土地評価

    はじめまして。 自社でもっている土地の評価ってしますか? もちろん固定資産税がくるので評価額をみればよいと思うのですが 路線価から計算する方法を教えてください。 路線価と近隣の公示価格又、基準地価も用いて 計算されるのでしょうか?補正率とか角地とかも関係ある? すみませんが計算方法教えてください。

  • 将棋ソフトについて

      将棋ソフトについて詳しいかた教えて下さい。 1. 将棋ソフトは相手が同じ手を指すと常に同じ手を指し、その結果相手が同じ手を指し続けると何度やっても同じ棋譜が繰り返されることになるのでしょうか。 2. 将棋ソフトの打つ手はハードには影響されず、ハードスペックは単に形勢の読みに必要な計算時間に影響するだけなのでしょうか。 3.電王戦ライブに表示されるボンクラーズの評価値(+500 -500など)はどのように読めばよいのでしょうか 4. これまでの電王戦の結果を見て思ったのですが、前半戦はプロ棋士有利で進み、後半戦で将棋ソフトに逆転される流れが目立つのは人間対将棋ソフトが対戦するときの特徴なのでしょうか。  

  • 原価計算基準について

    原価計算基準・管理会計論・会計学全般に精通している方、回答よろしくお願いします。 原価計算基準1(2)によれば、原価計算基準における原価計算の目的の一つとして ≪価格計算に必要な原価資料を提供すること。≫ とあります。 当基準1(2)での価格計算の意味は、政府における納入価格決定のための原価資料を提供することであるとされていますが、この「政府における納入価格決定のための原価資料」の具体的なイメージがわかりません。 どなたか回答よろしくお願いします。

  • 評価損益の計算のついて

    株の初心者です。よろしくお願いいたします。 現物取引で昨日購入した銘柄を 今日の午前中に売却し、 午後にまたその銘柄を買ったのですが マーケットスピードの保有銘柄一覧を見ると 評価損益が、前日と本日の購入価格の平均値で計算されています。 当日に同一銘柄を売り→買いした場合は このように計算されてしまうものなのでしょうか? (実際は含み益はほとんど出ていないはずなのですが、かなりの+で計算されて表示されます)

  • 軸組計算

    木造住宅の軸組計算をするとき、屋根に太陽光パネルを載せると、屋根の材料によって異なる計算の基準値は変わってくるのでしょうか?よろしくお願いいたします。

  • 経過時間を計算したい

    ある時間を基準とした経過時間を計算したいのですが... 知恵をお貸し下さい。 例えば、2:50を基準として、3:00ならば、+10:00     2:50を基準として、2:40ならば、-10:00 という風に表示させたいのです。 どうぞ宜しくお願いいたします。

  • 計算方法について

    計算式についてなんですが、下記の計算の求め方をお願いします。 目標36.86(t) 実績44.48(t) 達成率120.7% 基準達成率100% 4つの項目で増減を求めたいのですが、計算のやり方が忘れてしまったため、求めることができません。