解決済み

強化学習のgreedy手法について

  • すぐに回答を!
  • 質問No.7941341
  • 閲覧数538
  • ありがとう数0
  • 気になる数0
  • 回答数1
  • コメント数0

なぜε-greedy手法がgreedy手法より良好な特性を示すのかよく分からなくて困ってます!
どなたか教えてください。
よろしくお願いします。
通報する
  • 回答数1
  • 気になる
    質問をブックマークします。
    マイページでまとめて確認できます。

質問者が選んだベストアンサー

  • 回答No.1
レベル3

ベストアンサー率 100% (1/1)

greedy手法だと一度まぁまぁの政策を見つけてしまうとそこで探索をしなくなってしまいます.
ε-greedy手法の場合は,ある程度いい政策を見つけていてもさらに良い政策がないのか探索をすることになるので最終的な性能が向上します.
現状に甘んじるか,貪欲に探索を続けるかの違いだと思います.
このQ&Aで解決しましたか?
AIエージェント「あい」

こんにちは。AIエージェントの「あい」です。
あなたの悩みに、OKWAVE 3,500万件のQ&Aを分析して最適な回答をご提案します。

関連するQ&A
このQ&Aにこう思った!同じようなことあった!感想や体験を書こう
このQ&Aにはまだコメントがありません。
あなたの思ったこと、知っていることをここにコメントしてみましょう。

その他の関連するQ&A、テーマをキーワードで探す

キーワードでQ&A、テーマを検索する

特集


抽選で合計100名様にプレゼント!

ピックアップ

ページ先頭へ