システム制御情報学会 研究発表講演会講演論文集
第47回システム制御情報学会研究発表講演会
会議情報
ニューラルネットワークによる行動価値関数の学習および対戦ゲーム戦略獲得への応用
中西 智之西川 郁子
著者情報
会議録・要旨集 フリー

p. 5010

詳細
抄録
強化学習では、状態数が多くなるとコンピュータの資源を使い果たしてしまうという問題がある。特に、学習に必要なステップ数の増大による計算時間の爆発は大きな問題である。そこで、ニューラルネットワークをSarsa(λ)における行動価値関数の関数近似器として用いることで、状態数の増加に起因する問題の解決をはかる。計算機実験では提案手法をDots-and-Boxesと呼ばれる2人対戦ゲームの戦略獲得に適用し有効性を検証する。
著者関連情報
© 2003 システム制御情報学会
前の記事 次の記事
feedback
Top