人工知能学会全国大会論文集
Online ISSN : 2758-7347
第33回 (2019)
セッションID: 4O3-J-7-01
会議情報

「待った」の概念を取り入れた効率的なオセロの学習
*成田 穂木村 大毅
著者情報
会議録・要旨集 フリー

詳細
抄録

AlphaZeroに代表されるようなモンテカルロ木探索と深層強化学習の組み合わせにより、素晴らしい高い性能が達成されているが、その計算コストは高く、また長い計算時間がかかるという問題点がある。本研究では、MCTSをベースとして、「失敗度」の概念を取り入れたアルゴリズムを提案する。失敗度は効率的な探索を可能にし、学習時間を削減する。これにより、エージェントは勝敗を分ける重要な局面を重点的に探索することが可能になる。我々の手法は最初の数イテレーションでAlphaZeroを超える性能を示した。

著者関連情報
© 2019 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top