人工知能学会全国大会論文集
Online ISSN : 2758-7347
第37回 (2023)
セッションID: 2D4-GS-2-02
会議情報

自己対戦型深層強化学習における探索結果の利用
*神子島 一弥野田 五十樹小山 聡
著者情報
会議録・要旨集 フリー

詳細
抄録

我々はAlphaGoZeroやAlphaZeroなどのゲームAIで広く用いられている自己対戦型深層強化学習における訓練データ生成について新しい手法を提案する。一般に、このような自己対戦型の学習では、自己対戦中に生成される探索結果の多くを利用できておらず、現在その活用法の研究はほとんど行われていない。提案手法では、最終的な勝敗報酬と方策を推定することによって得られた探索結果を訓練データに変換する。学習のハイパーパラメータを変化させて実験を行った結果、提案手法は方策の効率的な学習に寄与し、学習の安定性を高めることを示唆する結果が得られた。

著者関連情報
© 2023 人工知能学会
前の記事 次の記事
feedback
Top