人工知能学会全国大会論文集
Online ISSN : 2758-7347
第32回 (2018)
セッションID: 1N3-01
会議情報

Neural Fictitious Self-Play における探索由来のデータを含めない教師あり学習による性能改善
*河村 圭悟鈴木 潤鶴岡 慶雅
著者情報
会議録・要旨集 フリー

詳細
抄録

NFSPは強化学習を用いて不完全情報ゲームを解く手法であり,他の手法と比較して環境のダイナミクスや事前知識を用いることなくナッシュ均衡解を得られるというメリットがある. 本研究ではNFSPにおいて強化学習の探索で得られたデータを教師あり学習の学習に含めず,かつ探索の確率を一定に保つことで,単純化したポーカーゲームであるLeduc Hold'emにおいてNFSPの性能が有意に向上することを実験的に示す.また.種々の探索確率について同様の実験を行い,結果について議論する.

著者関連情報
© 2018 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top