人工知能学会全国大会論文集
Online ISSN : 2758-7347
第32回 (2018)
セッションID: 1Z3-02
会議情報

拡張されうる行動空間での特徴の表現学習を伴う価値関数の近似
“逆転オセロニア” を例に
*甲野 佑田中 一樹奥村 純
著者情報
会議録・要旨集 フリー

詳細
抄録

高次な意思決定課題では発見により行動選択肢が無際限に拡張されうる.その場合,行動の特徴表現の自律的な獲得が重要になる.そこで本研究では状態遷移軌跡から行動表現を有限長のベクトルに埋め込み,強化学習に活用する学習フレームを提案する.具体的にはカードとボードゲームの要素を併せ持つ“逆転オセロニア”を例に,拡張されうる行動要素であるキャラクターの表現を暗黙的に獲得し,戦術の学習時に転用できる事を示す

著者関連情報
© 2018 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top