拡張されうる行動空間での特徴の表現学習を伴う価値関数の近似 “逆転オセロニア” を例に

甲野 佑; 田中 一樹; 奥村 純

doi:10.11517/pjsai.JSAI2018.0_1Z302

第32回 (2018)

セッションID: 1Z3-02

DOI https://doi.org/10.11517/pjsai.JSAI2018.0_1Z302

会議情報

主催: 一般社団法人人工知能学会

会議名: 2018年度人工知能学会全国大会（第32回）

回次: 32

開催地: 鹿児島県鹿児島市城山ホテル鹿児島

開催日: 2018/06/05 - 2018/06/08

拡張されうる行動空間での特徴の表現学習を伴う価値関数の近似

“逆転オセロニア” を例に

*甲野佑, 田中一樹, 奥村純

著者情報

会議録・要旨集フリー

詳細

抄録

高次な意思決定課題では発見により行動選択肢が無際限に拡張されうる．その場合，行動の特徴表現の自律的な獲得が重要になる．そこで本研究では状態遷移軌跡から行動表現を有限長のベクトルに埋め込み，強化学習に活用する学習フレームを提案する．具体的にはカードとボードゲームの要素を併せ持つ“逆転オセロニア”を例に，拡張されうる行動要素であるキャラクターの表現を暗黙的に獲得し，戦術の学習時に転用できる事を示す

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）