主催: 一般社団法人 人工知能学会
会議名: 2018年度人工知能学会全国大会(第32回)
回次: 32
開催地: 鹿児島県鹿児島市 城山ホテル鹿児島
開催日: 2018/06/05 - 2018/06/08
高次な意思決定課題では発見により行動選択肢が無際限に拡張されうる.その場合,行動の特徴表現の自律的な獲得が重要になる.そこで本研究では状態遷移軌跡から行動表現を有限長のベクトルに埋め込み,強化学習に活用する学習フレームを提案する.具体的にはカードとボードゲームの要素を併せ持つ“逆転オセロニア”を例に,拡張されうる行動要素であるキャラクターの表現を暗黙的に獲得し,戦術の学習時に転用できる事を示す