主催: 一般社団法人 人工知能学会
会議名: 2021年度人工知能学会全国大会(第35回)
回次: 35
開催地: オンライン
開催日: 2021/06/08 - 2021/06/11
強化学習を用いた対話制御においては、既存ドメインで学習した方策をいかに新規ドメインで活用するかが大きな課題の一つである。本研究では、混合密度ネットワークによって既存ドメインと新規ドメインの行動空間同士で関連確率を定義する。これにより、既存ドメインで学習した方策を新規ドメインでそのまま利用する手法を提案する。実験の結果、 回帰によるコンポーネントマッチングを用いた行動関連確率のモデル化が、効率的に既存ドメインの方策を利用可能であることを示した。