対話制御の方策再利用における行動関連確率の利用

NGUYEN Tung; 吉野 幸一郎; SAKTI Sakriani; 中村 哲

doi:10.11517/pjsai.JSAI2021.0_4E1OS11a01

第35回 (2021)

セッションID: 4E1-OS-11a-01

DOI https://doi.org/10.11517/pjsai.JSAI2021.0_4E1OS11a01

会議情報

主催: 一般社団法人人工知能学会

会議名: 2021年度人工知能学会全国大会（第35回）

回次: 35

開催地: オンライン

開催日: 2021/06/08 - 2021/06/11

対話制御の方策再利用における行動関連確率の利用

NGUYEN Tung, *吉野幸一郎, SAKTI Sakriani, 中村哲

著者情報

キーワード: 対話システム, 対話制御, 強化学習

会議録・要旨集フリー

詳細

抄録

強化学習を用いた対話制御においては、既存ドメインで学習した方策をいかに新規ドメインで活用するかが大きな課題の一つである。本研究では、混合密度ネットワークによって既存ドメインと新規ドメインの行動空間同士で関連確率を定義する。これにより、既存ドメインで学習した方策を新規ドメインでそのまま利用する手法を提案する。実験の結果、回帰によるコンポーネントマッチングを用いた行動関連確率のモデル化が、効率的に既存ドメインの方策を利用可能であることを示した。

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）