人工知能学会全国大会論文集
Online ISSN : 2758-7347
第35回 (2021)
セッションID: 4E1-OS-11a-01
会議情報

対話制御の方策再利用における行動関連確率の利用
NGUYEN Tung*吉野 幸一郎SAKTI Sakriani中村 哲
著者情報
会議録・要旨集 フリー

詳細
抄録

強化学習を用いた対話制御においては、既存ドメインで学習した方策をいかに新規ドメインで活用するかが大きな課題の一つである。本研究では、混合密度ネットワークによって既存ドメインと新規ドメインの行動空間同士で関連確率を定義する。これにより、既存ドメインで学習した方策を新規ドメインでそのまま利用する手法を提案する。実験の結果、 回帰によるコンポーネントマッチングを用いた行動関連確率のモデル化が、効率的に既存ドメインの方策を利用可能であることを示した。

著者関連情報
© 2021 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top