システム発話間の整合性を重視した発話選択への深層強化学習の適用

黒田 佑樹; 武田 龍; 駒谷 和範

doi:10.11517/jsaislud.93.0_62

抄録

ユーザ発話内容の解析に偏重することなく，システム発話の列をコントロールするだけで，聞き役の対話システムを実現することを目指している．我々は以前，システム発話の整合性を重視した発話選択を，Q学習を用いて実装した．さらにより多くの状態を考慮可能な強化学習を実装するために深層強化学習（DQN）を用いる．本稿では，以前実装したQ学習と同等の発話選択の実現を今回の目標として，深層強化学習を設計したので報告する．まず，Q学習で用いていた状態をone-hotベクトルを用いて入力表現とした．次に報酬として，これまで用いていたものを正規化して与えた．評価としては，テキスト対話を行い，システム発話の破綻数を以前の手法と比較することで，同等の性能が再現できているかを調べた．加えて，十分に学習できるまでのエピソード数の比較を行った．

著者関連情報

お気に入り & アラート

閲覧履歴

発行機関からのお知らせ

PDF閲覧時に認証を求められる記事がございます（発行後1年間）が，研究会登録メンバーは無料で閲覧可能です．認証のための購読者番号やパスワードは会員マイページにログインし「お知らせ」にてご確認下さい．メンバー以外の方は，storesにて購入いただけます．

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）