人工知能学会研究会資料 言語・音声理解と対話処理研究会
Online ISSN : 2436-4576
Print ISSN : 0918-5682
93回 (2021/11)
会議情報

マルチモーダル情報に基づくシステム応答の韻律・表情制御信号の生成に関する検討
渡辺 稜哉千葉 祐弥能勢 隆伊藤 彰則
著者情報
会議録・要旨集 フリー

p. 56-61

詳細
抄録

機械と人間のより円滑なコミュニケーションを実現するための手法として,人間らしい応答が可能な対話エージェントを導入することが挙げられる.近年,対話エージェントの応答の韻律や表情をニューラルベースの手法で個別に制御する手法が検討されている.これに対して我々は,言語,韻律,表情の複数のモダリティを用いてエージェントの表情と韻律の両方を制御するためのエンコーダー・デコーダーモデルを提案する.実験から,複数のモダリティ,特に表情モダリティを入力として利用した場合に客観評価値が向上することを確認した.また,マルチタスク学習を行うことで全体的な性能がさらに改善する可能性が示唆された.

著者関連情報
© 2021(一社)人工知能学会
前の記事 次の記事
feedback
Top