2022 年 34 巻 3 号 p. 555-567
現在普及している音声対話システムは主に音声認識によって得られた文字列を入力としているが,音声認識では口調や表情などの非言語的情報に表れるユーザ感情を認識できない.また,ルールベース方式でユーザ感情まで考慮した応答を行うためには膨大な応答ルールを作成しなくてはならない.そこで本論文では,統計的応答手法を用いて非言語的な感情表出を考慮した応答を行う音声対話システムを提案する.しかし統計的応答手法は文字列を対象とした手法であるため,非言語的な表出感情を絵文字として発話文字列に付与した中間表現を作成し,その中間表現を統計的応答手法への入力とする.発話音声の音響的特徴から感情を推定する処理を組み込んだ提案手法と非言語的な感情表出を考慮しない比較手法について評価実験を行った結果,実際に対話することでの印象評価においても各応答発話に対する評価においても,提案手法の方が有意に良い結果となった.