人工知能学会研究会資料 言語・音声理解と対話処理研究会
Online ISSN : 2436-4576
Print ISSN : 0918-5682
103回(2025/3)
会議情報

アバター傾聴対話システムにおける多様な頷きのリアルタイム予測
加藤 利梓井上 昂治河原 達也
著者情報
会議録・要旨集 認証あり

p. 171-176

詳細
抄録

人間どうしの対話において、頷き・視線・表情などの非言語情報は言語情報同様に重要な役割を担っており、近年研究が進んでいる音声対話システムにおいても、これらの非言語情報を適切に表出することが求められている。本研究では、非言語的聞き手反応の中で頷きに焦点を当て、それらのタイミングと種類をリアルタイムに予測するモデルを提案する。傾聴対話データに対して追加的に聞き手ジェスチャーを収録し、頷きを3種類に分類、アノテーションした。提案モデルとして話し手と聞き手の音声両方を用いるVAPをベースとしたモデルを紹介する。実験では相槌とのマルチタスク学習および汎用的な対話データを用いた事前学習を実施し、その有効性を確認した。提案モデルはリアルタイムアバター傾聴対話システムへ統合することができる。

著者関連情報
© 2025 人工知能学会
前の記事 次の記事
feedback
Top