人工知能学会研究会資料 言語・音声理解と対話処理研究会
Online ISSN : 2436-4576
Print ISSN : 0918-5682
99回 (2023/12)
会議情報

マルチモーダル入力からリアクティブな行動と応答発話の制御を両立する音声対話基盤の開発
馬場 惇岡藤 勇希大平 義輝兵頭 克哉猪狩 大輔
著者情報
会議録・要旨集 認証あり

p. 197

詳細
抄録

実空間での音声対話では,言語情報のやりとりだけでなく,ユーザやシステムの非言語の振る舞いを正確に対話に反映させることが重要である.しかし,人間同士の会話における非言語情報のやりとりは数十ミリ秒単位で高速に処理されており,単一の応答制御モデルで正確性と速度を両立することは難しい.また,対話タスクごとに必要な非言語情報は異なり,場面に応じてセンサーや認識モデル,出力デバイス等を切り替えられることが望ましい.そこで我々は,ROS2の分散処理構造の上で,各種マルチモーダル入力の認識器と対話応答制御,出力制御を分散的に並列実行できる音声対話基盤の開発を進めている.本セッションでは,簡易な対話デモを用意し参加者に体験いただくとともに,開発している基盤について説明する.

著者関連情報
© 2023 人工知能学会
前の記事 次の記事
feedback
Top