主催: 人工知能学会
会議名: 第99回言語・音声理解と対話処理研究会
回次: 99
開催地: 国立国語研究所 講堂 / オンライン
開催日: 2023/12/13 - 2023/12/14
p. 197
実空間での音声対話では,言語情報のやりとりだけでなく,ユーザやシステムの非言語の振る舞いを正確に対話に反映させることが重要である.しかし,人間同士の会話における非言語情報のやりとりは数十ミリ秒単位で高速に処理されており,単一の応答制御モデルで正確性と速度を両立することは難しい.また,対話タスクごとに必要な非言語情報は異なり,場面に応じてセンサーや認識モデル,出力デバイス等を切り替えられることが望ましい.そこで我々は,ROS2の分散処理構造の上で,各種マルチモーダル入力の認識器と対話応答制御,出力制御を分散的に並列実行できる音声対話基盤の開発を進めている.本セッションでは,簡易な対話デモを用意し参加者に体験いただくとともに,開発している基盤について説明する.