マルチモーダル入力からリアクティブな行動と応答発話の制御を両立する音声対話基盤の開発

馬場 惇; 岡藤 勇希; 大平 義輝; 兵頭 克哉; 猪狩 大輔

doi:10.11517/jsaislud.99.0_197

抄録

実空間での音声対話では，言語情報のやりとりだけでなく，ユーザやシステムの非言語の振る舞いを正確に対話に反映させることが重要である．しかし，人間同士の会話における非言語情報のやりとりは数十ミリ秒単位で高速に処理されており，単一の応答制御モデルで正確性と速度を両立することは難しい．また，対話タスクごとに必要な非言語情報は異なり，場面に応じてセンサーや認識モデル，出力デバイス等を切り替えられることが望ましい．そこで我々は，ROS2の分散処理構造の上で，各種マルチモーダル入力の認識器と対話応答制御，出力制御を分散的に並列実行できる音声対話基盤の開発を進めている．本セッションでは，簡易な対話デモを用意し参加者に体験いただくとともに，開発している基盤について説明する．

著者関連情報

お気に入り & アラート

閲覧履歴

発行機関からのお知らせ

PDF閲覧時に認証を求められる記事がございます（発行後1年間）が，研究会登録メンバーは無料で閲覧可能です．認証のための購読者番号やパスワードは会員マイページにログインし「お知らせ」にてご確認下さい．メンバー以外の方は，storesにて購入いただけます．

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）