主催: 人工知能学会
会議名: 第103回言語・音声理解と対話処理研究会
回次: 103
開催地: 早稲田大学 40号館 グリーン・コンピューティング・システム研究開発センター
開催日: 2025/03/20 - 2025/03/22
p. 127-132
本研究は,大規模言語モデル(LLM)を音声対話システムに組み込むにあたって課題となる応答速度の改善を目的としている.音声入出力による対話システムでは,音声認識技術を利用してユーザの完全な発話テキストを取得したタイミングで初めてLLMによる応答文の生成を開始できる.そのため,システムがユーザへ応答するまでに遅延が発生する.そこで本研究では,ユーザの発話終了を待たずに発話テキストを取得しそれに対する応答文を生成することで,対話システムの応答を早めることを考える.この手法では発話の末尾が欠けた入力文に対する応答文の生成を行うため,発話文を取得できている割合によって応答文の内容の変化が予想される.そこで,発話入力文の末尾の欠損率に対するLLMによる応答文の適切性を評価した結果を示す.