主催: 人工知能学会
会議名: 第102回言語・音声理解と対話処理研究会
回次: 102
開催地: 国立国語研究所 講堂
開催日: 2024/11/28 - 2024/11/29
p. 189-194
コールセンターに導入されているボイスボットは、システム主導で事前に定義されたシナリオに沿って対話を進める方式が主流であり、人間のオペレーターのような柔軟な対応が難しい。近年、大規模言語モデル(LLM)を用いて柔軟な対応を行う音声対話システムが注目されているが、LLMは計算コストが大きく、リアルタイム応答には適していない。本研究では、予約タスクを対象とした音声対話システムにおいて、LLMを使用せずにストリーミング処理で高速な意図理解と終話判定を行う手法を提案する。また、LLMを使用した際の柔軟性とリアルタイム性を両立させる方法も検証する。さらに、本発表では、提案手法を実装したデモを提供し、得られたフィードバックを基に音声対話システムの課題を考察し、今後の研究方向について議論する。