人工知能学会研究会資料 言語・音声理解と対話処理研究会
Online ISSN : 2436-4576
Print ISSN : 0918-5682
102回 (2024/11)
会議情報

リアルタイム性と柔軟性を兼ね備えた音声対話システムのための軽量かつ高速な処理手法の検討
大竹 真太
著者情報
会議録・要旨集 認証あり

p. 189-194

詳細
抄録

コールセンターに導入されているボイスボットは、システム主導で事前に定義されたシナリオに沿って対話を進める方式が主流であり、人間のオペレーターのような柔軟な対応が難しい。近年、大規模言語モデル(LLM)を用いて柔軟な対応を行う音声対話システムが注目されているが、LLMは計算コストが大きく、リアルタイム応答には適していない。本研究では、予約タスクを対象とした音声対話システムにおいて、LLMを使用せずにストリーミング処理で高速な意図理解と終話判定を行う手法を提案する。また、LLMを使用した際の柔軟性とリアルタイム性を両立させる方法も検証する。さらに、本発表では、提案手法を実装したデモを提供し、得られたフィードバックを基に音声対話システムの課題を考察し、今後の研究方向について議論する。

著者関連情報
© 2024 人工知能学会
前の記事 次の記事
feedback
Top