主催: 人工知能学会
会議名: 第102回言語・音声理解と対話処理研究会
回次: 102
開催地: 国立国語研究所 講堂
開催日: 2024/11/28 - 2024/11/29
p. 201-206
システムとの音声対話では,文意変化を伴う音声認識誤りにより対話破綻が生じる.音声認識誤りは大規模言語モデルにより修復されることもあるが,どのような誤りがどのように修復されるかは定量的に把握すべきである.本研究では,音声認識誤りによる文意変化に基づき対話破綻リスクを設定し,大規模言語モデルによる修復の有無を分析した.分析のためGPT-4及びWhisperを用いてコーパスを収集した.本コーパスを用いて音声認識誤りによる対話破綻を計数し,ユーザ心象との関係を分析した.以上により,自律音声対話の課題について考察を行った.