主催: 人工知能学会
会議名: 第105回言語・音声理解と対話処理研究会
回次: 105
開催地: 東京科学大学大岡山キャンパス 蔵前記念会館 くらまえホール
開催日: 2025/11/10 - 2025/11/11
p. 12-15
タスク指向対話システムにおいて対話状態追跡 (DST) は重要な役割を担うが, その学習データセットに含まれるアノテーションエラーはDSTモデルの性能を低下させる一因となる. 人手によるエラー修正は高コストであるため, 本研究では2つのDSTデータセットの自動修正フレームワークを提案する. 一つは、アノテーションエラー検出モデルを用いてエラーを特定し, そのデータのみを修正する手法であり, もう一つはLLMとDSTモデルを連携してアノテーションエラーを修正する手法である. 事前学習済み言語モデルをファインチューニングして構築したエラー検出モデルを MultiWOZ データセットで評価した結果, 性能は十分ではなかったものの, 埋められたスロット数が多いデータをエラーと誤判定しやすい傾向を発見した.