人工知能学会全国大会論文集
Online ISSN : 2758-7347
第37回 (2023)
セッションID: 3A1-GS-6-04
会議情報

含意関係認識におけるActive Learningを用いた不適切なラベルへの対策
*松帆 愛彌冨 仁
著者情報
会議録・要旨集 フリー

詳細
抄録

含意関係認識は重要な技術であるが,不適切な教師ラベルがデータセットに多く含まれることが研究上の課題として挙げられる.本報告ではActive Learning (AL)を活用し不適切なラベル付けの検出を行いうActive Cleanを提案する.Actine Cleanは,まず少ない学習データに基づく予測モデルを構築した後,予測の難しい少量のデータを選抜し,これらに手動で正解ラベルを付与して再学習を繰り返すことで性能向上を図るとともに、不適切ラベルを検出する手法である.本研究で扱うJSNLIデータセットのラベルはサンプル調査で1割程度に誤りがあることが示唆された.このデータに対し,Active Cleanで不適切ラベルデータ候補を検出したところ,そのうち過半数が不適切であると推定された.これらの不適切ラベル候補データを学習データから除いて構築された含意関係認識モデルは,ラベルが正しいことが確認できているテストデータに対して平均予測能が7.8%向上した.このことからActive Cleanは,不適切なラベルが多く含まれているデータを特定することに役立ち,より頑健なモデルを構築できる可能性を示した.

著者関連情報
© 2023 人工知能学会
前の記事 次の記事
feedback
Top