主催: 一般社団法人 人工知能学会
会議名: 2024年度人工知能学会全国大会(第38回)
回次: 38
開催地: アクトシティ浜松+オンライン
開催日: 2024/05/28 - 2024/05/31
文書データにおけるマルチラベル分類は,各文書データに対して複数のクラスラベルを正しく付与するタスクである.ただし,文書データに付与される複数のラベル間には,意味的な階層構造が存在することが多く,このような階層構造を考慮することでラベルの予測精度が向上することがある.このようなラベル間の意味的な階層構造を考慮したマルチラベル分類モデルの1つとして,Multi-label Box Model(以下,MBM)が提案されており,教師データに全ての階層のクラスラベルが付与されている場合において有効性が示されている.しかし,実世界のユーザ投稿型サイトに投稿されているような文書データには,全ての階層のクラスラベルが付与されていない場合も多く,このようなデータをそのまま用いてMBMの学習を行うと,ラベルの予測精度が低下してしまう.そこで本研究では,BERTを導入することにより,不足している階層のラベルを補完してMBMを学習するフレームワークを提案する.また,一部の階層のラベルが不足しているデータに対して従来手法および提案手法を適用した場合の精度を比較した評価実験を通じ,提案手法の有効性を示す.