主催: 一般社団法人 人工知能学会
会議名: 2023年度人工知能学会全国大会(第37回)
回次: 37
開催地: 熊本城ホール+オンライン
開催日: 2023/06/06 - 2023/06/09
昨今では,SNSを活用することで多種多様なテキストデータの収集が容易となった.しかし,SNS上のテキストデータには省略表現や口語表現などの短い文により,ラベル付けが難しいことや,短期間で大量のデータ収集が難しいことなどの問題点を持つ.これを解決するために機械学習向けの大規模かつ高品質なラベル付きのテキストデータを効率よく準備する手法として,データ拡張が有効である.本研究では,日本語テキストにデータ拡張を行うことにより,感情分類の学習精度の向上を目指す.データ拡張の手法としてEDAを用いた.EDAのテキスト操作に様々なモデルを用いることで,データ拡張の拡張幅を大きくした.また,意味的類似度とテキストの変化度によってデータ拡張で生成された拡張テキストを評価した.そして,閾値を決めることで学習に最適なデータを選んだ.データセットには,WRIMEコーパスを用いてることでラベルの信頼性を確保した.本発表では,データ拡張を用いた感情分類の学習精度の結果について報告する.