人工知能学会全国大会論文集
Online ISSN : 2758-7347
第37回 (2023)
セッションID: 3T1-GS-6-03
会議情報

テキストデータ拡張による感情分類精度向上の検討
*宇田 陽斗松本 和幸吉田 稔北 研二
著者情報
会議録・要旨集 フリー

詳細
抄録

昨今では,SNSを活用することで多種多様なテキストデータの収集が容易となった.しかし,SNS上のテキストデータには省略表現や口語表現などの短い文により,ラベル付けが難しいことや,短期間で大量のデータ収集が難しいことなどの問題点を持つ.これを解決するために機械学習向けの大規模かつ高品質なラベル付きのテキストデータを効率よく準備する手法として,データ拡張が有効である.本研究では,日本語テキストにデータ拡張を行うことにより,感情分類の学習精度の向上を目指す.データ拡張の手法としてEDAを用いた.EDAのテキスト操作に様々なモデルを用いることで,データ拡張の拡張幅を大きくした.また,意味的類似度とテキストの変化度によってデータ拡張で生成された拡張テキストを評価した.そして,閾値を決めることで学習に最適なデータを選んだ.データセットには,WRIMEコーパスを用いてることでラベルの信頼性を確保した.本発表では,データ拡張を用いた感情分類の学習精度の結果について報告する.

著者関連情報
© 2023 人工知能学会
前の記事 次の記事
feedback
Top