主催: 一般社団法人 人工知能学会
会議名: 2024年度人工知能学会全国大会(第38回)
回次: 38
開催地: アクトシティ浜松+オンライン
開催日: 2024/05/28 - 2024/05/31
本研究では,日本語のSNS投稿テキストを対象とする感情極性分類に取り組む.SNSから収集されたテキストには,発音の崩れや誤字脱字をはじめとする日本語の表記の崩れや,ネットスラングのようなSNS特有の造語など,様々なノイズが含まれる.このようなテキストの多様性が感情分析モデルの性能に悪影響を及ぼす可能性があるため,本研究ではテキスト正規化によって感情分析の性能改善を試みる.さらに,同義語集合の高頻度な表現への統一,誤字脱字の修正,常体敬体などの文末表現の統一など,テキスト正規化に含まれる様々な編集操作について詳細に分析し,どの種類の正規化が感情分析の性能改善に貢献するのかを明らかにする.SNS投稿テキストを対象とするWRIMEコーパスにおける感情極性分類の評価実験の結果,テキスト正規化によって日本語感情分析の性能を改善できることを確認した.