2004 年 2004 巻 SWO-006 号 p. 02-
Weblogに含まれる評判情報を扱うには,テキスト中の評価表現を抽出し,その表現が肯定・否定のどちらの感情を含んでいるかを特定することが不可欠である.評価表現には,「おいしい」のような,それ自体に肯定・否定の感情が込められているものもあるが,「大きい」といった形容詞のように,評価対象やどの部分が大きいのかといった点を考慮しなければ,肯定・否定の感情がわからないものもあり,それらを機械的に分析することは難しい課題となっている.そこで,文中から評価表現を抽出し,肯定・否定の分類を行うために,我々はラベル付きデータに加えて,ラベルなしデータも学習に組み込むsemi-supervised学習手法を用いることを提案する.実際に我々が収集したWeblogデータに対し,実験による評価を行い,ラベルありデータのみを用いる方法で66.7%の正解率,ラベルなしデータも併せて用いることで70.4%の正解率が得られることがわかった.