自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
HTML文書集合からの評価文の自動収集
鍜治 伸裕喜連川 優
著者情報
キーワード: 評価情報分析, 評価極性
ジャーナル フリー

2008 年 15 巻 3 号 p. 77-90

詳細
抄録

本論文では大規模なHTML文書集合から評価文を自動収集する手法を提案する.基本的なアイデアは「定型文」「箇条書き」「表」といった記述形式を利用するというものである.本手法に必要なのは少数の規則だけであるため, 人手をほとんどかけずに評価文を収集することが可能である.また, 任意のHTML文書に適用できる手法であるため, 様々なドメインの評価文を収集できることが期待される.実験では, 提案手法を約10億件のHTML文書に適用したところ, 約65万の評価文を獲得することができた.

著者関連情報
© 言語処理学会
前の記事 次の記事
feedback
Top