Webインテリジェンスとインタラクション研究会 予稿集
Online ISSN : 2758-2922
第1回研究会
会議情報

セッション6:CGM分析
潜在的意味を考慮したグラフに基づく複数文書要約
北島 理沙小林 一郎
著者情報
会議録・要旨集 フリー

p. 59-64

詳細
抄録

近年,情報技術の発展に伴い大量のテキストデータが蓄積されるようになり,その中からユーザが必要としている情報を選択することが必要となってきた.そして,情報を取捨選択するための一手法として,自動文書要約技術の必要性が高まっている.特に複数文書要約は,大量のデータの概要をユーザが捉えることが可能になるという点で,今後ますます重要となると考えられる.要約手法としては様々な手法が提案されている一方で,LexRankのようなグラフベースの要約手法の有用性が示されている.これは,文をノード,文間の類似度をエッジとしたグラフ表現において,固有ベクトル中心性の概念に基づいて文の重要度を計算する手法である.しかし,この手法が用いているのは文の単語頻度ベクトルのような表層的な情報のみであり,文のもつ潜在トピックは考慮していない.本研究では,潜在トピックを考慮したグラフを用いた複数文書要約手法を提案する.そして,DUC2004を用いた実験を通して従来の手法であるLexRankとの比較を行い,潜在トピックがグラフベースの要約手法において有用であることを示す.

著者関連情報
2012 この論文のすべての権利と著作権は著者に帰属します。
前の記事 次の記事
feedback
Top