主催: Webインテリジェンスとインタラクション研究会
会議名: WI2研究会
回次: 1
開催地: 神奈川近代文学館
開催日: 2012/12/14 - 2012/12/15
p. 59-64
近年,情報技術の発展に伴い大量のテキストデータが蓄積されるようになり,その中からユーザが必要としている情報を選択することが必要となってきた.そして,情報を取捨選択するための一手法として,自動文書要約技術の必要性が高まっている.特に複数文書要約は,大量のデータの概要をユーザが捉えることが可能になるという点で,今後ますます重要となると考えられる.要約手法としては様々な手法が提案されている一方で,LexRankのようなグラフベースの要約手法の有用性が示されている.これは,文をノード,文間の類似度をエッジとしたグラフ表現において,固有ベクトル中心性の概念に基づいて文の重要度を計算する手法である.しかし,この手法が用いているのは文の単語頻度ベクトルのような表層的な情報のみであり,文のもつ潜在トピックは考慮していない.本研究では,潜在トピックを考慮したグラフを用いた複数文書要約手法を提案する.そして,DUC2004を用いた実験を通して従来の手法であるLexRankとの比較を行い,潜在トピックがグラフベースの要約手法において有用であることを示す.