Webインテリジェンスとインタラクション研究会 予稿集
Online ISSN : 2758-2922
第3回研究会
会議情報

セッション4:コンテキスト・トピック分析
潜在トピックを網羅し差分進化アルゴリズムを用いた複数文書要約
重松 遥小林 一郎
著者情報
会議録・要旨集 フリー

p. 43-48

詳細
抄録

近年,大量の文書データと接する機会の増加にともない,文書要約技術の必要性が高まっている.文書要約における一般的な手法としては,冗長性などを考慮してバランスの良い重要文の組合せを求めることにより要約文を生成する手法がある.最適な文の組合せを求めるのには整数計画法などが用いられるが,整数計画法はNP困難に属し,要約対象とする文書集合が大きい場合には厳密解を求めるために膨大な計算時間を要するという問題が存在する.一方,厳密な解を追求せず実用的な時間で近似解を求める最適化手法として,進化的アルゴリズムの有効性が報告されている.そのような背景を踏まえて,本研究では,進化的アルゴリズムの中でも解の精度や計算時間の点で優れているとされている差分進化アルゴリズムを用いて組合せ最適化を行う要約文生成を行う.また,文書中には複数のトピックが含まれているという仮定の下に,文書内の潜在トピックを潜在的ディリクレ配分法を用いて抽出し,各トピックの内容を万遍なく含むような文の組合せを要約文として生成する.

著者関連情報
2013 この論文のすべての権利と著作権は著者に帰属します。
前の記事 次の記事
feedback
Top