主催: Webインテリジェンスとインタラクション研究会
会議名: WI2研究会
回次: 3
開催地: さくらWORKS<関内>
開催日: 2013/12/13 - 2013/12/14
p. 43-48
近年,大量の文書データと接する機会の増加にともない,文書要約技術の必要性が高まっている.文書要約における一般的な手法としては,冗長性などを考慮してバランスの良い重要文の組合せを求めることにより要約文を生成する手法がある.最適な文の組合せを求めるのには整数計画法などが用いられるが,整数計画法はNP困難に属し,要約対象とする文書集合が大きい場合には厳密解を求めるために膨大な計算時間を要するという問題が存在する.一方,厳密な解を追求せず実用的な時間で近似解を求める最適化手法として,進化的アルゴリズムの有効性が報告されている.そのような背景を踏まえて,本研究では,進化的アルゴリズムの中でも解の精度や計算時間の点で優れているとされている差分進化アルゴリズムを用いて組合せ最適化を行う要約文生成を行う.また,文書中には複数のトピックが含まれているという仮定の下に,文書内の潜在トピックを潜在的ディリクレ配分法を用いて抽出し,各トピックの内容を万遍なく含むような文の組合せを要約文として生成する.