自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
論文
入れ子依存木の刈り込みによる単一文書要約手法
菊池 悠太平尾 努高村 大也奥村 学永田 昌明
著者情報
ジャーナル フリー

2015 年 22 巻 3 号 p. 197-217

詳細
抄録

近年の抽出型要約の多くの手法は,原文書の情報を網羅し,かつ与えられる要約長の制約に柔軟に対応すべく,文抽出と文圧縮を併用した組み合わせ最適化問題として要約を定式化している.つまり,文書から文という文法的な単位を維持するよう単語を抽出することで要約を生成している.従来の手法は非文の生成を避けるため,構文木における単語間の関係を利用して文を圧縮しているものの,文書における大域的な文と文の間の関係,つまり談話構造には着目してこなかった.しかし,談話構造を考慮することは要約の一貫性を保つ上で非常に重要であり,文書の重要箇所の同定にも役立つ.我々は,文書を文間の依存関係,単語間の依存関係をあらわした入れ子依存木とみなし,単語重要度の和が最大となるように木を刈り込むことで要約を生成する手法を提案する.実験の結果,提案手法が要約精度を有意に向上させたことが確認できた.

著者関連情報
© 2015 一般社団法人 言語処理学会
前の記事
feedback
Top