自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
重複部・冗長部削除による複数記事要約手法
大竹 清敬船坂 貴浩増山 繁山本 和英
著者情報
キーワード: 要約, 複数文章, 重複表現
ジャーナル フリー

1999 年 6 巻 6 号 p. 45-64

詳細
抄録

複数の関連記事に対する要約手法について述べる. 記事の第一段落を用いて, その重複部・冗長部を削除することにより複数の関連記事をどの程度要約できるかを明確にすることを目的とする. さらに, 重複部・冗長部を特定, 削除する処理をヒューリスティックスにより実現する手法を提案する. まず, 新聞記事における推量文の一部は重要度が低いと考えられ, これを文末表現ならびに手掛り語で特定し, 削除する. 次に, 詳細な住所の表現は記事の概要を把握するためには不必要であり, これも削除する. さらに, 導入部と呼ぶ部分を定義し, 導入部内の名詞と動詞が他記事の文に含まれるならば導入部は重複しているとし, 削除する. また, 頻繁に出現する人名・地名に関する説明語句, 括弧を用いた表現について, 他記事との重複を調べる. 重複している部分は, 1つを残し他は削除する. 提案手法を計算機に実装し, 実験を行った. その結果, 27記事群に対して各記事の第一段落を平均要約率82.1%で要約することができた. さらに, 実験結果のうち6記事群を用いて評価者11人に対してアンケートを行い評価した. アンケートの内容は, 要約文章において冗長に感じる箇所, ならびに削除部分を含めた元記事において重要と考えられるが削除されている箇所を指摘する, である. アンケート調査の結果, 本手法による要約がおおむね自然であることを確認した. また, 本手法によって削除された部分がおおむね妥当であることが明らかになった.

著者関連情報
© 言語処理学会
前の記事 次の記事
feedback
Top