自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
連想概念辞書の距離情報を用いた重要文の抽出
岡本 潤石崎 俊
著者情報
ジャーナル フリー

2003 年 10 巻 5 号 p. 139-151

詳細
抄録

大量の文書情報の中から必要な部分を入手するために, 自動要約技術などによって文書の量を制御し, 短い時間で適確に内容を把握する必要性が高くなってきている. 自動要約を行なうには文書中のどの箇所が重要なのかを判断する必要があり, 従来の重要文の抽出方法には単語の出現頻度にもとづいた重要語の計算方法などがある. 本論では連想概念辞書における, 上位/下位概念, 属性概念, 動作概念などの連想関係を用いて文書中の単語の重要度を計算し重要文を抽出する手法を提案して有効性を示す. 連想概念辞書は, 小学校の学習基本語彙を刺激語とし大量の連想語を収集して構造化すると同時に, その連想語との距離が定量化されている. また既存の重要語抽出法と本手法での抽出結果とを, 人間が行なった要約結果と比較することによって評価した. 従来の手法に比べて連想関係を計算に含めることによって要約精度が人間の要約に近く, 本手法によって改良されることがわかった.

著者関連情報
© 言語処理学会
前の記事
feedback
Top