自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
語彙的結束性に基づく話題の階層構成の認定
仲尾 由雄
著者情報
ジャーナル フリー

1999 年 6 巻 6 号 p. 83-112

詳細
抄録

語彙的結束性に基づき、文章中の話題の階層的な構成を自動認定する手法を提案する。語の繰り返しだけを手がかりに、文章全体の数分の1程度の大きな話題のまとまりから、段落程度の小さな話題のまとまりまで、話題の大きさ別に認定し、次に、大きな話題に関する境界と小さな話題に関する境界を対応づけることで、話題の階層構成を求める手法である。この手法は、複数の話題に関する文章が混在している集合的な文書の要約作成を目的に考案したものである。白書のような数十頁の報告書の骨子を把握したい利用者にとっては、1/4程度にまとめた通常の要約では長過ぎて役に立たないことがある。また、新聞の連載記事を要約する場合、関連する記事をまとめて要約した方がよい場合なども考えられる。よって、利用目的に応じて適切な粒度の話題を抽出する技術が重要となる。提案手法を使えば、指定した程度の大きさの話題のまとまりを認定できるので、要約の単位として適した大きさの話題のまとまりを抽出し、それぞれを要約することで、粒の揃った話題を含む要約が作成できる。本文では、提案手法の詳細を説明するとともに、長めの報告書と、新聞の連載記事を集めた文書などを対象とした話題構成認定実験により、提案手法の有効性と認定精度を示す。

著者関連情報
© 言語処理学会
前の記事 次の記事
feedback
Top