自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
語の反復距離に基づく段落境界の認定
中野 滋徳足立 顕牧野 武則
著者情報
ジャーナル フリー

2006 年 13 巻 2 号 p. 3-26

詳細
抄録

テキストを意味段落に分割する方法として, 語の反復距離に基づく話題結束度による認定手法を提案する. 意味段落とはテキスト中に含まれるまとまった話題の単位である. 文をまたがって出現する反復語の文間距離をもとに話題形成の尺度化を行い話題結束力を算出する. 語が近接して反復する区間に話題形成ポテンシャルが生じ, それが話題結束力を形成するという話題境界判定モデルを考案した. 社説記事を連結して, 記事境界と段落分割点とが一致したときを正解とする境界判定実験を行った結果, 再現率67.8%, 適合率61.8%の精度を得た. 極めて簡単な方法で段落境界を判定することができ, 記事以外に随筆等の比較的長いテキストに対しても有効である.

著者関連情報
© 言語処理学会
前の記事 次の記事
feedback
Top