自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
セグメントの分割と統合による文章の構造解析
田村 直良和田 啓二
著者情報
ジャーナル フリー

1998 年 5 巻 1 号 p. 59-78

詳細
抄録

本研究では, 論説文の文章構造についてモデル化し, それに基づいた文章解析手法について論じる. 近年のインターネットや, 電子媒体の発達などにより大量の電子化された文書が個人の周囲にあふれてきているが, 大量の文書を高速に処理するためには, 記述されている領域に依存した知識を前提とせず, なるべく深い意味解析に立ち入らない「表層的」な処理により行なうことが求められる. ここで提案する手法での構造化は, 文末の表層的な情報によるモダリティの解析に依る. これを基に文章の論説モデルを定義する. 文章解析のトップダウン的アプローチとしては, 文章のセグメンテーションの手法を応用し, 評価関数の値の大きい箇所から分割していく. 文章解析のボトムアップ的アプローチとしては, 修辞関係に着目したセグメント統合により隣接していて関係が強いところから統合していく. ここで提案する手法は, 構造木の葉に近い部分をボトムアップ的解析で, 根に近い部分をトップダウン的解析で処理することにより, 一方の欠点を他方の利点で補う効果的なものである. 本研究のような対象においては, 解析結果を正解と不正解の2値に分けてしまうのでは評価としては不十分であり, 正解に近いものはそれなりに評価してやる必要がある. これについて, 構造木の根に近い部分は形式段落の位置に基づく客観的評価, 葉に近い部分は人間が解析したものとの比較, 全体的な構造に対しては個々の解析結果を人間が検討することにより本手法の評価を行う.

著者関連情報
© 言語処理学会
前の記事 次の記事
feedback
Top