自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
認知単位のbigramを用いた日本語文解析の一方法
横田 和章藤崎 博也
著者情報
ジャーナル フリー

1996 年 3 巻 4 号 p. 129-139

詳細
抄録

現在, 自然言語処理システムの多くは, 処理単位として形態素を用いているが, 人間はもっと大きな単位で文を処理していることが既に分かっている. この単位を認知単位と呼ぶ. この知見から, 人間の文解析処理は, 認知単位の検出処理と, 検出した認知単位の取捨選択の2段階に分離できるものと考えられている. 本論文では, この考えに基づき, 第一段階として状態遷移図を用いて認知単位を検出し, 第二段階としてbigramを用いて認知単位を選択する, 計二段階からなる文解析法を提案するものである. この方法を用いて誤りを含んだテキストに対し誤り訂正を行う実験を行った結果, 形態素を単位としたbigramを用いるよりも良い結果を得ることができた.

著者関連情報
© 言語処理学会
前の記事
feedback
Top