自然言語処理システムに求められている分析性能が向上するにつれて, そのシステムで用いる文法規則や辞書データといった言語知識ベースも複雑化, 巨大化してきた. 一方, 自然言語処理システムを用いる応用分野がますます多様化することが予想され, 応用分野ごとに新たな分析性能が要求される. 言語知識ベースにおいても追加と修正の作業が発生する. しかし, 現状では, その開発には多数の人員と多くの時間を必要とするため, 言語知識ベースの再構築は困難な作業である. 応用分野に適合するシステムを, より効率的に開発する手段が必要である. そのためには, 融通性を持ち容易に修正できる文法規則や辞書データの作成技法と, 作成された言語知識ベースの保守性の向上を図る必要がある. この課題は, 応用分野の多様化に伴う需要と規模が増大する中でますます重要となっている. この稿では, この技術課題に対して, 言語知識ベースのうち, 文法規則の系統的な記述の方法を提案し, その方法に従って作成した機械処理を指向した文法規則について述べる. まず, 形態素と表層形態の概念区分をした上で, 日本語の持つ階層構造に注目した. 形態素の述部階層位置との関係から, 表層での形態の現れ方を構文構造に結び付ける形態構文論的な文法作成のアプローチを採用し, 文法規則の開発手続きを確立した. 融通性を持ち容易に修正できることを例証するため, 試作した文法規則を新聞の論説文の分析に適用し, 分析の出来なかった言語現象を検討した. そして, その言語現象を取り上げて, これを新たな分析性能を満たす要求仕様と見なし, 同じ手続きを用いて文法規則を拡張した. この結果, 拡張した文法規則の分析性能が漸増していることを確認した. 系統的な記述の手続きに従うことによって, 文法規則記述の一貫性を維持しながら, その分析性能を向上させることが可能となった. このため工学上, 文法規則の開発作業手順に一般性が生じ, 開発時間を短縮することができる. 試作した文法規則は実際に計算機上に実装している. 本稿は機械処理を指向した文法規則記述のノウハウを体系化する試みとして位置づけられる.
抄録全体を表示