長い文の統語解析を行なうと, 多くの解析結果が得られることがある. これは, その文に含まれる曖昧性に起因するものであり, 曖昧性が大きくなるにつれて, 解析結果の数が増え, 解析時間も長くなる. 曖昧性を解消する手法は古くから提案されているが, 近年は, 統計的に学習した優先度情報を文法制約に組み込んで, 解析結果問の優劣を判断し, 曖昧性を解消する手法が広く用いられている. しかし, 統計的に得られた優先度情報を文法制約に組み込むことは, 知識のモジュール性の観点から, あまり望ましいことではない. 本論文では, 文法制約と統計的に得られた優先度情報を, 知識レベルでは独立に記述しておき, 統語解析を行なう処理レベルで, 統合して利用する手法を提案する. 優先度情報としては, 統計的に学習した確率付き係り受け情報を利用する. 優先度の高い係り受け関係から順に成立させることができるように, チャート法のアルゴリズムに修正を加えた. その結果, 統計情報と文法制約を処理レベルで統合的に利用することができ, また, 解析の効率化も実現できる. 講談社和英辞典の例文220文について実験を行なったところ, 解析中に生成される弧の数が4分の1, 解析速度が7倍になった.
抄録全体を表示