2000 年 7 巻 5 号 p. 71-91
本稿では、日本語係り受け解析のための統計的手法について述べる。この手法は、統計値の計算方法が従来の手法と異なる。従来の手法では、2つの文節問が依存関係にある確率をそれぞれの文節の組に対して計算するが、本研究で提案する「3つ組/4つ組モデル」は、係り元の文節と係り先の文節の候補となる全ての文節に関する情報を確率の条件部として、ある文節が係り先として選択される確率を求める。なお、係り先の候補は、HPSGに基づいた文法及びヒューリスティクスによって高々3つに絞られる。確率の推定には最大エントロピー法を用いており、我々の構文解析器は耳DRコーパスに対して文節正解率88.6%という高い解析精度を達成した。