コーパスからの日本語従属節係り受け選好情報の抽出およびその評価

宇津呂 武仁; 西岡山 滋之; 藤尾 正和; 松本 裕治

doi:10.5715/jnlp.6.7_29

抄録

日本語の長文で一文中に従属節が複数個存在する場合, それらの節の間の係り受け関係を一意に認定することは非常に困難である. また, このことは, 日本語の長文を構文解析する際の最大のボトルネックの一つとなっている. 本論文では, 大量の構文解析済コーパスから, 統計的手法により, 従属節節末表現の間の係り受け関係を判定する規則を自動抽出する手法を提案する. 統計的手法として, 決定リストの学習の手法を用いることにより, 係り側・受け側の従属節の形態素上の特徴と, 二つの従属節のスコープが包含関係にあるか否かの間の因果関係を分析し, この因果関係を考慮して, 従属節節末表現の間の係り受け関係判定規則を学習する. また, EDR日本語コーパスから抽出した係り受け情報を用いて, 本論文の手法の有効性を実験的に検証した結果について述べる. さらに, 推定された従属節間の係り受け関係を, 統計的文係り受け解析において利用することにより, 統計的文係り受け解析の精度が向上することを示す.

著者関連情報

お気に入り & アラート

閲覧履歴

責任著者(Corresponding author)

J-STAGEへの登録はこちら（無料）