抄録
本稿では, 大規模コーパスから収集した統計情報を用いて, 日本語係り受け解析の精度を向上させる手法を提案する.提案モデルでは, 従来の統計的機械学習アルゴリズムを用いた解析において有効に活用されていない2つの特徴を考慮している.1つは同じ用言を係り先とする格要素間の従属関係であり, もう1つは, 格要素・用言間の共起関係である.これらの関係は, 大規模コーパスから自動収集した係り受け情報から得ることができる.提案モデルが係り受け解析に有効であるかを実証するために, 既存の係り受け解析システムが出力した複数の解析候補をrerankingする方法で実験を行った.その結果, 既存システムの係り受け解析精度をさらに向上させることができた.また, 用言が名詞を連体修飾しているとき, 被修飾名詞とその用言の関係が係り受けに影響を及ぼすことを示し, 提案モデルに連体修飾節の解析を統合する手法を提案する.