抄録
本稿では, 日本語文章中における格要素の省略 (ゼロ代名詞) を検出し, その先行詞を同定する手法を提案する. 本手法は, 自動構築した格フレーム辞書に基づく格解析によってゼロ代名詞を検出し, 同辞書による正確な選択制限を用いてゼロ代名詞の先行詞を同定する. また, 先行詞はゼロ代名詞から近いところに存在しやすいという傾向を正確にモデル化するために, 文・文章中の構造を考慮した先行詞の位置選好順序をコーパスから学習し, これを解析で利用する. 格フレーム辞書, 先行詞の位置選好順序, さらに機械学習を統合した省略解析システムを作成し, 100記事の大規模解析実験を行った結果, ゼロ代名詞検出が適合率87.1%, 再現率74.8%, ゼロ代名詞の先行詞同定が61.8%の精度であった.