抄録
構文解析において, 多様な言語現象を扱うためには大規模な文法が必要となるが, 一般に人手で文法を開発することは困難である.一方, 大規模な構文構造付きコーパスから様々な統計情報を取り出し, 自然言語処理に利用する研究が多くの成果をあげてきており, 構文構造付きコーパスの整備が進んでいる.このコーパスから大規模な文脈自由文法 (CFG, 以下, 文法と略す) を抽出することが考えられる.ところが, コーパスから抽出した文法をそのまま用いた構文解析では多数の解析結果 (曖昧性) を作り出すことが避けられないことが問題であり, それが解析精度の悪化や解析時間, 使用メモリ量の増大の要因ともなる.効率的な構文解析を行うためには, 曖昧性を増大させる要因を分析し, 構文解析の段階では曖昧性を極力抑えるよう文法やコーパスを変更する必要がある.本論文では, 構文解析で出力される曖昧性を極力抑えた文法を開発するための具体的な方針を提案し, その有効性を実験により明らかにしている.