抄録
筆者らは, コーパスに基づいて形態素を基本とした日本語文法を自動獲得する方法を既に提案している. 本論文は, この方法における処理単位として, 形態素の代わりにより長い単位-認知単位-を用いた新しい方法を提案するものである. 認知単位は, 人間を被験者とした知覚実験の結果から得られた人間の文解析の単位である. こうした, 形態素より長い単位を解析に用いることにより, 構文解析における経路数を抑えることができる. しかし, 単純に認知単位を辞書に登録して用いるだけでは, 未知認知単位の出現確率が高まり, 結果として文解析の正解率が低下する. この現象を抑えるため, 既知認知単位から未知認知単位を推定する新しい方法を更に取り入れた. この方法で天気概況文コーパスを処理し, 得られた文法に基づき構文解析を行った結果, 形態素を処理単位とした解析に比べ高い処理効率を得ることができた.