2018 年 25 巻 4 号 p. 421-439
本稿では,文法誤り検出のための正誤情報と文法誤りパターンを考慮した単語分散表現の学習手法を提案する.これまでの文法誤り検出で用いられている単語分散表現の学習では文脈だけをモデル化しており,言語学習者に特有の文法誤りを考慮していない.そこで我々は,正誤情報と文法誤りパターンを考慮することで文法誤り検出に特化した単語分散表現を学習する手法を提案する.正誤情報とは,n-gram 単語列内のターゲット単語が誤っているのか正しいのかというラベルである.これは単語単位の誤りラベルを元に決定される.誤りパターンとは,学習者が誤りやすい単語の組み合わせである.誤りパターンは大規模な学習者コーパスから単語分散表現の学習のために抽出することが可能である.この手法で学習した単語分散表現で初期化した Bidirectional Long Short-Term Memory を分類器として使うことで,First Certificate in English コーパスに対する文法誤り検出において世界最高精度を達成した.