自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
論文
正誤情報と文法誤りパターンを考慮した単語分散表現を 用いた文法誤り検出
金子 正弘堺澤 勇也小町 守
著者情報
ジャーナル フリー

2018 年 25 巻 4 号 p. 421-439

詳細
抄録

本稿では,文法誤り検出のための正誤情報と文法誤りパターンを考慮した単語分散表現の学習手法を提案する.これまでの文法誤り検出で用いられている単語分散表現の学習では文脈だけをモデル化しており,言語学習者に特有の文法誤りを考慮していない.そこで我々は,正誤情報と文法誤りパターンを考慮することで文法誤り検出に特化した単語分散表現を学習する手法を提案する.正誤情報とは,n-gram 単語列内のターゲット単語が誤っているのか正しいのかというラベルである.これは単語単位の誤りラベルを元に決定される.誤りパターンとは,学習者が誤りやすい単語の組み合わせである.誤りパターンは大規模な学習者コーパスから単語分散表現の学習のために抽出することが可能である.この手法で学習した単語分散表現で初期化した Bidirectional Long Short-Term Memory を分類器として使うことで,First Certificate in English コーパスに対する文法誤り検出において世界最高精度を達成した.

著者関連情報
© 2018 一般社団法人 言語処理学会
前の記事 次の記事
feedback
Top