文法誤り訂正モデルの横断評価

三田 雅人; 水本 智也; 金子 正弘; 永田 亮; 乾 健太郎

doi:10.5715/jnlp.28.160

抄録

文法誤り訂正の既存研究の多くはこれまで主に CoNLL-2014 評価データセットを用いた単一コーパス上で文法誤り訂正モデルを評価してきた．しかし，書き手の習熟度やエッセイのトピックなど様々なバリエーションのある入力文が想定される文法誤り訂正タスクにおいて，タスクの難易度は各条件下によって異なるため，単一コーパスによる評価では不十分であると考えられる．そこで本研究では，文法誤り訂正の評価の方法論として，単一コーパス評価は不十分であるという仮説に基づきコーパス横断評価の必要性について調査を行う．具体的には，4 種類の手法 (LSTM, CNN, Transformer, SMT) を 6 種類のコーパス (CoNLL-2014, CoNLL-2013, FCE, JFLEG, KJ, BEA-2019) で評価し，各コーパス間でモデル順位にばらつきが生じるかについて検証を行った．評価実験の結果，モデル順位は各コーパスによって大きく変動したため，既存の単一コーパス評価では不十分であることがわかった．また，横断評価はメタ評価方法としてだけではなく，実応用を見据えた場合においても有用であると考えられる．そこで，横断評価の有用性のケーススタディとして，文法誤り訂正の入力に想定される代表的な条件の一つである，書き手の習熟度を評価セグメントとした場合の横断評価について調査を行った．その結果，書き手の習熟度が初中級レベルと上級レベル間ではモデルの性能評価に関して大きな乖離があることがわかった．

著者関連情報

Licensed under CC BY 4.0
https://creativecommons.org/licenses/by/4.0/

お気に入り & アラート

閲覧履歴

責任著者(Corresponding author)

J-STAGEへの登録はこちら（無料）