抄録
本研究は,外国人日本語学習者向けの日本語文章の難易度に関連する言語要素を明らかにし,言語教育分野に求められる高精度かつ説明性を備えた難易度判定モデルを構築することを目的とする.具体的には,レベルが明確に記載されている日本語学習用の教科書文章に基づき,5つの言語単位の86の言語特徴を抽出し,判定モデルの構築および性能の評価を行った.自動的な難易度評価のための4つの分類モデルの予測効果を比較した結果,SVM(Support Vector Machine)が日本語文章の難易度判定において優れている性能(ACC = 0.898)であることが示された.また,言語教育分野で期待されるモデルの簡潔性および説明性を確保するために,特徴選択の手法で文章の難易度と最も関連性の高い35の要因を取り上げ,モデルの解読性を高めつつ0.880の予測精度が得られた.