抄録
学習者コーパスは,均衡コーパスと異なり,代表性や大規模性を満たしていないものが多い.しかしその分析には,基本的に均衡コーパスと同様の分析法が用いられてきた.本稿では,従来の分析法が統計的に有効かどうかを検討した.その結果,誤用表現,文,形態素などの言語単位は,学習者ごとに一定のまとまりを持っているため,統計分析に不可欠な独立性の仮定を満たしていないこと,また,外れ値によって分析結果を大きく歪める場合があることが明らかとなった.このため,従来の分析法に替えて,学習者別に頻度を集約し,学習者を観察単位として分析する方法が有効だと考えられた.