抄録
コーパスを用いた言語研究では,複数の頻度データを比較することが多い。そして,一般的には,複数の頻度データに統計的に意味のある差(有意差)が存在するかどうかを検証するために,有意性検定と呼ばれる統計処理が行われる。しかしながら,検定には,サンプル・サイズが大きくなれば,結果として得られるp値が小さくなる傾向があることが知られている。そして,p値が小さいと,実質的な差がない場合にも,「有意差あり」という誤った解釈が導かれる危険性がある。そのようなときには,検定の結果だけでなく,何らかの効果量を提示する必要がある。以下,本稿では,頻度差の検定を行う際の注意点を述べ,効果量(オッズ比,φ係数,クラメールのV)についての解説を行う。