抄録
本稿では,「現実の言語データ」を統計的に分析する際の留意点を概観した.言語研究で用いられるデータは,言語音の測定データなど一部を除けば,ほぼすべてが質的データである.質的データである言語データを統計的に分析するためには,何らかの方法で量的データに転換させなければならない.そこで,言語研究で用いられることの多い質的データから「アンケート調査の回答」「インタビュー調査の回答」「コーパス」の3つを取りあげ,量的データに転換する方法,その際の留意点について述べた.自然言語を統計的に処理するというのは,アナログな世界を1/0のデジタルな世界に移し替えるという作業であり,その背景には常に研究者の判断がある.言語データを統計的な分析するにあたっては,「何のために統計的に分析するのか」「そもそもどのような理念,思考に基づいてデジタルな世界に移し替えたのか」という原点を常に意識することが重要である.