抄録
2012年に1億語規模の「現代日本語書き言葉均衡コーパス」が完成・公開され,日本語のコーパスは日本語学・日本語教育・自然言語処理等の諸分野において欠かすことのできない研究基盤として広く活用されている。本稿は,日本語コーパスの前史からはじめ,「日本語話し言葉コーパス」「太陽コーパス」「現代日本語書き言葉均衡コーパス」「日本語歴史コーパス」等の国立国語研究所で構築されたコーパスと形態素解析用の辞書「UniDic」について紹介するとともに,今日のデジタル時代に日本語コーパスが果たしている役割と,今後の日本語コーパスのあり方について論じた。