情報の科学と技術
Online ISSN : 2189-8278
Print ISSN : 0913-3801
ISSN-L : 0913-3801
日本語コーパスの今(<特集>デジタル時代の日本語)
小木曽 智信
著者情報
ジャーナル オープンアクセス

2014 年 64 巻 11 号 p. 463-468

詳細
抄録

2012年に1億語規模の「現代日本語書き言葉均衡コーパス」が完成・公開され,日本語のコーパスは日本語学・日本語教育・自然言語処理等の諸分野において欠かすことのできない研究基盤として広く活用されている。本稿は,日本語コーパスの前史からはじめ,「日本語話し言葉コーパス」「太陽コーパス」「現代日本語書き言葉均衡コーパス」「日本語歴史コーパス」等の国立国語研究所で構築されたコーパスと形態素解析用の辞書「UniDic」について紹介するとともに,今日のデジタル時代に日本語コーパスが果たしている役割と,今後の日本語コーパスのあり方について論じた。

著者関連情報
前の記事 次の記事
feedback
Top