人間文化研究機構 国立国語研究所 [日本]
2018 年 10 巻 p. 26-30
(EndNote、Reference Manager、ProCite、RefWorksとの互換性あり)
(BibDesk、LaTeXとの互換性あり)
本稿では,250 億語規模のテキストコーパスである『国語研日本語ウェブコーパス』の概要と,その検索系『梵天』の紹介を行う。コーパスの構築手法として,どのようにテキストを収集し,どのような言語解析が行われているかについて,統計情報を示しながら紹介する。さらに,検索系「梵天」の文字列検索・品詞列検索・係り受け検索機能について述べる。
すでにアカウントをお持ちの場合 サインインはこちら