自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
論文
Universal Dependencies 日本語コーパス
浅原 正幸金山 博宮尾 祐介田中 貴秋大村 舞村脇 有吾松本 裕治
著者情報
ジャーナル フリー

2019 年 26 巻 1 号 p. 3-36

詳細
抄録

Universal Dependencies (UD) は,共通のアノテーション方式で多言語の構文構造コーパスを言語横断的に開発するプロジェクトである. 2018 年 6 月現在,約 60 の言語で 100 以上のコーパスが開発・公開されており,多言語構文解析器の開発,言語横断的な構文モデルの学習,言語間の類型論的比較などさまざまな研究で利用されている. 本稿では UD の日本語適応について述べる.日本語コーパスを開発する際の問題点として品詞情報・格のラベル・句と節の区別について議論する.また,依存構造木では表現が難しい,並列構造の問題についても議論する.最後に現在までに開発した UD 準拠の日本語コーパスの現状を報告する.

著者関連情報
© 2019 一般社団法人 言語処理学会
前の記事 次の記事
feedback
Top