自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
一般論文(査読有)
国語研長単位に基づく日本語 Universal Dependencies
大村 舞若狭 絢浅原 正幸
著者情報
ジャーナル フリー

2023 年 30 巻 1 号 p. 4-29

詳細
抄録

Universal Dependencies (UD) は言語横断的に単語の依存構造に基づくツリーバンクを構築するプロジェクトである.全言語で統一した基準により,品詞・依存構造アノテーションデータの構築が 100 言語以上の言語について進められている.分かち書きをしない言語においては,基本単位となる構文的な語 (syntactic word) を規定する必要がある.従前の日本語の UD データは,形態論に基づく単位である国語研短単位を採用していた.今回,我々は新たに構文的な語に近い単語単位である国語研長単位に基づく日本語 UD である UD_Japanese-GSDLUW, UD_Japanese-PUDLUWUD_Japanese-BCCWJLUW を構築したので報告する.

著者関連情報
© 2023 一般社団法人 言語処理学会
前の記事 次の記事
feedback
Top