自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
論文
『現代日本語書き言葉均衡コーパス』に対する 文節係り受け・並列構造アノテーション
浅原 正幸松本 裕治
著者情報
ジャーナル フリー

2018 年 25 巻 4 号 p. 331-356

詳細
抄録

本稿では『現代日本語書き言葉均衡コーパス』のコアデータに対する文節係り受け・並列構造情報のアノテーションについて述べる.統語構造のアノテーションに対して,文節係り受け情報と並列・同格構造を分離してアノテーションする方法を提案する.さらに節境界を越える係り受け関係について,節の分類に基づきスコープを決めることでよりアノテーションの精緻化を行う.実作業の工程上の問題などにも言及しながら,アノテーション基準を概説する.また,アノテーションデータの基礎統計量について示す.

著者関連情報
© 2018 一般社団法人 言語処理学会
前の記事 次の記事
feedback
Top