人間文化研究機構国立国語研究所
奈良先端科学技術大学院大学情報科学研究科
2018 年 25 巻 4 号 p. 331-356
(EndNote、Reference Manager、ProCite、RefWorksとの互換性あり)
(BibDesk、LaTeXとの互換性あり)
本稿では『現代日本語書き言葉均衡コーパス』のコアデータに対する文節係り受け・並列構造情報のアノテーションについて述べる.統語構造のアノテーションに対して,文節係り受け情報と並列・同格構造を分離してアノテーションする方法を提案する.さらに節境界を越える係り受け関係について,節の分類に基づきスコープを決めることでよりアノテーションの精緻化を行う.実作業の工程上の問題などにも言及しながら,アノテーション基準を概説する.また,アノテーションデータの基礎統計量について示す.
すでにアカウントをお持ちの場合 サインインはこちら