抄録
日本語の述語項構造アノテーションコーパスは,これまでにいくつかの研究によって整備され,その結果,日本語の述語項構造解析の研究は飛躍的にその成果を伸ばした.一方で,既存のコーパスのアノテーション作業者間一致率やアノテーション結果の定性的な分析をふまえると,ラベル付与に用いる作業用のガイドラインには未だ改善の余地が大きいと言える.本論文では,より洗練された述語項構造アノテーションのガイドラインを作成することを目的とし,NAIST テキストコーパス (NTC), 京都大学テキストコーパス (KTC) のアノテーションガイドラインと実際のラベル付与例を参考に,これらのコーパスの仕様策定,仕様準拠のアノテーションに関わった研究者・アノテータ,仕様の改善に関心のある研究者らの考察をもとにガイドライン策定上の論点をまとめ,現状の問題点や,それらに対する改善策について議論・整理した結果を報告する.また,アノテーションガイドラインを継続的に改善可能とするための方法論についても議論する.