人工知能学会全国大会論文集
Online ISSN : 2758-7347
第37回 (2023)
セッションID: 2E6-GS-6-01
会議情報

テ形従属節の用法判定のための用法分類アノテーション
*野口 咲帆田中 リベカ戸次 大介
著者情報
会議録・要旨集 フリー

詳細
抄録

テ形従属節は日本語に頻出する表現であり、複数の用法がある。その用法を計算機で判定することは自然言語処理分野の重要なタスクと言える。そこで本研究では、テ形従属節の用法分類とアノテーションガイドラインの設計を行った。テ形従属節の用法については日本語学分野でさまざまな分類が提案されている。しかし、それらの分類で説明された用法ごとの特徴や例文をそのまま用いてアノテーションガイドラインの作成を試みると、非専門家である作業者にとって判断が難しかったり、複数の用法がアノテーションされたりするという問題点がある。そのため本研究では言語学的テストを用いたアノテーションガイドラインを設計する。言語学的テストとは対象表現が言い換え可能かなどを判定するもので、 それによってアノテーション時の判断が揺れにくくなるとされている。アノテーション時にはガイドラインの言語学的テストを適用することでテ形従属節の出現の用法を判定し、用法タグを付与した。さらに、このようにして構築したコーパスをもとに、BERTを用いて用法判定器を学習する。

著者関連情報
© 2023 人工知能学会
前の記事 次の記事
feedback
Top