人工知能学会全国大会論文集
Online ISSN : 2758-7347
第35回 (2021)
セッションID: 4J3-GS-6f-02
会議情報

JSICK: 日本語構成的推論・類似度データセットの構築
*谷中 瞳峯島 宏次
著者情報
会議録・要旨集 フリー

詳細
抄録

単語と文の構造に基づいて新しい文を構成的に理解し,文間の意味的関係を認識することは,より人間らしい自然言語理解をコンピュータによって実現するための基本的な課題の一つである.本研究では,英語の構成的推論・類似度データセットSICKを人手で日本語に翻訳することで日本語の含意関係認識・文間類似度データセットJSICKを構築し,JSICKを学習した汎用言語モデルBERTが否定表現や量化表現といった多様な意味現象を構成的に捉えられているかについて,意味現象のタイプごとに評価を行う.さらに,語順を変えても意味内容が変わらないという日本語独自の性質を考慮して,モデルが意味現象を構成的に捉えているかについて分析を行う.実験の結果,現行の汎用言語モデルは数量表現や語順の入れ替えの扱いにおいて,改善の余地があることが示唆された.

著者関連情報
© 2021 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top