主催: 一般社団法人 人工知能学会
会議名: 2023年度人工知能学会全国大会(第37回)
回次: 37
開催地: 熊本城ホール+オンライン
開催日: 2023/06/06 - 2023/06/09
時間に関する自然言語推論は事前学習済み言語モデルにとって挑戦的なタスクである.そのため,これまで様々な評価用データセットが構築されてきた.しかし,既存のデータセットは主に英語を対象としており,他言語を扱ったものは少ない.そこで本研究では,時間推論に関する日本語NLIベンチマークを構築する.提案手法では,まず形式意味論のテストセットに基づいて様々な推論パターンからなる時間推論テンプレートを作成する.次に,テンプレートに対して日本語格フレームを用いて動詞や名詞,時間表現を自動で割り当てることで,多様な時間推論の問題を生成する.構築したデータセットを制御して分割し,言語モデルの学習・評価に用いることで,時間推論パターンや時間表現における多言語・単言語の言語モデルの汎化性能を評価する.実験により,既存の言語モデルは習慣などの特定の言語現象の理解に課題があることを示す.