自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
一般論文(査読有)
基本イベントに基づく常識推論データセットの構築と利用
大村 和正河原 大輔黒橋 禎夫
著者情報
ジャーナル フリー

2023 年 30 巻 4 号 p. 1206-1239

詳細
抄録

本研究では,基本イベントに基づく常識推論データセットの構築手法を提案する.具体的には,テキストから「お腹が空いたので,ご飯を食べる」といった蓋然的関係を持つ基本的なイベント表現の組を自動抽出し,クラウドソーシングによる確認を行った後,基本イベント間の蓋然的関係を問う多肢選択式問題を自動生成する.提案手法に従って 10 万問規模の常識推論データセットを構築し,計算機による解答実験を行った結果,高性能な汎用言語モデルと人間の間に解答精度の開きがあることを示した.また,提案手法の拡張性の高さを利用して疑似問題を大規模に自動生成し,このデータ拡張による常識推論タスクおよび関連タスクでの効果を検証した.実験の結果,蓋然的関係に関する知識を広範に学習させることで,常識推論タスクおよび関連タスクにおいて一定の効果があることを示した.これは,蓋然的関係を推論する能力が自然言語理解において重要であることを示唆している.

著者関連情報
© 2023 一般社団法人 言語処理学会
前の記事 次の記事
feedback
Top