主催: 一般社団法人 人工知能学会
会議名: 2022年度人工知能学会全国大会(第36回)
回次: 36
開催地: 京都国際会館+オンライン
開催日: 2022/06/14 - 2022/06/17
Semantic Textual Similarity (文間意味的類似度タスク) は,機械翻訳の評価や関連文書検索などの後段タスクにおいて必要な「2文間の類似度を評価する」能力を測るタスクであり,このタスクのためのベンチマークデータセットでの精度を元に,2文間の類似度を測定するシステムの良し悪しが議論されている.しかし,このベンチマークデータセットによって高評価を得たシステムが,実際の応用タスク中でも高評価を出すとは限らない.本研究では,このSTSと後段タスクの評価ギャップの要因を突き止めるための分析を行い,結果データセット間の文長ギャップが評価ギャップの一因となっていることを突き止めた.この結果を元に,適切なベンチマークデータに改善するための方針について議論する.