人工知能学会全国大会論文集
Online ISSN : 2758-7347
第36回 (2022)
セッションID: 4Yin2-17
会議情報

文間意味的類似度のベンチマークタスクと実応用タスクの乖離
*阿部 香央莉横井 祥梶原 智之乾 健太郎
著者情報
会議録・要旨集 フリー

詳細
抄録

Semantic Textual Similarity (文間意味的類似度タスク) は,機械翻訳の評価や関連文書検索などの後段タスクにおいて必要な「2文間の類似度を評価する」能力を測るタスクであり,このタスクのためのベンチマークデータセットでの精度を元に,2文間の類似度を測定するシステムの良し悪しが議論されている.しかし,このベンチマークデータセットによって高評価を得たシステムが,実際の応用タスク中でも高評価を出すとは限らない.本研究では,このSTSと後段タスクの評価ギャップの要因を突き止めるための分析を行い,結果データセット間の文長ギャップが評価ギャップの一因となっていることを突き止めた.この結果を元に,適切なベンチマークデータに改善するための方針について議論する.

著者関連情報
© 2022 人工知能学会
前の記事 次の記事
feedback
Top