主催: 一般社団法人 人工知能学会
会議名: 2024年度人工知能学会全国大会(第38回)
回次: 38
開催地: アクトシティ浜松+オンライン
開催日: 2024/05/28 - 2024/05/31
Zero-shot分類は,同じテキストに対しても,ラベルセットの選択により異なる分類結果が得られる可能性がある. 本論文では,対義語置換やWordNetを用いた同義語への変換によって,同じ分類目標に対して大量のラベルセット候補を生成し,適切なラベルセットを抽出する手法を提案する. 分類手法として,1.BERTによるテキストのcos類似度を用いる手法,2. OpenAIのEmbeddingモデルを用いる手法,3. MoritzLauerモデルを用いる手法の合計3種類を用意した. 評価実験では,日本語能力試験の過去問から,N1からN5の各レベル50件ずつの聴解テスト対話文を収集し,合計250件に対して分類を行った. 分類された対話文の属性は,対話場所(6分類),話者の人間関係(2分類,4分類),対話形式(2分類)の3つであった. 212個のラベルセット候補を作成し,精度をRMSE(二条平均誤差)で算出したところ,提案手法によりZero-shot分類の精度が高いラベルセットが得られることを確認した.