主催: 一般社団法人 人工知能学会
会議名: 2022年度人工知能学会全国大会(第36回)
回次: 36
開催地: 京都国際会館+オンライン
開催日: 2022/06/14 - 2022/06/17
一般化ゼロショットテキスト分類は,教師データが存在しないクラスである未知クラスを含むクラス集合へテキストを分類するタスクであり,ニュースや商品分類などに幅広く応用される.一般化ゼロショットテキスト分類の既存のアプローチとして,未知クラスに対する知識を分類器に獲得させるために,言語モデルを用いて未知クラスのサンプルを擬似的に生成し学習に組み込む手法がある.しかし,この既存手法では,対象ドメイン外も含むデータから獲得した情報をもとに文の生成を行うため,対象ドメインに応じたサンプルのみを生成できず,それにより分類器の学習に悪影響がある.本稿では,分類器にドメイン外のサンプルが入力された時,各クラスへの確率が総じて低くなるという仮定を元に,言語モデルから生成されたサンプル集合からドメイン外のサンプルを削除し,対象ドメインに応じたサンプルのみからなるデータを再構築することで,分類性能を向上させる一般化ゼロショットテキスト分類法を提案する.実データを用いた実験により,ベースラインに対する提案手法の分類性能の改善を示す.