人工知能学会全国大会論文集
Online ISSN : 2758-7347
第36回 (2022)
セッションID: 3C3-GS-6-03
会議情報

言語モデルから生成されたサンプルを選択的に利用する一般化ゼロショットテキスト分類
*河南 壮太矢野 太郎竹岡 邦紘小山田 昌史岡留 剛
著者情報
会議録・要旨集 フリー

詳細
抄録

一般化ゼロショットテキスト分類は,教師データが存在しないクラスである未知クラスを含むクラス集合へテキストを分類するタスクであり,ニュースや商品分類などに幅広く応用される.一般化ゼロショットテキスト分類の既存のアプローチとして,未知クラスに対する知識を分類器に獲得させるために,言語モデルを用いて未知クラスのサンプルを擬似的に生成し学習に組み込む手法がある.しかし,この既存手法では,対象ドメイン外も含むデータから獲得した情報をもとに文の生成を行うため,対象ドメインに応じたサンプルのみを生成できず,それにより分類器の学習に悪影響がある.本稿では,分類器にドメイン外のサンプルが入力された時,各クラスへの確率が総じて低くなるという仮定を元に,言語モデルから生成されたサンプル集合からドメイン外のサンプルを削除し,対象ドメインに応じたサンプルのみからなるデータを再構築することで,分類性能を向上させる一般化ゼロショットテキスト分類法を提案する.実データを用いた実験により,ベースラインに対する提案手法の分類性能の改善を示す.

著者関連情報
© 2022 人工知能学会
前の記事 次の記事
feedback
Top