主催: 一般社団法人 人工知能学会
会議名: 2025年度人工知能学会全国大会(第39回)
回次: 39
開催地: 大阪国際会議場+オンライン
開催日: 2025/05/27 - 2025/05/30
近年大規模言語モデル(LLM)を用いたテキスト分類が注目を集めている。LLMを用いた分類で一般的な手法は、Few-shot 学習を用いる手法である。これは、"分類カテゴリの定義"、"分類対象テキスト"をプロンプトに入力することでLLMに分類させるZero-shot学習手法に、分類カテゴリごとに"分類例"(サンプル)を追加すること分類精度を向上させた手法である。ただし、Few-shot学習による分類は、分類カテゴリ数が増えることでサンプル数も増えるため、実行時間と実行コストが増加してしまう課題を持つ。 従来、Few-shot学習は全カテゴリに同数のサンプルを入力する手法が主流であるが、タスクによってはカテゴリごとに精度の優先度が異なる場合がある。 そこで本研究では、サンプルのカテゴリを偏らせることによる精度への影響を検証した。実験の結果、Zero-shot分類で精度が低かったカテゴリへサンプルを偏らせることでFew-shot分類での該当カテゴリの精度が向上された。また、サンプルのトークン数による精度比較も行い、トークン数が比較的少ないサンプルでもFew-shot分類では有効であることを示した。