人工知能学会全国大会論文集
Online ISSN : 2758-7347
第35回 (2021)
セッションID: 4I1-GS-7b-02
会議情報

Multi-modal Few-shot One-class Image Classification の為のメタラーニング手法の提案
*大熊 拓海中山 英樹
著者情報
会議録・要旨集 フリー

詳細
抄録

One-class Image Classification (OCIC) は入力画像が特定のクラスに属するか否かを識別する機械学習タスクであり,本タスクは視覚的な概念認識の為に重要である. 人間は少数データのみを用いて概念認識を高い精度で行うことができ,先行研究で提案されているFew-shot Learning手法の性能は人間と比較すると大きく劣っている. この性能を高めるために,我々は「Multi-modal Belongingness Network (MMBeNet)」を提案する. MMBeNetは「Belongingness Network」と呼ばれるFew-shot OCIC手法を、少数の画像データに加えて「属性」や「Word Vector」といった意味情報を用いる目的で拡張した手法である. このように少数画像と意味情報からOCICを解くタスクを我々は「Multi-modal Few-shot One-class Image Classification」と呼ぶ. 我々は意味情報を視覚的概念認識能力に対する重要な要素とみなし,実際に意味情報を用いることで精度を高めることが可能であることを実験によって確かめた.

著者関連情報
© 2021 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top