主催: 一般社団法人 人工知能学会
会議名: 2023年度人工知能学会全国大会(第37回)
回次: 37
開催地: 熊本城ホール+オンライン
開催日: 2023/06/06 - 2023/06/09
画像から説明文を生成する画像キャプショニング技術(image-to-text)は,深層学習が登場して以降急速に発展している.この画像キャプショニングによって生成される説明文において,元の画像がもつ情報はどの程度維持されるだろうか? この問いに答えるため,画像を一切見ずに説明文のみから画像を分類する実験を行い,標準的なCNNベースの画像分類との精度比較を行う.災害画像分類タスク,CrisisNLPにおいていくつかの画像キャプショニングモデルを評価し,説明文による分類器が時にCNNベースの分類器を超える精度を達成できることを示す.さらに,CNNベースの分類器と説明文による分類器を統合することでさらなる精度向上が得られることを示す.