画像キャプションに対する表現学習に向けた敵対的生成ネットワーク

阿部 佑樹; 妹尾 卓磨; 松森 匠哉; 今井 倫太

doi:10.11517/pjsai.JSAI2019.0_3Rin230

第33回 (2019)

セッションID: 3Rin2-30

DOI https://doi.org/10.11517/pjsai.JSAI2019.0_3Rin230

会議情報

主催: 一般社団法人人工知能学会

会議名: 2019年度人工知能学会全国大会（第33回）

回次: 33

開催地: 新潟県新潟市朱鷺メッセ

開催日: 2019/06/04 - 2019/06/07

画像キャプションに対する表現学習に向けた敵対的生成ネットワーク

*阿部佑樹, 妹尾卓磨, 松森匠哉, 今井倫太

著者情報

キーワード: 表現学習, 敵対的生成ネットワーク, 画像キャプショニング

会議録・要旨集フリー

詳細

抄録

ひとつの画像から生成されるキャプションは、表現（例えば注意点または文章表現）に関して互いに異なることが考えられる。しかし、世界中の膨大な量の画像キャプションのデータセットには、潜在変数のアノテーションはほとんどまたはまったく付けられていない。教師なしで画像キャプションの潜在変数を学習することは、条件付き画像キャプショニングの拡張性および解釈可能性の観点から重要である。本研究では、画像キャプションの潜在変数を学習し活用するための深層生成モデルを提案する。実験では、画像キャプショニングの縮小設定として、複数のMNIST画像と正解ラベルを用いた画像分類問題を使用し、本提案モデルがラベルのサブグループを表す潜在変数を獲得したことを示す。

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）