人工知能学会全国大会論文集
Online ISSN : 2758-7347
第33回 (2019)
セッションID: 3Rin2-30
会議情報

画像キャプションに対する表現学習に向けた敵対的生成ネットワーク
*阿部 佑樹妹尾 卓磨松森 匠哉今井 倫太
著者情報
会議録・要旨集 フリー

詳細
抄録

ひとつの画像から生成されるキャプションは、表現(例えば注意点または文章表現)に関して互いに異なることが考えられる。しかし、世界中の膨大な量の画像キャプションのデータセットには、潜在変数のアノテーションはほとんどまたはまったく付けられていない。教師なしで画像キャプションの潜在変数を学習することは、条件付き画像キャプショニングの拡張性および解釈可能性の観点から重要である。本研究では、画像キャプションの潜在変数を学習し活用するための深層生成モデルを提案する。実験では、画像キャプショニングの縮小設定として、複数のMNIST画像と正解ラベルを用いた画像分類問題を使用し、本提案モデルがラベルのサブグループを表す潜在変数を獲得したことを示す。

著者関連情報
© 2019 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top