人工知能学会全国大会論文集
第33回全国大会(2019)
セッションID: 2L1-J-9-02
会議情報

言語から画像を生成する深層学習モデルの挙動に関する考察
*藤山 千紘小林 一郎
著者情報
会議録・要旨集 フリー

詳細
抄録

本研究では,ヒトの知能のメカニズムを反映して動作する汎用人工知能の構築に向けた基礎的な取り組みとして,text-to-imageモデルを対象に,計算機構の挙動や特徴表現空間の構造の分析を行う.初めに,入力キャプションから単語の境界情報を欠落させた場合の画像生成を行い,モデルの言語エンコード能力および画像生成能力を調べる.その結果,定性的にも定量的にもキャプション内容に適合する画像を生成し得たが言語の意味の単位をモデルが獲得している様子は確認されなかった.二つ目に,埋め込み空間での単語の意味の構成的特性を分析し,空間を意味する単語間に単語の意味の加法構成性が現れる可能性を示唆する結果を得た.

著者関連情報
© 2019 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top