人工知能学会全国大会論文集
Online ISSN : 2758-7347
第38回 (2024)
セッションID: 1D3-GS-7-05
会議情報

Alternative Adapter Model: 視覚言語基盤モデルのための視覚的説明生成
*平野 愼之助飯田 紡杉浦 孔明
著者情報
会議録・要旨集 フリー

詳細
抄録

深層学習が幅広い分野に応用されている現代において,深層学習モデルの説明性は重要である.しかし,既存手法は視覚言語基盤モデルに最適化されておらず,視覚言語基盤モデルに対する説明品質が低い. そこで,本研究では視覚言語基盤モデルに対する説明生成モデルであるAlternative Adapter Modelを提案する. 提案手法は視覚言語基盤モデルに接続するSide Branch Networkおよび,モジュールの出力およびfreezeする層を動的に変更するAlternative Epoch Architectureを導入する. 提案手法を評価するため、CUBデータセットを用いて実験を行った. 実験の結果,提案手法は視覚的説明生成タスクにおける標準的な評価尺度であるmean IoU,Insertion Score,Deletion ScoreおよびID Scoreにおいて既存手法を上回り,適切な視覚的説明の生成に成功することを示した.

著者関連情報
© 2024 人工知能学会
前の記事 次の記事
feedback
Top