主催: 一般社団法人 人工知能学会
会議名: 2024年度人工知能学会全国大会(第38回)
回次: 38
開催地: アクトシティ浜松+オンライン
開催日: 2024/05/28 - 2024/05/31
近年の動画生成拡散モデルでは,注意機構層を用いて動画の時間方向の特徴を捉えている.しかし,注意機構層は系列長の二乗に比例するメモリを要求するため,長期の動画を生成しようとした場合にメモリの観点で困難が生じる.この限界を克服すべく,状態空間モデル(SSM)を利用することを提案する.SSMは系列長の一乗に比例するメモリ要件から,注意機構の有用な代替機構として知られている.UCF101を用いた実験で,SSMベースの動画拡散モデルは,注意機構ベースのモデルを上回るFŕechet Video距離(FVD)を達成した.さらに,より長いビデオ生成におけるSSMの可能性を調べるために,MineRL Navigateを用いた実験を行った.この設定では,SSMベースのモデルは,競争力のあるFVDスコアを維持しながら,より長い系列に対してメモリ消費量を節約できることが確認された.