深層状態空間モデルおよびtransformerの並列機構による物体操作前アラインメント予測

神原 元就; 杉浦 孔明

doi:10.11517/pjsai.JSAI2025.0_1Win455

第39回 (2025)

セッションID: 1Win4-55

DOI https://doi.org/10.11517/pjsai.JSAI2025.0_1Win455

会議情報

主催: 一般社団法人人工知能学会

会議名: 2025年度人工知能学会全国大会（第39回）

回次: 39

開催地: 大阪国際会議場＋オンライン

開催日: 2025/05/27 - 2025/05/30

深層状態空間モデルおよびtransformerの並列機構による物体操作前アラインメント予測

*神原元就, 杉浦孔明

著者情報

キーワード: オープンボキャブラリ物体操作, 操作前アラインメント予測, 基盤モデル

会議録・要旨集フリー

詳細

抄録

本研究では，オープンボキャブラリ物体操作タスクにおける軌道のアラインメント予測タスクを扱う．多くの従来手法では，物体操作の実行後にその成否を判定する．一方，それらの手法では物体操作時における潜在的な危険を未然に防ぐことが困難であり，失敗した場合はその後に軌道の再生成を行うため，物体操作全体の効率が低下するという課題がある．この課題を解決するため，一人称視点画像，軌道，及び自然言語指示間のアラインメンを物体操作前に予測する手法を提案する．提案手法では，深層状態空間モデル及びtransformerエンコーダを並列に利用するMulti-Level Trajectory Fusionモジュールを導入し，エンドエフェクタ軌道の多層的な時系列自己相関を抽出する．実験結果から，提案手法は基盤モデルを含む既存手法を上回る予測精度を達成した．

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）