人工知能学会全国大会論文集
Online ISSN : 2758-7347
第38回 (2024)
セッションID: 3O1-OS-16b-01
会議情報

視覚的情報と予測指向プロンプトを用いたLLMに基づくEmbodied世界モデル
*朏島 和香那中窪 仰佑平山 翔湧鈴木 雅大松尾 豊
著者情報
会議録・要旨集 フリー

詳細
抄録

近年,機械学習,特に視覚と言語理解が進歩するにつれて,Embodied AI の研究も発展してきた.LLM ベースのEmbodied AIとしてはVOYAGER が知られており,Minecraftの世界で自律的な探索を行うことを可能としたが,視覚的データの未活用や世界モデルとしての機能の不明確性といった課題がある.そこで本研究では,Embodied AIのパフォーマンス向上を目的とし,視覚的データの活用可能性とLLMの世界モデルとしての機能を調査した.実験の結果,LLMは視覚データから必要な情報を抽出することができ,その情報を活用することで世界モデルとしての性能を向上させることができることが明らかとなった. また,プロンプトの工夫によってLLMの世界モデルとしての機能を引き出すことができる可能性が示唆された.

著者関連情報
© 2024 人工知能学会
前の記事 次の記事
feedback
Top