主催: 一般社団法人 人工知能学会
会議名: 2024年度人工知能学会全国大会(第38回)
回次: 38
開催地: アクトシティ浜松+オンライン
開催日: 2024/05/28 - 2024/05/31
近年,vision-and-language navigation(VLN)の研究が大きく進展している.VLNは人とロボットの共生空間における有用な指示方法を提示する一方,その問題設定ではナビゲーション毎にユーザーの指示が必要となる.そこで我々は,ユーザーの言語による経路指示を用いて地図を作成し,それをVLNに利用する手法を検討した.この地図を用いることで,新たな目的地に対して詳細な経路指示を与えずとも,地図から経路指示を生成することが可能となる.本研究では,大規模な言語モデルを用いた2つのアプローチを紹介する.1つは大規模言語モデルに直接経路指示を入力し,経路を記憶させる方法,もう1つはモデル外にグラフ構造の地図を構築し,大規模言語モデルから利用可能にする方法である.グラフ構造の地図を用いた実験では,提案手法の空間構造の把握能力を評価するため,複数の経路を組み替えて未説明の経路を生成する実験を行った.結果から、既存の大規模言語モデルの限界を示す一方,モデルが利用可能なグラフ構造の地図を外部に持つことで,これらの能力を獲得できることを示す.