主催: 一般社団法人 人工知能学会
会議名: 2025年度人工知能学会全国大会(第39回)
回次: 39
開催地: 大阪国際会議場+オンライン
開催日: 2025/05/27 - 2025/05/30
我々は、都市規模の3Dシーンとの自然言語インタラクションを可能にするビジュアルプログラミングフレームワーク、GeoProg3Dを提案する。GeoProg3Dは、我々が紹介する2つの重要な技術を制御する: 地理情報を考慮した都市規模3D言語フィールド(GCLF)と地理的視覚API(GV-API)である。GCLFは言語フィールドを都市規模の3Dデータに拡張し、地理情報に基づいた正確なクエリを可能にする。GV-APIは、セグメンテーションや物体検出などの特殊な地理的視覚処理ツールを提供する。GeoProg3Dは、GCLFとGV-APIのコンポーネントを動的に組み合わせて実行可能なプログラムを構築し、正確な地理推論を実現する。さらに、我々は評価のためのデータセット、GeoEval3Dを紹介する。GeoEval3Dデータセットには、5つの難解な地理的視覚タスクに対する952のクエリと正解のペアが含まれている。実験の結果、GeoProg3Dは様々な地理的視覚タスクにおいて既存のモデルを凌駕することが示された。このフレームワークは、都市計画、災害対応、環境モニタリングなどの分野への応用が期待される。