人工知能学会全国大会論文集
Online ISSN : 2758-7347
第38回 (2024)
セッションID: 3T5-OS-6b-04
会議情報

大規模言語モデルを用いたSwitching機構付きマルチモーダル検索モデルに基づく生活支援ロボットによる物体操作
*是方 諒介兼田 寛大長嶋 隼矢今井 悠人杉浦 孔明
著者情報
会議録・要旨集 フリー

詳細
抄録

高齢化の進行に伴う在宅介助者不足に対し,被介助者を物理的に支援可能な生活支援ロボットは有望な解決策の一つである.そこで,open-vocabularyなユーザ指示文に基づき,事前に収集された環境の画像群から対象物体および配置目標を検索することで,日常物体を指定された家具へ運搬するタスクを扱う.本論文では,大規模言語モデルを用いて埋め込み空間を切り替えるSwitching機構を導入することにより,単一モデルで対象物体および配置目標を個別に検索可能なマルチモーダル検索モデルを提案する.大規模な屋内環境において収集された実画像および物体操作指示文から構成される新規データセットにおいて評価を行い,提案手法は画像検索設定における標準的な評価指標において既存手法を上回った.さらに,標準化された屋内環境においてユーザから与えられるopen-vocabularyな物体操作指示文に従い生活支援ロボットが日常物体を運搬する実機実験を行い,80%以上のタスク成功率を達成した.

著者関連情報
© 2024 人工知能学会
前の記事 次の記事
feedback
Top