近年の自律移動ロボットには高精度な環境認識が求められており,安全な走行のために小さな障害物や物体の凹凸など目立つ領域や注目箇所を特定し精度よく推定を行う必要がある.そのための手法としてサリエンシーの研究が盛んに行われている.サリエンシーの研究はKoch & Ullmanの原理モデルに始まり,カメラ画像やRGB画像と深度情報を組み合わせたRGB-Dなどを入力とした手法が数多く提案されている.しかし,これらの手法では画像を入力としており空間的な特徴を取得しづらい点から,自律移動ロボットへサリエンシーを適用するためには3次元点群を入力とする手法が必要となる.そこで本研究では,Growing Neural Gas(GNG)を用いることで3次元点群を入力とした位相構造を構築し,位相構造と中心周辺抑制機構を活用することでサリエンシーマップを構築する手法を提案する.本手法を用いることで,従来の研究に比べて,より詳細な注視領域の特定が可能となる.本論文では,ベンチマークデータおよび実環境における3次元点群を用いた実験を通じて,提案手法の有用性を検証する.
本稿では,文章と画像による二重拘束に着目し,(1) LLMが違和感を判断できるのか,(2) 好印象と悪印象を与える画像によって違和感の判断に影響はあるのか,(3) 違和感の判断は被験者と同様かについて調査検討した.本稿では,LLMとしてGTP-4o,Gemini 1.5 Flash,Claude 3 Haikuの3つを調査対象とした.その結果,文章と画像によってLLMが二重拘束による違和感を示す傾向があった.また,画像による印象評価は異なるものの違和感を示す傾向があった.最後に,違和感の判断はGTP-4oが最も被験者と同様な傾向であった.
c-回帰モデル(CRM)は,クラスタリングと回帰を同時に行う手法である.CRMは,データからクラスタ数個の回帰線を求め,求めた回帰線との残差に基づきデータを分割する手法である.しかし,CRMは線形回帰を行うため,データの非線形な構造を捉えられない.そこで,CRMをガウス過程回帰に拡張した,ガウス過程回帰に基づくc-回帰モデル(GPCRM)が提案されている.ガウス過程回帰は,特徴空間の内積であるカーネル関数を用いて,非線形な回帰線を推定する手法である.GPCRMは,データを非線形に分割するが,カーネルパラメータによっては過小適合が起き,回帰線の残差が大きくなることが報告されている.そこで本論文は,周辺尤度を最大化し,カーネルパラメータを最適化する手法としてMML-GPCRMを提案する.数値実験により,提案手法は既存手法に比べ,より残差の小さな回帰線を求めデータを分割することを確認した.
すでにアカウントをお持ちの場合 サインインはこちら