2024 年 76 巻 1 号 p. 75-80
本論文では,カメラとLi-DARのセンサーフュージョンに基づく,2Dおよび3D物体検出のための新しい知覚フレームワークを紹介する.カメラ画像は豊富な環境特徴を提供するが,奥行き情報が不足している.逆に,Li-DARの点群は正確な奥行き情報を提供するが,その性質は疎である.それぞれのセンサーの長所と短所の補完的な性質を認識し,教師なし深度補完ネットワークを使用して,両方のセンサーからの情報を強化する.この強化されたデータは,最先端の検出ネットワークを用いて2Dと3Dの物体検出タスクを実行するために利用される.我々はKITTIデータセットで我々のフレームワークを検証し,実験結果はベースラインの結果と比較して,2Dと3Dの両方のタスクで顕著な改善を実証した.