2019 年 48 巻 1 号 p. 144-152
物体検出は,画像認識分野において困難な課題の1つであったが,近年の機械学習技術の向上により,劇的に精度が改善されつつある.高い検出精度を達成している手法には,決定木を弱識別器としブースティングによって強識別器を構築する手法と,深層学習に基づくものがある.深層学習に基づく代表的な手法には,様々な研究に利用され始めているR-CNN及びその派生や,スライディングウィンドウを利用せずに速度と精度の両立を目指したYOLOやその改良版がある.本稿では,実用上重要な課題であるスポーツ選手検出を対象として,これらの手法にどのような差があるのかを,空撮画像を想定したCGデータセット及びVS-PETS2003データセットに対して行った検出結果に基づき議論を行う.