本研究では,畳み込みニューラルネットワーク(CNN)による深層学習を用いた新しいデータクレンジング手法を提案する.深層学習をはじめとする機械学習では,多くの場合,注釈付け(アノテーション付け)した正解データ(教師データ)が大量に必要であるが,人手によるアノテーション付けには多大な労力が必要であり,不正確なアノテーションの混入が避けられない.提案手法では,不正確なアノテーションが混入したデータセットに対し,CNNによる過学習と再アノテーションを繰り返すことで,自動的なデータクレンジングを実現し,品質の高い教師データを構築する.実験対象としたデータは,2019年6月6日から収穫直前まで,約2週間毎に撮影されたフジ1391枚,あいかの香り1534枚のリンゴ果実画像である.各画像は撮影日に基づく生育度を数値としてアノテーション付けしたため,不正確なアノテーションが混入している.これらの画像に提案手法を適用した結果,不正確にアノテーション付けされたと考えられる画像を特定でき,別のクラスに移動,もしくは,除去することができた.また,除去対象となったフジ12枚,あいかの香り4枚は,果実の一部が葉などで隠れている,逆光になっている,果実の底部分を撮影している,人工物が写っているという特徴が確認された.さらに,深層学習のサンプルデータとしてよく用いられる手書き文字の画像セット(MNIST)に提案手法を適用した結果,除去対象となった画像が人間による判断でも分類が困難であることなどが確認され,提案手法の有効性を支持する結果を得た.