主催: 一般社団法人 人工知能学会
会議名: 2021年度人工知能学会全国大会(第35回)
回次: 35
開催地: オンライン
開催日: 2021/06/08 - 2021/06/11
近年の深層学習の成功により,セマンティックセグメンテーションの精度は大きく向上したが,訓練データをを作成する人間のアノテーションコストが大きくかかる.能動学習は,データの中から最も情報利得の多いものを選択することにより,人間のアノテーションコストを削減することができる.従来の能動学習の多くはモデルにとって不確実なデータを選択しており,人間のアノテーションコストは一定であると仮定している.しかしながら,実際にはそれらは一定ではなく,データによって大きく異なる.本論文では,モデルの情報利得が多く,かつ人間のアノテーションコストが低いような画像領域を選択していく能動学習戦略を提案する.ここでは,不確実性だけではなく,クラウドソーシングで得られたデータを用いて人間のアノテーション時間を予測し,領域のスコアを算出する.予備実験の結果,提案手法は学習の初期の段階で,アノテーションコストを削減可能であることを確認した.