人工知能学会全国大会論文集
Online ISSN : 2758-7347
第38回 (2024)
セッションID: 2L6-OS-19b-03
会議情報

分類器出力の確信度エントロピーを用いたConfident Learningの提案
*鷹合 孝之谷口 正輝
著者情報
会議録・要旨集 フリー

詳細
抄録

ノイズの多いラベルをもつデータセットに対しては、損失関数の工夫などによるモデル中心のアプローチと、ラベルの誤りを判定するデータ中心のアプローチであるConfident Learning(以下CL)が存在する。CLにおける問題設定は、あるクラスに属する事例のラベルが別のクラスに誤ってラベル付けされている例を見つけることであり、ラベル誤りは個々のデータによらずデータの属するクラスにのみ依存することが仮定されている。しかし現実の問題では、どのクラスにも属さないデータにクラスのラベルが誤って付されている状況も存在し、この場合CLにおける問題設定や仮定が成立しない。本研究では、分類器が出力する各ラベルの確信度のエントロピーに閾値を設け、閾値を越えた事例をノイズラベル事例として新たに分類器を学習し、学習した分類器を通したテストデータの混同行列を評価することにより閾値をサーチする手法を提案する。また実データへの適用例としてナノポアデバイスによるウイルス検出の問題を取り上げる。

著者関連情報
© 2024 人工知能学会
前の記事 次の記事
feedback
Top