ノイズ付加汎化誤差上界による機械学習モデルの確率的保証付き評価

磯部 祥尚

doi:10.11517/pjsai.JSAI2023.0_2R4OS1204

抄録

現在、深層学習を用いたニューラルネットワークに代表される機械学習モデルの評価には、データセットに対する評価指標（正解率、適合率、再現率など）が広く利用されているが、このような評価指標ではデータセットに含まれない未知のデータに対する性能を保証することは難しい。本発表では、データセット以外のデータに対しても確率的に性能（不正解率）を保証するために、統計的学習理論に基づくノイズ付加汎化誤差上界を評価指標として利用する方法を説明し、その有効性を実証するための実験結果について報告する。ここで、汎化誤差とは、対象とする（ある確率分布に従う）全ての入力データに対する機械学習モデルの出力の不正解率の期待値である。一般に入力データは無数にあるため、汎化誤差を正確に計算することは困難であるが、その上界に関する多数の既存研究がある。本研究では、よく知られている訓練誤差ベースの汎化誤差上界（PAC-Bayesian bounds）の定理をテスト誤差ベースとして適用し、タイトな（汎化誤差と上界の差が小さい）汎化誤差上界を計算している。

著者関連情報

お気に入り & アラート

閲覧履歴

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）