主催: 一般社団法人 人工知能学会
会議名: 2023年度人工知能学会全国大会(第37回)
回次: 37
開催地: 熊本城ホール+オンライン
開催日: 2023/06/06 - 2023/06/09
現在、深層学習を用いたニューラルネットワークに代表される機械学習モデルの評価には、データセットに対する評価指標(正解率、適合率、再現率など)が広く利用されているが、このような評価指標ではデータセットに含まれない未知のデータに対する性能を保証することは難しい。本発表では、データセット以外のデータに対しても確率的に性能(不正解率)を保証するために、統計的学習理論に基づくノイズ付加汎化誤差上界を評価指標として利用する方法を説明し、その有効性を実証するための実験結果について報告する。ここで、汎化誤差とは、対象とする(ある確率分布に従う)全ての入力データに対する機械学習モデルの出力の不正解率の期待値である。一般に入力データは無数にあるため、汎化誤差を正確に計算することは困難であるが、その上界に関する多数の既存研究がある。本研究では、よく知られている訓練誤差ベースの汎化誤差上界(PAC-Bayesian bounds)の定理をテスト誤差ベースとして適用し、タイトな(汎化誤差と上界の差が小さい)汎化誤差上界を計算している。