人工知能学会全国大会論文集
Online ISSN : 2758-7347
第38回 (2024)
セッションID: 3P5-OS-17a-03
会議情報

信号伝播過程におけるスケーリング則に基づく人工深層ニューラルネットワークの系統的な設計
*玉井 敬一大久保 毅ズイ チュオン ビン チュオン名取 直毅藤堂 眞治
著者情報
会議録・要旨集 フリー

詳細
抄録

前回の論文で,人工深層ニューラルネットワークの信号伝播過程が統計力学における吸収状態転移のスケーリング則を用いて見通しよく整理できることを報告した.深層学習の理論的理解に向けて次に問うべきは,吸収状態転移のスケーリング則が人工深層ニューラルネットワークの訓練ダイナミクスにどのように効いてくるかである.この問題は,深層学習のチューニングをより系統的に行い,優れた汎化性能をもつニューラルネットワークをより少ない資源で探索可能にするための重要なステップでもある.本論文では,無限に幅が広く比較的単純なアーキテクチャを取り上げ,信号伝播過程のスケーリング解析といわゆる Neural Tangent Kernel (NTK) の理論・数値解析を組み合わせることで,優れたネットワークを少ない訓練ステップ数で得るための初期化条件や学習率・隠れ層深さの選定とスケーリング則における現象論的パラメータが密接に関係することを示す.

著者関連情報
© 2024 人工知能学会
前の記事 次の記事
feedback
Top