人工知能学会全国大会論文集
Online ISSN : 2758-7347
第37回 (2023)
セッションID: 1B5-GS-2-02
会議情報

SGDの陰的正則化効果の陽的なモデリング
*中村 祥大横田 理央
著者情報
会議録・要旨集 フリー

詳細
抄録

深層学習モデルとデータセットの増大により分散並列学習が必要になっている。データ並列化は各GPUがモデルを冗長に持ち、バッチを分散させる最も容易に実装できる分散学習手法である。しかし、GPU数が増えるとバッチサイズもそれに比例して増大しSGDのもつ陰的正則化効果が失われることで汎化性能が低下する。本研究では、勾配のノルムによる正則化を行うことでこのラージバッチ問題を緩和することを目指す。

著者関連情報
© 2023 人工知能学会
前の記事 次の記事
feedback
Top