卷积神经网络卷积层算完数据超阈怎么办

平安智慧城 • 2023-8-6 • 服务器 • 阅读 63

深度学习模型通常由随机梯度下降算法进行训练。随机梯度下降算法有许多变形：例如 Adam、RMSProp、Adagrad 等等。这些算法都需要你设置学习率。学习率决定了在一个小批量（mini-batch）中权重在梯度方向要移动多远。

如果学习率很低，训练会变得更加可靠，但是优化会耗费较长的时间，因为朝向损失函数最小值的每个步长很小。
如果学习率很高，训练可能根本不会收敛，损失函数一直处于波动中，甚至会发散。权重的改变量可能非常大，使得优化越过最小值，使得损失函数变得更糟。

训练应当从相对较大的学习率开始。这是因为在开始时，初始的随机权重远离最优值。在训练过程中，学习率应当下降，以允许细粒度的权重更新。

参考： >

欢迎分享，转载请注明来源：内存溢出

权重梯度卷积算法函数

打赏

微信扫一扫

支付宝扫一扫

上一篇 2023-08-06

下一篇 2023-08-06

登录后才能评论