如何解决RNN梯度爆炸和弥散的问题?

switch语句 • 2022-11-12 • 随笔 • 阅读 24

如何解决RNN梯度爆炸和弥散的问题?

答：梯度爆炸：为解决梯度爆炸问题，Thomas Mikolov首先提出了一个简单的启发性的解决方案，就是当梯度大于一定阀值的时候，将它截断为一个较为小的数。

解决梯度弥散问题的两种方法：

第一种：将随机初始化W改为一个有关联的矩阵初始化。

第二种：使用ReLU代替sigmid函数。ReLU导数不是0就是1，因此，神经元的梯度将始终为1，而不会当梯度传播了一定时间之后变小

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/4888020.html

梯度弥散爆炸初始化解决

打赏

微信扫一扫

支付宝扫一扫

switch语句一级用户组

下表为某款APP在17年Q2的日均新增用户的渠道数据：1）根据上表，你能得出哪些结论？2）17年4月，Android端的渠道A单个新增用户成本为3元，渠道B单个新增用户成本为10元。这批新增用户的

上一篇 2022-11-11

Kafka中的HW、LEO等分别代表什么？

下一篇 2022-11-11

发表评论

登录后才能评论

评论列表（0条）