RNN梯度消失问题,为什么LSTM和GRU可以解决此问题

3d八卦图 • 2022-11-11 • 随笔 • 阅读 12

RNN梯度消失问题,为什么LSTM和GRU可以解决此问题

参考回答：

RNN由于网络较深,后面层的输出误差很难影响到前面层的计算,RNN的某一单元主要受它附近单元的影响。而LSTM因为可以通过阀门记忆一些长期的信息,相应的也就保留了更多的梯度。而GRU也可通过重置和更新两个阀门保留长期的记忆,也相对解决了梯度消失的问题。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/4886464.html

梯度面层阀门单元消失

打赏

微信扫一扫

支付宝扫一扫

3d八卦图一级用户组

你有使用过render函数吗？有什么好处？

上一篇 2022-11-11

请你讲讲Java支持的数据类型有哪些？什么是自动拆装箱？

下一篇 2022-11-12

发表评论

登录后才能评论

评论列表（0条）