浅谈神经网络中的激活函数 (2)

日期：2021-08-24 栏目：程序人生浏览：次

\[0 < \frac{{\partial S}}{{\partial {a_{20}}}}\frac{{\partial S}}{{\partial {a_{19}}}} \cdots \frac{{\partial S}}{{\partial {a_1}}} \le {0.25^{20}} = {\rm{9}}.0{\rm{94}} \times {10^{ - 13}}\]

这是一个更小的数，所以神经网络后几层求第一层参数W1的梯度就非常小。而ReLU函数就是为了避免梯度消失问题，因为ReLU求导只有两个值1或0，这样的话只要神经网络梯度中一条路径上的导数都是1，那么无论网络有多少层，网络后几层的梯度都可以传播到网络前几层。

参考资料

https://en.wikipedia.org/wiki/Logistic_function

https://en.wikipedia.org/wiki/Hyperbolic_function

https://en.wikipedia.org/wiki/Rectifier_(neural_networks)

共2页:
上一页
1
2
下一页

转载注明出处：https://www.heiqu.com/zyxdsg.html

浅谈神经网络中的激活函数 (2)

相关推荐