2020轻薄笔记本电脑推荐前十名排行榜 (3)

日期：2021-02-13 栏目：资源分享浏览：次

与普通RNN类似，输出

$y^t$

往往最终也是通过

$h^t$

变化得到。

3. 总结

以上，就是LSTM的内部结构。通过门控状态来控制传输状态，记住需要长时间记忆的，忘记不重要的信息；而不像普通的RNN那样只能够“呆萌”地仅有一种记忆叠加方式。对很多需要“长期记忆”的任务来说，尤其好用。

但也因为引入了很多内容，导致参数变多，也使得训练难度加大了很多。因此很多时候我们往往会使用效果和LSTM相当但参数更少的GRU来构建大训练量的模型。