深度学习笔记（二） BP算法

日期：2022-03-22 栏目：程序人生浏览：次

监督学习是指：利用一组已知类别的样本调整分类器的参数，使其达到所要求性能的过程，也称为监督训练或有教师学习。

输入数据为“训练数据”，由正确的训练集和错误的训练集构成。

2.非监督学习

在机器学习，无监督学习的问题是，在未加标签的数据中，试图找到隐藏的结构。因为提供给学习者的实例是未标记的，因此没有错误或报酬信号来评估潜在的解决方案。

没有告诉模型哪些是正确的，哪些是错误的。

关联规则，聚类

3.强化学习

目标：学习从环境状态到行为的映射，使得智能体选择的行为能够获得环境最大的奖赏，使得外部环境对学习系统在某种意义下的评价(或整个系统的运行性能)为最佳。

如果Agent的某个行为策略导致环境正的奖赏(强化信号)，那么Agent以后产生这个行为策略的趋势便会加强。Agent的目标是在每个离散状态发现最优策略以使期望的折扣奖赏和最大。

4.人工神经网络和深度学习都属于机器学习的一种。深度学习是神经网络的分支，深度学习的基本结构是深度神经网络。

5.传统神经网络一般只有2-3层，深度神经网络至少有5层。

6.如何训练神经网络：

BP算法：BP算法是由学习过程由信号的正向传播与误差的反向传播两个过程组成。由于多层前馈网络的训练经常采用误差反向传播算法，人们也常把将多层前馈网络直接称为BP网络。

BP算法由信号的正向传播和误差的反向传播两个过程组成。