机器学习之五:神经网络、反向传播算法

一、逻辑回归的局限

在逻辑回归一节中,使用逻辑回归的多分类,实现了识别20*20的图片上的数字。

但所使用的是一个一阶的模型,并没有使用多项式,为什么?

可以设想一下,在原有400个特征的数据样本中,增加二次、三次、四次多项式,会是什么情形?

很显然,训练样本的特征数量将会拔高多个数量级,而且,更重要的,要在一个式子中拟合这么多的特征,其难度是非常大的,可能无法收敛到一个比较理想的状态。

也就是说,逻辑回归没法提供很复杂的模型。

因为其本质上是一个线性的分类器,擅长解决的是线性可分的问题。

那么非线性可分问题,要怎么解决?

解决思路

如果有一种方法,将非线性可分问题先进行特征提取,变为接近线性可分,那么再应用一次逻辑回归,是否就能解决非线性问题了?

这便是神经网络的思想。

二、神经网络 1、结构

神经网络的结构,如下图所示


image

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/wpzzgp.html