一、逻辑回归的局限
在逻辑回归一节中,使用逻辑回归的多分类,实现了识别20*20的图片上的数字。
但所使用的是一个一阶的模型,并没有使用多项式,为什么?
可以设想一下,在原有400个特征的数据样本中,增加二次、三次、四次多项式,会是什么情形?
很显然,训练样本的特征数量将会拔高多个数量级,而且,更重要的,要在一个式子中拟合这么多的特征,其难度是非常大的,可能无法收敛到一个比较理想的状态。
也就是说,逻辑回归没法提供很复杂的模型。
因为其本质上是一个线性的分类器,擅长解决的是线性可分的问题。
那么非线性可分问题,要怎么解决?
解决思路如果有一种方法,将非线性可分问题先进行特征提取,变为接近线性可分,那么再应用一次逻辑回归,是否就能解决非线性问题了?
这便是神经网络的思想。
二、神经网络 1、结构神经网络的结构,如下图所示