深度学习-神经网络 (2)

回顾深层神经网络,因为每个层都是全连接的,假设有一个64×64×3的图像(64×64是二维平面上的像素值,3为第三维RGB的值),每个节点的权重是不同的,则下一层的每个神经元将会计算64×64×3个节点,若下一层有n个节点的神经元则计算量还需乘n,训练起来较为复杂。

卷积神经网络主要有三个特点

局部感受野(Local Receptive Fields)

共享权值(Shared Weights)

池化(Pooling)

局部感受野

在动物器官中,大脑皮层有不同的感受区域,如听觉区,视觉区等,每块区域都有自己特殊的神经元,当有听觉信号时会传到大脑皮层的听觉区的神经元,因此每个神经元对应的感受区域叫感受野.
那么在神经网络中,不同的卷积核会对应不同的感受区域,在卷积时彼此之间无联系。

卷积神经网络的卷积层每个节点与上一层某个区域通过卷积核连接,而与这块区域以外的区域无连接。

深度学习-神经网络

从右边图可见,每个圆圈代表一个卷积核,每个卷积核只需要关注自己的局部感受区域。

卷积核

卷积核到底是什么?那就来观察一下每个卷积核局部作用域。

深度学习-神经网络

上图是取一个卷积和其对应的局部感受野,中间的那一层就是卷积核,3×3的卷积核对源数据中左上角的3×3的矩阵进行点乘,就得到了一个数值,叫做该区域的卷积层的值。然而,这只是源数据中的部分区域,源数据是7×7的矩阵,所以卷积核再通过移动映射的方式多次卷积,如下图。
该图中在卷积层的值与源数据之间还应有个3×3的卷积核,未画出。

深度学习-神经网络

通过上图可以看出,如果一个7×7×1像素的图片通过一个3×3×1的卷积核卷积,则被卷积后的值为5×5×1 !这里注意一点,还是以图片为例,若是图片像素是三维的(彩色图片),则像素为7×7×3的图片必须使用三维的卷积核,并且第三维度也是3。

stride:步长

padding:扩展像素,填充像素

in:输入的模式数,

out:输出的模式数

W H:卷积核宽度长度

共享权值

每个卷积核连接8×8个节点也就64个权重值,然而还有8×8×2个卷积核呢!这里出现了共享权值,共享权值就是每个卷积核对自己区域的权重比值都是相同的,所以仅需要给出64个权重比值即可,极大的减少了计算量。

池化

池化层也叫采样层,作用是降低数据维度,主要有两个池化方式

最大池化

平均池化

以最大池化为例,有4个2×2的矩阵,则取每个矩阵中的最大值作为该矩阵的特征。

深度学习-神经网络

另一个就是平均池化,就是取矩阵中的平均值来作为该矩阵的特征

迁移学习

[4,3,224,224]

4张,3rgb,244*244矩阵

对抗网络

G生成的图像被D识别为真图像loss越小,D对于G生成的图像的判别正确率越高越好

单目标对象分类-》多目标对象分类-》多目标对象图像分割

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/zywsjz.html