深度学习论文翻译解析（十）：Visualizing and Understanding Convolutional Networks (6)

日期：2021-10-24 栏目：程序人生浏览：次

　　图5 图像的垂直移动，尺度变换，旋转以及卷积网络模型中相应的特征不变性。列1：对图像进行各种变形；列2和列3：原始图片和变形图片分别在层1~层7所产生特征间的欧式距离。列4：真实类别在输出中的概率。

深度学习论文翻译解析（十）：Visualizing and Understanding Convolutional Networks

　　图6 （a）层1输出的特征，还未经过尺度约束操作，可以看到有一个特征十分巨大；（b）（Krizhevsky et al 2012）第1层产生的特征；（c）本文模型第1层产生的特征。更小的跨度（2 vs 4），更小的核尺寸（7*7 vs 11*11）从而产生了更具辨识度的特征和更少的“无用特征”；（d）：（Krizhevsky et al 2012）第二层产生的特征；（e）本文模型第二层产生的特征，很明显，没有（d）中的模糊特征。

深度学习论文翻译解析（十）：Visualizing and Understanding Convolutional Networks

　　图7：输入图片被遮挡时的情况。灰度方块遮挡了不同区域（第1列），会对第5层的输出强度产生影响（b和c），分类结果也发生改变（d和e）（b）：图像遮挡位置对第5层特定输出强度的影响。（c）将第5层特定输出特征投影到像素空间的情形（带黑框的），第1行展示了狗狗图片产生的最强特征。当存在遮挡时，对应输入图片对特征产生的刺激强度降低（蓝色区域表示降低）。（d）正确分类对应的概率，是关于遮挡位置的函数，当小狗面部发生遮挡时，波西米亚小狗的概率急剧降低。（e）最可能类的分布图，也是一个关于遮挡位置的函数。在第1行中，只要遮挡区域不在狗狗面部，输出结果都是波西米亚小狗，当遮挡区域发生在狗狗面部但有没有遮挡网球时，输出结果是“网球”。在第2行中，车上的纹理是第5层卷积网络的最强输出特征，但也很容易被误判为“车轮”。第三行包含了多个物体，第5层卷积网对应的最强输出特征是人脸，但分类器对“狗狗”十分敏感（d）中的蓝色区域，原因在于 Softmax 分类器使用了多组特征（即有人的特征，又有狗的特征）。

深度学习论文翻译解析（十）：Visualizing and Understanding Convolutional Networks

　　图8 其他用于遮挡实验的图片，第1列：原始图片，第2,3,4列；遮挡分别发送在右眼，左眼和鼻子部位；其余列显示了随机遮挡。

深度学习论文翻译解析（十）：Visualizing and Understanding Convolutional Networks

5，实验内容 5.1 ImageNet 2012

　　该图像库共包含了（130万/5万/10万）张（训练/确认/测试）样例，种类数超过 1000。表2显示了本文模型的测试结果。

　　首先，本文重构了（Krizhevsky et al 2012）的模型，重构模型的错误率与作者给出的错误率十分一致，误差在 0.1%以内，一次作为参考标准。

　　而后，本文将第1层的卷积核大小调整为 7*7，将第1层和第2层卷积运算的步长改为2，获得了相当不错的结果，与（Krizhevsky et al 2012）相比，我们的错误率为 14.8%，比（Krizhevsky et al 2012）的 15.3% 提高了 0.5 个百分点。

深度学习论文翻译解析（十）：Visualizing and Understanding Convolutional Networks

　　表2，ImageNet 2012分类错误率，星号表示了使用 ImageNet2011和ImageNet2012两个训练集

深度学习论文翻译解析（十）：Visualizing and Understanding Convolutional Networks

　　改变卷积网络结构：如图3所示，本文测试了改变（Krizhevsky et al 2012）模型的结构会对最终分类造成什么样的影响，例如：调节隐藏层节点个数，或者将某隐含层直接删除等等。每种情况下，都将改变后的结构从头训练。当层6， 7被完全删除后，错误率只有轻微上升；删除掉两个隐含卷积层，错误率也只有轻微上升。然而当所有的中间卷积层都被删除后，仅仅只有4层的模型分类能力急剧下降。这个现象或许说明了模型的深度与分类效果密切相关，深度越大，效果越好。改变全连接层的节点个数对分类性能影响不大；扩大中间卷积层的节点数对训练效果有提升，但也同时加大了全连接出现过拟合的可能。

转载注明出处：https://www.heiqu.com/zwwyyg.html

深度学习论文翻译解析（十）：Visualizing and Understanding Convolutional Networks (6)

相关推荐