深度学习笔记 (5)

日期：2021-05-21 栏目：程序人生浏览：次

卷积核对应的检测特征可以从其参数分布简单地判断，例如，权重从左到右变小的卷积核可以检测到黑白竖条纹的边界，并显示为中间亮，两边暗的特征图，具体的相对亮暗结果取决于图像像素分布和卷积核的相对关系。卷积核权重可以直接硬编码，但为了让相同的架构适应不同的任务，通过训练得到卷积核权重是更好的办法。

卷积运算的主要参数：

padding：直接的卷积运算会使得到的特征图越来越小，padding 操作会在图像周围添加 0 像素值的边缘，使卷积后得到的特征图大小和原图像（长宽，不包括通道数）相同。

常用的两个选项是：『VALID』，不执行 padding；『SAME』，使输出特征图的长宽和原图像相同。

stride：两次卷积操作之间的步长大小。

一个卷积层上可以有多个卷积核，每个卷积核运算得到的结果是一个通道，每个通道的特征图的长宽相同，可以堆叠起来构成多通道特征图，作为下一个卷积层的输入。

深度卷积神经网络的架构：

深度卷积神经网络的架构主要以卷积层、池化层的多级堆叠，最后是全连接层执行分类。池化层的主要作用是减少特征图尺寸，进而减少参数数量，加速运算，使其目标检测表现更加鲁棒。

14. 经典卷积神经网络

LeNet·5：手写识别分类网络，这是第一个卷积神经网络，由 Yann LeCun 提出。

AlexNet：图像分类网络，首次在 CNN 引入 ReLU 激活函数。

VGG-16：图像分类网络，深度较大。

15. 特殊卷积神经网络

ResNet： 引入残差连接，缓解梯度消失和梯度爆炸问题，可以训练非常深的网络。

Network in Network： 使用 1x1 卷积核，可以将卷积运算变成类似于全连接网络的形式，还可以减少特征图的通道数，从而减少参数数量。

Inception Network： 使用了多种尺寸卷积核的并行操作，再堆叠成多个通道，可以捕捉多种规模的特征，但缺点是计算量太大，可以通过 1x1 卷积减少通道数。

16. 实践建议

使用开源实现： 从零开始实现时非常困难的，利用别人的实现可以快速探索更复杂有趣的任务。

数据增强： 通过对原图像进行镜像、随机裁剪、旋转、颜色变化等操作，增加训练数据量和多样性。

迁移学习： 针对当前任务的训练数据太少时，可以将充分训练过的模型用少量数据微调获得足够好的性能。

基准测试和竞赛中表现良好的诀窍： 使用模型集成，使用多模型输出的平均结果；在测试阶段，将图像裁剪成多个副本分别测试，并将测试结果取平均。

17. 目标检测算法

目标检测即使用边界框检测图像中物体的位置，Faster R-CNN、R-FCN 和 SSD 是三种目前最优且应用最广泛的目标检测模型，上图也展示了 YOLO 的基本过程。

18. 人脸识别

人脸识别有两大类应用：人脸验证（二分分类）和人脸识别（多人分类）。