重磅!YOLOv4阅读笔记(附思维导图和论文译文)! (5)

自对抗训练(SAT)也代表了一种新的数据增强技术,它在两个前向后向阶段运行。在第一阶段,神经网络改变原始图像而不是网络权值。通过这种方式,神经网络对其自身执行对抗性攻击,改变原始图像,以制造图像上没有所需对象的欺骗。在第二阶段,训练神经网络,以正常的方式在修改后的图像上检测目标。

CmBN表示CBN的修改版本,如图4所示,定义为交叉小批量规范化(Cross mini-Batch Normalization,CMBN)。这仅在单个批次内的小批次之间收集统计信息。

图片

我们将SAM从空间注意修改为点注意,并将PAN的快捷连接分别替换为串联,如图5和图6所示。

图片

3.4 YOLOv4

在本节中,我们将详细介绍YOLOv4的细节。

YOLOv4的组成:

图片

YOLOv4的使用:

图片

4、Experiments

我们在ImageNet(ILSVRC 2012 Val)数据集上测试了不同训练改进技术对分类器精度的影响,然后在MS Coco(test-dev 2017)数据集上测试了不同训练改进技术对检测器精度的影响。

4.1 Experimental setup

在ImageNet图像分类实验中,缺省超参数如下:训练步数为800万步;batch size和mini-batch size分别为128和32;采用多项式衰减学习率调度策略,初始学习率为0.1;预热步数为1000步;动量和权值分别设置为0.9和0.005。我们所有的BoS实验都使用与默认设置相同的超参数,并且在BoF实验中,我们增加了50%的训练步骤。在BoF实验中,我们验证了MixUp、CutMix、Mosaic、Bluring数据增强和标记平滑正则化方法。在BoS实验中,我们比较了LReLU、SWISH和MISHISH激活函数的效果。所有实验均使用1080Ti或2080Ti GPU进行训练。

在MS COCO目标检测实验中,缺省超参数如下:训练步数为500,500;采用阶跃衰减学习率调度策略,初始学习率为0.01,在400,000步和450,000步分别乘以因子0.1;动量衰减和权重衰减分别设置为0.9和0.0005。所有的体系结构都使用单个GPU来执行批处理大小为64的多尺度训练,而小批处理大小为8或4,具体取决于体系结构和GPU内存的限制。除采用遗传算法进行超参数搜索实验外,其余实验均采用默认设置。遗传算法使用YOLOv3-SPP算法在有GIoU损失的情况下进行训练,在300个历元中搜索Min-Val5k集。我们采用搜索学习率0.00261,动量0.949,IOU阈值分配地面真值0.213,损失归一化0.07%进行遗传算法实验。我们验证了大量的BoF算法,包括网格敏感度消除、moSAIC数据增强、IOU阈值、遗传算法、类标签平滑、交叉小批量归一化、自对抗训练、余弦退火调度器、动态小批量大小、DropBlock、优化锚点、不同类型的IOU损失。我们还在不同的BoS上进行了实验,包括MISH、SPP、SAM、RFB、BiFPN和Gaus-Sian YOLO[8]。对于所有的实验,我们只使用一个GPU进行训练,因此不使用诸如优化多个GPU的syncBN之类的技术。

4.2 Influence of different features on Classifier training

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/zwjjyw.html