深度学习论文翻译解析（十）：Visualizing and Understanding Convolutional Networks (7)

日期：2021-10-24 栏目：程序人生浏览：次

深度学习论文翻译解析（十）：Visualizing and Understanding Convolutional Networks

5.2 特征泛化

　　上面的实验显示了我们的 ImageNet 模型的卷积部分在获得最新性能方面的重要性。这由图2 的可视化支持，它显示了卷积层中的复杂不变性。我们现在探索这些特征提取层的能力，以推广到其他数据集，即 Caltech-100（Feifei 等人， 2006），Caltech-256（Grifffi等人， 2006）和 PASCAL VOC 2012。为此，我们将我们的 ImageNet 训练的模型的第1~7层固定并使用新数据集的训练图像在最上面训练一个新的 Softmax 分类器（使用适当的类别数）。由于Softmax包含的参数相对较少，因此可以从相对较小的示例中快速训练，如某些数据集的情况。

　　我们的模型（Softmax）和其他方法（通常是线性 SVM）使用的分类器具有相似的复杂性，因此实验将我们从 ImageNet 学习到的特征表示与其他方法使用的手工标注的特征进行比较。需要注意的是，我们的特征表示和手工标注的特征都是使用 Caltech 和 PASCAL 训练集的图像设计的。例如，HOG描述中的超参数是通过对行人数据集进行系统实验确定的（Dalal & Triggs，2005）。我们还尝试了第二种从头开始训练模型的策略，即将层1~7重新设置为随机值，并在数据集的训练图像上训练他们以及 Softmax。

　　其中一个复杂因素是 Caltech 数据集中有一些图像也是在 ImageNet 训练数据中。使用归一化相关性，我们确定了这些“重叠”图像，并将其从我们的 ImageNet训练集中移除，然后重新训练我们的 ImageNet 模型，从而避免训练/测试污染的可能性。

深度学习论文翻译解析（十）：Visualizing and Understanding Convolutional Networks

　　Caltech-101：我们遵循（Fei-fei等，2006）的程序，每类随机选择15或30幅图像进行训练，每类测试50幅图像，表4中报告了每类准确度的平均值，使用 5次训练/测试折叠。训练 30张图像/类的数据用时 17分钟。预先训练的模型在 30幅图像/类上的结果比（Bo et al 2013）的成绩提高 2.2%，然而，从零开始训练的 Convnet 模型非常糟糕，只能达到 46.5%。说明基于 ImageNet 学习到的特征更有效。

深度学习论文翻译解析（十）：Visualizing and Understanding Convolutional Networks

　　Caltech-256：遵循（Griffin et al 2006）的测试方法进行测试，为每个类选择15， 30， 45,或 60 个训练图片，结果如表5所示，基于ImageNet预先学习的模型在每类 60 训练图像上以准确率高出 19% （74.2% VS 55.2%）的巨大优势击败了历史最好的成绩。图9从另一个角度（一次性学习）描述了基于 ImageNet 预先学习模型的成功，只需要6张 Caltech-256训练图像即可击败使用10倍图像训练的先进方法，这显示了ImageNet特征提取器的强大功能。

深度学习论文翻译解析（十）：Visualizing and Understanding Convolutional Networks

转载注明出处：https://www.heiqu.com/zwwyyg.html

深度学习论文翻译解析（十）：Visualizing and Understanding Convolutional Networks (7)

相关推荐