mixer:然而,失去跨通道整合可能会削弱模型,为了添加回去,作者引入了一个mixer(混合器),这个mixer融合了多个split块的输出。引入mixer可以将性能再提升0.5%。mixer的输入可以是拼接的,也可以是各split块输出元素之和。
(ps:作者做了一个实验,发现拼接方法的acc表现略胜一筹,但参数量较多)
3.4.2、TiedResNeXt下图为基于TBC卷积和ResNet构建的TiedResNeXt Bottleneck:
3.4.3、TiedResNeSt下图为基于TBC卷积和ResNet构建的TiedResNeSt Bottleneck:
3.4.4、TiedSE下图为基于TBC卷积和ResNet构建的TiedSE Bottleneck:
4.EXPERIMENTS 4.1、图像分类实验 4.2、目标检测实验由上表可以看出,加入Tied CNN后性能得到了明显的提升,同时参数还下降了很多:
4.3、实例分割实验 4.4、可视化结果分析通过Heatmap(类激活热力图)可以看出,TiedResNet对物体所在区域的像素更为敏感。
这里x轴是余弦相似度,y轴是概率密度。我们知道ResNet相比VGG有较少冗余,而和ResNet相比,TiedResNet具有更小的相似度,消除了深层更多的冗余,这也验证了作者的假设和动机。
通过分析Heatmap和Histograms可以看出基于Tied CNN的模型由于去除了深层网络层冗余的kernel,模型注意力更加地集中,因此对于目标检测或者实例分割出现遮挡的情况更加的鲁棒。效果如下图所示:
图中第一排为ResNet作为BackBone的结果,第二排为TiedResNet作为BackBone的结果,可见对于遮挡的情况,TiedCNN有更好的效果。
5.Summary(1)作者提出了在不同通道块上共享相同filter的TBC并通过单个filter产生多个相应。
(2)TBC的概念也可以扩展到分组卷积和全连接层,并且能够应用于各种backbone网络和注意力模块,相较于baseline会有较为显著的提升。
(3)基于TBC的TiedResNet以更高的参数使用效率和更好的检测被遮挡物体的能力超越了baseline。