Tied Block Convolution:一种共享filter的卷积形态 (2)

mixer:然而,失去跨通道整合可能会削弱模型,为了添加回去,作者引入了一个mixer(混合器),这个mixer融合了多个split块的输出。引入mixer可以将性能再提升0.5%。mixer的输入可以是拼接的,也可以是各split块输出元素之和。

(ps:作者做了一个实验,发现拼接方法的acc表现略胜一筹,但参数量较多)

3.4.2、TiedResNeXt

下图为基于TBC卷积和ResNet构建的TiedResNeXt Bottleneck:

Tied Block Convolution:一种共享filter的卷积形态

3.4.3、TiedResNeSt

下图为基于TBC卷积和ResNet构建的TiedResNeSt Bottleneck:

Tied Block Convolution:一种共享filter的卷积形态

3.4.4、TiedSE

下图为基于TBC卷积和ResNet构建的TiedSE Bottleneck:

Tied Block Convolution:一种共享filter的卷积形态

4.EXPERIMENTS 4.1、图像分类实验

Tied Block Convolution:一种共享filter的卷积形态

4.2、目标检测实验

Tied Block Convolution:一种共享filter的卷积形态

由上表可以看出,加入Tied CNN后性能得到了明显的提升,同时参数还下降了很多:

4.3、实例分割实验

Tied Block Convolution:一种共享filter的卷积形态

Tied Block Convolution:一种共享filter的卷积形态

Tied Block Convolution:一种共享filter的卷积形态

4.4、可视化结果分析

Tied Block Convolution:一种共享filter的卷积形态

通过Heatmap(类激活热力图)可以看出,TiedResNet对物体所在区域的像素更为敏感。

Tied Block Convolution:一种共享filter的卷积形态

这里x轴是余弦相似度,y轴是概率密度。我们知道ResNet相比VGG有较少冗余,而和ResNet相比,TiedResNet具有更小的相似度,消除了深层更多的冗余,这也验证了作者的假设和动机。

通过分析Heatmap和Histograms可以看出基于Tied CNN的模型由于去除了深层网络层冗余的kernel,模型注意力更加地集中,因此对于目标检测或者实例分割出现遮挡的情况更加的鲁棒。效果如下图所示:

Tied Block Convolution:一种共享filter的卷积形态

图中第一排为ResNet作为BackBone的结果,第二排为TiedResNet作为BackBone的结果,可见对于遮挡的情况,TiedCNN有更好的效果。

5.Summary

(1)作者提出了在不同通道块上共享相同filter的TBC并通过单个filter产生多个相应。

(2)TBC的概念也可以扩展到分组卷积和全连接层,并且能够应用于各种backbone网络和注意力模块,相较于baseline会有较为显著的提升。

(3)基于TBC的TiedResNet以更高的参数使用效率和更好的检测被遮挡物体的能力超越了baseline。

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/wssggp.html