论文阅读 | ExtremeNet：Bottom-up Object Detection by Grouping Extreme and Center Points (2)

日期：2022-10-24 栏目：程序人生浏览：次

此外，极值点并非总是唯一的，比如一个汽车的极值点可能是水平或竖直的线段，文中极值点的响应是对边缘多个点的弱响应而不是一个点的强响应。这有可能产生几个问题：弱响应可能会被忽略；目标如果发生轻微旋转即便检测到关键点，得分也有很大差异。作者采用边缘聚集的方法来解决：对于每个极值点（局部最大值点），分别沿水平和垂直两个方向进行聚集，也就是在每个方向上找极值点最近的左右两个局部最小值，在区间内做加权和作为极值点的得分。公式如下所示：

论文阅读 | ExtremeNet：Bottom-up Object Detection by Grouping Extreme and Center Points

其中，m为极值点位置，i0、i1分别为距离m最近的两个局部最小值。

如下图所示，使用边缘聚集策略后，边缘中心的像素点的置信度明显提升：

论文阅读 | ExtremeNet：Bottom-up Object Detection by Grouping Extreme and Center Points

实例分割

文中提出了一个简单的八边形逼近目标的方法（基于四个极值点形成的矩形边界框）：将一个极值点左右各延长1/8形成线段，如果遇到矩形框的角时则截断。将这四个线段的端点连接起来，形成八边形。

实验

在COCO数据集上进行实验，如果一条边与坐标轴平行或者夹角小于3度，就将其中心作为极值点。从头训练太耗时，使用了CornerNet的预训练模型进行finetune。

细节：最多只取ExtractPeak 中top40的点进行枚举；测试阶段使用flip argumentation策略；对增强的检测结果使用soft NMS。检测速度3.1fps。

在COCO数据集上的检测结果：

论文阅读 | ExtremeNet：Bottom-up Object Detection by Grouping Extreme and Center Points

由上表可见，ExtremeNet多尺度模型的效果达到目前单阶段算法的***AP（43.2%），比CornerNet提升1.1%；而单尺度模型的AP比CornerNet低了0.4%，在中、小目标的检测上AP都高于CornerNet，而大目标检测略差，可能原因是中心点的response map不够准确造成的。

在实例分割方面，ExtremeNet与DeepExtremeCut结合，在COCO val2017上达到34.6%的AP，而当前最先进的Mask RCNN的AP为34.0%（基于ResNet-50+FPN）、37.5%（基于ResNeXt-101+FPN）。在实例分割方面也与最先进的方法相当。

转载注明出处：https://www.heiqu.com/zgfyyx.html

论文阅读 | ExtremeNet：Bottom-up Object Detection by Grouping Extreme and Center Points (2)

相关推荐