带你读AI论文丨用于目标检测的高斯检测框与ProbIoU

摘要:本文解读了《Gaussian Bounding Boxes and Probabilistic Intersection-over-Union for Object Detection》,该论文针对目标检测任务,提出了新的高斯检测框(GBB),及新的计算目标相似性的方法(ProbIoU)。

本文分享自华为云社区《论文解读系列十九:用于目标检测的高斯检测框与ProbIoU》,作者:BigDragon。

带你读AI论文丨用于目标检测的高斯检测框与ProbIoU

论文地址: https://arxiv.org/abs/2106.06072

Github地址: https://github.com/ProbIOU  

现有目标检测的改进方向主要集中在:训练更大数据集 (LVIS dataset)、处理类别不均衡、提出更好的 backbones 、建立长距离相互作用模型 (Transformers , LambdaNetworks)、分类和检测框的权衡分析,对于检测框的呈现形式相关研究较少。现有目标检测任务中以水平框 (HBB )和旋转框 (OBB )为主,呈现形式还是矩形或者类矩形。 而现有目标距离及相似性计算方式包括:IoU (Intersection over Union)、 GIoU (Generalized IoU )、 DIoU (Distance IoU)、 PIoU (Pixel IoU), Gaussian Wasserstein Distance (GWD)。

现有OBB算法在细长及旋转物体检测问题相对于HBB算法有所提高,但是与目标语义分割的贴合度不高,因此,本文提出更加贴合语义分割形式的分割呈现形式及对应的目标相似度计算方法。

该论文贡献如下:

提出一种新的椭圆形目标检测框 (Gaussian Bounding Boxes,GBB)

GBB与目标的语义分割mask形状更加接近,更加贴合非矩形目标,在非矩形目标检测效果优于HBB和OBB。

提出一种新的目标相似度的计算方法 (Probabilistic IoU,ProbIoU)

基于Hellinger Distance的ProbIoU,考虑了2D高斯分布的特点,满足所有距离度量标准,能够表示不同分布间的真实距离,且处处可微,能提升OBB和HBB目标检测效果。

1.Gaussian Bounding Boxes (GBB)

为在 2 维区域确定一个二维高斯分布,需要计算其均值μ和协方差矩阵∑,其中μ为 (x0, y0) T,协方差矩阵∑可通过下列公式进行计算。在目标检测任务中,可直接设置(x0,y0,a,b,c )作为目标检测中的回归任务中的参数,也可将回归任务中参数表示为(x0, y0,a ’,b ’,θ ),而后者的形式更加符合现有旋转检测框的输出形式。

假设

水平框及旋转框向高斯框转换中遵循以下假设:目标区域为 2 维二元区域 Ω,且 Ω 符合均匀概率分布,则该分布的均值 μ 和协方差矩阵 ∑ 可通过如下公式进行计算。

其中, N 表示区域 Ω 的面积。

1.1 将 HBB 转化为 GBB

对于 HBB ,其二元区域 Ω 为以 (x0, y0) 为中心,高为 H,宽为 W 的矩形区域 , 因此 μ 为 (x0, y0) , 它的协方差矩阵 Σ 可通过如下公式进行计算

因此,可以得出 a=w²/ 12 , b =H²/12,c=0 。如上述公式所示,转换后的高斯框也可以转化水平框,该过程是可逆的。

1.2 将 OBB 转化为 GBB

OBB 转化为 GBB 需要计算 (a ’,b ’,θ),如下图所示,方差 a ’和b ’ 可通过将旋转框转化为水平框进行计算, 其协方差矩阵可通过下列公式进行计算。

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/zwfgzf.html