1、Backbone模型为ResNet-101+Generalized Mean (GeM)-pooling,训练loss为ArcFace loss。
2、使用全局特征+局部特征对GLd-v2数据集进行清洗,用于后续模型训练。
算法思路:
1、使用GLD-v2全量数据分别训练Resnet152、ResNet200等模型,训练loss为ArcFace loss、Npairs loss,拼接各个backbone的特征,使用PCA降到512维,作为图像的全局特征。
2、使用全局特征进行KNN搜索,对搜索结果使用SURF、Hassian-Affine 和root sift局部特征进行再排序,并且使用了DBA和AQE。
算法思路:
Step1:使用GLD的带bbox数据集,训练Faster-RCNN或SSD检测模型,用于地标框的提取。
Step2:提出了D2R-R-ASMK方法,用于检测框内的局部特征提取与特征聚合。
Step3:使用聚合后特征在database中进行搜索。
Notes:
1、D2R-R-ASMK基于DELF局部特征抽取和ASMK特征聚合方法实现。
2、每张图片提取4.05个region的时候效果最好,search的内存占用会有相应增加。
六、《Unifying Deep Local and Global Features for Image Search》算法思路:
Step1:统一在同一个网络中提取全局和局部特征
Step2:使用全局特征搜索top100的相似图片
Step3:使用局部特征对搜索结果进行重排序
Notes:
1、全局特征使用GeM池化和ArcFace loss。
2、局部特征匹配使用Ransac方法。