6种常见的地标识别算法整理和总结

日期：2021-05-24 栏目：程序人生浏览：次

摘要：地标识别，基于深度学习及大规模图像训练，支持上千种物体识别及场景识别，广泛应用于拍照识图、幼教科普、图片分类等场景。本文将为大家带来6种关于地标识的算法整理和总结。

地标识别，基于深度学习及大规模图像训练，支持上千种物体识别及场景识别，广泛应用于拍照识图、幼教科普、图片分类等场景。本文将为大家带来6种关于地标识的算法。

一、《1st Place Solution to Google Landmark Retrieval 2020》

6种常见的地标识别算法整理和总结

算法思路：

Step1：使用清洗过的GLDv2数据集训练初始embedding模型。
Step2：使用全量GLDv2数据基于Step1得到的模型进行迁移学习。
Step3：逐步扩大训练图片的尺度（512*512，640*640，736*736），模型性能得到进一步提升。
Step4：增加清洗后的数据的训练loss权重，进一步训练模型。
Step5：模型融合。

Notes：

1、Backbone模型为Efficientnet+global average pooling，训练使用了cosine softmax loss。
2、为了处理类别不均衡问题，使用了weighted cross entropy。

经验总结：

1、清洗后的数据有利于模型快速收敛。
2、全量大数据集有利于模型学习到更好的特征表示。
3、增加训练分辨率能提升模型性能。

6种常见的地标识别算法整理和总结

二、《3rd Place Solution to “Google Landmark Retrieval 2020》

6种常见的地标识别算法整理和总结

算法思路：

Step1：使用CGLDv2训练基础模型用于提取GLDv2全量图片特征，使用DBSCAN聚类方法更新图像类别，进行数据清洗。
Step2：使用了Corner-Cutmix的图像增广方法，进行模型训练。
Notes：
1、backbone为ResNest200和ResNet152，GAP池化，1*1卷积降维到512维，损失函数为cross entropy loss。

三、《Two-stage Discriminative Re-ranking for Large-scale Landmark Retrieval》

6种常见的地标识别算法整理和总结

算法思路：

Step1：使用CNN特征进行KNN搜索，获取相似图片。
Step2：插入Step1遗漏的图片进行重新排序。

Notes：

转载注明出处：https://www.heiqu.com/wpgpsx.html

6种常见的地标识别算法整理和总结

相关推荐