从软件开发到 AI 领域工程师：模型训练篇 (3)

日期：2021-05-28 栏目：程序人生浏览：次

基于深度学习的人脸检测算法，多数都是基于深度学习目标检测算法进行的改进，或者说是把通用的目标检测模型，为适应人脸检测任务而进行的特定配置。而众多的目标检测模型（Faster RCNN、SSD、YOLO）中，人脸检测算法最常用的是 SSD 算法（Single Shot MultiBox Detector，“Single Shot”指的是单目标检测，“MultiBox”中的“Box”就像是我们平时拍摄时用到的取景框，只关注框内的画面，屏蔽框外的内容。创建“Multi”个 "Box"，将每个 "Box" 的单目标检测结果汇总起来就是多目标检测。换句话说，SSD 将图像切分为 N 片，并对每片进行独立的单目标检测，最后汇总每片的检测结果。），其他如 SSH 模型、S3FD 模型、RetinaFace 算法，都是受 SSD 算法的启发，或者基于 SSD 进行的任务定制化改进，例如将定位层提到更靠前的位置，Anchor 大小调整、Anchor 标签分配规则的调整，在 SSD 基础上加入 FPN 等。本文训练口罩识别模型采用了 YOLO。

目标检测过程都可以分解为两个独立的操作：

定位（location）：用一个矩形（bounding box）来框定物体，bounding box 一般由 4 个整数组成，分别表示矩形左上角和右下角的 x 和 y 坐标，或矩形的左上角坐标以及矩形的长和高。

分类（classification）：识别 bounding box 中的（最大的）物体。

我选择采用 keras-yolo3-Mobilenet 方案，开源项目地址：
https://github.com/Adamdad/keras-YOLOv3-mobilenet。
MobileNet 的创新亮点是 Depthwise Separable Convolution（深度可分离卷积），与 VGG16 相比，在很小的精度损失情况下，将运算量减小了 30 倍。YOLOv3 的创新亮点是 DarkNet-53、Prediction Across Scales、多标签多分类的逻辑回归层。

基于开源数据集的实验结果：

从软件开发到 AI 领域工程师：模型训练篇

动手训练模型

训练模型自然需要训练数据集和测试数据集，大家可以在这里下载：

https://modelarts-labs-bj4.obs.cn-north-4.myhuaweicloud.com/casezoo/maskdetect/datasets/maskdetectdatasets.zip

Yolo v3-MobileNet 目标检测工程的目录结构如下：

转载注明出处：https://www.heiqu.com/wpjypy.html

从软件开发到 AI 领域工程师：模型训练篇 (3)

相关推荐