face recognition[翻译][深度学习理解人脸] (7)

对于一个单一人脸,我们能够验证人脸的属性如:性别,表情,年龄,皮肤颜色等等。这些属性对于图像检索,表情检测和手机安全都有帮助,在生物文献中,人脸属性被称为soft-生物性[95].Kumar[56]将属性概念引入到图像描述子中,以此用来做人脸验证。他们使用65个二值属性来描述每个人脸图像。Berg[56]对每个人脸对训练分类器,然后用这些分类器去生成人脸分类器的特征。这里每个人都被描述为与他人的相似性。这是一种自动创建属性集的方法,而不需要依赖很大的手工标注属性数据集。近些年DCNN也用来做属性分类,如深度属性的姿态对齐网络(pose aligned networks for deep attributes,panda)通过将part-based模型与pose-normalized DCNN来做属性分类[96]。[97]在adience数据集上使用DCNN去关注年龄和性别,Liu使用两个DCNN,一个用来做人脸检测,另一个做属性识别,其在Celeba和LFWA数据集上在许多属性上效果要好于PANDA[80]。

[99]中不将每个属性独立看待,而是利用属性之间的关联性去提升图像的排序和检索,通过先在独立训练属性分类器,然后学习这些分类器输出对之间的相关性。Hand[100]训练一个单一属性网络用来分类40个属性,通过学习这40个属性之间关系去共享网络之间的信息,而不只是属性对。Ranjan[2]用MTL去训练一个单一网络,其可以同时做人脸检测,人脸关键点标注,人脸识别,三维头部姿态估计,性别分类和年龄评估,笑容检测。最近Gunther提出无需对齐的人脸属性分类器技术(alignment-free facial attribute classifcation technique,affact)[101]算法去执行无需对齐的属性分类,它使用了一个数据增强技术,以此允许网络在不需要对齐的基础上做人脸属性分类,盖苏阿凡在CelebA数据集上以三个网络的集成学习方式达到了最好的效果。

另外,一些人脸属性可以用来加速手机认证性能[17]。近期提出的属性连续认证[102,103]方法显示了在大陆属性的基础上可以在手机上获得很好的认证效果。同样的,如果只学习人脸的一部分,那么就变得更容易了。通过使用这两个优势,Samangouei[98]设计了高效的DCNN网络结构,其可以部署在手机设备上,图7介绍了如何将人脸属性用在手机认证上.

face recognition[翻译][深度学习理解人脸]

6.人脸分析的多任务学习

在这部分,介绍了几种不同的用于人脸分析的MTL方法。Caruana[104]首先分析了MTL框架在机器学习中的应用,然后,MTL被用来解决CV中的多种问题。基于MTL的一个早期的人脸分析工作是由Zhu[55]提出的。该算法用来解决人脸检测,关键点定位,头部姿态评估。另一个方法叫JointCascade[105],通过结合训练关键点标注任务来提升人脸检测效果。这些算法都是基于手工设计的特征,使得难以将MTL方法扩展到更多的任务上。

在深度学习出来之前,MTL受限于部分数据集,因为不同任务解决的特征表征问题是不同的。例如人脸检测通常使用HOG,而人脸识别使用LBP。类似的,关键点表征,练级和性别估计,属性分类,不同任务自然需要不同特征。然而,随着深度学习的出现,手工设计的特征可以抛弃了,从而训练一个单一的网络结构来实现人脸检测,关键点定位,人脸属性预测和人脸识别成为可能。

通常而言,当人类看图片中的人脸时,他会检测人脸在哪,然后判别其性别,大致姿态,年龄,标签等等。而当机器执行这些任务时,通常需要设计独立的算法去解决不同的任务。然而我们可以设计一个深度网络去同时完成这些所有的任务,并利用任务之间的关系。Goodfellow[106]将MTL解释为一个关于DCNN的正则。在采用MTL方法时,学到的参数可以即刻用在所有的任务上,这减少了过拟合,冰洁收敛于一个鲁棒的解决方法。

HyperFace[10]和任务受限深度卷积网络(Tasks-Constrained deep convolutional network, tcdcn)[107]. HyperFace被提出来解决人脸检测,关键点定位,头部姿态评估,和性别分类。他融合一个DCNN的中间层使得任务能够利用丰富的语义特征。所以MTL可以提升独立任务的性能。Zhang[107]提出TCDCN算法也能同时实现性别识别,笑容预测,眼睛检测等等。在他们的算法中所有任务的预测都来自相同的特征空间。他们的工作显示使用辅助任务例如眼睛检测和笑容预测可以提升人脸关键点定位。

ranjan最近提出的all in one face[2]是使用单一的DCNN来同时完成人脸检测,关键点标注,人脸识别,三维头部姿态估计,笑容检测,人脸年龄检测和性别分类。该结构(图8(a))

face recognition[翻译][深度学习理解人脸]


以一个预训练的人脸识别网络开始[73]。该网络有7层卷积层和三层全连接层组成,他用来做基底网络来训练人脸识别任务,且其前6层卷积层的参数用来共享给其他人脸相关的任务。中心原则是在人脸识别任务上预训练的CNN为通用人脸分析任务提供了更好的初始化,因为每一层的过滤器保留了有辨别力的人脸信息。

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/zwgyjf.html