人脸识别技术发展及实用方案设计

人脸识别技术发展及实用方案设计,第1张

人脸识别技术发展及实用方案设计

本文试图对人脸识别技术的发展进行梳理,并根据创客相关范畴的理论给出一些切实可行的方案,希望对感兴趣的读者有所裨益。

人脸识别技术不仅吸纳了谷歌、脸书、阿里、腾讯、百度等国内外互联网巨头的巨额研究和投入,更是秒杀了一大批明星创业公司,如Face++、商汤科技、Linkface、中科从云、易图等,正以视频监控、刑事侦查、互联网金融身份验证、自助系统等为目的,创造着众多成功的使用案例。本文试图对人脸识别技术的发展进行梳理,并根据创客相关范畴的理论给出一些切实可行的方案,希望对感兴趣的读者有所裨益。

1.概观

简单来说,任何一个机械的学习成绩,都可以等价于找到合适的变化函数的一个结果。

例如,语音识别意味着正在提供适当的改变功能,以将输入的一维时间序列语音编号改变为语义空;AlphaGo这种已经远去引起民众关注的围棋野智,是把输入的二维规划图像改成分辨率plan空来决定下一步的最差方法;作为回应,人脸识别也在提供适当的改变功能,将输入的二维人脸图像改变为特征空,从而唯一确认对应人的身份。

久而久之,人们认为围棋的容易程度远远大于人脸识别的容易程度。所以,当AlphaGo在第九节随便击败世界冠军李石柱和荆轲的时候,人们更加惊讶于野智的成长。

实际上,那个结论只是基于人们“知识”的曲解。结果是,从大多数人的亲身经历来看,被围棋世界冠军打败的概率微乎其微,即使他们努力锻炼。相反,大多数人,即使锻炼得很厉害,也能完成人脸识别的使命。

但我们可以认真解释一下两者之间的互易程度:在计算机眼里,围棋的棋盘无非是一个19×19的矩阵,矩阵的每个元素的和值都来自一个三元组{0,1,2}。分离代表无子、黑子、黑,所以输入量的和值是3361;关于人脸识别,以一张512×512的输入图像为例。在计算机眼里,它是一个512×512×3维矩阵,矩阵的每个元素的和值范围是0~255,所以输入量的和值是256,786,432。诚然,GoAI和人脸识别都是合适的变化函数F,但后者对空的输入量级远大于前者。

对于一个假想的变化函数F,为了达到最差的分类结果,在变化的特征空中,我们期望相似样本的类内尽可能小,而不同样本的类间尽可能大。

然而幻想很丰满,理想却很骨感。由于光线、心情、遮挡、姿势等诸多水果元素的影响(如图1),不同人之间的差异往往小于不同人之间的差异,如图2所示。人脸识别算法的历史就是取影响果奋斗的识别历史。

图1面孔识别对水果因子的影响

图2姿势导致差异。人和同龄人不太相似。

2.人脸识别技术发达。

早在20世纪50年代,认知科学家和教育家就开始讨论人脸识别。20世纪60年代,人脸识别工程应用研讨会正式开启。当时的方法主要是对人脸的结构进行 *** 纵,通过对人脸特征及其之间拓扑关系的过程分析,停止识别。那种方法简单不雅,但是一旦脸部姿势和情绪改变,粗糙感下降严重。

1991年,著名的“特征脸”方法[1]首次将主观身份分析和统计特征技术引入人脸识别,在实际应用中进展甚微。这个想法在最近的研究中也得到了进一步的发展。例如,Belhumer成功地将Fisher判别原理应用于人脸分类,提出了基于线性判别分析的Fisherface方法[2]。

在21世纪的前十年,随着机器学习的实际发展,教育工作者们先后探索出了基于遗传算法、支持向量机(SVM)、boosting、流形学习和核方法的人脸识别方法。从2009年到2012年,稀疏表示[3]因其美好的真实感和对着色水果元素的鲁棒性成为当时讨论的热点。

与此同时,业界有一个根本性的共鸣:基于狂野不经意的假设,提升某些形态的停止特征,借助[/k0/]选择停止特征,可以获得最好的识别结果。Gabor[4]和LBP[5]特征形态学是人脸识别领域中最成功的两种狂野的假想部分形态学。当时人脸识别影响的各类果的针对性处理也是那个阶段的热门话题,比如人脸光照归一化、人脸姿态矫正、人脸超分辨、遮挡处理等。也是在那个阶段,研究人员的关注点开始从受限场景下的人脸识别转移到非受限场景下的人脸识别。LFW人脸识别大赛就是在这种背景下开始盛行的。当时,虽然最好的识别系统在受限的FRGC测试上可以获得超过99%的识别粗糙度,但在LFW上最低的粗糙度只有80%。阁下,间隔看起来真的很近。

2013年,MSRA研究员的尾部测试测试了10万个大规模演习数据,基于低维LBP特征战的联合贝叶斯方法[6]在LFW上得到95.17%的粗糙度。结果表明,大规模的训练数据对于无限制的人脸识别是非常重要的。然而,上述所有示例性方法都易于处理具有分散数据的运动场景。

2014年前后,随着数据战深入研究的开展,神经采集备受关注,在图像分类、手写识别、语音识别等方面取得了近乎超示范性的成果。

香港香港中文大学教授孙毅等人提出了将卷积神经集合应用于人脸识别的设想[7],接受了20万个练习数据,这是首次在LFW上获得超越人类水平的识别粗糙度,在人脸识别史上具有里程碑意义。

此后,研究人员不断改进集合结构,扩大练习样本范围,将LFW上的识别粗糙度推至99.5%以上。如表1所示,我们给出了人脸识别发展中的一些典型方法及其在LFW上的粗糙程度。一个根本的趋势是,运动数据的范围越来越广,识别的粗糙程度越来越低。如果读者有兴趣更详细地了解人脸识别的历史,可以参考文献。

表2人脸识别的一般练习

表3本文中使用的测试粉末

表4快速可靠的清洗运动数据的方法。

图4展示了一组有用的人脸识别技术方案,主要包括多面片、CNN特征提取、多任务训练/多损失混合、特征混合等模块。

图4人脸识别工艺平面图

1.多面片主要用于 *** 纵人脸差异面片之间的互补信息,以加强识别功能。特别地,多个补片的混合可以促进遮挡条件下的识别功能。目前,LFW评价中99.50%以上的成果大多是由多个斑块融合而成。

2.通过最终研究,优秀的面部特征提取和卷积神经集合包括:Deep-ID系列、VGG网、雷斯网和谷歌事件结构。读者可以根据自己对粗鄙和顺从的需求,选择合适的集合。本文以19层resnet为例。

3.多任务训练主要是 *** 纵其他相关信息来促进人脸识别功能。以性别和种族歧视为例,这两个属性与一个细节人物的身份有很强的相关性,而其他属性,如情绪和年龄,都具有那个特征。我们正在通向resnet的中心,以停止种族战争和多任务研究,这样CNN收集的前几层就相当于带有种族和性别歧视的下层语义怀疑,我们正在进一步研究CNN收集的最后几层的详细的身份歧视。同时,通过基线分类器投票可以得到练习集样本的性别和种族属性。

4.多损失融合主要是 *** 纵不同损失之间的互补特征来学习适量的面部特征,使类内尽可能小,类间尽可能大。目前人脸识别常用的集合有:成对损失、三重损失、softmax损失、中心损失等。这种三重损失间接陈述了删除类间良好间隙的劣化目的,但在具体的工程理论中,有许多窍门,不容易掌握。而最近提出的centerloss,将softmaxloss分离出来,具有更好的心智特性空,良好的类内和类间表现,运动设置方便,因此应用广泛。

5.通过多次贴片练习的过程得到的模具会有多个特征背,如何将多个特征背融合起来阻止最终识别也是一大技术成果。常用的方案有:特征组合、分数权重缩减的混合、决议方案的混合(如投票)等。

表5泥洗前后鉴定模具功能对比

表5显示了洗涤前后运动数据的功能比较结果。据此,可以得出以下结论:

数据的浑洗,既可以减缓模具的运动,也有助于促进对粗度的识别;

在西圈赏主的练习粉MSCeleb1M上练习得到的模具,在西圈赏主的同测粉LFW上达到了完美的泛化功能。而东圈正在付费的商考粉的泛化功能已经大大下降;

在东圈赏主的业务培训中心培训得到的模具在东圈赏主的业务测试中心有非常好的作用,但是西圈赏主的LFW和MSCeleb1M有必然的区别。

停止MSCeleb1M的合并,业务练习,练习得到的模型在LFW和业务数据上远非完美。其中,基于三块融合的模型在LFW上获得了99.58%的识别粗糙度。

由此可知,要想尽可能低的实现真正的识别功能,就要尽量接受并采取相同利用情况的运动数据来停止运动。论文[12]中也给出了相同的结论。

在实践中,一个完善的人脸识别系统除了上述识别算法外,还应该包括人脸检测、人脸铰链定位、人脸对齐等模块,并且正在一些安静的层面使用。为了避免照片、视频回放、3D印象等对识别系统的模仿。按需引入活体检测模块;为了在视频输入中得到最差的识别结果,引入图像质量评价模块,选择最合适的视频帧停止识别,尽量消除无平均光照、高姿态、低分辨、恍惚等水果元素对识别的影响。此外,也有许多研究人员和公司试图通过自动化过程来避免那些水果的影响:引入白色/3D相机。典型的真实人脸识别方案如图5所示。

图5真实人脸识别计划流程图

4.摘要

本文简要总结了人脸识别技术的发展历史,并给出了实用方案的参考。虽然人脸识别技术在LFW公开赛上获得了99%以上的粗糙度,但1:N的识别间隔在视频监控等真实情况下,尤其是在大N的情况下,还有很长的路要走。未来,我们将在训练数据的扩展,新模型的假设和进一步教育的追求方面投入更多的努力,使大规模的人脸识别尽快投入实际应用。

参考

[1]杜康德,彭兰.特征脸在识别中的应用[J].认知神经科学杂志,1991,3(1):71-86。

[2]BelhumeurP,HespanhaJ,Kriegmand.eigenfacesvs.fisherfaces:使用类别特定的线性投影进行识别[J].IEEE模式分析和机器智能汇刊,1997,19(7):711-720。

[3]刘C,韦氏。基于Gabor特征分类的增强型fisher线性模型人脸识别[J].IEEE图像处理汇刊,2002,11(4):467-476。

[4]AhonenT,HadidA,pietikinenm.基于局部二值模式的人脸描述:在人脸识别中的应用[J].IEEE模式分析与机器智能汇刊,2006,28(12):2037-2041。

[5]WrightJ,YangA,GaneshA,SastryS,MaY.基于稀疏表示的鲁棒人脸识别[J].IEEE模式分析与机器智能汇刊,2009,31(2):210-227。

[6]陈D,曹X,文F,孙j.面向人脸验证的高维特征及其高效压缩[C].2013年IEEE计算机视觉和模式识别国际会议。

[7]孙Y,王X,唐X.联合识别-验证的深度学习人脸表征[C].

[8]赵伟,ChellappaR,RosenfeldA,PhillipsPJ.人脸识别:一个文献综述[J].美国计算机学会计算调查,2003,35(4):399-458。

[9]李淑珍,贾安凯.人脸识别手册(第二版)[M].斯普林格出版社,2011年。

[10]王B,李W,杨W,廖q.基于韦伯定律的光照归一化及其在人脸识别中的应用[J].IEEE信号处理快报,2011,18(8):462-465。

[11],冯X,龚L,冯H,黄W,韩j.用于不同视角下人脸识别的鲁棒姿态归一化[C].ICIP,2015年,

[12]KanM.用于人脸识别的域适应:由公共子空间桥接的目标源域,IJCV,2014。

制作人:_两个橙子_

产地:https://www.jianshu.com/p/68e768131b65

本文由@_二橙_授权发布,制作方已承诺停止转载。

标题来自unsplash,基于CC0和谈。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zz/777433.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-03
下一篇 2022-05-03

发表评论

登录后才能评论

评论列表(0条)

保存