一种改进的多任务级联网络人脸检测算法研究

一种改进的多任务级联网络人脸检测算法研究周航蔡茂国吴涛沈冲冲摘要:传统人脸检测算法在复杂环境背景下一直存在着检测准确率及效率低等问题。近年来,得益于人脸数据集的增长以及计算机硬件的极速发展,使用深度神经网络的人脸检测算法在准确度方面已有很大提升,但使用的模型结构越来越复杂,检测速度也相对变慢。本文提出一种改进的多任务卷积神经网络(Multi-taskconvolutionalneuralnetworks,MTCNN)算法。在制造數据集时更改IOU阈值参数,来获取更多、更精确的人脸样本;对与置信度损失有关的交叉熵损失函数和与偏移量损失有关的均方差函数求均值,使得整个网络收敛得更加平稳。经在AFW、PASCAL以及FDDB数据集上实验,与传统算法相比,该算法在保证实时性的同时提升了检测准确率,可应用于追求更高准确率的人脸检测系统。关键词:深度神经网络;MTCNN;人脸检测:2095-2163(2021)03-0172-05:TP391文献标志码:A【Abstract】Traditionalfacedetectionalgorithmshavealwayshadproblemssuchaslowdetectionaccuracyandlowefficiencyinthecontextofcomplexenvironments.Inrecentyears,ithasbenefitedfromthegrowthoffacedatasetsandtherapiddevelopmentofcomputerhardware.Facedetectionalgorithmsusingdeepneuralnetworksareinaccuracy.Thisaspecthasbeengreatlyimproved,butthestructureofthemodelusedisbecomingmoreandmorecomplex.ThedetectionspeedisrelativelysloTherefore,itisveryimportanttodesignadetectionmodelthattakesintoaccountbothaccuracyandreal-timeperformance.Thispaperproposesanimprovedmulti-taskconvolutionalneuralnetworks(MTCNN)algorithm.ThefirstinthemanufacturingdatasetschangestheIOUthresholdparametertoobtainamoreaccuratefacesamples.Secondly,thecrossemotionlossfunctionrelatedtotheconfidencelossandtheaverageofthemeansquareerrorfunctionrelatedtotheoffsetlossmaketheconvergenceoftheentirenetworkmorestable.AfterexperimentsontheAFW,PASCALandFDDBdatasets,comparedwithtraditionalalgorithms,thisalgorithmimprovesthedetectionaccuracywhileensuringreal-timeperformance,whichcouldbeappliedtofacedetectionsystemspursuinghigheraccuracy.【Keywords】deepneuralnetwork;MTCNN;facedetection0引言人脸检测已广泛应用于人们的日常生活中,如公共刑侦追逃[1]、考勤打卡、金融机构的门禁控制、自动驾驶以及机器人等都用到了人脸检测技术。人脸检测是计算机视觉和模式识别的重要应用方向之一,是解决与面部相关工作的前提。例如,人脸识别、人脸表情识别、活体检测[2]等。将检测到的人脸图像提取出来,作为后续工作的输入信息,可以大大减少计算量。面部检测算法可分为两大类:基于手工特征提取的人脸检测算法和基于深度学习的人脸检测算法。Viola等人[3]提出的级联人脸检测算法,利用Haar-Like特征和AdaBoost级联分类器,实现了良好的实时性能。然而,文献[4]表明,即使检测系统提取更高维的特征和分类器,在人脸图像发生较大变化的情况下,也可能严重退化。除此之外,文献[5]中介绍了一种用于面部检测的可变形部分模型,但其计算量较为复杂,并且需要在训练阶段对图片进行复杂的标注。近年来,卷积神经网络(CNN)在各种计算机视觉任务(如,图像分类[6]、人脸识别[7])中都取得了重大进展。受深度学习方法在计算机视觉任务中取得巨大成功的启发,一些研究开始采用深度卷积神经网络进行人脸检测。如:Yang等人[8]训练了深度卷积网络,来进行面部属性识别,以获取面部区域的人脸特征,从而进一步生成面部候选窗口。但由于其复杂的CNN结构,该方法在实践中非常耗时。Li等人[9]使用级联CNN进行人脸检测,但需要从人脸检测中进行边界框校准,需要额外的计算量,并忽略了人脸界标定位与边界框回归之间的内在关联。与此同时,面部对齐也吸引了研究者的广泛兴趣。该领域的研究工作大致可分为2类:基于回归方法[10]和模板匹配方法[11]。Zhang等人[12]提出,利用深度CNN作为辅助特征来增强面部对齐性能。然而,以往大多...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

笔杆子文秘
机构认证
内容提供者

为您提供优质文档,供您参考!

确认删除?