马勇博士论文人脸检测

复杂背景下人脸检测和器官定位研究(申请清华大学工学博士学位论文)培学养单位科::清华大学电子工程系信息与通信工程研究生:马勇指导教师:丁晓青教授二○○四年七月摘要摘要人脸检测和器官定位是人脸信息处理领域中的一个重要课题,具有很高的学术价值和应用潜力;同时人脸检测和器官定位又是一个极具挑战性的问题。本文研究其中最具普遍性,也是最困难的复杂背景下静止灰度图像中的人脸检测、以及在得到人脸区域后进行的器官精确定位问题。在对复杂背景下人脸检测和器官定位问题的特点以及现有解决方法进行深入分析的基础上,本文主要在以下方面做出了创新:(一)将风险概念引入SVM分类器设计中,首次提出了风险敏感的SVM算法(CS-SVM),进行了理论分析和实验验证,证明了与常规SVM算法相比CS-SVM算法可以减少高风险类别上的FRR,在此基础上尽量减少低风险类别上的FAR,并保持分类器良好的推广性能。论文还将CS-SVM算法应用于正面直立人脸检测,提出了一种层次型的正面直立人脸检测器设计方法,实验结果进一步表明了CS-SVM算法的上述优点;(二)将风险概念引入AdaBoost学习算法,提出了一种新的风险敏感AdaBoost学习算法(CS-AdaBoost),使算法的优化目标由常规AdaBoost算法的最小化错误率上界改变为最小化错误风险上界,从而较好的折衷FAR和FRR;论文对CS-AdaBoost算法的其它性质进行了理论分析和实验验证。并结合扩展了的微结构特征,提出了基于CS-AdaBoost算法的正面直立人脸实时检测方法,大量实验结果表明本文方法的人脸检测性能达到和超过了目前同类算法的最好性能。(三)提出了一种快速检测复杂背景下平面内任意旋转的正面人脸的新方法。本方法采用一种结构简单的人脸方向分类器进行窗口旋转角度的估计,结合正面直立人脸检测器来验证旋转校正后的窗口,从而检测到平面内任意旋转的正面人脸。大量实验证明本方法人脸检测率接近于直接旋转图像来检测人脸的方法的性能,而优于目前提出的绝大部分正面旋转人脸检测方法,并且具有较快的检测速度。-I-摘要(四)提出了一种复杂背景下人脸姿态估计和多姿态人脸快速检测新方法。本方法将多层结构由简单到复杂、姿态划分由粗到精的人脸姿态估计器与人脸/非人脸分类器组织成一个快速多姿态人脸检测器。这样构成的多姿态人脸检测器不仅可以在快速检测到人脸位置的同时得到人脸的姿态信息,而且可以降低人脸/非人脸分类器的训练难度,提高了分类器的检测性能和姿态估计的准确性。大量实验结果表明本方法具有很好的检测性能。(五)提出了一个解决器官精确定位问题的统一框架,并在此框架的指导下,给出了定位眼睛和嘴巴的具体实现算法。在大量测试集上详尽地比较了本文算法以及其它典型器官定位算法的性能,实验结果表明本文提出的定位算法特别是眼睛定位算法无论是定位精度还是鲁棒性均优于这些方法。论文还特别研究了眼睛定位对于人脸识别性能的影响并尝试利用多个定位结果来进一步提高识别性能。实验结果表明在使用相同识别算法的情况下,基于本文眼睛定位算法的识别性能接近于基于人工标定结果的识别性能,而优于基于其它自动定位算法的识别性能。除了应用于解决人脸检测和器官定位问题外,本文提出的算法对于解决复杂背景下的其它物体如文字、汽车、行人等的定位问题也具有很强的启发意义。关键词:人脸检测,器官定位,姿态估计,支持向量机,AdaBoost,风险敏感分类器设计-II-目录目录摘要.......................................................................................................................IABSTRACT.............................................................................................................III第一章绪论..........................................................................................................11.1人脸检测研究的意义...................................................................................1.1.2人脸检测研究现状......................................................................................2.1.2.1基于启发式规则...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

文秘专家
机构认证
内容提供者

1

确认删除?