基于卷积神经网络的行人检测技术的研究综述

基于卷积神经网络的行人检测技术的研究综述谭玉枚余长庚摘要:隨着深度学习方法在行人检测领域的深入应用,基于卷积神经网络的行人检测技术在特征学习、目标分类、边框回归等方面表现出的优势已愈发突出。因此,本文从对传统的行人检测方法和基于卷积神经网络的行人检测技术进行优劣比较切入,概述了卷积神经网络的基础构架,以此引出对当前常用的基于卷积神经网络的常见行人检测技术及其优缺点,最后讨论了现有基于卷积神经网络算法实现行人检测存在的不足和指出今后发展方向。关键词:卷积神经网络;行人检测;目标分类;边框回归:TP391.41:ADOI:10.3969/j.issn.1003-6970.2020.07.006本文著录格式:谭玉枚,余长庚.基于卷积神经网络的行人检测技术的研究综述[J].软件,2020,41(07):31-36+75ReviewofPedestrianDetectionBasedonConvolutionNeuralNetworkTANYu-mei,YUChang-geng(CollegeofInformationandCommunicationEngineering,HezhouUniversity,hezhou542899,China)【Abstract】:Withthein-depthapplicationofdeeplearninginpedestriandetection,theadvantagesofpedestriandetectionbasedonconvolutionalneuralnetworkhavebecomemorepronouncedinthefieldsoffeaturelearning,objectclassification,borderregressionandothers.Anoverviewofbasicstructureofconvolutionalneuralnetworkisdonebycomparingtheadvantagesanddisadvantagesofthepedestriandetectionbasedonthetraditionalmethodandconvolutionalneuralnetwork.Onthisbasis,thepaperintroducesthecommonpedestriandetectiontechnologiesbasedonconvolutionalneuralnetworkanditsadvantagesanddisadvantages.Atlast,thepresentdeficienciesexistinginpedestriandetectionbasedonCNNarebrieflydiscussedandthefuturedirectionsarepointedout.【Keywords】:Convolutionneuralnetwork;Pedestriandetection;Targetclassification;Borderregression0引言目前,在无人驾驶、智能视频监控和机器人视觉感知[1]等应用背景下,计量机视觉研究领域中的行人检测技术受到国内外学术界的广泛关注和深入研究。传统的行人检测方法侧重于在特征提取和分类方面提升检测准确率。其中,具有代表性的方法有:HOG(histogramoforientedgradient)+SVM(supportvectormachine)[2]、Harr+Adaboost[3]、基于多特征融合的粒子滤波多目标跟踪方法[4]等。该类方法把特征提取和分类训练分离为两个独立过程,往往受限于特定环境条件(如小尺度变换处理等[5])、设定低阶特征(如纹理特征等),并且不同的特征与分类器适用程度各异,导致特征表达能力不足、可分性较差、可移植性差。为更好提升行人检测技术的泛化性和鲁棒性,Hinton在2006年提出了自下向上方式自动逐层学习数据高阶特征的深度学习方法[6],引起了机器学习领域学者的广泛关注。相对传统行人检测方法,该类方法避免了复杂的特征提取和数据分类重建过程,学习到的高阶特征表达能力更强、更丰富。其中,卷积神经网络(convolutionalneuralnetwork,CNN)[7]作为常见深度学习模型,因其精度高和速度快的优势相比深度信念网络结构(DeepBeliefNetwork,DBN),堆叠自动编码器(StackedBeliefNetwork,SBN)使用更为广泛[8],已成为当前计算机视觉领域研究热点。该方法整合了特征提取、特征选择、特征分类处理过程,并通过端对端训练和权值共享结构模拟生物神经网络,自动提取图像的纹理、颜色等复杂特征,较好的提升了目标识别精度。1卷积神经网络的基础构架卷积神经网络建立在认知机(Neocognitron)[9]基础上,把卷积运算和采样操作引入到人工神经网络,使提取出的特征具备一定的空间不变性,并最早作为分类器应用于手写字符、小图片识别中,取得了不错成效[10-12]。因此,卷积神经网络逐渐成为当前图像识别领域的研究热点之一[13]。如图1所示,典型的卷积神经网络主要由输入层、卷积层、池化层、全连接层和输出层组成。首先,输入层主要用于接收输入图像,并可进行简单预处理。其次,由多个卷积层和池化层构成特征提取器,完成对图像高层特征的提取。最后,由全连接层...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

文秘专家
机构认证
内容提供者

1

确认删除?