图像语义提取与描述的研究现状及趋势

图像语义提取与描述的研究现状及趋势郭克华,段桂华(中南大学信息科学与工程学院,长沙410083)摘要:图像高层语义和低层视觉特征之间存在的鸿沟,是语义图像检索研究中遇到的一大难题。为了能保证图像语义提取的精度,同时避免降低提取的效率,学者们进行了大量的研究工作,主要集中在图像语义特征的提取、描述和匹配三个问题上进行研究,致力提出有效、完善的图像语义特征提取和描述方法,为语义图像检索提供新的交互式可视化框架。本文对语义图像检索的研究现状和趋势进行了综述和展望。关键词:模式识别;图像检索;语义图像中图分类号:TP391ReviewandTrendofImageSemanticExtractionandRepresentationGUOKehua,DUANGuihua(SchoolofInformationScience&Engineering,CentralSouthUniversity,ChangSha410083)Abstract:Thegapbetweenhighlevelsemanticandlowlevelvisualfeatureshasbecomeachallengingproblemintheresearchofsemanticimageretrieval.Toensuretheextractionprecisionandavoidthereductionofefficiency,researchershavefinishedlargeamountofworktofocusonlheresearchofextraction,descriptionandmatchingofimagesemanticfeatures・Theresearchsaimatproposingnew,effective,systematicmethodstorimagesemanticextractionanddescription,providinganewinleraclivevisualframeworkforsemanticimageretrieval.Inthispaper,areviewandtrendofsemanticimageretrievalispresentedinthispaper.Keywords:patternrecognition;imageretrieval;semanticimage0引言特征提取与描述技术,是模式识别领域的重要研究课题之一,其成果己经广泛应用于图像检索、目标分类、目标检测和人脸识别等领域中。多年来,针对图像特征提取与描述中关键问题的探索,以及对后期匹配效率和效果的改善,一直是学者们孜孜以求的目标,并形成了很多成果(7。随着研究的不断深入,学者们一直在探索如何缩小计算机智能和人类视觉智能的差距。实际上,用人类的智能来识别一个目标,并非仅仅建立在目标的低层视觉特征,如颜色、形状和纹理上,而是充分考虑了冃标所描述的对彖、事件,甚至情感等语义X。如图1所示的左右两个人的头像,以人类的智能来判断,基本上有一些相似之处,甚至可以确定为同一个人;但是,使用计算机皋于低层视觉特征进行分析,却难以判断两个头像的相似之处。图1人类智能认为相似的两个头像Fig.1TwoSimilarFacesforHumanIntelligence从上ifn的例子可以看出,人类智能进行目标识别,其依据往往是建立在目标的低层视觉特征以外的其他特征上。从本质上讲,如果目标的视觉特征在像素数据基础上提取,则一般基金项冃:教育部博上点基金(20090162120069),湖南省科技计划(2009FJ30I6),喃大学博士后基金作者简介:郭克华,(1980-)>男,副教授.主要研究方向:人工智能、模式识别。E-mail:guokchua@csu.cdu.cn只能用于基于低层视觉特征的识别;而口标的语义特征,需要结合目标的低层视觉特征,利用人类智能推理得到。但是,人类的智能的功能丰富多彩,同样的语义可表现出不同的含义,一般说来,和人类智能相关的对彖、事件、情感形成的语义,难以单独通过低层视觉特征来进行表达,因此,在图像的语义和其低层视觉特征之间存在着“语义鸿沟”。要较好地满足用户对冃标进行识别或检索的需求,需要在冃标特征的描述上充分考虑高层语义;如果能够使计算机图像识别系统更符合人类的思维习惯,必将对模式识别的研究产生较大的推动作用。能否设计一种高效、准确并且不用专门耗费大量人工的语义提取方案,并构建一种可以在图像复制、移动的同时,也支持语义匹配和检索的语义存储策略,成为图像语义提取和描述研究的关键性问题。近年来,国内外高校、科研院所大量关注该领域的研究工作,本文针对以上问题进行详细的描述,并基于社会网络⑹应用,展望了其发展趋势。1语义特征提取研究现状目前,由于对人类视觉认知机理了解的局限,认知心理学和视觉神经生理学的成果尚处于建模和验证阶段,还较难广泛地应用到实际中去。从应用的角度讲,比较实际的切入点是将人类视觉认知机理融合在目标特征提取和描述中,...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

确认删除?