基于几何流形熵的图片分类方法研究

基于几何流形爛的图片分类方法研究摘要:本文提出了一种新颖的基于几何语义的爛描述符算法。借助爛描述符,可以更好的构造用于图片分类的爛环。通过最小化嫡值获得最优环,此时图片将按语义顺序连接。图片分类过程分为训练和预测,训练步骤搜索各类别的最优坏,在预测步骤中,如果某图片插入某个环中,相对于其他类别环产生最小的爛增量,则该图片属于该环所属的分类。通过研究发现,该方法对于很难分类的容易混淆的图片集仍能产生非常好的效果,但是各类图片须是同一个对象的多视角投影。实验结果表明,该炳描述符方法在该类图片分类过程中具有很优异的性能。关键词:图片分类;儿何流形爛;最优环;禁忌搜索中图分类号O1文献标识码a文章编号1674-6708(2011)53-0089-010引言图片分类即基于图片内容对图片进行分类。过去的很多论文都是基于支持向量机(svm)构建分类器[1],并取得了一定的成果。但是,耍获得很高的图片分类正确率以及稳定性仍具有相当大的挑战。这部分是因为语义相关的图片可能并不是一个线性超平面的特征空间。本文着重探讨这个问题,并提出了一个新颖的基于炳描述符的图片分类算法。文中提出的爛用來描述表示儿何特征的流形特征。通过最小化爛值,将图片数据组织为一个语义连续的环。优化的环实际上为训练图像建立了一个数学模型,而这些模型可用來决定测试图像的分类标签。该分类策略为:首先搜索该测试图像在每个环中最优或算法所能达到的最优位置。对于每个环,测试图像会插入使嫡增加最小的位置,再通过比较所有环的爛增量,测试图片会添加到嫡值增加最小的坏所代表的分组即分类中。在本文的研究中,釆用禁忌搜索方法[2]求解该优化问题。1爛描述符图片的语义表示是图片分类方法成功的关键。本文的研究中,我们应用几何流形爛(geomen)描述特征空间屮得图片的语义相似性。具体而言,给定一个图片特征向量的集合。我们首先定义一个长度为n的闭合且无自相交的环。每个在该环中得向量都与邻居相连,其对应的连接顺序o可以描述为:,其中每一项对应向量的索引。这样集合x的在顺序o下的geomen值为环上各点炳值的平均值。即:(1)且各s(x,o,i)为两分量加权和:空间分量P(x,o,i)和几何分量g(X,o,i)如下:(2)上式a是用来修正空间分量对geomen的贡献大小。geomen表征按照顺序0连接的环的平滑程度。另外,它也是在数据近似性的量度。因为图片排序可以被看做提取一维流行的问题,但实际情况下这是一条曲线,因此我们仅仅考虑在一维曲线上geomen的表示。geomen的空间分量用欧拉距离量度,其中,与为环()中得相邻项。几何分量由两部分组成:曲线曲率k和止则项。即:(3)引入正则项可以修正噪声对曲率的彩响。2图片分类的算法框架因为如果两个类别有一个明显的区别,那么在边界点处爛值便会极大的增加。这个启发我们对一个点的错误分类将会导致该类最优环炳值的急剧增加。反之,如果一个点正确分组进入一个类,该类的最优环的爛值将只会增加一点点。这正是本文基于炳描述符的图片分类算法基木框架的基木思想。因此每个类首先都需要通过训练获得一个最优环即该类别的模型。这样对于待预测图片,通过比较其插入每个故优环的爛增即可获得该图片的分类标签。这样,为了找到最优环,我们需要最小化geomen值,亦即:。在该研究中,我们估计通过简单的禁忌搜索算法获得爛的全局最小值。关于禁忌搜索算法可以参看文献[2]。每个类的最优环实际上训练图片的提取模型。该模型可用于获取测试未知图片的类别标签。分类的策略为在所有环中找到图片q的最优位置。测试图片的类别即位最优位置所在环的类别。3实验木实验采用phog[3]作为特征描述符。实验针对对三个数据集进行了测试:umist人脸数据集,以及自制的背景杂乱的汽车数据集,E机模型数据集。匕机模型数据集通过使用3dmax软件对各种飞机模型进行旋转,并选取角度渲染投影成二维照片获得。同时,我们基于svni的分类器与之相比较。4结论由表1可知,我们的算法框架具有更好的性能,更高的正确率以及可靠性。人脸数据集表明我们的算法框架中在人脸分析中具有很好的分类性能。同时,汽车数据集尽管背景杂乱,但仍具有较高止确率,更比svm高...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

确认删除?