基于局部学习半监督多标记分类算法

基于局部学习半监督多标记分类算法摘要:针对在求解半监督多标记分类问题时通常将其分解成若干个单标记半监督二类分类问题从而导致忽视类别之间内在联系的问题,提出基于局部学习的半监督多标记分类方法。该方法避开了多个单标记半监督二类分类问题的求解,采用"整体法”的研究思路,利用基于图的方法,引入基于样本的局部学习正则项和基于类别的拉普拉斯正则项,构建了问题的正则化框架。实验结果表明,所提算法具有较高的查全率和查准率。关键词:半监督学习;多标记分类问题;局部学习;标记;正则项中图分类号:TP391.4文献标志码:ASemi-supervisedmulti-labelclassificationalgo-rithmbasedonlocallearningLJia*CollegeofComputerandInformationSciences,Chongqing-NormalUniversity,Chongqing400047,ChinaAbstT8Ct:Semi-supervisedmulti-labelclassificationproblemisusuallydecomposedintoasetofsingle-labelsemi-supervisedbinaryclassificationproblems・However,itre-suItsintheignoranceoftheinnerrelationshipbetweenlabels・Asemi-supervisedmulti-labelclassificationalgo----本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---rithmwaspresented,whichavoidedmultipiesingle-labelsemi-supervisedbinaryclassificationproblemsbutadopt-edtheoverallapproachinthispaper.Onthebasisofundirected-graph,locallearningregularizerfordatapointsandLaplac-eregularizerforlabelswereintroducedandregularization-frameworkoftheproblemwasconstructed・Theexperimentalre-sultshowstheproposedalgorithmhashigherprecisionan-drecalL英文关键词Keywords:semi-supervisedlearning;multi—labelclassificationproblem;locallearning;label;regular-izer0引言多标记学习起源于文本分类研究中遇到的歧义性问题,主要解决一个样本可以同时属于多个类别的问题。现实世界中,多标记学习问题普遍存在[1],例如,在生物信息学中,一个基因序列具有若干个功能,如“新陈代谢”、“蛋白质合成”等;在文本分类中,每篇文档可能同时属于多个主题,如“苹果”、“乔布斯”等;在场景分类中,每个场景图片可能对应于多个类别,如“大海”、“沙滩”等。通常多标记分类问题的一种直观的处理办法是把多标记分类问题转化为一组独立的二类分类问题,其中每一个二类分类问题对应一个标记,每一个样本的标记最终通过组合所有的二类分类问题的结果获得[2]。这种处理方法的好处在于可以利用最新的二类分类算法,缺点是它是孤立地处理分解得到的每一个二类分类问题,未考虑到每个样本所属类标记集中类与类之间的相关性。而在实际问题中,---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---如能充分利用类与类之间的相关性,则可有效地提高学习系统的泛化能力。研究者们已开始考虑样本所属类标记集中类与类之间的相关性的问题[3-4]o进一步地,在多标记分类问题中考虑无标记样本,这就是半监督多标记分类问题。将半监督学习引入多标记学习中,可以降低多标记学习在应用中的成本,使得仅需标注少量的样本,得到更好的学习效果。其中,比较具有代表性工作的有:Liu等[5]提出了一种半监督多标记学习框架,根据输入空间和输出空间的相似性,把半监督多标记学习问题转换为约束非负矩阵因式分解的问题。该方法有效地利用了无标记样本提供的信息,并且考虑了类与类之间的相关性,在训练样本数相对较少时分类效果也很好。陈钢等[6]同时考虑无标记样本和类与类之间相关性两方面的内容,在训练样本和类标记上分别创建了无向图,构建了基于图的正则化框架。再通过求解Sylvester方程来获得无标记样本的标记。孔祥南等[7]利用直推式多标记分类(Transductivemulti-labelclassification,TRAM)方法为每一个训练样本分配一组多标记,首先构造直推式多标记学习的优化问题来估计类标记构成,接着推导出该优化问题的闭型解,最后运用一种有效的算法给未标记样本分配标记集。本文以“整体法”来研究半监督多标记分类问题,利用局部学习来习得样本类标记,利用流形学习来考虑类别与类别之间的相关性,提出了基于局部学习的半监督多类分类算法,实验证明了算法的可行性和有效性。---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---1半监督二分类问题半监督多标记分类问题的数学描述如下:---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

文秘专家
机构认证
内容提供者

1

确认删除?