基于非负稀疏表示的多标签学习算法#陈思宝1,2,徐丹洋1,2,罗斌1,2*(1.安徽大学计算机科学与技术学院,合肥230601;5101520253035402.安徽省工业图像与分析重点实验室,合肥230039)摘要:为提高多标签数据分类性能,提出基于非负稀疏表示多标签学习算法。首先基于LASSO稀疏最小化方法,将测试样本用训练样本集进行非负稀疏线性重构,得到稀疏的非负重构系数;然后根据非负重构系数计算测试样本的各个标签隶属度;根据隶属度的排序完成多标签分类。提出一个全局最优的迭代更新求解算法及其相应的分析与证明。该算法保留了更多的重构后图像的信息。在多标签分类识别的实验结果中显示所提出的方法比经典的ML-SRC和ML-KNN方法性能更优。关键词:多标签学习;非负稀疏表示;LASSO稀疏最小化;非负重构中图分类号:TP391.4AMulti-LabelLearningAlgorithmBasedonNon-negativeSparseRepre-sentationCHENSibao1,2,XUDanyang1,2,LUOBin1,2(1.CollegeofComputerScienceandTechnology,AnhuiUniversity,HeFei230601;2.KeyLaboraryofIndustrialImageProcessingandAnalysisofAnhuiProvince,HeFei230039)Abstract:Toimprovethemulti-labeldataclassificationperformance,anewmulti-labellearningalgorithmbasedonnon-negativesparserepresentationisproposed.Firstly,basedonLASSOsparseminimization,atestingsampleislinearlyreconstructedbythetrainingsampleswithnon-negativesparsecoefficients.Then,usingthesparsenon-negativereconstructioncoefficients,themembershipsofalllabelsonthetestingsamplearecalculated.Finally,theclassificationisachievedbyrankingthesememberships.Inaddition,aniterativeupdateglobaloptimizationalgorithmanditsassociatedtheoreticanalysisareprovidedtosolvetheproposedmodel,whichreservesmoreimageinformationafterreconstruction.Experimentalresultsonmulti-labelclassificationshowthattheproposedmethodachievesbetterperformancethanclassicalML-SRCandML-KNN.Keywords:multi-labellearning;non-negativesparserepresentation;LASSOsparseminimization;Non-negativereconstruction0引言多标签学习的目的就是根据已知的训练样本数据,通过多标签学习算法来预测测试样本中的标签信息。因为现实世界中多标签现象随处可见,以及图像检索和管理系统的发展使多标签学习算法的研究成为一个有巨大潜力的研究方向。目前多标签学习算法研究中已经提出了一些有效的算法。文献[1]的多标签分类算法Rank-SVM对基因数据进行了分类;文献[2]将多标签分类问题分解成多个相互独立的两类问题;文献[3]基于稀疏表示的多标签分类算法ML-SRC,对图像进行了稀疏重构;文献[4]将传统的k近邻算法和贝叶斯理论相结合来完成多标签学习。由于计算机所需处理的信息量迅速膨胀,一种高效的数据表示方式稀疏表示(Sparserepresentation)[5]被提出。基于稀疏表示的多标签分类算法ML-SRC就是利用稀疏表示来解决多标签学习问题。该算法利用训练样本集在LASSO[6]稀疏最小化约束下表示待分类样本,---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---基金项目:国家自然科学基金资助项目(61202228,61073116);高等学校博士学科点专项科研基金联合资助课题(20103401120005);安徽省高校自然科学研究重点项目(KJ2012A004)作者简介:陈思宝,(1979-),男,副教授,主要研究方向:图像处理与模式识别。sbchen@ahu.edu.cn-1----本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---大于0的系数对应的训练样本被看作与待分类样本正相关[7],所得稀疏解含有判别信息,通45505560过隶属度的计算[8]可用对标签进行分类和识别。然而该算法在处理稀疏系数的过程中可能会丢失应用于多标签识别的有用信息。本文对基于稀疏表示的多标签学习算法改进后提出了基于非负稀疏表示的多标签学习算法。本文算法中测试样本通过训练样本在l1范数约束下的非负稀疏表示[9~11]得到其稀疏系数。该稀疏系数中包含了更多测试样本中各标签的判别信息。本文算...