基于迁移学习的P2P流量识别蔡霖1,2,景晓军1,2,孙松林1,2,黄海1,2**(1.北京邮电大学信息与通信工程学院,北京,100876;5101520253035402.北京邮电大学可信分布式计算与服务教育部重点实验室,北京,100876)摘要:随着互联网的飞速发展,出现了大量的对等网络(P2P)应用,并且得到了广泛的应用。这为网络运营商管理和监控带来了不小的困难,所以识别P2P应用程序产生的网络流量是十分必要的,如果我们能今早的识别流量,就可以更好的控制它们。在本课题中,我们使用了基于机器学习的分类方法来识别P2P流量。根据以往他人的经验,我们选择了使用基于K近邻法的迁移学习算法的来进行流量分类,并使用奇异值分解对其作出改进。最后本课题根据分类正确率和耗时作为指标比较和评价分类结果。实验表明,改进后的算法是一种高效的流量识别算法,并且能够构建一个快速识别系统。关键词:机器学习;迁移学习;K近邻法;奇异值分解中图分类号:TP391.4P2PTrafficIdentificationBasedonTransferLearningCAILin1,2,JingXiao-jun1,2,SUNSong-lin1,2,HUANGHai1,2(1.SchoolofInformationandCommunicationEngineering,BeijingUniversityoyPostsandTelecommunications,Beijing100876;2.KeyLaboratoryofTrustworthyDistributedComputingandService,BeijingUniversityoyPostsandTelecommunications,Beijing100876)Abstract:WiththerapiddevelopmentofInternet,alargenumberofpeernetworks(Peer-to-Peer)applicationsriseandarewidelyused.Becauseofthis,itismoredifficultfornetworkoperatorstomanageandmonitortheirnetworksinaproperway.Toidentifythepeernetworksapplicationsgeneratingthetraffictravelingthroughnetworksisnecessaryandifwecanidentifythemsooner,wecontrolthembetter.Inthiswork,weusethemachinelearning-basedclassificationmethodtoidentifytheclassesoftheflows.Accordingtopreviouswork,wechoosetransferlearningbasedonKNNalgorithmtoclassifythetraffic,andimprovethemethodbySVD.Finallywecompareandevaluatetheclassificationresultsintermsofthetwometricssuchastruepositiveratioandtimeexpense.OurexperimentsshowthattheourimprovedalgorithmisanefficientalgorithmfortrafficidentificationandisabletobuildaquickidentificationsystemKeywords:Machinelearning;Transferlearning;K-nearestneighbor;SVD0引言近年来,P2P(Peer-to-Peer)技术正在快速发展,P2P应用流量已经占据了整个互联网流量的70-80%,逐渐成为其重要组成部分。P2P应用的不断增加,其抢占宽带的特点造成了网络带宽的巨大消耗,甚至引起网络拥塞,对其他应用的服务质量造成了威胁,损害了网络资源运营者的利益。另一方面,P2P环境下文件共享的方便和选路机制的快速,为网络病毒和不健康信息也提供了更好的入侵机会。因此,实现P2P流量的准确识别对于有效管理网络和合理利用网络资源都具有重要意义。P2P流量识别是对P2P流量和网络行为进行深入的了解和分析的基础,为监控与管理P2P网络提供技术支持。本课题研究基于迁移学习的P2P流量识别方法,关键技术集中在P2P流量特征的提取、高效的将已标记的数据迁移到新的识别任务中,提高迁移学习中的迁移效率的方法。课题目的在于将改进的迁移学习方法应用P2P流量识别,降低对样本的手工标注的依赖程度,提高识别准确度和识别效率。---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---作者简介:蔡霖(1988-),男,硕士研究生,主要研究方向:模式识别、机器学习通信联系人:景晓军(1965-),男,教授,博士生导师,主要研究方向:图像处理、模式识别.jxiaojun@bupt.edu.cn-1----本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---从经济效益上来说,P2P流量检测的成果将有着广阔的市场前景。特别是在当前P2P应4550用日益广泛发展日新月异的时候,在享用P2P提供的各种内容共享服务的同时,P2P应用也给人们带来许多的负面的问题,本文的研究成果将为节省网络资源,提高带宽利用率,保证网络的...