基于迁移学习的P2P流量识别

基于迁移学习的P2P流量识别蔡霖1,2,景晓军1,2,孙松林1,2,黄海1,2**(1.北京邮电大学信息与通信工程学院,北京,100876;5101520253035402.北京邮电大学可信分布式计算与服务教育部重点实验室,北京,100876)摘要:随着互联网的飞速发展,出现了大量的对等网络(P2P)应用,并且得到了广泛的应用。这为网络运营商管理和监控带来了不小的困难,所以识别P2P应用程序产生的网络流量是十分必要的,如果我们能今早的识别流量,就可以更好的控制它们。在本课题中,我们使用了基于机器学习的分类方法来识别P2P流量。根据以往他人的经验,我们选择了使用基于K近邻法的迁移学习算法的来进行流量分类,并使用奇异值分解对其作出改进。最后本课题根据分类正确率和耗时作为指标比较和评价分类结果。实验表明,改进后的算法是一种高效的流量识别算法,并且能够构建一个快速识别系统。关键词:机器学习;迁移学习;K近邻法;奇异值分解中图分类号:TP391.4P2PTrafficIdentificationBasedonTransferLearningCAILin1,2,JingXiao-jun1,2,SUNSong-lin1,2,HUANGHai1,2(1.SchoolofInformationandCommunicationEngineering,BeijingUniversityoyPostsandTelecommunications,Beijing100876;2.KeyLaboratoryofTrustworthyDistributedComputingandService,BeijingUniversityoyPostsandTelecommunications,Beijing100876)Abstract:WiththerapiddevelopmentofInternet,alargenumberofpeernetworks(Peer-to-Peer)applicationsriseandarewidelyused.Becauseofthis,itismoredifficultfornetworkoperatorstomanageandmonitortheirnetworksinaproperway.Toidentifythepeernetworksapplicationsgeneratingthetraffictravelingthroughnetworksisnecessaryandifwecanidentifythemsooner,wecontrolthembetter.Inthiswork,weusethemachinelearning-basedclassificationmethodtoidentifytheclassesoftheflows.Accordingtopreviouswork,wechoosetransferlearningbasedonKNNalgorithmtoclassifythetraffic,andimprovethemethodbySVD.Finallywecompareandevaluatetheclassificationresultsintermsofthetwometricssuchastruepositiveratioandtimeexpense.OurexperimentsshowthattheourimprovedalgorithmisanefficientalgorithmfortrafficidentificationandisabletobuildaquickidentificationsystemKeywords:Machinelearning;Transferlearning;K-nearestneighbor;SVD0引言近年来,P2P(Peer-to-Peer)技术正在快速发展,P2P应用流量已经占据了整个互联网流量的70-80%,逐渐成为其重要组成部分。P2P应用的不断增加,其抢占宽带的特点造成了网络带宽的巨大消耗,甚至引起网络拥塞,对其他应用的服务质量造成了威胁,损害了网络资源运营者的利益。另一方面,P2P环境下文件共享的方便和选路机制的快速,为网络病毒和不健康信息也提供了更好的入侵机会。因此,实现P2P流量的准确识别对于有效管理网络和合理利用网络资源都具有重要意义。P2P流量识别是对P2P流量和网络行为进行深入的了解和分析的基础,为监控与管理P2P网络提供技术支持。本课题研究基于迁移学习的P2P流量识别方法,关键技术集中在P2P流量特征的提取、高效的将已标记的数据迁移到新的识别任务中,提高迁移学习中的迁移效率的方法。课题目的在于将改进的迁移学习方法应用P2P流量识别,降低对样本的手工标注的依赖程度,提高识别准确度和识别效率。---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---作者简介:蔡霖(1988-),男,硕士研究生,主要研究方向:模式识别、机器学习通信联系人:景晓军(1965-),男,教授,博士生导师,主要研究方向:图像处理、模式识别.jxiaojun@bupt.edu.cn-1----本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---从经济效益上来说,P2P流量检测的成果将有着广阔的市场前景。特别是在当前P2P应4550用日益广泛发展日新月异的时候,在享用P2P提供的各种内容共享服务的同时,P2P应用也给人们带来许多的负面的问题,本文的研究成果将为节省网络资源,提高带宽利用率,保证网络的...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

确认删除?