数据挖掘算法的改进及其在chord网络中的应用

数据挖掘算法的改进及其在Chord网络中的应用摘要:为了提高数据挖掘算法的效率以及chord资源定位的速度,引入条件模式以及深度优先的策略改进数据挖掘算法,并将改进后的数据挖掘算法应用到chord网络的路由表中,通过删除无效或使用频率极低的路由和增加相关路由信息的方法,加速资源定位过程。最终性能比较实验表明,数据挖掘改进算法不仅体现了优越的算法性能,同时通过挖掘chord网络的关联规则,有效地提升了系统的资源定位性能。关键词:数据挖掘;资源定位;定位机制;频繁项目集;路由信息:tp311.131文献标志码:aabstract:toimprovetheefficiencyofdataminingalgorithmsandthespeedofchordresourcelocation,thepaperoptimizedthedataminingalgorithmbyintroducingtheconditionalmodelandthedepth-firststrategy,andthenappliedthedataminingalgorithminthechordnetworkroutingtable.thepaperspeededuptheprocessofresourcelocationbydeletingtheroutinginformationofinvalidorlowfrequencyuse,andaddingtherelevantroutinginformation.finally,theperformancecomparisonexperimentsshowthattheimproveddataminingalgorithmreflectsthesuperiorperformance,andeffectivelyimprovesthepositioningperformanceofthesystemsresourcesbyminingtheassociationrulesofthechordnetwork.keywords:datamining;resourcelocation;locationmechanism;frequentitemset;routinginformation0引言网络中数据资源分布在各个独立的节点上,如何高效地索引、查找、定位以及访问这些数据信息资源是一个重要的问题,在分布式系统中这些问题同样也是正在研究的热点问题。本文主要研究优化后的数据挖掘技术在网络chord定位中的应用。因为网络在运行的过程中会产生大量的访问日志数据,而数据挖掘技术可以从海量的数据中挖掘出有用的知识,利用从这些日志数据中挖掘出的规则来指导网络的运行,可以改善网络在chord定位速度方面的性能。1数据挖掘算法的分析与改进1.1问题的提出关联规则挖掘是数据挖掘技术中的一个重要研究领域,apriori算法一直作为经典的关联规则挖掘算法被引用。apriori算法的实现过程比较简单,但是每次生成含有不同项目数的候选集时都要扫描数据库,当候选集规模较大时,该算法在时间上的开销就会比较大[1]。另外由于事务数据库中的数据在不断地增加,每次增加数据后,apriori算法计算频繁项目集和生成关联规则这两项工作必须针对增加新数据后的数据库重新做起,这意味着以前生成的频繁项目集和关联规则都没用了,这显然不利于快速高效地发现关联规则[2]。再有当数据库的规模超出主存的容量时,该算法效率较低,不足也就明显体现。频繁模式树(frequentpatterntree,fp-tree)算法采用了一种fpgrowth的方法。它采用了分而治之的策略:在对数据库进行第一次扫描后,把找到的频繁集压缩进一棵fp-tree,同时依然保留其中的关联信息。随后再将fp-tree分化成一些条件库,然后再对这些条件库分别进行挖掘。fpgrowth方法挖掘过程中将会产生所有的频繁项集,当数据集中包含大量频繁项集时,fp-tree算法性能较差,而且大量的cpu时间被fp-tree遍历占用[3-4]。本文在apriori算法及fp-tree算法的基础上,提出了一种有效且快速发现最大频繁项目集的算法——基于条件模式的最大频繁项集的挖掘算法。它一方面引入条件模式,很好地达到了压缩事务数据库的目的;另一方面充分利用了挖掘技术的特点,采用深度优先的策略,将计算量压缩到很小。该算法在挖掘最大频繁项目集时,具有更优越的性能。1.2数据挖掘算法的改进思想本文所研究的数据挖掘改进算法采用深度优先搜索策略和数据库的垂直表示形式,无需重复扫描数据库,节省了算法的执行时间。改进算法的思想是:首先从根节点执行基于深度优先的搜索算法,这样可以更有效到达最大频繁项目集所对应的叶子节点;其次,在搜索算法的执行过程中,可以根据频繁扩展策略对相关节点进行修剪操作,而修剪节点操作与树节点的排序有一定的关联性。因此,可以对树在搜索算法执行之前进行适当的排序,这样就可以使树达到瘦窄状态。需要注...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

笔杆子文秘
机构认证
内容提供者

为您提供优质文档,供您参考!

确认删除?