一种基于APRIORI性质的多维关联规则挖掘算法的研究

本文档下载自文库下载网,内容可能不完整,您可以点击以下网址继续阅读或下载:http://www.wenkuxiazai.com/doc/13bd41457e21af45b207a82d.html一种基于APRIORI性质的多维关联规则挖掘算法的研究超清晰论文~~~VoI.20ApriINo.22003安徽工业大学学报J.ofAnhuiUniversityofTechnoIogy第20卷第2期2003年4月文章编号:1671-7872(2003)02-0141-04一种基于APRIORI性质的多维关联规则挖掘算法的研究秦锋,杨学兵(安徽工业大学计算机学院,安徽马鞍山243002)摘要:Apriori算法是一种找频繁项集的基本算法,它常常被用于单维关联规则的挖掘,本文在对数据立方体的组织结构以及Apriori算法包括它的一些变形算法进行了深入研究的基础上,给出了一种适用于多维关联规则挖掘的算法,并分别通过理论和实验方法对此算法的性能进行了分析。关键词:数据挖掘;关联规则;多维数据立方体中图分类号:TP312文献标认码:AResearchandanaIysisofmuIti-dimensionaIassociationruIesminingOINFeng,YANGXue-bing(SchooIofComputerScience,AnhuiUniversityofTechnoIogy,Ma'anshan243002,China)Abstract:AprioriisacIassicaIaIgorithmoffindingfreguentitemsetsinnormaIsingIedimensionaIdatatabIe.ThispaperpresentsanewmuIti-dimensionaIassociationruIesminingaIgorithm.bydeepIyanaIyzingthestructureofdatacubeandAprioriaIgorithm.Attheendofthispaper,theefficiencyanaIysisoftheaIgorithminpracticeandtheoryisgiven.Keywords:datamining;associhttp://www.wenkuxiazai.com/doc/13bd41457e21af45b207a82d.htmlationruIes;muIti-dimensionaIanaIysis引言已经受到KDD(KnowIedgeDiscoverinDatabases)是目前人工智能和数据库相交叉的一个热门研究领域,越来越多的关注。数据挖掘(DataMining,简称DM)是KDD的一个十分重要的步骤,其内容涉及各种知识模式的提取算法。关联规则是数据库中存在的一种十分有用的知识模式,其挖掘算法已得到了较为广泛的重(Muti-DimensionaIDataCube)视和研究,并取得了较大的进展。另外,多维数据分析、多维数据立方体等也是近年来涌现出的一些更有效地对数据进行组织、存贮、分析和处理的新方法。多维关联规则是指在各个属性维之间存在的关联规则。由于每个集中的项目来自不同的维,项目集的出现频次可直接从一个立方体方格中得到,这使得挖掘过程效率大大提高。许多学者对Apriori算Apriori算法是一种找频繁项集的基本算法,(singIe-dimensionaIruIes)的挖掘,法进行改进,大大提高了原算法的效率。这些算法被用于单维关联规则而对于多维关联规则的挖掘并不有效,为此作者提出了一种基于Apriori性质的适用于多维关联规则挖掘的算法。1概念1.1关联规则关联规则概念首先由R.AgrawaI等于1993年提出。所谓关联规则,是指客体之间的相互关系。关联规收稿日期:2002-11-05(2002KJ046)基金项目:安徽省教育厅科研经费资助(1962-),男,安徽和县人,安徽工业大学计算机学院副教授,硕士,主要研究方向为人工智能、机器学作者简介:秦锋习。142安徽工业大学学报2003年则形如:意味着目标数据中客体B1,B2,…,Bj倾向于同A1/A2/…/Ai-B1/B2/…/Bj,(4%,70%)客体A1,A2,…,Ai一起出现。其中4%为关联规http://www.wenkuxiazai.com/doc/13bd41457e21af45b207a82d.html则的支持度,70%为关联规则的信任度。1.2Apriori性质需要多遍扫描事务数据库,为了提高频繁项目集的产生效率,可利用一Apriori算法采用的是迭代方法,个重要的Apriori性质来减少项目搜索空间。Apriori性质就是一个频繁项目集的所有非空子集必需也是频繁项目集。这一性质是由Agrawal和Srikant提出并证明的。根据这一性质,进行第遍扫描之前,可先产生候选集C,C可以分两步来产生,设前一步(第-1步)已生成(-1)-频繁集L-1,则首先可以通过对L-1中的成员进行联接来产生候选,L-1中的两个成员即:必需满足在两个成员的项目中有-2个项目是相同的这个条件方可联接,C=L-1!L-1=A!BIA,BcL-1,IAnBI=-2接着,再从C中删除所有包含不是频繁的(-1)-子集的成员项目集即可。1.3数据立方体数据立方体是指含有多维属性的统计实体,设...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

文秘专家
机构认证
内容提供者

1

确认删除?