叶志伟数据挖掘实验指导书算法编程部分

《数据挖掘与数据仓库》实验指导书2013年计算机学院计算应用实验1Apriori算法实现一、实验目的1、掌握Apriori算法对于关联规则挖掘中频繁集的产生以及关联规则集合的产生过程;2、根据算法描述编程实现算法,调试运行。并结合相关实验数据进行应用,得到分析结果。数据和删除数据的操作。实验类型:综合计划课间:2学时二、实验内容1、频繁项集的生成与Apriori算法实现;2、关联规则的生成过程与Rule-generate算法实现;3、结合样例对算法进行分析;三、实验步骤编写程序完成下列算法:1、Apriori算法输入:数据集D;最小支持数minsup_count;输出:频繁项目集LL1={large1-itemsets}For(k=2;Lk-1≠Φ;k++)Ck=apriori-gen(Lk-1);//Ck是k个元素的候选集Foralltransactionst∈DdobeginCt=subset(Ck,t);//Ct是所有t包含的候选集元素forallcandidatesc∈Ctdoc.count++;endLk={c∈Ck|c.count≧minsup_count}EndL=∪Lk;2、apriori-gen(Lk-1)候选集产生算法输入:(k-1)-频繁项目集Lk-1输出:k-频繁项目集CkForallitemsetp∈Lk-1doForallitemsetq∈Lk-1doIfp.item1=q.item1,p.item2=q.item2,…,p.itemk-2=q.itemk-2,p.itemk-1<q.itemk-1thenbeginc=p∞qifhas_infrequent_subset(c,Lk-1)thendeletecelseaddctoCkEndReturnCk3、has_infrequent_subset(c,Lk-1)功能:判断候选集的元素输入:一个k-频繁项目集Lk-1,(k-1)-频繁项目集Lk-1输出:c是否从候选集中删除的布尔判断Forall(k-1)-subsetsofcdoIfNot(S∈Lk-1)THENreturnTRUE;ReturnFALSE;4、Rule-generate(L,minconf)输入:频繁项目集;最小信任度输出:强关联规则算法:FOReachfrequentitemsetlkinLgenerules(lk,lk);5、Genrules递归算法:Genrules(lk:frequentk-itemset,xm:frequentm-itemset)X={(m-1)-itemsetsxm-1|xm-1inxm};Foreachxm-1inXBEGINconf=support(lk)/support(xm-1);IF(conf≧minconf)THENBEGIN输出规则:xm-1->(lk-xm-1),support,confidence;IF(m-1)>1)THENgenrules(lk,xm-1);END;END;结合相关样例数据对算法进行调试,并根据相关实验结果对数据进行分析,四、实验报告要求1、用C语言或者其他语言实现上述相关算法。2、实验操作步骤和实验结果,实验中出现的问题和解决方法。五、注意事项1、集合的表示及相关操作的实现;2、项目集的数据结构描述;参考核心代码如下:(相关的测试main函数可以自己书写。根据频繁k项集生成关联规则相对简单,只需要计算最小置信度即可从频繁K项集中找到所有的满足条件的关联规则。)//对事物进行第一次扫描,生成频繁一项集,并返回一项集中个数intinit_pass(char*item,chartran[len_t][len],intlen,charres_item[len_t][len],floatmin_sup){floatt_sup;intnumber=0;for(inti=0;i<len;i++){intcount=0;for(intj=0;j<len_t;j++){for(intk=0;k<len;k++)if(item[i]==tran[j][k]){count++;break;}break;}t_sup=count*1.0/len;if(t_sup>=min_sup)res_item[number++][0]=item[i];}returnnumber-1;}//生成候选K项集,返回k项集中事物的个数intcandidate_gen(charktran[len][k],charkktran[len][k+1]){chartemp[k],temp1[k],ktemp[k+1];intnumber=0;for(inti=0;i<len;i++){strcpy(temp,ktran[i]);boolflag;for(j=i+1;j<len;j++){strcpy(temp1,ktran[i]);for(intm=0;m<k;m++){if((m<k-1&&temp[m]==temp1[m])||m==k-1){continue;flag=true;}else{flag=false;break;}}if(flag){if(temp[k-1]>temp1[k-1]){strcpy(ktemp,temp1);ktemp[k]=temp[k-1];}else{strcpy(ktemp,temp);ktemp[k]=temp1[k-1]}break;}}flag=judge(kemp,ktran[len][k]);if(flag==true)strcpy(kktran[number++],ktemp);}returnnumber-1;}//判断子集是否在k项集中booljudge(char*srcstr,chardesstr[len][k]){chartemp[k];intcount=0;for(inti=0;i<k-1;i++){for(intj=0;j<i;j++)temp[j]=srcstr[j];for(intj=i+1;j<k+1;j++)temp[j]=srcstr[j];for(intp=0;p<len;p++)if(strcmp(temp,desstr[i])==0){count++;break;}}if(count==k-1)returntrue;returnfalse;}//apriori算法intapriori(charitem[len],chartran[length][len],charres_tran[leng...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

笔杆子文秘
机构认证
内容提供者

为您提供优质文档,供您参考!

确认删除?