基于Apriori关联规则农民工信息行为模式

基于Apriori关联规则农民工信息行为模式研究摘要:农民工在城市中,边缘的生活水平很大部分体现在信息的边缘化和孤岛化,开展农民工信息行为与信息服务策略研究非常迫切。本文以抽样调查为基础,通过对广东农民工群体的实地调研,分析了农民工信息行为的现状。运用SPSS17.0和SPSSClementine11.1软件,利用Apri-ori关联规则数据挖掘技术,对农民工信息行为调研结果进行了实证分析,发现农民工信息行为的偏好及其规律性,挖掘出农民工信息行为的模式。为发展完善农民工信息服务提出对策建议。关键词:农民工;信息行为;Apriori;关联规则中图分类号:TP311.13文献标识码:A文章编号:1007-9599(2012)20-0000-02国家信息化专家咨询委员会常务副主任周宏仁在“首届中国农民工信息化论坛”上表述“政府的管理和服务必须关注农民工,关心农民工的公共服务需求,信息化也必须为农民工服务。”[1]随着社会信息化发展和信息社会的来临,信息己经成为一种重要的资源。运用数据挖掘方法研究农民工信息行为是定量与定性相结合的综合研究方法,从信息需求、信息查寻、信息获取动机、信息分析与比较、信息吸收与信息利用、信息评价、信息交流与沟通等七部分进行分析,以农民工信息行为历史数据来发现农民工信息行为的潜在模式,并为发展完善农民工信息服务提出建议,它有助于政府及相关部门对农民工信息鸿沟问题的妥善解决;有助于加深社会各方对农民工这一特殊群体的认识,改善农民工“信息弱势"的社会状况,帮助农民工科学、合理地融入城市,促进社会和谐与稳定。1Apriori关联规则算法Apriori算法是关联规则中最著名的方法,1994年由R.Agrawal和R.Srikant提出,Apriori使用逐层搜索的迭代方法,首先找出频繁1-项集的集合LI,L1用于找频繁2-项集的集合L2,而L2用于找L3,如此下去,直到不能找到频繁K-项集,找每个LK需要一次数据库扫描。Apriori算法的核心部分是Apriori-gen(LKT)函数。Apriori-gen(LKT)函数的参数为频繁(KT)-项集的集合LK-1,输出结果为候选K-项集的集合CK,它通过两个步骤来完成[2]。第一步、连接步。11、12是LK-1中的项集(已按字母次序排列),ll[j]表示11的第j项,如果11、12的前K-2项相同,即:(11[1]二12[1])A(11[2]=12[2])A-(ll[K-2]=12[K-2])A(11[K-1]<12[K-1])则称LK-1中的元素11、12是可连接的。连接11、12产生的结果是K-项集11[1]、12[1]-11[K-1],12EK-1],由此连接LK-1中的项集生成CK。第二步、剪枝步。由Apriori性质:频繁项集的所有非空子集也是频繁的。知如果一个候选K-项集的(KT)-子项集不在LK-1中,则该候选也不可能是频繁项集,从而可以从CK中剪掉,CK经压缩后,再进行CK中每个候选的支持计数,这样可以提高频繁项集逐层产生的效率。一旦产生所有候选项集,就扫描数据库,对每个事务,使用subset函数找出该事务中是候选的所有子集,并对每个这样的候选累加计数。最后,所有满足最小支持度的候选形成频繁项集的集合L。从L中产生强关联规则:对于每个频繁项集1,产生1的所有非空子集。对于1的每个非空子集,如果2min_conf,则输出规则"s(l-s)”o其中,min_conf是最小置信度阈值。2农民工行为模式Apriori关联规则分析本文以国家社会科学基金项目“农民工信息行为与信息服务策略研究”(项目编号:09BTQ008)为背景。项目组采用问卷调查方式对以广东为主辐射全国地区的农民工进行整群抽样和偶遇抽样,得到2930份有效问卷进行分析,通过Apriori方法挖掘出农民工信息行为的前项与后项,这对农民工的信息行为分析以及农民工的信息服务十分重要,本文作者对农民工的信息行为的问卷进行SPSS17.0的编辑,再导入到Clementine11.1中,在运用Apriori算法进行分析,通过作者多次分析对比,确定支持度为3%,置信度为40%,以农民工个人特征的基本情况为前项,以农民工信息需求信息渠道、信息过程中遇到困难、信息获取动机、信息利用、信息评价分别为后项,最后以以上所有1-6的项为后项进行Apriori分析。如图1。图1Apriori关联规则建模及部分挖掘结果由Clementine11.1运算得出总共379规则,在进行比较与筛选,删除一些没有研究价值、不符合常识、琐碎或无意义的规则,如:A10=l:个人...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

确认删除?