基于数据挖掘的购物篮分析软件的设计与实现

基于数据挖掘的购物篮分析软件的设计与实现摘要:市场购物篮分析是数据挖掘技术中针对零伟型企业销售数据的分析方式,在有效选择促销活动和营销策略方面有着举足轻重的重要性。通过分析,可以发现隐藏着的顾客消费模式,鉴别出促进商品组合销住的获利机会。木文描述了一个购物篮分析软件从需求分析、详细设计到编程实现的过程,重点说明了开发过程中遇到的问题以及解决问题的方法,为同行开发同类产品提供参考依据。关键词:数据挖掘;购物篮分析;聚类分析:TP311.52文献标识码:A:1007-9599(2011)23-0000-01MarketBasketAnalysisSoftwareDesignandImplementationBasedonDataMiningTongTie激e(NingboHigh-techZoneYaoYaoTechnologyCo.,Ltd.,Ningbo315040,China)Abstract:Market-basketanalysisisaDataMiningtechnologyfortheretailenterprisesales,itisveryimportantforthemarketingstrategychoice.Throughtheseanalyses,wecanfoundthehiddenconsumerspendingpatternsandidentifythemixofgoodssoldforprofitopportunities.Thispaperdescribeshowtobuildmarket-basketanalysissoftware,includingrequirementsanalysis,detaileddesignandcoding.Keywords:Datamining;Market-basketanalysis;Clusteranalysis一、引言商业智能技术在当前的商业社会有着广泛的应用前景,特别是对零传型企业来说非常需要,而数据挖掘技术是商业智能技术的一个重要组成部分。从顾客的购买交易中分析出顾客有可能会同时购买的一类或一组商品美联商品,商场则可根据此分析结果调整商品的摆放位置,把相关商品摆放在一起,以增加商品的销传量同时,还可为促销提供帮助促销一种商品,并避免在同一时期促销同一类相关商品,从而大幅度提高促销的效果。市场购物篮分析在数据挖掘应用领域中有着独特的地位,越来越多的企业通过分析软件的帮助来部署、改变他们的销伟策略。比较典型的如L1本的7.11便利连锁店,他在全世界拥有超过28200个连锁店,他们正是靠着“市场购物篮分析软件”来展开货品的部署及搭配,起到了非常好的效果。二、软件整体结构设计商场的销偲数据从POS机读入,存储到后台的数据库,形成了海量的原始销售数据集。系统首先要做的就是将这些海量数据进行数据数据、清洗和转换,建立一个新先数据仓库。在此数据仓库基础上,软件进行数据挖掘操作,形成有效的数据报表,同时生成时间、门店、商品三个纬度的聚类数据。此过程涉及到数据抽取工具(ETL)的设计,冗余数据的删除以及大量数据的比对。总体架构图见图1。图1:软件总体架构图软件分成数据处理与数据展示两部分。数据处理为服务器端,主要是将多个原始数据库中的数据根据所选条件,抽取到数据仓库中,以多维数据集和数据集市的形式存储,并在数据仓库基础上进行数据挖掘操作,木软件中的数据挖掘主要是聚类分析以及购物篮分析。数据展示为BS模式,用户可以从互联网上根据不同的权限登录查看各类报表,比如用户在某次购买活动中同时购买多类产品的概率等。三、开发难点及解决方案本软件最大的难度在于数据仓库的动态建立过程,其次是在数据仓库基础上所做的数据挖掘工作。针对这两大难点,设计人员做了如下处理:(一)数据仓库的动态建立。由于原始数据是POS机传到后台数据库的不断变化的数据,因此所建立的数据仓库也要随之同步,但同步时间可控制。为此,木软件专门独立开发了ETLT具,用于对不同数据源的数据抽取,可以根据条件单表或者多表生成新的数据表到数据仓库中;同时,数据若有更新,则定时以作业的形式同步到数据仓库。这里涉及到一个多表连接查询海量数据速度的问题。软件采用的方法是多进程多线程模式,一个进程以10万条数据为一队列,以主键排列的方式放到缓存区,排序完成后另一进程负责将数据插入到数据仓库。多线程的方式保证了海量数据的及时插入与更新。(二)数据挖掘操作。当数据仓库建立之后,就需要对数据仓库进行数据挖掘操作,木软件主要采用的数据挖掘技术为购物篮分析及聚类分析。购物篮分析从对顾客的购买行为进行分类开始,接下来的步骤是根据购买者特征,鉴别出提升利润的活跃性信息。一旦购买者特征决定的利润...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

文秘专家
机构认证
内容提供者

1

确认删除?