数据挖掘的研究报告

关于数据挖掘研究的预研报告本文从数据挖掘(datamining)的含义开始,介绍数据挖掘的过程,主要算法和方法,以及国内外H前的研究情况,及(重点在商业方而)用途,产品和趋势,最后根拯本单位的环境分析寻找解决当前问题的办法。---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---引言两年前国内报刊开始谈及数据仓库技术,现在数据仓库等产品进入商业宣传领域,数据挖掘这个词汇再对1T业界不再陌牛。它似乎与在线分析处理(OnlineAnalyticalProcessing),数据仓库(DataWarehouse),数据库有密切的关系;同时在某些资料里又与数理统计、人I.智能(ArtificialIntelligence)、机器学习(MachineLearning)>知识发现(KnowledgeDiscovery)等有密切联系。我们将随后对这儿个方面作具体的介绍。这里我觉得有必要提及的是山于数据挖掘本身也已不断发展了儿年,本文引用相关资料不仅來自不同的作者,而H•时间跨度也冇几年,此外自己的观点、看法也会随着不断的认识而不断的发展;这是一个我们当前研究的结果。什么是数据挖掘?岂接从名字分析就是从数据中发现规则(关系、模式或趋势)。一个典型的例子就是啤酒与尿布问题:超市从以前的数据中挖掘出周四啤酒为尿布很多成年人同时购买,于是超市经理变安排尿布放在啤酒附近,并因此扩大的销售。这是一个多次被人谈及的例子,它反映了数据挖掘的模型的一种:描述模型。此外不少人声称己把数据挖掘实现到经济领域(如:股票交易所),并获得成功。这里就可以利用数据挖掘的另外一种模型:预测模型来估计经济指数。山于它在经济和商业上的成功,也有人把这类应用形容为5%就算成功的应用。从研究课题的也度出发,我认为应从几个方面来分析:数据挖掘代表一类技术(理论分析),一类相关产品或软件工具,还代表一种解决应用问题的方法和模型(应用分析)。它的特点是以比较大(甚至是海量)的计算机町直接处理的数据为输入,而为解决这问题采用数据挖掘办法的原因是数据虽过人不得以用计算机来解决,或/及缺乏准确的数学模型解决或已有的模型过于困难解决该问题。这里我们介绍一个与数据挖掘最相关的名词:数据库中的知识发现(KnowledgeDiscoveryinDatabase),有时简称知识发现。关于知识发现与数据挖掘在很多情况并不明确区分,但在描述知识发现步骤时把数据挖掘作为知识发现过程的一个部分。简单描述知识发现的步骤(具体在后面冇较详细的描述):定义问题,收集、淸洗和准备数据,数据挖掘,模式解释,规则监控。我们可以理解KDD为数据挖掘的实际应用。数据挖掘理论思想最主要的來源是人工智能的机器学习。可以说是机器学习与大量数据相结合的产物。同时数理统计的回归分析也提供了另一种实现办法。从深层次说完整的数据挖掘体现人工智能那种以知识和学习为核心的经验型方法与高等数学严谨的分析和结合。例如对于数理统计那种建立完整的数学逻辑上的结來也有人试图引进到数据挖掘里。而从数据库角度看,针对这种数据处理操作方式,对原有的数据库提出新的要求(有人认为整个处理的过程来看数据的准备处理能占70%的时间),数据库厂家在原有数据库之上并与在线分析相结合形成了以元数据5et3d3ta)为基本数据的以多维分析处理的新的产品一一数据仓库(数据集市),并表示了数据仓库应是数据挖掘的基础。对于在线分析的区别在这也就从时间的长度为划分,那些可以在儿分钟就可实现的分析技术当然被划到在线分析里。同吋有人针对某些数据处理提出对原有的SQL进行扩展的研究,并以有实现。从应用范围來看,数据挖掘已在市场、金融投资、欺骗识别(frauddetection)、牛:产和制造以及网络管理、牛物、医学、天文、地理等众多领域里出现。在很多领域使川数据挖掘的一般H的是减少花费/开支,提高利润和凹报率。其它特殊/专用使用聚举例:代冃标的市场活动(targetedmarketing),churnmanagement,信用评测(creditscoring)等。从数据挖掘的任务/问题來看有分类(classification)、聚类(clustering)、关联(association)和时间序列/顺序模式(eries/sequencing)儿种分类。关键技术有判定树/决策树(Decisiontrees)>Naive-Bayes、神经网络(Neuralnetwork...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

笔杆子文秘
机构认证
内容提供者

为您提供优质文档,供您参考!

确认删除?