浅析数据挖掘技术的主要功能及算法

浅析数据挖掘技术的主要功能及算法[摘要]随着当前现代科技的发展,计算机在各方面都得到了广泛的应用,计算机给人们的生活带来了翻天覆地的变化,人们对计算机的重视程度越来越高。但是应该看到,计算机一方面带来了巨大的便利条件,另一方面也带来了很多问题,如果能够对这些数据进行深入的分析,并且从中找到潜在的规律,会对管理者决策起到非常大的作用。本文主要是在分析数据挖掘技术主要功能的基础上,提出了四点关于数据挖掘技术的算法。[关键词]数据挖掘计算机算法中图分类号:TV55文献标识码:A文章编号:1009-914X(2017)06-0138-01正文数据挖掘功能主要是用于指定数据挖掘任务中要找的模型类型。数据挖掘模式可以是说明数据库中数据一般特性的描述性挖掘,也可以是用于在当前数据上进行预测和推断的预测性挖掘。一、数据挖掘技术的主要功能1、描述功能所谓的类/概念描述就是指将数据与类或概念相关联,对每个类/或概念用精确的、简洁的、汇总的方式进行描述。采用的描述方法主要有:数据特征化、数据分区和数据特征比较。数据特征化就是目标类数据的一般特征或特征的汇总。通过数据库查询收集用户指定类的数据,采用多种方式实现数据特征化和汇总,也可以运用多种形式提供数据输出,也可以采用规则形式或者概化关系进行结果描述。2、分类预测功能分类就是找出描述并区分数据类或概念的模型,这样可以较好地使用模型预测类对未知对象类进行标记。基于对训练数据集分析的导出模型可以表示为多种形式,例如:判定树、数学公式、分类规则和神经网络等。其中判定树是一个类似于流程图的树结构,在这个树结构中,树叶代表类分布或者类,分支代表测试的一个输出,每个节点代表一个属性值上的测试。判定树容易转化为分类规则。数据对象的类标记可以用分类来预测,预测通常指被预测的值是数据数值。3、聚类分析功能聚类就是把物理或者抽象对象的集合分组成为由类似的对象组成的多个类的过程。首先就是要把数据对象分组为多个簇或者类,不同簇中的对象差别大,而同在一个类或者簇中的对象相似性较大。就数据挖掘来讲,通过聚类分析用来获取数据分布情况,可以对每个簇进行观察,可以选定一些需要进一步分析的簇。同时,聚类分析还可以作为其他算法的预处理步骤。4、演变分析功能数据演变分析描述行为随时间变化的对象或者趋势,并且对此建立模型。演变分析可能包括时间相关数据的类聚、关联、区分以及特征化等,这些分析的不同特点包括序列或者周期模式匹配的数据分析、时间序列数据分析以及基于类似性的数据分析。二、数据挖掘技术分析方法1、聚类分析方法通过数据聚类分析把相似性特点的数据归为若干个簇,这些簇具有最小的组间相似性和最大的组内相似性。换句话说就是要让同一聚类中的数据达到最大的相似性,让不同类聚中的数据达到最大的不同。聚类分析与分类是不同的,对目标数据库中的数据进行分类的时候,我们是知道存在哪些类,然后标记出来每一条记录属于哪一类。可是聚类是不同的,聚类预先不知道目标数据库中有多少类,以某种度量为标准的相似性,将所有的记录组成的类在不同类聚之间实现最大化,而在同一类聚之间实现最小化。依据聚类的数据情况,可以把聚类分为属性聚类和对象聚类两类,属性聚类常常根据相似系数来度量相似性,对象聚类则通常用距离或相似系数来度量相似性。2、关联分析方法关联是指多个数据项之间联系的规律。关联规则挖掘是数据挖掘中最成熟的技术之一,同时还是数据挖掘的主要研究方向之一。关联规则挖掘可以发现数据库中两个或者多个数据项之间的关系,可以用来寻找大量数据之间的相关性或者关联性,进而可以对事物某些属性同时出现的规律和模式进行描述。由于关联规则不收因变量的限制,所以在数据挖掘中关联规则得到了广泛的应用。关联规则可以进行多维数据之间的相关性分析,所以关联规则适用于发现大型数据集中数据之间的关系。3、分类分析方法在数据挖掘技术中分类分析技术的使用率非常高。分类分析中首先要确定类别概念,根据类别的特征构造模型,标记好每个类别,该标记代表着各类数据的综合信息。然后对簇中对象的共同点以及各个簇间对...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

确认删除?