浅谈数据挖掘技术及其相关问题解析

浅谈数据挖掘技术及其相关问题解析摘要:数据挖掘(DataMining,简称DM),又称数据库中的知识发现(KnowledgeDiscoveryinDatabase,简称:KDD),是指从大型数据库或数据仓库中提取隐含的、未知的、特殊的及有潜在应用价值的信息或模式。本文在了解数据挖掘的定义和市场前景的基础上,结合当今企业对数据挖掘技术的重视和数据挖掘技术对企业发展带来的巨大效益的现状,从众多方面提出和分析了数据挖掘技术在发展和应用过程中面临的主要问题。并且结合开放网格服务体系(OGSA)的思想,采用分层描述的方法,围绕功能、结构、调度成本和网格服务目标等,设计了一种五层的网格数据挖掘体系结构(GDMA)。该体系结构以服务为核心,通过统一的网格服务接口屏蔽资源的异构性,并针对用户的特殊需求,设计了基于工作流和Web服务的数据挖掘客户端。关键词:网格数据挖掘体系结构开放网格服务体系数据挖掘网格计算中图分类号:TP311文献标识码:A文章编号:1007-9416(2014)04-0141-04数据挖掘,顾名思义就是从大量的、不完全的、有噪声的、模糊的数据中挖掘出有用的信息和知识的过程。这些信息和知识是隐含的,先前未知的,对决策有潜在价值的。随着计算机技术和信息技术应用的越来越广泛,企业每年都要积累大量的数据,运用数据挖掘技术在这些大量数据当中我们可以找出有价值的知识、规则或高层次的信息为决策提供依据,从而使数据仓库成为一个丰富可靠的资源为企业决策者服务。数据挖掘技术主要又分成“关联规则”、“时间序列”、“聚集”、“分类”、“估值”等这几类。有效运用数据挖掘技术有助于企业分析关键因素,发现业务规律,揭示隐藏趋势,预测未知结果,达到增收节支的目的,处于更有利的竞争位置。人类进入信息化时代以后,短短的数年时间,积累了大量的数据,步入了“大数据时代”,使人类以前所未有的速度、厚度、细度和准确度对信息的掌握成为可能。面对大量的数据,基于充足的数据基础,对数据进行挖掘与分析,并将其运用于企业的精细管理,也就不仅成为可能而且势在必行。以数据网格为基础,构建分布式数据挖掘体系,对于解决海量数据挖掘问题具有重要的理论意义和实用价值。目前网格挖掘体系结构主要存在两方面的问题:(1)网格挖掘体系结构标准不一,采用的技术也不同。目前几种主流的网格挖掘体系结构都是针对不同的应用而设计的。(2)网格中间件不够成熟。网格中间件实际上是一种网格操作系统,网格操作系统、网格应用与计算机操作系统和计算机应用软件相比,存在很大的差距。只有当网格中间件与网格应用像目前计算机的系统软件和应用软件一样方便时,才能展现网格的真正优势。目前还没有一种网格体系结构能适应所有的应用,应借鉴已有网格体系结构的优点,设计适用于网格数据挖掘的体系结构。网格体系结构从最开始的五层沙漏体系(FLSGA),发展到开放网格服务体系(OGSA),再发展到Web服务资源框架(WSRF)。1数据挖掘的概念数据挖掘(DataMining,简称DM),又称数据库中的知识发现(KnowledgeDiscoveryinDatabase,简称:KDD),是指从大型数据库或数据仓库中提取隐含的、未知的、特殊的及有潜在应用价值的信息或模式,它是数据库研究中的一个很有应用价值的新领域,融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术[2]。这些数据可以是结构化的,如关系数据库中的数据,也可以是半结构化的,如文本,图形,图像数据,甚至是分布在网络上的异构型数据。这些知识可以表示为概念、规则、规律、模式等形式。发现知识的方法可以是数学的,也可以是非数学的,可以是演绎的,也可以是归纳的。发现了的知识可以被用于信息管理、查询优化、决策支持、过程控制等,还可以进行数据自身的维护。随着数据挖掘技术的发展,数据挖掘的重要性己经被越来越多的人认可,它是利用己知的数据通过建立数学模型的方法找出隐含的业务规则。数据挖掘借助了多年来数理统计技术和人工智能以及知识工程等领域的研究成果构建自己的理论体系,是一个交叉学科领域,可以集成数据数据库、人工智能、数理统计、可视化、并行计算等技术。本节中将从数据挖掘与数据仓库的关系...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

文秘专家
机构认证
内容提供者

1

确认删除?