基于粗糙集及模糊聚类方法属性约简算法

基于粗糙集及模糊聚类方法属性约简算法摘要:属性约简算法是数据挖掘领域发展的核心内容,是确保我们能够从海量的数据中快速、准确的找到最具价值数据内容的关键。但目前的属性约简算法还并不够完善,远远跟不上互联网飞快发展的脚步,存在运算效率还不够髙、应用范围太过狭隘等缺陷,还有待我们去做突破性研究。因此,数据挖掘技术的研究和开发应侧重于努力从属性约简算法上寻找突破口,进而优化算法,提高数据挖掘技术的工作效率粗糙集理论方法及模糊集理论方法在处理不确定数据过程中各具特点,两者都可用来砚察、侧试数据并进行推理。虽然它们之间有一些重处,但两者的粉眼点和计算方法是不一样的,因此不能相互替代,而是必须结合起来使用。该文在研究粗粗集和模栩集理论的基础上将两者相结合,提出了一个断的篇性约简算法。关键词:粗糙集;模糊集;约简算法中图分类号:TP18文献标识码:A文章编号:1009-3044(2012)32-7718-021背景随着网络计算机及数据库的大量建立并迅速发展,世界范围整体数据库所存储的数据总量也随之飞速庞大起来。然而,大量数据库的建立起初目的仅仅是作为存储数据,数据---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---库内部及各数据库之间大部分数据是相互孤立的,许多数据长时间得不到有效利用,长期处于冗余状态,因此,海量的数据虽然丰富,但其知识却处于贫乏状态,这就要求数据库工具具有极强的数据分析能力。数据挖掘领域的发展应能够从海量的数据中快速、准确的找到相应的数据内容,能够正确的理解历史数据并作出合理解释,从而对未来的行为发展作出准确预测。数据挖掘是结合人工智能、统计学、并行计算、模式识别、数据库及模糊智能等技术而兴起的一个全新的科学领域,并受到有关学者的密切关注。一个优秀的数据挖掘方法应具备有效、新颖、高效及转为可视等特点。目前,常用的方法包括数理统计学、概率论、模糊集、粗糙集、遗传算法、神经网络及决策树等,或是结合了上述两种或多种方法。近些年,粗糙集数据挖掘方法从各种方法中脱颖而出,成为了人们的研究重点,它能够在各种运行环境下有效地获取知识,并能对不确定和模糊数据进行不可分辨类型及不可分辨关系处理,过程中不需要对知识做任何附加信息处理或先验知识处理。粗糙集数据挖掘方法首先要做的是将数据系统做约简处理(值约简及属性约简),这同时也是该方法的重要步骤之一。值约简过程是指将数据系统中那些没有价值的重复内容删除。属性约简过程是指在保证数据系统分类能力不发生改变的条件下进行一系列信息变换,最终得到一个---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---最小的条件属性子集。2粗糙集及模糊集纯粗糙集属性约简过程中,要求数据通常具有一定的精确性,要求数据属性对应等价。约简计算中过程中,计算内容必须是经离散化后属性值,而现实的数据系统通常无法做到这一点,例如气象数据系统中湿度、风速、温度等属性值均不是确切的固定值,而是随时间在不断变化。所以,利用粗糙集数据挖掘方法做属性约简前,必须将这些连续属性值做离散化处理,这就有可能在某种程度上对一些数据造成不可避免的数据缺失,这是因为属性值离散化后与其实数值所存在的差异信息没有被保留。粗糙集方法是传统集合论的延拓,它将用于分类的数据嵌入集合中,并视为集合的组成部分。可依据现有的理论来判断对象a是否包含于集合X,通常将其分为三种类型:①已确定集合X包含对象a;②已确定集合X不包含对象a;③集合X可能包括对象a也可能不包含对象a。集合的划分与我们现有的论域知识具有密切关系,具有相对性。论域U是一个有限非空集合,U中的一族与I为等效关系,则称K=(U,I)为其一个近似空间。设x对象及X子集均包含于U,I(x)则表示为与x不可分辨的所有对象构成的一个集合,也就是说,该等效类是由x对象所决定,I(x)包含的所有对象均和x有共同的属性特征。---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---模糊集理论同样也是数据系统中不精确、不完善数据内容的研究理论,侧重于数据的模糊性研究。粗糙集...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

笔杆子文秘
机构认证
内容提供者

为您提供优质文档,供您参考!

确认删除?