一种基于信息熵建立决策树的算法

文档大全文档大全可免积分在线阅读和下载文档包括资格考试、工作总结等大量word文档免费下载「•种基于信息嫡建立决策树的算法搜索文档|•文档大全•工作范文•求职职场•表格模板•总结汇报•经管营销-高等教育•高中教育•初中教育•小学教育•外语考试•资格考试•教学研究•游戏攻略您的位置:所有分类工程科技信息与通信一种基于信息嫡建立决策树的算法一种基于信息嫡建立决策树的算法信息论给出了信息的数学本质,提出了用热力学中的嫡来度量信息量的人小。分类是一个重要的数据挖掘问题,在训练数据集上建立分类树的关键是如何选择决策树每一个内部结点的测试属性。传统的决策树建立算法利用信息论中嫡的概念选择属性,具有偏向于取值较多属性的缺点。本文分析了信息论中有关爛的一些基本概念和含义,讨论了它们在挖掘分类树中的应用,利用互信息设计了一个建维普资讯http://www.lmpi.com第1卷第19期2006年2月常州工学院学报JunloaghulsttfTcnlgorafChnzontueoehooyiVo・9No111・Fb20e・06种基于信息嫡建立决策树的算法朱宇光黄树成(常州工学院计算机信息工程学院,江苏常州230)102摘要:信息论给岀了息的数学本质,出了用热力学中的嬌来度量信息量的大小。分类是一信提个重要的数据挖掘问题,在训练数据集上建立分类树的关键是如何选择决策树每一个内部结点的测试属性。传统的决策树建立算法利用信息论中爛的概念选择属性,具有偏向于取值较多属性的缺点。本文分析了息论中有关爛的一些基本概念和含义,信讨论了它们在挖掘分类树中的应用,利用互信息设计了一个建立分类树的算法,克服了传统算法的缺点。关键词:息论;;据挖掘;策树信嫡数决中图分类号:P0T31文献标识码:A文章编号:7—4620)10501103(060—05—560引言从海量数据屮发现有用的信息具有广阔的应用前景,数据挖掘技术应运而生。数据挖掘是从大量的数据中提取对用户未知的、有用的、最终可理解的模型或模式的非平凡过程。分类是数据挖掘的一个重要问题,己得到广泛的研究。已有的儿种分类模型中,1在1由于决策树具有很多的优点而得到广泛的应用。首先,决策树很直观,分类规则很容易理解;其次,_2决策树无需用户设置参数,特别适合探寻性知识发现;,比于其它方法,第三相决策树可以快速地建立;最后,【4决策树可以取得与其它分类算法相当的、吋更高的准确率。有J在决策树建立过程屮,关键是如何选择属性进行划分样本数据。早期由IIn等人提出的CS学utL习算法,一没有给出如何选取测试属性。ut6Hn曾经提岀几种标准,但在决策树的各种学习算法当中,最为有影响的是Qiaulnn于1799年提出的以信息论中的信息嫡为基础、信息增益为标准来选取测试属性的13算法oD[应用信息论的知识建立的决策树具有较好的性能。后来的许多算法,TJ比如S[、LQSRN_PTT,.都是基于信息爛建立决策树的算法。341信息论相关知识信息与信息科学是两个常见的名词,它们的内容十分广泛,尤其在当今的信息社会中,有着十分重要的意义与丰富的含义。哲学家把信息与物质、能量并列,作为构成世界的三大要素之一,并成为推动当今社会文明与发展的主要因素。没有信息,世界将变得杂乱无章。但是,什么是信息?信息的数学本质是什么?信息如何度量等问题一直是人们所关心的。人们迫切需要信息的理论基础。信息论的产牛以1498年香农的奠基性论文为标志,至今已有50多年的历史。在这50多年中,以收稿日期:050-620-91I—ord文档免费下载:一种基于信息爛建立决策树的算法(共]页,当前第1页)你可能喜欢•ID3算法•数据挖掘•联机分析处理•数据仓库实例•决策树例题•数据恢复•决策树模型•ID3算法实验报告12页•ID3算法可视化解读15页•1D3算法的理论基础4页•ID3算法在绩效评价中的应用研究2页•ID3算法及其改进5页更多与“ID3算法”相关的内容>>•【精品资料】云计算与数据挖掘116页•Wekc数据挖掘软件使用指南14页•数据挖掘课程案例教学研究4页•数据挖掘应用案例12页•数据挖掘16页更多与“数据挖掘”相关的内容>>•数据仓库与联机分析处理63页•数据仓库与联机分析处理技术25页•商业件能之联机分析处理5页•第三章联机分析处理0MP73页•ORACLE...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

笔杆子文秘
机构认证
内容提供者

为您提供优质文档,供您参考!

确认删除?