NAiVEBAYES和ADABOOST提升算法应用于葡萄酒的品质测定

NAiVEBAYES和ADABOOST提升算法应用于葡萄酒的品质测定摘要:葡萄酒品质测定是数据挖掘、信息处理的一个重要应用,本文将结合朴素贝叶斯算法和Adaboost算法,通过二分类手段解决多分类问题,并参考相关文献对该问题进打详细的探究和解决,并呈现该算法得到的结果。关键词:NAVEbayes;Adaboost提升算法;应用二分类分类器处理多分类问题中图分类号:TP391文献标识码:A文章编号:1671-2064(2017)08-0037-011背景,应用二分类的分类器处理多分类问题关于二分类处理多分类问题,目前主要有两种手段:一种为“一对多”方法,即把一个问题分为“是”或者“不是”,通过对n个元素进行n-1次处理,将其进行分类;另一种为“多对一”方法,即n个元素,对每一个元素之间比较,逐对分类,进行Cn2次,达到实验目的。目前还有一些其他的方法正在进行研究和学习,希望得到优化算法。2推导分析2.1算法思想二分类的算法是解决分类的一个重要手段,在解决多分类问题时,正如上文所述分为两种主要的方法(“一对多”方法,“多对一”方法),本课题研究着重于前者,“一对多”的问题解决方法。简单来说,算法本身要处理多组数据,我们将数据依次分为不同的两类,“是”或者“否”,选择后将“是”的样本数据留下,将“否”的数据继续重复上述的循环操作,进而递推筛选,得到需要的结果。2.2算法内容这是一个运用NAIVEBAYES算法对问题的解决。NAIVE算法主要体现在概率的精确求法,用该数据的最大概率来对数据进行分类从而达到减小误差的功能因此这里运用NaiveByes算法来计算品质概率,具体的算法应用贝叶斯定理而推导得出。定理的具体内容我们把xi组成的集合叫做训练样本集。依次计算统计各个特征属性即xi的条件概率估计。P(yl|xi),P那么由贝叶斯定理可得:因为分母P(x)对于所有类别均为常数,所以我即有一系列待分类数据xi(i=l、2m)和一系列分类项yj(j=l>2n)用上述公式求得概率P(yj|xi(y2|xi),P(yn|xi),如果各个xi是独立的们只要将分子最大化皆可。又因为xi是条件独立的,因而可以得到以下公式:根据上述分析,我们可以导出贝叶斯分类的流程:如果有P(yk|xi)=max{P(yl|xi),P(y2|xi),P(yn|xi)}则有xieyk。进而将数据分类,类此将葡萄酒的品质进行处理。同时该算法应用Adaboost提升算法,对所处理的数据进行精确分类。该算法的内容主要在于将n个数据赋予相同的权值1/n,然后将数据样本通过弱分类器处理,如果该样本已经被准确的分类则权数增加,否则权数降低。每次添加新的弱分类器通过下一轮迭代,逐步确立分类函数。其应用的方式为通过对阈值的加权求平均比重,进而对数据的分类进行优化。具体的操作如下:首先确立一个样本的集合X:(am,n代表个体的标号数)和一个分类集合Y,(yl,y2...........yk)eYo其次我们确立一个选择函数F(x),来使F(x)->{-1,1}从而作为基本的分类器。令F(x)的误差率为aa为误分类的样本权数的和,然后我们计算F(x)的重要程度用w表示w=(1/2)Xlog[(1-a)/a]有上述表达式可以发现伴随误差的减小,w增大,即n|m,n=l,2,3ex(其中m代表迭代的轮数F(x)的权增大。我们从而进行下面的循环操作,逐步对分类的方法进行优化选择,从而达到降低误差的目的。此时我们移入一个量Zm作为规范化因子,Zm=Lam,nexp[-wykF(xk)],从而使得整体的概率和保持为1,从而运用Zm规范化因子可以使数据形成概率分布。最后我们设计组合各个弱处理器,设其为g(x),g(x)=EwF(x)。我们从而得到最终的处理器d(x)=sign(g(x))=sign(LwF(x)),进而通过此sign函数对数据进行准确的二分类,评定算法的优缺的重要依据为误差的大小,该算法成功的利用合理规范阈值,合理选择等手段有效的降低了分类的误差。3算法构架和流程3.1算法构架Initialization-*DataImput-*ValuableIntializati-*FunctionNaivebayes-^TrainingData-^TestingData*DadaOutput3.2实验步骤具体的操作和流程如下:Data采winequalityred,在FunctionNaveBayes中,Input为Training_Data,Testing_DataandTraining_DatadensitymatrixD•在各?的先验概率密度估算中采用每一类的先验概率密度估计采用的是极大似然估计法,总体密度以及类条件密度估计采用的是窗...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

笔杆子文秘
机构认证
内容提供者

为您提供优质文档,供您参考!

确认删除?