随机森林在棉蚜虫害等级预测中的应用

随机森林在棉妍虫害等级预测中的应用摘要:棉虫牙是棉区的主要农业害虫之一,对于棉花的产量和质量影响较大。为了准确地对棉虫牙虫害的等级进行分类预测,以便采取科学的防治措施,该研究对山东省滨州地区1990-2009年的20年中5-9月的平均气温、降水量、相对湿度、日照时数等气象数据、棉酚天敌数据与棉酚虫害数据进行了相关性分析,筛选后保留的影响因子数据构建随机森林棉酚虫害等级预测模型。结果表明:随机森林模型的00B为5.7%,等级的误分率为0.09和0.019,经测试集检验,模型预测的准确率为82.2%0模型泛化性好,等级的误分率低。关键词:随机森林;棉虫牙;气象因子;等级预测中图分类号TP391;S431文献标识码A文章编号1007-7731(2017)01-0018-03Abstract:Cottonaphidisoneofthemainagriculturalpestsofcotton,forgreatereffectsontheyieldandqualityofcotton.Inordertoaccuratelyclassifythelevelofcottonaphidpestforecast,throughtheacquisitionofBinzhouareaofShandongProvinceregionfromMaytoSeptemberin1990-2009,averagetemperature,precipitation,relativehumidity,sunshinehoursandothermeteorologicaldataandcottonaphidenemiesandAphisgossypiipestdatacorrelationanalysis,screeningofgossypiilevelpredictionmodel.ExperimentalresuItsshowthattherandomforestmodelof00Bwas5.7%,thelevelofpointerrorratewas0.09and0.019,haveexaminedthetestsetandmodelpredictionaccuracyis82.2%.Thegeneralizationofthemodelisgood,andtherateofmisclassificationislow.Keywords:Randomforest;Cottonaphid;Meteorologicalfactors;levelPrediction棉花是我国重要的经济作物之一,山东省滨州地区棉花种植面积广泛。棉呀是造成棉花减产的主耍害虫z—,由于其发生时间长,繁殖速度快,危害严重且防治困难,在一定程度上制约了滨州地区棉花的优质和高产。而气象条件和天敌数量均对棉蜗产生直接的影响,为有效防治棉蜗的危害,学者们对棉蜗虫害的预测进行了大量的研究。如张金[1]等采用逐步判?e分析法分析了气候条件和棉蜗虫害等级的关系,构建了新疆石河子地区棉呀多元线性回归预测模型。吴昊[2]等对九江鄱阳湖地区棉呀发生规律和预报方法进行了研究,以丰富该地区的棉酚预报方法。慕彩云[3]等对东疆地区的棉虫牙预测构建了日预测、月预测及旬预测的线性回归模型。目前,在棉蜗预测模型的构建中多运用线性回归,但是在线性回归分析中采用何种因子进行表达只是一种推测,从而影响了因子的多样性和不可测性,使得回归分析在某些情况下的使用受到限制。随机森林在运算量没有显著提高的前提下提高了预测精度,并但对于多元共线性不敏感,对缺失数据和非平衡数据比较稳健[4],而且模型训练速度快,样本选择具有随机性,不易产生过拟合。为此,本实验将随机森林用于棉虫牙虫害等级的短期预测中,提高了棉虫牙预测的效率和准确率,从而可以及时地为农业生产者提供准确的预警信息,提前采取防治措施,降低棉酚对棉花的危害。1随机森林算法随机森林算法[5]是2001年加利福尼亚大学的LooBroiman提出的,是一种由多个决策树组成的集成分类算法。集成学习现已成为国际机器学习界研究的热点机器学习范式[6]。随机森林中引入了2个随机化过程,使得不同的分类树具有不同的分类能力,当输入待分类样本时,随机森林输出的结果由每个决策树的分类结果进行投票决定[7-8]。随机森林是一个树型分类器的集合。该算法中的元分类器是由CART算法组成但没有剪枝的分类冋归树。参数X是输入向量;是独立分布的随机向量,决定单棵决策树的生长过程。随机森林屮最重要的是如何构造一个随机森林。随机森林的算法步骤如下:(1)假设数据的样本数为N,那么每棵决策树采样的样本数就是N。在这N个样本中有放回的随机选择n(n〈N)个样本,用这n个样本来训练一棵决策树。(2)每个样本有M个属性,每棵决策树的节点需要分裂时,从这M个属性中随机的选取m(m<M)个属性,从这m个属性中依据Gini指标选择最佳属性作为当前节点的分裂属性。(3)每棵决策树的每个节点分裂都是按照步骤(2)进行,使每个节点的不纯度达到最...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

文秘专家
机构认证
内容提供者

1

确认删除?