枣果实品质鉴定因子数据的预处理研究

枣果实品质鉴定因子数据的预处理研究李孜洋++申连英++王晓玲++孙晨霞摘要:因子数据预处理是为枣果实品质鉴定提供高质量数据的关键。对枣果实因子数据预处理研究,是将枣果实的颜色、形状、口感、树形、是否丰产等文本信息通过去噪音、处理空白数据、然后运用专家赋值规则库进行Java编程进行自动数字化,再利用归一化公式进行数据转化,从而判定影响枣果实品质优劣的关键因子,为枣农和消费者及时了解枣果实品质提供了简单的理论参考。关键词:枣果实品质鉴定;因子数据;专家赋值规则库;数据预处理;关键因子:S665.1:A:0439-8114(2016)22-5945-04DOI:10.14088/j.cnki.issn0439-8114.2016.22.054ResearchofDataPreprocessinginIdentifyingtheFactorDataofJujubeFruitQualityLIZi-yang,SHENLian-ying,WANGXiao-ling,SUNChen-xia(GraduateSchoolofComputerApplicationTechnology,AgriculturalUniversityofHebei,Baoding071001,Hebei,China)Abstract:DatapreprocessingoffactordataisafactortoprovidehighqualitydatafortheidentificationofJujubefruitquality.ResearchofdatapreprocessinginJujubefruitfactor,ischangingthetextinformationofjujubefruitcolor,fruitshape,fruitflavor,thetreeform,andfertilityintodigitalinformationbydealingwithnoisedata,blankdata.AndusingexpertassignmentrulebasewritesJavaprogrammingtoautomaticdigitization,andthenusesthenormalizationformulafordatatransformation.SothatitdeterminesthekeyfactorsoftheJujubefruitquality.ItprovidesasimpletheoryreferenceforconsumersandJujubeworkerstoknowtheJujubefruitqualityontime.Keywords:identificationofJujubefruitquality;factordata;expertassignmentrulebase;datapreprocessing;keyfactor棗树是中国特有的果树和经济林树种,也是中国第一大干鲜兼用果树。目前中国拥有世界98%以上的枣树资源和几乎全部的枣产品国际贸易,也是近千万中国农民的主要经济来源[1]。鉴定枣品质优劣决定对该品种枣的处理方向,包括枣品种的选育、改良以及消费者选取适合自己需要的枣果实具有决定性作用。影响枣果实品质的因子有很多种,但是影响最终决策目标的因素并非是全部因素,找出决定性因素以降低数据处理规模,提高数据分析效率具有重要作用。对影响枣果实品质的因子数据进行预处理,是将枣专家在果园多次尝试并记录下的文本信息以及给出的鉴定结果与计算机技术相结合,通过整理庞大的数据,找出决定枣果实品质的关键因子,并建立数据库,为枣农以及消费者了解任何品种的枣果实提供参考。1因子数据预处理的必要性数据库通常有一个共同的特点,即存在大量的不完整的、含噪声的和不一致的数据[2]。为了使这些数据能够符合数据分析的要求,提高数据分析的效率和得到清晰的结果,必须进行数据的预处理。对枣果实的因子数据进行预处理,目的是将专家考察后记录的文本信息转化为便于处理的数据。由于实践考察后专家手工记录的原始数据,没有经过系统的整理,规范化程度比较低,例如记录多为:胜似红珍珠、果面平整、酸甜可口等,因子名称不规范、因子属性值不明确、而且还有许多空白值。所以对枣果实品质鉴定的因子数据进行预处理是非常必要的。专家调查的数据量大、需要处理的原数据为文本信息、后期处理(比如品种推荐、枣品质鉴定)等需要数字化、规范化的数据,并且调查工作具有持续性、周期性(专家每年调查数据以及果农或者消费者咨询专家的建议时提供的数据),所以数据预处理在整个决策系统中占有60%的时间,这也给因子数据的预处理带来了更大的难度和更多的工作量,所以数据预处理需要自动化。2因子数据预处理本研究数据预处理包含过滤噪声数据、填充空白数据、文本信息数字化、数据转化与分析以及数据验证(图1)。2.1过滤对噪声数据预处理本研究的源数据是不同专家到果园进行多次实践品尝记录下的,由于每个人记录习惯的不同,所以大多因子名称以及因子属性的表述不一致,而且手工记录导致噪声数据有很多。只有将这些噪声数据进行有效的处理,后期的决策才会更加...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

确认删除?