基于KMUS-RF算法的复杂产品关键质量特性识别研究

基于KMUS-RF算法的复杂产品关键质量特性识别研究柳嘉昊【摘要】复杂产品生产数据具有高维度、不平衡的特点,为在复杂产品的生产阶段有效识别关键质量特性,及时进行质量控制,论文提出了一种基于聚类欠采样的改进随机森林算法(RandomforestalgorithmbaseonK-Meansclusteringundersampling,KMUS-RF),利用K-Means算法对多数样本进行聚类,并根据聚类结果进行多次欠采样形成多个平衡数据集,以随机森林为基分类器进行识别,最终根据分类过程中的特征重要性输出关键质量特性集。算例表明,KMUS-RF算法相比现有的多种分类器有良好的整体分类性能,并能显著降低复杂产品分类的第二类错误率,满足产品实际生产需求。【Abstract】Theproductiondataofcomplexproductshavethecharacteristicsofhighdimensionandimbalance.Inordertoeffectivelyidentifythecritical-to-qualitycharacteristicsintheproductionstageofcomplexproductsandtimelycontrolthequality,thispaperproposesanimprovedrandomforestalgorithmbaseonK-Meansclusteringundersampling(KMUS-RF).K-Meansalgorithmisusedtoclusterthemajorityofsamples,andmultipleundersamplingisperformedaccordingtotheclusteringresultstoformmultiplebalanceddatasets.Therandomforestbasedclassifierisusedforrecognition,andfinallythecritical-to-qualitycharacteristicssetisoutputaccordingtothefeatureimportanceintheclassificationprocess.NumericalexamplesshowthatKMUS-RFalgorithmhasgoodoverallclassificationperformancecomparedwithexistingclassifiers,andcansignificantlyreducethetypeIIerrorrateofcomplexproductclassification,andmeettheactualproductionneedsofproducts.【关键词】关键质量特性;不平衡数据;随机森林;K-Means;第二类错误【Keywords】critical-to-qualitycharacteristics;imbalanceddata;randomforest;K-Means;typeIIerror【中圖分类号】F273.2【文献标志码】A1673-1069(2021)10-0134-041引言质量强则国家强,质量兴则民族兴,质量可靠性是产品生产最基本的要求。在复杂产品的生产制造过程中,由于复杂产品由诸多系统组成,且它们具有高度集成、系统之间相互关联、相互制约的特点,因此需要控制的变量极多。例如,汽车发动机由五大系统和两大机构组成。五大系统是燃料供给系统、冷却系统、润滑系统、点火系统和起动系统。两大机构是曲柄连杆机构和配气机构,其中某一系统又由活塞、连杆、摇臂等零部件组成,零部件又能进一步被分解为螺丝、轴承等,每一微小的零部件都有尺寸、重量等质量特性。在复杂产品被从部件分解成零件的过程中,产品质量特性数据集的维度会随着产品结构的逐步分解而不断升高。另外,在实际生产过程中,产品数据往往具有不平衡性。在制造业中,如果生产出的合格产品数量是不合格产品数量的10倍以上,就称这样的数据为不平衡数据(ImbalanceDataSets,IDS)。高维度、不平衡的复杂产品生产数据使质量控制成为难题。因此,质量问题成为复杂产品生产控制的关键问题,这不仅关系到复杂装备的生产质量问题,更关系到经济安全甚至生命安全。为了在较低的控制成本下有效实现质量控制,就需要从高维度、不平衡的质量特性数据集中识别出对产品质量有显著影响的关键质量特性(Critical-to-QualityCharacteristics,CTQ)。2相关研究工作概述传统的CTQ识别主要依赖于工程人员的专业知识或者是顾客的需求,从产品构造、产品加工、工程特性、顾客需求等角度定性或定量方法识别产品的CTQ。应用最多的就是质量功能展开法(QualityFunctionDeployment,QFD)。QFD法主要包括以下几个步骤:调查顾客需求、产品规划、产品设计方案确定、零部件规划、零部件设计和工艺过程设计、工艺规划、工艺质量控制。至今,QFD仍被认为是产品设计阶段CTQ识别的最有效方法。但是,在应用中发现,当QFD法应用于高维度、不平衡的数据集时会因自身的局限性而大大降低效率,QFD法的质量矩阵变得难以确定,由此便产生了通过数据挖掘、机器学习等方法识别产品CTQ的研究,这方面的研究还相对较少。闫伟等(2...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

文秘专家
机构认证
内容提供者

1

确认删除?