第19卷第2期2004年3月统计与信息论坛Vol.19No.2Mar.,2004收稿日期:2003-03-25作者简介:叶宗裕(1962-,男,浙江省江山市人,副教授,在读硕士。研究方向:预测与决策。【统计理论与方法】主成分综合评价方法存在的问题及改进叶宗裕(浙江师范大学工商管理学院,浙江金华321004摘要:文章深入分析了用目前普遍采用的主成分分析法进行多指标综合评价时存在的指标权系数不合理问题,并对用主成分构建综合评价函数的方式作了改进,使综合评价函数的权系数变得较为合理。关键词:主成分;综合评价;特征值中图分类号:C21214文献标识码:A文章编号:1007-3116(200402-0029-04一、引言近几年来,法为[1~3]:11设某综合评价使用p项指标,先将指标同趋势化,即将逆向指标转为正向指标,一般用指标值的倒数代替原指标。21将p项指标的原始数据标准化。设标准化后的p项指标记为x1,x2,…,xp,即E(xi=0,D(xi=1,i=1,2,…,p。31计算指标的相关矩阵R,求R的p个特征值记为:λ1≥λ2≥…≥λp≥0相应的正则化特征向量ui=(ui1,ui2,…,uip,i=1,2,…,p。41设方差贡献率αi=λi∑pk=1λk,当累计贡献率∑mi=1αi达到一定数值(≥一般取85%时,取m个主成分Fi=ui1x1+ui2x2+…+uipxp(i=1,2,…,m,进而得到综合评价函数:F=α1F1+α2F2+…+αmFm51将每一个单位的标准化指标值代入上式求得各单位的综合评价函数值,根据综合评价函数值对各单位进行排序。由于主成分Fi是x1,x2,…,xp,F也可1,,,p(但可能是由于,许多文献都回避这一点。不少学者认为:主成分分析法有许多优点[2],并将其作为综合评价的首选方法。然而,通过对主成分分析法的深入研究,仍然可以发现用主成分分析法进行综合评价时存在一些问题,而导致所得结果往往不正确。这也正是笔者所要讨论的问题。二、用主成分分析法进行综合评价存在的问题用主成分分析法进行综合评价存在许多问题,其中最关键的问题(其它问题多数由此而引起是主成分分析法不能消除指标重叠信息。而恰恰相反,却强化了指标重叠信息,使综合评价结果与指标相关性结构关系十分密切,其具体表现在:(一若评价指标体系中存在一部分变量高度相关、其它变量相关程度较低,则综合评价函数中权系数分配存在一个明显的集结倾向。权系数明显向相关性较高的变量倾斜,这些变量的权系数明显大于其它变量的权系数。一般来说,同一类指标(如经济效益评价时的利税类指标的相关系数往往较大,可认为其中包含较多的重叠信息,不相同类指标的相关系数往往较小,所包含的重叠信息也少。若选用的某一类属性指标数量越多,则在用主成分分析法92时,这一类指标所占的总权重系数就越大。这一点可通过下例得以说明:例1某综合评价有4项指标,其中x1,x2,x3为同一类的指标,x4为另一类的指标(具体数据略,则x1,x2,x3之间的相关系数较高,x4与x1,x2,x3的相关系数较低。其相关矩阵为:x1x2x3x4x1x2x3x410198801860108101988101856011460186018561-010070108101146-010071其特征值为:λ1=2.814λ2=1.004λ3=0.173λ4=0.00961而前两个主成分的方差贡献率已达到了95.44%,其主成分分别为:F1=0.586x1+0.5866x2+0.3+0.0709F2=-0.0.2-0.135x3+0.990x4综合评价函数为:F=0.405x1+0.4036x2+0.3561x3+0.2984x4可以看出:x1,x2,x3的系数都比x4的系数大,x1,x2,x3作为同一类的指标在综合评价函数中占据着绝对优势。而在实际问题中,就单个指标而言,x1,x2,x3则不一定比x4重要,相反有可能x4是关键性指标,而x1,x2,x3都是辅助性指标。所以综合评价函数F强化了x1,x2,x3之间的信息重叠,致使评价结果无法真实地反映实际情况。在此也顺便指出:主成分分析法显然不能确定指标的重要程度,只能在假设各指标在综合评价中的重要性相同的情况下,讨论其权系数的合理性(以下均作此假设。(二若综合评价中有两类指标,分别记作S1和S2。其类内指标两两高度相关且两类指标的个数及相关程度相当,而类间指标两两低度相关,则在综合评价函数中,S1中指标与S2中指标的权系数相差很大,而类内指标的权系数相差不大。例2设某综合评价有6项指标,指标集S1由x1,x2,x3组成,S2由x4,x5,x6组成,其相关系数矩阵为:x1x2x3x4x5x6x1x2x3x4x5x6110000198801860010810114401018019881100001856011460121501077018600185611000-0100...