应用主成分分析、聚类分析划分新疆绿①生态经济类型的初步研究李秀萍杨德刚(中国科学院新疆生态与地理研究所,乌鲁木齐830011)韩剑萍(西北师范大学经济管理学院,兰州733000)摘要本文结合新疆实际,采用多元统计中主成分分析法、聚类分析法,对新疆87个市县进行了生态经济类型划分。首先确立指标体系,然后用主成分分析法对原始数据进行筛选,接着用聚类分析法将87个市县划分为十大类型,最后对各类型生态经济现状进行了分析,评价和概述,为系统整体地认识和评价新疆各地区的生态经济协调发展现状,因地制宜地制定可持续发展政策提供科学依据。关键词生态经济分类主成分分析聚类分析新疆中图分类号F127文献标识码A改革开放以来,新疆经济取得了长足的发展,同时也带来了一系列的生态环境问题,使新疆经济发展和生态环境之间的矛盾日益突出〔1〕。因而在西部大开发过程中,新疆必须遵循经济与生态环境协调发展的道路。为此,正确认识和评价新疆生态经济协调发展状况显得极为重要。关于新疆生态环境和经济发展现状,已有很多专家和学者作了大量的调查、分析和研究。中国科学院新疆综考队对新疆生态环境作了大量调查,在此基础上许多学者对新疆的生态环境和经济发展水平分别作了科学的分析和评价。然而,对新疆各地区生态经济综合研究还很少。生态环境和经济发展之间的关系是一组矛盾的统一体,它们是相互制约、相互促进的。对一个区域而言,应把生态经济作为一个系统,来综合地考察它们之间的协调发展状况〔2〕。基于此,在吸取他人成果的基础上,尝试以系统整体的观点,运用聚类分析的方法,对新疆87个县市的生态经济进行划分,目的是对新疆各地区生态经济协调发展状况有一个新的认识和评价,从1方法和步骤采用多元统计的方法,对新疆87个县进行数值聚类分析1.1基本单元分析的基本单元为新疆所有的县级生态经济系统,共87个。1.2指标体系的建立根据代表性原则、综合性原则、系统性原则生态环境和经济发展相关性原则、易获性原则及替代性和延伸性原则,紧密结合新疆各地区生态经济的实际特点,并通过专家咨询,选取和建立了包括目标层、指标层1和指标层2共三层,29个指标(详见图1)作为聚类分析的指标体系。1.3独立性检验与聚类指标的生成由于指标过多,不但各项指标数据之间往往具有一定的相关性,而且对运算和分析问题带来了不必要的麻烦,不能很好地抓住事物的主要矛盾,而人为地选择变量难免会带有主观意识。所以必须对所考虑的众多变量,用数理统计的方法,经过正交化处①收稿日期:2001-12-18;修订日期:2002-05-23基金项目:中国科学院资源与生态环境研究室七项目(KV951-B1-213-03-01)作者简介:李秀萍,1974年生,女,中国科学院新疆生态与地理研究所在读硕士研究生,研究方向为区域发展和生态经济2653期李秀萍等:应用主成分分析、聚类分析划分新疆绿洲生态经济类型的初步研究理,变成一些相互独立,为数较少的综合变量(或者称为主成分),以这些综合指标,作为聚类分析的新的数值数据,而主成分分析法(PCA)正好为实现这一思想提供了十分有效的数学方法〔3〕。主成分分析法的计算方法与步骤如下:(1)原始数据准备和预处理。全疆的县级单元87个,选取1999年的指标因子29个,组成一个87×29的原始数据〔4-6〕矩阵X,并对逆指标进行转换。(2)对原始数据矩阵X按指标(即变量)用如下公式进行标准化处理。最主要的计算量,常用对称阵的雅可比方法,得出特征值Tj(按从大到小排列)和特征向量lij。Tj/∑Ti和累积贡献率(5)计算贡献率pi=1p∑T/∑Tijdd=1d=1由表1累积贡献率可知,前15个主成分的累积贡献率达到90.6%,超过一般标准(85%)的5.6%,仅损失信息量9.4%。因此,前15个主成分基本代表了原始因子的全部信息,即利用主成分分析法(PCA)把原来的29个指标综合成15个主成分完全能反映原始总体特征,从数值分析看是科学的、合xij-¯xj(in=1,2,3,,m;j=1,2,3,n)xij=sj12(N:指标个数)∑xij-¯xjsj=()6计算15个主成分的得分,由87个区域15N-1i=1个主成分的因子得分组成一个新的数据矩阵S;由这个数据矩阵S组成聚类分析的数据集合。p(3)将标准化的数据矩阵求变量之间的相关系数,得到相关系数矩阵R=(rij)87х29(4)计算特征值和特征向量,这是主成分分析∑lki×xij(kS=...