第六章自相关性6.1自相关性:6.1.1.非自相关假定由第2章知回归模型的假定条件之一是,Cov(ui,uj)=E(uiuj)=0,(i,jT,ij),(6.1)即误差项ut的取值在时间上是相互无关的。称误差项ut非自相关。如果Cov(ui,uj)0,(ij)则称误差项ut存在自相关。自相关又称序列相关。原指一随机变量在时间上与其滞后项之间的相关。这里主要是指回归模型中随机误差项ut与其滞后项的相关关系。自相关也是相关关系的一种。6.1.2.一阶自相关自相关按形式可分为两类。(1)一阶自回归形式当误差项ut只与其滞后一期值有关时,即ut=f(ut-1)+vt称ut具有一阶自回归形式。(2)高阶自回归形式当误差项ut的本期值不仅与其前一期值有关,而且与其前若干期的值都有关系时,即ut=f(ut–1,ut–2,…ut–p)+vt则称ut具有P阶自回归形式。通常假定误差项的自相关是线性的。因计量经济模型中自相关的最常见形式是一阶自回归形式,所以下面重点讨论误差项的线性一阶自回归形式,即ut=1ut-1+vt(6.2)其中1是自回归系数,vt是随机误差项。vt满足通常假设E(vt)=0,t=1,2…,T,Var(vt)=v2,t=1,2…,T,Cov(vi,vj)=0,ij,i,j=1,2…,T,Cov(ut-1,vt)=0,t=1,2…,T,依据普通最小二乘法公式,模型(6.2)中1的估计公式是,=(=)(6.3)其中T是样本容量。若把ut,ut-1看作两个变量,则它们的相关系数是=(r=)(6.4)对于大样本显然有(6.5)把上关系式代入(1.4)式得≈=(6.6)因而对于总体参数有=1,即一阶自回归形式的自回归系数等于该二个变量的相关系数。因此原回归模型中误差项ut的一阶自回归形式(见模型(6.2))可表示为,ut=ut-1+vt.(6.7)的取值范围是[-1,1]。当0时,称ut存在正自相关;当0时,称ut存在负自相关。当=0时,称ut不存在自相关。图1.1a,c,e,分别给出具有正自相关,负自相关和非自相关的三个序列。为便于理解时间序列的正负自相关特征,图1.1b,d,f,分别给出图1.1a,c,e,中变量对其一阶滞后变量的散点图。正负自相关以及非自相关性展现的更为明了。-3-2-10123102030405060708090100U-4-2024-4-2024U(-1)Ua.非自相关的序列图b.非自相关的散点图-4-2024102030405060708090100X-6-4-20246-6-4-20246X(-1)Xc.正自相关的序列图d.正自相关的散点图-6-4-20246102030405060708090100X-6-4-20246-6-4-20246X(-1)Xe.负自相关的序列图f.负自相关的散点图图1.1时间序列及其自相关散点图下面推导当误差项ut为一阶自回归形式时,ut的期望、方差与协方差公式。由上式有E(ut)=E(ut-1+vt)=E(ut-1)+E(vt)(6.8)因为对于平稳序列有E(ut)=E(ut-1),整理上式得E(ut)==0.(6.9)Var(ut)=E(ut)2=E(ut-1+vt)2=E(2ut–12+vt2+2ut-1vt)=2Var(ut-1)+v2整理上式得Var(ut)=u2=(6.10)Cov(ut,ut-1)=E(utut-1)=E((ut-1+vt)ut-1)=Var(ut-1)=Var(ut)=u2ut=ut-1+vt=(ut-2+vt-1)+vt=====所以:Cov(ut,ut-s)=E((utut-s)====sVar(ut-s)=su2,(s0)(6.11)令u=(u1u2u3…uT)’,则由公式(1.9),(1.10),(1.11)得E(uu’)==u2(6.12)其中u2=。从而验证了当回归模型的误差项ut存在一阶自回归形式时,Cov(ui,uj)0。同理也可证明当ut存在高阶自回归形式时,仍有Cov(ui,uj)0。注意,(1)经济问题中的自相关主要表现为正自相关(原因见3节)。(2)自相关主要针对时间序列数据。6.2自相关的与后果6.2.1自相关性的误差项存在自相关,主要有如下几个原因。(1)模型的数学形式不妥。若所用的数学模型与变量间的真实关系不一致,误差项常表现出自相关。比如平均成本与产量呈抛物线关系,当用线性回归模型拟合时,误差项必存在自相关。-800-600-400-2000200400600800828486889092949698RESID2000400060008000100000100200300400500FDIGDP-2000-1500-1000-500050010001500828486889092949698RESID(2)惯性。大多数经济时间序列都存在自相关。其本期值往往受滞后值影响。突出特征就是惯性与低灵敏度。如国民生产总值,固定资产投资,国民消费,物价指数等随时间缓慢地变化,从而建立模型时导致误差项自相关。(3)回归模型中略去了带有自相关的重要解释变量。若丢掉了应该列入模型的带有自相关的重要解释变量,...