第三章统计案例3.1回归分析的基本思想及其初步应用第2课时残差分析高效演练知能提升------------------------A级基础巩固一、选择题1.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做实验,并用回归分析方法分别求得相关系数r与残差平方和m如下表所示:分类甲乙丙丁r0.820.780.690.85m106115124103则哪位同学的试验结果体现A、B两变量有更强的线性相关性()A.甲B.乙C.丙D.丁解析:r越接近1,相关性越强,残差平方和m越小,相关性越强,所以选D正确.答案:D2.为了表示n个点与相应直线在整体上的接近程度,我们常用的表示法为()A*工(v3—曲)J=1D.£($厂y)2C.解析:由回归直线方程y=f^-a可知,为一个量的估计值,而y为它的实际值,在最小二乘估计中(yi-a—bx)2,即(Yi-)2.答案:C3•甲、乙、丙、丁4位同学各自对A,B两变量进行回归分析,分别得到散另(丫---点图与残差平方和一'如下表所示:分类甲乙丙丁散点图—•4«*u*■11■A■4*n■■-*•*0400A0A残差平方和115106124103哪位同学的试验结果体现拟合A,B两变量关系的模型拟合精度高()A.甲B.乙C.丙D.丁解析:根据线性相关的知识,散点图中各样本点条状分布越均匀,同时保持丈(W—\)~残差平方和越小(对于已经获取的样本数据,R2的表达式中为确定的数,则残差平方和越小,R2越大),由回归分析建立的线性回归模型的拟合效果越好,由试验结果知丁要好些.答案:D4.通过残差图我们发现在采集样本点过程中,样本点数据不准确的是()A.第四个B.第五个C.第六个D.第八个解析:由题图可知,第六个的数据偏差最大,所以第六个数据不准确.答案:C5.如图所示,5个(x,y)数据,去掉D(3,10)后,下列说法错误的是()A.相关系数r变大B.残差平方和变大C.相关指数R2变大D.解释变量x与预报变量y的相关性变强解析:由散点图知,去掉D后,x与y的相关性变强,且为正相关,所以r变大,R2变大,残差平方和变小.答案:B二、填空题6.若一组观测值(xi,yi),(X2,y2),…,(xn,yn)之间满足y尸bxi+a+e«i=1,2,…,n),且e恒为0,则R2为________________________________.AA解析:由e恒为0,知yi=y,即yi—yi=0,答案:17.x,y满足如下表的关系:x0.20.61.01.21.41.61.82.02.2y0・040.3611.41.92.53.23.984.82则x,y之间符合的函数模型为___________________.解析:通过数据发现y的值与x的平方值比较接近,所以x,y之间的函数模型为y=x2・答案:y=x28.关于x与y,有如下数据:x24568y3040605070有如下的两个模型:(1)y=6・5x+17・5;2)y=7x+17•通过残差分析发现第(1)个线性回归模型比第(2)个拟合效果好.则R1________R2,QI_______________2(用大于,小于号填空,R,Q分别是相关指数和残差平方和).解析:根据相关指数和残差平方和的意义知R2>R2,QI<Q2.答案:><三、解答题9.在实验中得到变量y与x的数据如下表所示:x0.06670.03880.03330.02730.0225y39.442.941.043.149.21由经验知,y与X之间具有线性相关关系,试求y与X之间的回归曲线方程,并预测Xo=0.038时,yo的值.1解:令由题目所给数据可得下表所示的数据:序号Uiy2UiUiyi115.039.4225591225.842.9665.641106.82330.041.09001230436.643.11339.561577.46544.449.21971.362184.48合计151.8215.65101.566689.76计算得b=0.29,a=34.32.A所以y=34.32+0.29u.A所以试求回归曲线方程为y=34.32+0.29当xo=0.038时,yo=34.32+启〜41.95.10.关于x与y有以下数据:x24568y3040605070A已知x与y线性相关,由最小二乘法得b=6.5.⑴求y与x的线性回归方程;A(2)现有第二个线性模型:y=7x+17,且R2=0.82若与⑴的线性模型比较,哪一个线性模型拟合效果比较好,请说明理由.AA解:⑴依题意设y与x的线性回归方程为y=6・5x+a.经过(x,y),所以y与x的线性回归方程为y=6.5X+17.5.所以50=6.5X5AA+a.所以a=17.5.⑵由⑴的线性模型得出―yi与比―y的关系如下表所示:yi—yi—0.5—3.510—6.50.5yi—y—20—1010020所以£(讯一yi)2=155,Y(抽―V)2=1000.!=11由于R1=0.845,R2=0.82知R1>R2,所以(1)的线性模型拟合效果比较好.B级能力提升—2+4+5+6+85—x=5=5,y30+40+60+50+705AA50,因为y=6.5x+a所——电"1儿―刖1551000=0.84...