
【高中数学】第八章-8.2.doc
20页温馨提示: 此套题为Word版,请按住Ctrl,滑动鼠标滚轴,调节合适的观看比例,答案解析附后关闭Word文档返回原板块8.2 一元线性回归模型及其应用必备知识素养奠基1.一元线性回归模型一元线性回归模型的完整表达式为Y=bx+a+e,E(e)=0,D(e)=σ2.其中Y称为因变量或响应变量,x称为自变量或解释变量;a,b为模型的未知参数,e是Y与bx+a之间的随机误差. 具有相关关系的两个变量,其样本点散布在某一条直线y=bx+a的附近,可以用一次函数y=bx+a来描述两个变量之间的关系吗?提示:不能.2.最小二乘法与经验回归方程(1)最小二乘法=x+称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估计.(2)经验回归方程的系数计算公式经验回归方程的计算公式的计算公式=x+=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2=∑i=1nxiyi-nxy∑i=1nxi2-nx2=y-x(3)经验回归方程的性质①经验回归方程一定过点__(x,y)__;②一次函数=x+的单调性由的符号决定,函数递增的充要条件是>0__;③的实际意义:当x增大一个单位时,增大个单位. 正相关、负相关与的符号有何关系?提示:Y与x正相关的充要条件是>0,Y与x负相关的充要条件是<0.3.残差(1)残差:对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为残差.(2)决定系数:R2=1-越接近1,表示回归的效果越好.1.思维辨析(对的打“√”,错的打“”)(1)经验回归方程一定过样本中的某一个点.( )(2)选取一组数据中的部分点得到的经验回归方程与由整组数据得到的经验回归方程是同一个方程.( )(3)在经验回归模型中,R2越接近于1,表示解释变量和响应变量的线性相关性越强.( )(4)在画两个变量的散点图时,响应变量在x轴上,解释变量在y轴上.( )提示:(1).经验回归方程一定过点(x,y),可能过样本中的某个或某些点,也可能不过样本中的任意一个点.(2).选取一组数据中的部分点得到的经验回归方程与由整组数据得到的经验回归方程不一定是同一个方程.(3)√.(4).在画两个变量的散点图时,解释变量在x轴上,响应变量在y轴上.2.若某地财政收入x与支出Y满足经验回归方程=x++ei(单位:亿元)(i=1,2,…),其中=0.8,=2,|ei|<0.5,如果今年该地区财政收入10亿元,年支出预计不会超过( )A.10亿元 B.9亿元C.10.5亿元 D.9.5亿元【解析】选C.=0.810+2+ei=10+ei,因为|ei|<0.5,所以9.5<<10.5.3.若施肥量x(kg)与水稻产量Y(kg)的经验回归方程为=5x+250,当施肥量为80 kg时,预计水稻产量约为________kg.【解析】把x=80代入经验回归方程可得其预测值=580+250=650(kg).答案:650关键能力素养形成类型一 求经验回归方程【典例】某种产品的广告费用支出x与销售额Y(单位:百万元)之间有如下的对应数据:x/百万元24568Y/百万元3040605070(1)画出散点图;(2)求经验回归方程;(3)试预测广告费用支出为10百万元时,销售额多大?【思维引】(1)按表中的数据在平面直角坐标系中描点即得散点图;(2)由公式求出,,写出经验回归方程;(3)利用经验回归方程分析.【解析】(1)散点图如图所示:(2)列出下表,并用科学计算器进行有关计算:i12345合计xi2456825yi3040605070250xiyi601603003005601 380xi2416253664145所以x=255=5,y=2505=50,∑i=15xi2=145,∑i=15xiyi=1 380.于是可得=∑i=15xiyi-5xy∑i=15xi2-5x2=1 380-5550145-525=6.5,=y-x=50-6.55=17.5.所以所求的经验回归方程为=6.5x+17.5.(3)根据上面求得的经验回归方程,当广告费用支出为10百万元时,=6.510+17.5=82.5(百万元),即广告费用支出为10百万元时,销售额大约为82.5百万元.【内化悟】 求经验回归方程前应注意什么问题?提示:对于性质不明确的两组数据,要先作散点图,从图中看它们有无线性相关关系,有相关关系的求出的经验回归方程才有实际意义.【类题通】求经验回归方程的步骤(1)画散点图:由样本点是否呈条状分布来判断两个量是否具有线性相关关系.(2)求回归系数:若存性相关关系,则求回归系数.(3)写方程:写出经验回归方程,并利用经验回归方程进行预测说明.【习练破】 某公司的生产部门调研发现,该公司第二,三季度的月用电量Y与月份x线性相关,且数据统计如下:月份456789月用电量(千瓦时)61627554656但核对电费报表时发现一组数据统计有误.(1)请指出哪组数据有误,并说明理由;(2)在排除有误数据后,求月用电量与月份之间的经验回归方程=x+,并预测统计有误那个月份的用电量.(结果精确到0.1)【解析】(1)作散点图如图所示.因为用电量与月份之间线性相关,所以散点图的样本点分布在经验回归直线附近比较窄的带状区域内,而点(7,55)离其他点所在区域较远,故(7,55)这组数据有误.(2)排除(7,55)这一组有误数据后,计算得x=6.4,y=30.2.因为=∑i=15xiyi-5xy∑i=15xi2-5x2≈9.98,=y-x≈-33.67,所以经验回归方程为=9.98x-33.67,当x=7时,≈36.2,即7月份的用电量大约为36.2千瓦时.类型二 线性检验回归分析【典例】某运动员训练次数与训练成绩之间的数据关系如表:次数(x)3033353739444650成绩(Y)3034373942464851(1)作出散点图;(2)求出经验回归方程;(3)作出残差图;(4)计算R2,并说明运动员的训练次数对成绩的影响占百分之几.【思维引】根据题意先作散点图再求经验回归方程、残差及R2.【解析】(1)作出该运动员训练次数x与成绩Y的散点图,如图所示.由散点图可知,它们之间具有相关关系.(2)x=39.25,y=40.875,∑i=18xi2=12 656,∑i=18xiyi=13 180,所以=∑i=18xiyi-8x y∑i=18xi2-8x2≈1.041 5,=y-x=-0.003 875,所以经验回归方程为=1.041 5x-0.003 875.(3)残差分析:下面的表格列出了运动员训练次数和成绩的原始数据以及相应的残差数据.xY3030-1.241 13334-0.365 635370.551 437390.468 439421.385 444460.177 946480.094 95051-1.071 1作残差图如图所示.由图可知,残差点比较均匀地分布在水平带状区域内,说明选择的模型比较合适.(4)计算R2≈0.985 5,说明了该运动员的训练次数对成绩的影响占98.55%.【类题通】 “R2、残差图”在回归分析中的作用(1)R2是用来刻画回归效果的,由R2=1-可知R2越大,意味着残差平方和越小,也就是说模型的拟合效果就越好.(2)残差图也是用来刻画回归效果的,判断依据是:残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合精度越高,回归方程预报精度越高.【习练破】 为研究质量x(单位:g)对弹簧长度Y(单位:cm)的影响,对不同质量的6个物体进行测量,数据如表所示:x51015202530Y7.258.128.959.9010.911.8(1)作出散点图并求经验回归方程;(2)求出R2并说明回归模型拟合的程度;(3)进行残差分析.【解析】(1)散点图如图.x=16(5+10+15+20+25+30)=17.5,y=16(7.25+8.12+8.95+9.90+10.9+11.8)≈9.487,计算得≈0.183,≈6.285.故所求经验回归方程为=6.285+0.183x.(2)列出残差表为yi-i0.050.005-0.08-0.0450.040.025yi-y-2.237-1.367-0.5370.4131.4132.313所以∑i=16(yi-i)2≈0.013 18,∑i=16(yi-y)2=14.678 3.所以,R2=1-0.013 1814.678 3≈0.999 1,回归模型的拟合效果较好.(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个样本点的时候是否有人为的错误,如果有的话,需要纠正,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与所挂物体的质量成线性关系.类型三 非线性经验回归问题【典例】为了研究某种细菌随时间x的变化繁殖个数Y的变化,收集数据如下:时间x/天123456繁殖个数Y612254995190(1)将天数做解释变量,繁殖个数做响应变量,作出这些数据的散点图;(2)描述解释变量与响应变量之间的关系.【思维引】先由散点图确定相应的函数模型,再通过对数变换将非线性相关转化为线性相关的两个变量来求解.【解析】(1)由表中数据作散点图如图所示.(2)由散点图看出样本点分布在一条指数函数y=c1ec2x的图象的周围,其中c1和c2是待定系数.于是令Z=ln Y,则=x+(=ln c1,=c2),因此变换后的样本点应该分布在直线=x+的周围,因此可以用经验回归模型来拟合Z与x的关系,则变换后的样本数据如表:x123456Z1.792.483.223.894.555.25由表中数据得到经验回归方程=0.69x+1.115.因此细菌繁殖个数关于时间的非线性经验回归方程为=e0.69x+1.115.【内化悟】 将非线性相关问题转化为线性相关问题的依据是什么?提示:根据散点图确定.【类题通】1.非线性经验回归问题的解题步骤2.常见转化类型(1)反比例函数y=a+bx可作变换t=1x,得y=a+bt.(2)幂函数型y=axb(a>0)可作变换Y=ln y,m=ln a,t=ln x,则有Y=m+bt.(3)指数型函数y=kabx(a>0且a≠1,k>0)可作变换Y=ln y,m=ln k,则有:Y=m+。
