
2019年高考数学(理)一轮复习第9章算法初步、统计与统计案例第4节变量间的相关关系与统计案例学案.doc
9页北师大版 2019 届高考数学一轮复习学案1第四节第四节 变量间的相关关系与统计案例变量间的相关关系与统计案例[考纲] (教师用书独具)1.会做两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归系数公式不要求记忆).3.了解回归分析的基本思想、方法及其简单应用.4.了解独立性检验(只要求 2×2 列联表)的思想、方法及其初步应用.(对应学生用书第 165 页)[基础知识填充]1.两个变量的线性相关(1)正相关在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.(2)负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.(3)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫作回归直线.2.回归方程(1)最小二乘法求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫作最小二乘法.(2)回归方程方程y=bx+a是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中a,b是待定参数.Error!3.回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.(2)样本点的中心对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其中(,)x-y-称为样本点的中心.(3)相关系数当r>0 时,表明两个变量正相关;当r<0 时,表明两个变量负相关.北师大版 2019 届高考数学一轮复习学案2r的绝对值越接近于 1,表明两个变量的线性相关性越强.r的绝对值越接近于 0,表明两个变量之间几乎不存性相关关系.通常|r|大于 0.75 时,认为两个变量有很强的线性相关性.4.独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.(2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为 2×2 列联表)为2×2 列联表y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d构造一个随机变量χ2=,其中n=a+b+c+d为样本容n(ad-bc)2 (a+b)(a+c)(b+d)(c+d)量.(3)独立性检验利用随机变量χ2来判断“两个分类变量有关系”的方法称为独立性检验.[知识拓展] 1.b的几何意义:体现平均增加或平均减少.2.由回归直线求出的数据是估算值,不是精确值.[基本能力自测]1.(思考辨析)判断下列结论的正误.(正确的打“√” ,错误的打“×”)(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.( )(2)通过回归直线方程y=bx+a可以估计预报变量的取值和变化趋势.( )(3)因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.( )(4)事件X,Y关系越密切,则由观测数据计算得到的χ2的观测值越大.( )[答案] (1)√ (2)√ (3)× (4)√2.(教材改编)已知变量x与y正相关,且由观测数据算得样本平均数 =3, =3.5,则由xy该观测数据算得的线性回归方程可能是( )A.y=0.4x+2.3 B.y=2x-2.4C.y=-2x+9.5D.y=-0.3x+4.4A A [因为变量x和y正相关,排除选项 C,D.又样本中心(3,3.5)在回归直线上,排除北师大版 2019 届高考数学一轮复习学案3B,选项 A 满足.]3.下面是一个 2×2 列联表y1y2总计x1a2173x222527总计b46则表中a,b处的值分别为________.52,54 [因为a+21=73,所以a=52.又因为a+2=b,所以b=54.]4.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到回归直线方程:y=0.254x+0.321,由回归直线方程可知,家庭年收入每增加 1 万元,年饮食支出平均约增加________万元.0.254 [由题意知回归直线的斜率为 0.254,故家庭年收入每增加 1 万元,年饮食支出平均约增加 0.254 万元.]5.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取 50 名学生,得到如下 2×2 列联表:理科文科男1310女720已知P(χ2≥3.841)≈0.05,P(χ2≥5.024)≈0.025.根据表中数据,得到χ2的观测值k=≈4.844.则认为选50 × (13 × 20-10 × 7)2 23 × 27 × 20 × 30修文科与性别有关系出错的可能性为________.5% [χ2的观测值k≈4.844,这表明小概率事件发生.根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为 5%.](对应学生用书第 166 页)相关关系的判断(1)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是( )A.x与y正相关,x与z负相关北师大版 2019 届高考数学一轮复习学案4B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关(2)x和y的散点图如图 941 所示,则下列说法中所有正确命题的序号为________. 【导学号:79140333】图 941①x,y是负相关关系;②在该相关关系中,若用y=c1ec2x拟合时的相关指数为R,用y=bx+a拟合时的相2 1关指数为R,则R>R;2 22 12 2③x,y之间不能建立线性回归方程.(1)C C (2)①② [(1)因为y=-0.1x+1 的斜率小于 0,故x与y负相关.因为y与z正相关,可设z=by+a,b>0,则z=by+a=-0.1bx+b+a,故x与z负相关.(2)在散点图中,点散布在从左上角到右下角的区域,因此x,y是负相关关系,故①正确;由散点图知用y=c1ec2x拟合比用y=bx+a拟合效果要好,则R>R,2 12 2故②正确;x,y之间可以建立线性回归方程,但拟合效果不好,故③错误.][规律方法] 判定两个变量正、负相关性的方法1画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.2相关系数:r>0 时,正相关;r<0 时,负相关.3线性回归直线方程中:b>0 时,正相关;b<0 时,负相关.[跟踪训练] 某公司在 2017 年上半年的月收入x(单位:万元)与月支出y(单位:万元)的统计资料如表所示:月份1 月份2 月份3 月份4 月份5 月份6 月份收入x12.314.515.017.019.820.6支出y5.635.755.825.896.116.18根据统计资料,则( )A.月收入的中位数是 15,x与y有正线性相关关系B.月收入的中位数是 17,x与y有负线性相关关系C.月收入的中位数是 16,x与y有正线性相关关系北师大版 2019 届高考数学一轮复习学案5D.月收入的中位数是 16,x与y有负线性相关关系C C [月收入的中位数是=16,收入增加,支出增加,故x与y有正线性相关关15+17 2系.]回归分析(2017·全国卷Ⅰ)为了监控某种零件的一条生产线的生产过程,检验员每隔 30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的 16 个零件的尺寸:抽取次序12345678零件尺寸9.9510.129.969.9610.019.929.9810.04抽取次序910111213141516零件尺寸10.269.9110.1310.029.2210.0410.059.95经计算得 =xi=9.97,s==x1 16∑16i=11 16∑16i=1 (xi-\x\to(x))2≈0.212,1 16(\o(∑,\s\up7(16),\s\do7(i=1))x\o\al(2,i)-16\x\to(x)2)≈18.439,(xi- )(i-8.5)=-2.78,其中xi为抽取的第i个零件∑16i=1 (i-8.5)2∑16i=1x的尺寸,i=1,2,…,16.(1)求(xi,i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);(2)一天内抽检零件中,如果出现了尺寸在( -3s, +3s)之外的零件,就认为这xx条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查?(ⅱ)在( -3s, +3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天xx生产的零件尺寸的均值与标准差.(精确到 0.01)附:样本(xi,yi)(i=1,2,…,n)的相关系数r=北师大版 2019 届高考数学一轮复习学案6,≈0.09.∑ni=1 (xi-\x\to(x))(yi-\x\to(y))∑ni=1 (xi-\x\to(x))2∑ni=1 (yi-\x\to(y))20.008[解] (1)由样本数据得(xi,i)(i=1,2,…,16)的相关系数r=∑16i=1 (xi-\x\to(x))(i-8.5)∑16i=1 (xi-\x\to(x))2∑16i=1 (i-8.5)2≈≈-0.18.-2.780.212 ×16 × 18.439由于|r|<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)(ⅰ)由于 =9.97,s≈0.212,因此由样本数据可以看出抽取的第 13 个零件的x尺寸在( -3s, +3s)以外,因此需对当天的生产过程进行检查.xx(ⅱ)剔除离群值,即第 13 个数据,剩下数据的平均数为(16×9.97-9.22)=10.02,1 15这条生产线当天生产的零件尺寸的均值的估计值为 10.02.x≈16×0.2122+16×9.972≈1 591.134,∑16i=1 2i剔除第 13 个数据,剩下数据的样本方差为(1 591.134-9.222-15×10.022)≈0.008,1 15这条生产线当天生产的零件尺寸的标准差的估计值为≈0.09.0.008[规律方法] 1.回归直线方程中系数的两种求法1利用公式,求出回归系数b,a.2待定系数法:利用回归直线过样本点中心求系数.2.回归分析的两种策略1利用回归方程进行预测:把回归直线方程看作一次函数,求函数值.2利用回归直线判断正、负相关:决定正相关还是负相关的是回归系数B.3.选择填空中选一组数据的线性回归直线方程的方法1过定点,验证.x,y2正、负相关看b的符号.3代入数据看误差大小.[跟踪训练] 为了解某地区某种农产品的年产量x(单位:吨)对价格y(单位:千元/吨)和年利润z的影响,对近五年该农产品的年产量和价格统计如下表:北师大版 2019 届高考数学一轮复习学案7x12345y7.06.55.53.82.2(1)求y关于x的线性回归方程y=bx+a;(2)若每吨该农产品的成本为 2 千元,假设该农产品可全部卖出,预测当年产量为多少时,年利润z取到最大值?(保留两位小数)参考公式:b==,a= -b.∑ni=1 (xi-\x\to(x))(yi-\x\to(y))∑ni=1 (xi-\x\to(x))2∑ni=1xiyi-n x-y-∑ni=1x2i-nx2yx[解] (1)由题知 =3, =5,xiyi=62.7,x=55,xy∑5i=1∑5i=1 2ib===-1.23,∑5i=1xiyi-5x-y-∑5i=。












