电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本
换一换
首页 金锄头文库 > 资源分类 > DOC文档下载
分享到微信 分享到微博 分享到QQ空间

知识精讲:变量间的相关关系、回归分析及独立性检验.doc

  • 资源ID:104978472       资源大小:411.50KB        全文页数:12页
  • 资源格式: DOC        下载积分:20金贝
快捷下载 游客一键下载
账号登录下载
微信登录下载
三方登录下载: 微信开放平台登录   支付宝登录   QQ登录  
二维码
微信扫一扫登录
下载资源需要20金贝
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
如填写123,账号就是123,密码也是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

 
账号:
密码:
验证码:   换一换
  忘记密码?
    
1、金锄头文库是“C2C”交易模式,即卖家上传的文档直接由买家下载,本站只是中间服务平台,本站所有文档下载所得的收益全部归上传人(卖家)所有,作为网络服务商,若您的权利被侵害请及时联系右侧客服;
2、如你看到网页展示的文档有jinchutou.com水印,是因预览和防盗链等技术需要对部份页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有jinchutou.com水印标识,下载后原文更清晰;
3、所有的PPT和DOC文档都被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;下载前须认真查看,确认无误后再购买;
4、文档大部份都是可以预览的,金锄头文库作为内容存储提供商,无法对各卖家所售文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;
5、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据;
6、如果您还有什么不清楚的或需要我们协助,可以点击右侧栏的客服。
下载须知 | 常见问题汇总

知识精讲:变量间的相关关系、回归分析及独立性检验.doc

变量间的相关关系、回归分析及独立性检验【知识精讲】1会作两个相关变量的数据的散点图,会利用散点图认识变量的相关关系2了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程3掌握独立检验(只要求2×2列联表)的基本思想、方法简单应用.4. 掌握假设检验和聚类分析的基本思想、方法简单应用.【基础梳理】1相关关系的量:当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系2回归分析:对具有相关关系的两个变量进行统计分析的方法叫做回归分析3散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图4正相关与负相关概念:如果散点图中的点散布在从左下角到右上角的区域内,称为正相关如果散点图中的点散布在从左上角到右下角的区域内,称为负相关6 相关系数:r叫做变量y与x之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度7相关系数的性质:|r|1,且|r|越接近1,相关程度越大;且|r|越接近0,相关程度越小8独立性检验:一般地,假设有两个分类变量X和Y,它们的可能取值分别为x1,x2和y1,y2,其样本频数列联表(称为2×2列联表)为: 2×2列联表若要推断的论述为H1:X与Y有关系,可以按如下步骤判断结论H1成立的可能性:(1)通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度在三维柱形图中,主对角线上两个柱形高度的乘积ad与副对角线上的两个柱形高度的乘积bc相差越大,H1成立的可能性就越大在二维条形图中,可以估计满足条件Xx1的个体中具有Yy1的个体所占的比例 ,也可以估计满足条件Xx2的个体中具有Yy2的个体所占的比例.“两个比例的值相差越大,H1成立的可能性就越大”(2)可以利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度具体做法是:根据实际问题需要的可信程度确定临界值k0;利用公式K2 ,由观测数据计算得到随机变量K2的观测值k;如果kk0,就以(1P(K2k0)×100%的把握认为“X与Y有关系”;否则就说样本观测数据没有提供“X与Y有关系”的充分证据【要点解读】要点七 相关关系的判断【例7】山东鲁洁棉业公司的科研人员在7块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验,得到如下表所示的一组数据(单位:kg)(1)画出散点图;(2)判断是否具有相关关系【命题立意】考查相关关系的分析方法.【标准解析】用施化肥量x作为横轴,产量y为纵轴可作出散点图,由散点图即可分析是否具有线性相关关系【误区警示】正确选择坐标描点,并准确观察散点的实际分布判断两变量的正相关和负相关是常用方法.【答案】(1)散点图如右图所示,来源:学.科.网Z.X.X.K (2)由散点图知,各组数据对应点大致都在一条直线附近,所以施化肥量x与产量y具有线性相关关系.【变式训练】(2009·宁夏、海南)对变量x,y有观测数据(xi,yi)(i1,2,10),得散点图(1);对变量u、v有观测数据(ui,vi)(i1,2,10),得散点图(2)由这两个散点图可以判断()A变量x与y正相关,u与v正相关B变量x与y正相关,u与v负相关C变量x与y负相关,u与v正相关D变量x与y负相关,u与v负相关【标准解析】由图(1)可知,各点整体呈递减趋势,x与y负相关,由图(2)可知,各点整体呈递增趋势,u与v正相关【技巧点拨】注意正负相关的判断标准.【答案】C要点八 线性回归分析【例8】一台机器使用时间较长,但还可以使用它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器运转的速度而变化,下表为抽样试验结果:来源:学科(1)对变量y与x进行相关性检验;(2)如果y与x有线性相关关系,求回归直线方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么,机器的运转速度应控制在什么范围内?【命题立意】考查线性回归分析方法。【标准解析】利用相关系数r进行线性相关检验(也可利用散点图)如果线性相关,再求回归直线方程并加以判断(2) 0.728 6x0.857 1.(3)要使 100.728 6x0.857 110,所以x14.901 3.所以机器的转速应控制在14.901 3转/秒以下【答案】来源:Zxxk.Com【变式训练】假设关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料:(1)y与x间是否有线性相关关系?若有,求出线性回归方程;(2)估计使用年限为10年时的维修费用【标准解析】先作出散点图,然后检验相关性,再求其回归直线【技巧点拨】对具有相关关系的两个变量进行统计分析时,首先要作出散点图,然后进行相关性检验,在确认具有线性相关关系后,再求其回归直线。【答案】要点九 独立性检验【例9】(2009·辽宁)某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在29.94,30.06)的零件为优质品从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:甲厂: 乙厂:(1)试分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填下面2×2列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”.【命题立意】考查由采集样本的数据检验独立性.【标准解析】利用公式计算K2的值,比较它与临界值的大小关系,来判断事件X与Y是否有关的问题【误区警示】图表数据及利用计算数据判断独立性的步骤必须正确理解.【答案】(1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为64%.(2) 所以有99%的把握认为“两个分厂生产的零件的质量有差异” 【变式训练】在对人们休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人女性中有43人主要的休闲方式是看电视,另外27人的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动(1)根据以上数据建立一个2×2列联表;(2)画出二维条形图;(3)检验休闲方式是否与性别有关,可靠性有多大【标准解析】独立性检验的考查。【技巧点拨】先由已知条件转化联表及条形图,然后由公式计算k2与临界值的关系。【答案】(1)2×2列联表如图: (2)二维条形图如图:(3)假设休闲方式与性别无关,则K26.2015.024,所以有理由认为休闲方式与性别无关是不合理的,即我们有97.5%的把握认为休闲方式与性别有关【原创题探讨】【原创精典1】 某企业三月中旬生产A、B、C三种产品共3 000件,根据分层抽样的结果,企业统计员制作了如下的统计表:产品类别ABC产品数量(件)1 300样本容量130由于不小心,表格中A、C产品的有关数据已被污染看不清楚了,统计员只记得A产品的样本容量比C产品的样本容量多10,根据以上信息,可得C产品的数量是_件【解析】设样本的总容量为x,则×1 300130,x300.A产品和C产品在样本中共有300130170(件)设C产品的样本容量为y,则yy10170,y80.C产品的数量为×80800.【答案】800来源:Z。xx。k.Com【原创精典2】如右图是某电视台综艺节目举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为()A84,4.84 B84,1.6 C85,4 D85,1.6【解析】由茎叶图可知评委打出的最低分为79,最高分为93,其余得分为84,84,86,84,87,故平均分为85,方差为3×(8485)2(8685)2(8785)21.6.【答案】D【原创精典3】近年来,由于乱砍滥伐,掠夺性使用森林资源,我国长江、黄河流域植被遭到破坏,土地沙化严重,洪涝灾害时有发生沿黄某地区为积极响应和支持“保护母亲河”的倡议,建造了长100千米,宽0.5千米的防护林有关部门为掌握这一防护林共约有多少棵树,从中选出10块(每块长1千米,宽0.5千米)进行统计,每块树木数量如下(单位:棵)65 100 63 200 64 600 64 700 67 30063 300 65 100 66 600 62 800 65 500请你根据以上数据计算这一防护林共约有多少棵树(结果保留3个有效数字)【解析】要求学生有用样本估计总体的思想方法,另一方面要求学生有应用数学的意识,这是今后中考命题发展的趋势【答案】先计算出(65 10063 20064 60064 70067 30063 30065 10066 60062 80065 500)64 820于是,可以估计这一防护林平均每块约有64820株树又64 820×1006 482 0006.48×106(株),于是可以估计这一防护林大约共有6.48×106株树新动向前瞻【样题1】已知总体的各个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位数为10.5,若要使该总体的方差最小,则a、b的取值分别是_【解析】中位数为10.5,10.5,ab21,x10,s2(102)2(103)2(103)2(107)2(10a)2(10b)2(1012)2(1013.7)2(1018.3)2(1020)2令y(10a)2(10b)22a242a22122,当a10.5时,y取最小值,方差s2也取最小值a10.5,b10.5.【答案】10.510.5【样题2】某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K23.918,经查对临界值表知P(K23.841)0.05.p:有95%的把握认为“这种血清能起到预防感冒的作用”;q:若某人未使用该血清,那么他在一年中有95%的可能性得感冒;r:这种血清预防感冒的有效率为95%;s:这种血清预防感冒的有效率为5%.则下列结论中,正确结论的序号是_(把你认为正确的命题序号都填上)pq;綈pq;(綈p綈q)(rs);(p綈r)(綈qs)【解析】由题意,得K23.918,P(K23.841)0.05,所以只有p正确,即有95%的把握认为“这种血清能起到预防感冒的作用”,由真值表知

注意事项

本文(知识精讲:变量间的相关关系、回归分析及独立性检验.doc)为本站会员(F****n)主动上传,金锄头文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即阅读金锄头文库的“版权提示”【网址:https://www.jinchutou.com/h-59.html】,按提示上传提交保证函及证明材料,经审查核实后我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.