电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

数学2-3,3.1回归分析的基本思想及其初步应用

28页
  • 卖家[上传人]:w****i
  • 文档编号:91280135
  • 上传时间:2019-06-27
  • 文档格式:PPT
  • 文档大小:592.50KB
  • / 28 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、3.1 回归分析的基本思想 及其初步应用,比数学必3中“回归”增加的内容,必修统计 画散点图 了解最小二乘法的思想 求回归直线方程 ybxa 用回归直线方程解决应用问题,选修2-3统计案例 引入线性回归模型 ybxae 了解模型中随机误差项e 产生的原因 了解相关指数 R2 和模型 拟合的效果之间的关系 了解残差图的作用 利用线性回归模型解决 一类非线性回归问题 正确理解分析方法与结果,1、两个变量的关系,不相关,相关关系,函数关系,线性相关,非线性相关,问题1:现实生活中两个变量间的关系有哪些?,相关关系:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系。对具有相关关系的两个变量进行统计分析的方法叫回归分析。,思考:相关关系与函数关系有怎样的不同?,函数关系中的两个变量间是一种确定性关系. 相关关系是一种非确定性关系.,函数关系是一种理想的关系模型. 相关关系在现实生活中大量存在,是更一般的情况.,问题2:对于线性相关的两个变量用什么方法来刻划之间的关系呢?,2、最小二乘估计,最小二乘估计下的线性回归方程:,例1 从某大学中随机选出8名女大学生,其身高

      2、和体重数据如下表:,求根据女大学生的身高预报体重的回归方程,并预报一名身高为172的女大学生的体重。,问题一:结合例1得出线性回归模型及随机误差,并且区分函数模型和回归模型。,1. 散点图; 2.回归方程:,分析:由于问题中要求根据身高预报体重,因此选取身高为自变量,体重为因变量,身高为172的女大学生的体重一定是60.316kg吗?如果不是, 其原因是什么?,探究?,(1)由图形观察可以看出,样本点呈条状分布,身高和体重有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系。,(2)从散点图还可以看到,样本点散布在某一条直线的附近,而不是一条直线上,所以不能用一次函数来描述它们之间的关系。这时我们用下面的线性回归模型来描述身高和体重的关系:+其中和为模型的未知参数,e是y与 = bx + a 之间的误差, 通常称为随机误差。,其中a和b为模型的未知参数,e称为随机误差。,在线性回归模型(4)中,随机误差e的方差 越小,通过回归直线,预报真实值y的精度越高。随机误差是引起预报值 与真实值y之间的误差的原因之一,其大小取决于随机误差的方差。,另一方面,由于计算出来的 和 为截距

      3、和斜率的估计值,它们与真实值a和b之间也存在误差,这种误差是引起预报值 与真实值y之间误差的另一个原因。,随机误差:,线性回归模型:,思考: 产生随机误差项e的原因是什么?,随机误差e的来源(可以推广到一般): 1、忽略了其它因素的影响:影响身高 y 的因素不只是体重 x,可能还包括遗传基因、饮食习惯、生长环境等因素; 2、用线性回归模型近似真实模型所引起的误差; 3、身高 y 的观测误差。 以上三项误差越小,说明我们的回归模型的拟合效果越好。,函数模型与“回归模型”的差别:,函数模型:因变量y完全由自变量x确定 回归模型:预报变量y完全由解释变量x和随机误差e确定,问题二:在线性回归模型中,e是用bx+a预报真实值y的随机误差,它是一个不可观测的量,那么应如何研究随机误差呢?,称为残差平方和。,表3-2列出了女大学生身高和体重的原始数据以及相应的残差数据。,在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关, 是否可以用回归模型来拟合数据.,残差分析与残差图的定义:,然后,我们可以通过残差 来判断 模型拟合的效果,判断原始数据中是否存在可疑数据, 这方面的分析工作称

      4、为残差分析。,我们可以利用图形来分析残差特性,作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图。,残差图的制作及作用。 坐标纵轴为残差变量,横轴可以有不同的选择; 若模型选择的正确,残差图中的点应该分布在以横轴为心的带形区域; 对于远离横轴的点,要特别注意。,身高与体重残差图,几点说明: 第一个样本点和第6个样本点的残差比较大,需要确认在采集过程中是否有人为的错误。如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数据;如果数据采集没有错误,则需要寻找其他的原因。 另外,残差点比较均匀地落在水平的带状区域中,说明选用的模型计较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高。,问题三:如何发现数据中的错误?如何衡量随机模型的拟合效果?,(1)我们可以通过分析发现原始数据中的可疑数据,判断建立模型的拟合效果。,(2) 残差图的制作和作用: 制作:坐标纵轴为残差变量,横轴可以有不同的选择. 横轴为编号(或身高、体重等):可以考察残差与编号次序之间的关系 横轴为解释变量:可以考察残差与解释变量的关系, 作

      5、用:判断模型的适用性若模型选择的正确,残差图中的点应该分布在以横轴为中心的带形区域.,R2的值越大,说明残差平方和越小, 模型拟合效果越好。,在线性回归模型中,R2表示解析变量对预报变量变化的 贡献率。,R2越接近1,表示回归的效果越好(因为R2越接近1,表示解析变量和预报变量的线性相关性越强)。,如果某组数据可能采取几种不同回归方程进行回归分析,则可以通过比较R2的值来做出选择,即选取R2较大的模型作为这组数据的模型。,相关指数R2是度量模型拟合效果的一种指标。 在线性模型中,它代表自变量刻画预报变量的能力。,例3 在一段时间内,某中商品的价格x元和需求量y件之间的一组数据为:,求出y对x的回归直线方程,并说明拟合效果的好坏。,解:,列出残差表为,0.994,因而,拟合效果较好。,0,0.3,-0.4,-0.1,0.2,4.6,2.6,-0.4,-2.4,-4.4,1) 确定解释变量和预报变量; 2) 画出散点图; 3) 确定回归方程类型; 4) 求出回归方程; 5) 利用相关指数或残差进行分析.,问题四:若两个变量呈现非线性关系,如何解决?(分析例2),例2 一只红铃虫的产卵数y和

      6、温度x有关。现收集了 7组观测数据列于表中:,(1)试建立产卵数y与温度x之间的回归方程;并预测温度为28oC时产卵数目。 (2)你所建立的模型中温度在多大程度上解释了产卵数的变化?,选变量,解:选取气温为解释变量x, 产卵数为预报变量y。,画散点图,假设线性回归方程为 :=bx+a,选 模 型,估计参数,由计算器得:线性回归方程为 y = 19.87x -463.73, 相关指数R2 = 0.7464,所以一次函数模型中温度解释了74.64%的产卵数变化。,当x=28时, y =19.8728-463.7393,方法一:一元函数模型,合作探究,y= c1x2 + c2 变换 y= c1t + c2 非线性关系 线性关系,问题3,t =x2,方法二,二元函数模型,合作探究,平方变换:令t = x2,产卵数y和温度x之间二次函数模型y=bx2+a就转化为产卵数y和温度的平方t之间线性回归模型y=bt+a,作散点图,并由计算器得:y和t之间的线性回归方程为y=0.367t-202.54,相关指数R2 = 0.802,将t=x2代入线性回归方程得: y = 0.367x2 -202.54 当x=28时,y=0.367282-202.5485 所以,二次函数模型中温度解释了80.2%的产卵数变化。,产卵数,气温,方法三 指数函数模型,合作探究,当x =28oC 时,y 44 , 所以指数函数模型模型中温度解释了98%的产卵数的变化.,由计算器得:z关于x的线性回归方程为z=0.272x-3.849 , , 相关指数R2 = 0.98,对数变换:在 中两边取自然对数得,令 , 则 就转换为z = bx + a,最好的模型是哪个?,指数函数模型最好!,

      《数学2-3,3.1回归分析的基本思想及其初步应用》由会员w****i分享,可在线阅读,更多相关《数学2-3,3.1回归分析的基本思想及其初步应用》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2 2022年小学体育教师学期工作总结 2022年家长会心得体会集合15篇
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.