电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

回归分析法概念及原理

12页
  • 卖家[上传人]:cn****1
  • 文档编号:513837141
  • 上传时间:2023-04-12
  • 文档格式:DOCX
  • 文档大小:132.22KB
  • / 12 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、归分析法概念及原理回归分析法概念及原理回归分析定义:利用数据统计原理,对大量统计数据进行数学处理,并确定因变量与某些自变量的相关关系,建立一个相关性较好的回归方程(函数表达式),并加以外推,用于预测今后的因变量的变化的分析方法。分类:1. 根据因变量和自变量的个数来分类:一元回归分析;多元回归分析;2. 根据因变量和自变量的函数表达式来分类:线性回归分析;非线性回归分析;几点说明:1. 通常情况下,线性回归分析是回归分析法中最基本的方法,当遇到非线性回归分析时,可以借助数学手段将其化为线性回归;因此,主要研究线性回归问题,一点线性回归问题得到解决,非线性回归也就迎刃而解了,例如,取对数使得乘法变成加法等;当然,有些非线性回归也可以直接进行,如多项式回归等;2. 在社会经济现象中,很难确定因变量和自变量之间的关系,它们大多是随机性的,只有通过大量统计观察才能找出其中的规律。随机分析是利用统计学原理来描述随机变量相关关系的一种方法;3. 由回归分析法的定义知道,回归分析可以简单的理解为信息分析与预测。信息即统计数据,分析即对信息进行数学处理,预测就是加以外推,也就是适当扩大已有自变量取值范

      2、围,并承认该回归方程在该扩大的定义域内成立,然后就可以在该定义域上取值进行“未来预测”。当然,还可以对回归方程进行有效控制;4. 相关关系可以分为确定关系和不确定关系。但是不论是确定关系或者不确定关系,只要有相关关系,都可以选择一适当的数学关系式,用以说明一个或几个变M变动时,另一变M或几个变M平均变动的情况。相关关系线性相关非线性相关完全相关不相关正相关负相关正相关负相关一元回归线性回归非线性回归线性回归非线性回归回归分析主要解决的问题:回归分析主要解决方面的问题;1 .确定变M之间是否存在相关关系,若存在,则找出数学表达式;2 .根据一个或几个变M的值,预测或控制另一个或几个变M的值,且要估计这控制或预测可以达到何种精确度。回归模型:回归模型多元回归回归分析步骤:1 .根据自变M与因变M的现有数据以及关系,初步设定回归方程;2 .求出合理的回归系数;3 .进行相关性检验,确定相关系数;4 .在符合相关性要求后,即可根据已得的回归方程与具体条件相结合,来确定事物的未来状况,并计算预测值的置信区间;回归分析的有效性和注意事项:有效性:用回归分析法进行预测首先要对各个自变M做出预测。若各

      3、个自变M可以由人工控制或易于预测,而且回归方程也较为符合实际,则应用回归预测是有效的,否则就很难应用;注意事项:为使回归方程较能符合实际,首先应尽可能定性判断自变M的可能种类和个数,并在观察事物发展规律的基础上定性判断回归方程的可能类型;其次,力求掌握较充分的高质M统计数据,再运用统计方法,利用数学工具和相关软件从定M方面计算或改进定性判断。回归分析中的几个常用概念:实际值:实际观测到的研究对象特征数据值;理论值:根据实际值我们可以得到一条倾向线,用数学方法拟合这条曲线,可以得到数学模型,根据这个数学模型计算出来的、与实际值相对应的值,称为理论值;预测值:实际上也是根据数学模型计算出来的理论值,但它是与未来对应的理论值。表示符号:实际值,用”表示;理论值,用氏表示;预测值,用儿表示。+UnaryLinearRegressionXXXXXXXXXAAJI_1211_U,l,1,1,1,UIiiiiiiiii-1,1,1,1,1,1/,U_1till1XXXXX-III1111i1IIrTTTTTTTTTTTTtTTTTTTTTTTTT11fffTTrTtTTTTTTTTTTTTTTTTT

      4、TTT11ITTTTTTTT+一元线性回归,就是只涉及一个自变M的回归;自变M和因变M之间的关系是线性关系的回归;因变M与自变M之间的关系用一条线性方程来表示的回归。方法步骤:1 .确定回归模型:由于我们研究的是一元线性回归,因此其回归模型可表示为:n*;其中,y是因变X是自变M;是误差项;0()和人称为模型参数(回归系数)。2 .求出回归系数:这里的回归系数的求解,就要用一定的方法,使得该系数应用于该方程是“合理的”。最常用的一种方法就是最小二乘估计法。最小二乘法是测M工作和科学实验中最常用的一种数据处理方法,其基本原理是,根据实验观测得到的自变Mx和因变My之间的一组对应关系,找出一个给定类型的函数y=/(x),使得它所取的值-?与观测值”,儿,儿在莫种尺度下最接近,即在各点处的偏差的平方和达到最小,即s(%-庆-乂)2=最小。这种方法求的的久和B、将使得拟合宜线r-lZ-1y=6+加中的y和人之间的关系与实际数据的误差比其他任何直线都小O其中,根据最小二乘法的要求,可以推导得到最小二乘法的计算公式nVx2-Vx.,t上ij=ij=iP.=y-PA相关性检验:对于若干组具体数据(心

      5、牙)都可算出回归系数久,久从而得到回归方程。至于y与X之间是否真有如回归模型所描述的关系,或者说用所得的回归模型去拟合实际数据是否有足够好的近似,并没有得到判明。因此,必须对回归模型描述实际数据的近似程度,也即对所得的回归模型的可信程度进行检验,称为相关性检验。相关系数是衡M一组测M数据兀J线性相关程度的参其定义为:且出或者厂=-x2)(y2-y2)i-lJ-l/-I尸值在0|r1中。I门越接近于1,x*之间线性好;,?为正,宜线斜率为正,称为正相关;,为负,宜线斜率为负,称为负相关。I门接近于0,则测M数据点分散或?儿之间为非线性。不论测M数据好坏都能求出怎和心,所以我们必须有一种判断测M数据好坏的方法,用来判断什么样的测M数据不宜拟合,判断的方法是IrI时,测M数据是非线性的?心称为相关系数的起码值,与测M次数有关,如下表:相关系数起码值nnn31.00090.798150.64140.990100.765160.62350.959110.735170.60660.917120.708180.59070.874130.684190.57580.834140.661200.561在进

      6、行一元线性回归之前应先求出,?值,再与比较,若I门贝h和y具有线性关系,可求回归宜线;否则反之。置信区间的确定:当确定相关性后,就可以对置信区间进行确定,就可以结合实际情况,确定事物未来的状况了。回归分析的最主要的应用就在于“预测匕而预测是不是准确的,就得有一个衡M的工具。它就是置信区间。或者从另外一方面来说,回归方程是由数理统计得出的,它反映的是实际数据的统计规律,所以,根据回归方程所得的预测值V。只是对应于几的单点预测估计值,预测值应该有一个置信区间。这样来看,计算置信区间就是很有必要的。置信区间:s=,其中0是/的无偏估计S?称为剩余方差,S称为剩余标准差。注:该表达式的自由度为/一2是因为有2个限制变M兀和门故对于给定的,y值的概率为0.95的置信区间是:仇-1.96S,y0+1.96S)。点击参看置信区间的确定内容。+Example+实验数据如下表:城镇居民家庭人城巾人均住宅面城镇居民家庭人城巾人均住宅面均可支配收入积均可支配收入积343.46.74838.917.0477.67.25160.317.8739.110.05425.118.71373.913.55854.019

      7、.41510.213.76280.020.31700.614.26859.620.82026.614.87702.822.82577.415.28472.223.73496.215.79421.625.04283.016310493.026.1步骤一:先画出散点图,进行观察:程序如下:?elf?x=343.4477.6739.11373.91510.21700.62026.62577.43496.24283.04838.95160.35425.15854.06280.06859.67702.88472.29421.6049硼;y=6.77.210.013.513.714.214.815.215.716317.017.818.719.420320.822.823.725.026.1;plot(x,y;xf)?xlabel(f城镇居民家庭人均可支配收入Jylabef城市人均住宅面积*)2 2在MATALB 中的运行结果: 35O1000 2000 3000 4000 5000 6000 7000 8000 9000 10000城镇居民家庭人均可支配收入可以看到,除了个别点除外,基本上所有的

      8、点都分布在一条宜线的附近。而且自变量:只有一个,因此可以假设其回归模型为:尸0+0/+f步骤二求出回归系数,过程根据最小而乘法的公式计算计算公式为:h/tj/n编程:?nl,n2=size(x);Ixx=O;lxy=Ofork=l:n2lxx=lxx+(x(k)-mean(x)A2lxy=lxy+(x(k)-mean(x)*(y(k)-mean(y)endb=lxy/lxxa=mean(y)-b*mean(x)在MATLAB中的运行结果:求得p严0.0017Bo=9-4866,故:=9.4866+0.0017A:为所求。整个数据拟合如下:?elf?x=343.4477.6739.11373.91510.21700.62026.62577.43496.24283.04838.95160.35425.15854.06280.06859.67702.88472.29421.6049硼;y=6.77.210.013.513.714.214.815.215.716317.017.818.719.420320.822.823.725.026.1;plot(x,y;xf)?xlabelC城镇居民家庭人均可支配收入Jylabef城市人均住宅面积J?nl,n2=size(x);Ixx=O;lxy=Ofork=l:n2lxx=lxx+(x(k)-mean(x)A2lxy=lxy+(x(k)-mean(x)*(y(k)-mean(y)endb=lxy/lxxa=mean(y)-b*mean(x)nl,n2=size(x);lxx=0;lxy=0fork=l:n2lxx=lxx+(x(k)-mean(x)A2lxy=lxy+(x(k)-mean(x)*(y(k)-mean

      《回归分析法概念及原理》由会员cn****1分享,可在线阅读,更多相关《回归分析法概念及原理》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    监控施工 信息化课堂中的合作学习结业作业七年级语文 发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.