电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本
换一换
首页 金锄头文库 > 资源分类 > DOC文档下载
分享到微信 分享到微博 分享到QQ空间

excel一元及多元线性回归实例

  • 资源ID:457973589       资源大小:46.50KB        全文页数:6页
  • 资源格式: DOC        下载积分:15金贝
快捷下载 游客一键下载
账号登录下载
微信登录下载
三方登录下载: 微信开放平台登录   支付宝登录   QQ登录  
二维码
微信扫一扫登录
下载资源需要15金贝
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
如填写123,账号就是123,密码也是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

 
账号:
密码:
验证码:   换一换
  忘记密码?
    
1、金锄头文库是“C2C”交易模式,即卖家上传的文档直接由买家下载,本站只是中间服务平台,本站所有文档下载所得的收益全部归上传人(卖家)所有,作为网络服务商,若您的权利被侵害请及时联系右侧客服;
2、如你看到网页展示的文档有jinchutou.com水印,是因预览和防盗链等技术需要对部份页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有jinchutou.com水印标识,下载后原文更清晰;
3、所有的PPT和DOC文档都被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;下载前须认真查看,确认无误后再购买;
4、文档大部份都是可以预览的,金锄头文库作为内容存储提供商,无法对各卖家所售文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;
5、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据;
6、如果您还有什么不清楚的或需要我们协助,可以点击右侧栏的客服。
下载须知 | 常见问题汇总

excel一元及多元线性回归实例

精品文档,仅供学习与交流,如有侵权请联系网站删除野外实习资料的数理统计分析· 一元线性回归分析 一元回归处理的是两个变量之间的关系,即两个变量X和Y之间如果存在一定的关系,则通过观测所得数据,找出两者之间的关系式。如果两个变量的关系大致是线性的,那就是一元线性回归问题。对两个现象X和Y进行观察或实验,得到两组数值:X1,X2,,Xn和Y1,Y2,Yn,假如要找出一个函数Y=f(X),使它在X=X1,X2, ,Xn时的数值f(X1),f(X2), ,f(Xn)与观察值Y1,Y2,Yn趋于接近。在一个平面直角坐标XOY中找出(X1,Y1),(X2,Y2),(Xn,Yn)各点,将其各点分布状况进行察看,即可以清楚地看出其各点分布状况接近一条直线。对于这种线性关系,可以用数学公式表示:Y = a + bX这条直线所表示的关系,叫做变量Y对X的回归直线,也叫Y对X的回归方程。其中a为常数,b为Y对于X的回归系数。对于任何具有线性关系的两组变量Y与X,只要求解出a与b的值,即可以写出回归方程。计算a与b值的公式为:式中:为变量X的均值,Xi为第i个自变量的样本值,为因变量的均值,Yi为第i个因变量Y的样本值。n为样本数。当前一般计算机的Microsoft Excel中都有现成的回归程序,只要将所获得的数据录入就可自动得到回归方程。得到的回归方程是否有意义,其相关的程度有多大,可以根据相关系数的大小来决定。通常用r来表示两个变量X和Y之间的直线相关程度,r为X和Y的相关系数。r值的绝对值越大,两个变量之间的相关程度就越高。当r为正值时,叫做正相关,r为负值时叫做负相关。r 的计算公式如下:式中各符号的意义同上。在求得了回归方程与两个变量之间的相关系数后,可以利用F检验法、t检验法或r检验法来检验两个变量是否显著相关。具体的检验方法在后面介绍。2多元线性回归分析一元回归研究的是一个自变量和一个因变量的各种关系。但是客观事物的变化往往受到多种因素的影响,即使其中有一个因素起着主导作用,但其它因素的作用也是不可忽视的。因此,我们还需要研究多种变量的关系,这种多个变量之间的关系就叫做多元回归问题。例如,水稻的产量不仅与生长期内的雨量有关,而且与温度也有关系。所以寻求水稻的产量不仅与生长期内的雨量之间的相互关系,就是多元回归问题。如果假设自变量为X1,X2,Xm,因变量为Y,而且因变量与自变量之间是线性的关系,则因变量Y与自变量为X1,X2,Xm的多元线性回归方程为:Y = a+b1X1+b2X2+bmXm式中:a,b1,b2,bm为常数。因此,只要能够求出a,b1,b2,bm这些常数,就可以得到因变量Y与自变量为X1,X2,Xm之间的多元回归方程。具体的算法比较简单,但很烦琐。这里不再叙述。求解多元回归的计算机程序很多,只要将自变量的数据以及与其相对应的因变量的数据输入计算机程序中,立刻就可以求出a,b1,b2,bm各常数的值,从而可以获得因变量Y与自变量为X1,X2,Xm的多元线性回归方程。例如,设已知因变量Y的自变量X1,X2,X3,共得18组数据,并已知Y对Xi存在着线性关系,求其回归方程。样品X1X2X3Y10.4531586420.4231636033.119377140.6341576154.724595461.7651237779.4444681810.13111793911.629173931012.658112511110.937111761223.146114961323.150134771421.64473931523.15616895161.936143541726.8582021681829.95112499通过求解,得到a=41.6516b1=1.7410b2=-0.0062b3=0.1553所以,回归方程为Y=41.6516+1.7410 X1 -0.0062 X2+0.1553 X3通常可采用单相关系数、偏相关系数和复相关系数来说明这三个自变量与因变量之间是否有明显的线性关系以及它们之间相关的程度如何。单相关系数是指在不考虑其他因素影响的条件下,所求两个变量之间的相关系数。用rX1X2、rYX1和rYX2分别表示X1和X2、Y和X1以及Y与X2之间的单相关系数。偏相关系数是指在这三个变量中,将其中一个变量保持常数时,其他两个变量之间的相关系数。用rYX1X2和rYX2X1分别表示X2为常数时,Y与X1的偏相关系数和X1为常数时,Y与X2的偏相关系数。偏相关系数可以用单相关系数求得。当这三个变量中,同时考虑两个变量对另一个变量相关系数时,叫做复相关系数。用r(X1X2)Y表示X1和X2、两个自变量对于Y的复相关系数。3.方差分析方差分析法是分析多组平均数之间差异显著性时常用的一种统计方法。方差(或均方)是一个表示变异程度的量,它是离均差的平方和与自由度之商。在一项实验或调查中往往存在着许多造成生物形状变异的因素,这些因素有比较重要的,也有较次要的。分析时主要是把平方和与自由度按不同的变异起因分解为若干部分,从而构成来自不同起因的方差。利用它来检验各组平均数之间差异的显著性。在正态总体及方差相同的基本假定下,我们将利用方差比给出F分布的检验统计量。因此这种方法称为方差分析法。方差分析是分析和处理试验或观测数据的主要方法之一。它首先被应用于农业试验,目前它在农业、工业、生物、医学等各部门有着广泛的应用。方差分析的方法往往与试验设计的方式紧密地联系在一起。对于从不同试验设计中得出观测资料,进行方差分析时将有不同的计算方法,类型繁多,但其基本原理却大同小异。在这里将结合一个较简单的例子介绍方差分析的数学模型和基本方法,以便于读者对方差分析的方法有一个大致的了解。在实验设计的基础上,分组试验,如分为a组,每组作b个水平的试验,共得到a×b个数据。然后,算出组平均值和总平均值,组内和组间的离差平方和,组内和组间方差,作F检验。 F 组间方差/组内方差 假设 HO: 1 2··· b ,表示各水平的均值相等。当 F F 时,HO: 真;当 F > F时, HO:假。试验中必不可少地会产生误差。误差有两种:条件误差和试验误差。前者是由试验条件不同而引起的系统性误差,后者是在相同试验条件下引起的随机误差。例如,把四种不同的饲料分别喂给4组小鸡,每组5只,它们的增重情况如下:组别增重(Xij)1554942215226111230896334297819592416913716885153试问四组小鸡在平均增重量方面有没有明显的差别?通过计算,得到组内和组间方差分别为719.2和8706.3,因此,F=8706.3/719.2=12.1对于给定的显著性水平,将有临界值F一,当=0.01时,F0.01(3,16)=5.3,其中3与16是自由度。所以F=12.1>5.3= F0.01(3,16)故,否定各种饲料效果一致的假设,可以认为四种饲料的效果有极明显的差别。目前现成的计算机方差分析计算程序很多,如SPASS、SAS软件等,将数据输入后,都可以直接计算,并按要求输出结果。上述例子是单因素的方差分析,比较简单。对于多因素的方差分析,由于比较复杂,这里就不再叙述了。4. T检验生物学中所遇到的绝大多数问题,总体标准差都是未知的。在未知时,平均数的显著性检验有两种解决方法。其一是根据以往的经验或从类似的工作中估计出一个值,用这个做检验。使用估计的做检验并不是很可靠的。因此在实际工作中,一般不用这种方法而广泛使用t检验。对于一个正态分布总体,若未知则服从n-1自由度的t分布,因此,在未知时可以用t检验做平均数的显著性检验。t检验的零假设H0为:=0备择假设有以下三种情况:(1)HA:>0,若已知不可能小于0;(2)HA:<0,若已知不可能大于0;(3)HA:0,包括>0和<0 。三种备择假设的拒绝域为:(1)t>t ;(2)t< -t;(3)t > t/2,或表示为t > t(双侧) 。其中为给定的显著性水平。t检验的统计量为:t = (-0)/(s/n1/2)例如,已知玉米单交种群单105的平均穗重0=300克,喷药后,随机抽取9个果穗,其穗重为分别:308、305、311、298、315、300、321、294、320克。问喷药后与喷药前的果穗重差异是否显著?根据上面介绍的基本程序:· 已知玉米穗重是服从正态分布的随机变量,未知。 (2)假设:H0 :=0=300HA:0=300由于问题要求检验的是“果穗重差异是否显著”,并没有明确穗重一定增加或一定减少,所以备择假设为HA:0(3)显著性水平:根据实验的要求(差异是否“显著”)规定=0.05。(4)统计量的值:由于未知需使用t检验。t = (-0)/(s/n1/2)t = (308-3000)/(9.62/91/2)=2.49(5)建立的拒绝域H0:因HA:0,所以是双侧检验。当 t > t0.05(双侧)时拒绝H0,=0.05时,经查表t8,0.05(双侧)=2.306。(6)结论:因t =2.49> t8,0.05(双侧)=2.306 ,所以结论是拒绝H0,接受HA。即喷药前后果穗重的差异是显著的。5. F检验t检验属于单个样本的显著性检验,即在样本统计量与零假设所提出的总体参量之间做比较。这种检验需要我们事先能够提出合理的参量假设值和对参量有某种意义的备择值。然而,在实际工作中,很难提出这样的假设值及备择值。因此,限制了这种方法在实际工作中的应用。为了避免上述问题的出现,在实际应用时,常常选择两个样本,一个作为处理,一个作为对照。在这两个样本之间做比较。判断它们之间是否存在足够显著的差异。当它们之间的差异不能用偶然性解释时,则认为它们之间存在足够显著的差异,这两个样本来自两个不同的总体。而F检验是关于两个方差的检验,所以常用F检验来解决上述问题。F检验的程序概述如下:(1)假定从两个正态总体中,独立地抽取含量分别为n1和n2的两个随机样本,计算出s12和s22。总体平均数1和2可以相等也可以不相等。(2)零假设H0为:1=2备择假设有以下三种情况:(1)HA:1>2,若已知1不可能小于2; (2)HA:1<2,若已知1不可能大于2;(3)HA:12 ,包括1>2和1<2 。(3)显著性水平:经常用=0.05和=0.01两个水平。(4)检验的统计量:F(n1-1),(n2-1)经= s12 /s22(5)建立H0的拒绝域:对于HA:1>21<2,应做上尾单侧检验,当F>F时拒绝H0;对于HA:1<2,应做下尾单侧检验,当F<F1-时拒绝H0;对于HA:12 ,应做双侧检验,当F>F/2及F<F1-/2时拒绝H0;【精品文档】第 页

注意事项

本文(excel一元及多元线性回归实例)为本站会员(工****)主动上传,金锄头文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即阅读金锄头文库的“版权提示”【网址:https://www.jinchutou.com/h-59.html】,按提示上传提交保证函及证明材料,经审查核实后我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.