好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

7第八章相关分析和回归分析.ppt

90页
  • 卖家[上传人]:宝路
  • 文档编号:47017509
  • 上传时间:2018-06-29
  • 文档格式:PPT
  • 文档大小:810.97KB
  • / 90 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 第八章 相关分析和回归分析n8.1 相关分析和回归分析概述n8.2 相关分析n8.3 直线回归n8.4 多元线性回归n8.5 逐步回归n8.6 非线性回归8.1 相关、回归分析概述相关分析计算反映各变量之间相关密切程度和性质的统计数8.1.1 相关分析概述简单相关:研究两变量直线相关的密切程度和性质,也称直线相关偏相关:排除其余的影响因子,求出x 与y的纯相关,这种相关称偏相关复相关:研究一个变量与一组变量之间的相关性关系典型相关:研究两组变量的相关性8.1.2 回归分析概述由自变数预测因变数的问题都叫回归分析相关分析反映各变量间相关密切程度,回归分析反映 因变量(Y)和自变量(X)之间的数量关系,用回归方程表 示回归模型不一定是因果关系,自变量可多于一个回归分析依自变量个数的多少分为:一元回归和多元回归 因变量和自变量间关系的性质分:线性回归和非线性回归回归分析的SAS过程:主要有REG(回归分析)GLM (广义线性模型)如由温度表水银柱高度(X)来估计温度(Y )时, 自变量实际上是依赖于因变量n1 简单相关n2 偏相关n3 复相关8.2 相关分析(Analysis of Correlation)补:秩相关1 简单相关简单相关: 是对有联系的两类事物(x与y)表面关系密切程度的衡量。

      Simple Correlation)一、简单相关系数相关系数r(无单位)的取值:即:二、简单相关系数r的显著性测验由d.f=n-2查出相关系数的临界值r0.05 、r0.01(degree of freedom)SAS直接输出prob>|r|概率值,记为a.统计假设H0:总体相关系数ρ=0若a >0.05,接受H0,相关不显著,即总体x与y间不存在相关关系若0.01 |R| under Ho: Rho=0 / N = 26X YX 1.00000 0.710190.0 0.0001Y 0.71019 1.000000.0001 0.0结论:因r=0.71019,其出现的概率=0.0001 |r|x1x2x3x11.000000.79949 0.00100.77549 0.0018x20.79949 0.00101.000000.86931 0.0001x30.77549 0.00180.86931 0.00011.00000CORR 过过程1 Partial 变变量:x32 变变量:x1 x2简单统计简单统计 量 变变 量N均值值标标准偏差总总和最小值值最大值值偏方差偏标标准偏 差x31 315.738460.99544204.6000013.7000017.90000 x11 328.6076920.18875371.900000.4000052.30000177.2425913.31325x21 315.484621.13420201.3000013.1000017.600000.342840.58552Pearson 偏相关系数, N = 13 当 H0: Partial Rho=0 时时,Prob > |r|x1x2x11.000000.40169 0.1956x20.40169 0.19561.00000统计结论:r12=0.79949 p=0.0010.05 相关不显著r13.2=0.27108 p=0.27108>0.05 相关不显著实例:p170例8.2 腰果分期播种试验试验 ,采用10天播种一次,每次 播种10粒。

      1986年4月至1987年3月,共进进行33次分期 播种表11是腰果种子发发芽“普遍期”天数、平均气 温、平均最低气温、及平均最高气温的观观察资资料试试 求简单简单 相关系数及二级级偏相关系数普遍天数平均气温平均最低气温平均最高气温 1229.024.234.6 1527.823.632.6 ………… 4219.214.925.2表8.3 腰果种子“普遍期”天数与气温表data cashew;input x1 x2 x3 x4 @@;cards; 12 29.0 24.2 34.6 .... 42 19.2 14.9 25.2 ; proc corr; var x1 x2 x3 x4;proc corr; var x3 x4; partial x2;proc corr; var x1 x4; partial x2 x3; run;Correlation Analysis2 'PARTIAL' Variables: X2 X32 'VAR' Variables: X1 X4Pearson Partial Correlation Coefficients / Prob > |R| under Ho: Partial Rho=0 / N = 33X1 X4X1 1.00000 0.075170.0 0.6878X4 0.07517 1.000000.6878 0.0统计结论:r34.2=-0.8031 p=0.00010.05 相关不显著部分输出结果:组合代号 X1 X2 X3 Y1 10.37 29.56 33.31 10.5202 10.47 34.25 29.05 10.0703 9.67 35.25 37.65 12.7904 9.87 29.25 31.52 9.2305 8.20 37.85 33.62 10.3606 8.67 37.78 38.09 12.5707 10.03 40.97 30.42 12.5608 9.00 46.00 29.10 11.3889 10.07 39.73 32.06 12.830实习四实 习作业:21个小麦双列杂交组合F1的单株产量y(克),每株穗 数x1,每穗的粒数x2,千粒重x3(克)数据如下:组合代号 X1 X2 X3 Y10 10.57 36.30 30.59 11.800 11 8.73 37.10 27.17 8.73012 10.20 35.67 32.21 11.79013 8.93 35.44 33.22 10.42014 9.83 34.28 28.40 9.83015 8.60 33.31 35.49 10.92016 8.83 35.10 27.54 8.44017 8.80 34.45 34.20 10.50018 8.80 30.65 29.47 7.94019 9.40 31.20 30.75 8.83020 10.03 39.27 29.21 11.330试求ry1、ry3、ry1.2、 ry1.23 , 并确定其显著性。

      input x y @@;cards; 77 8.8 64 7.9 … 73 3.5 ; proc reg corr; model y=x/ cli clm; /*CLI输出Y值的95%预测区间*/ Plot y*x/conf95; run;其SAS程序:四、直线回归实例conf95在散点图(x,y)上附加回归直线和均值置信区间/*选项CORR,要求输出简单相关系数*/clm输出条件总体平均数的95%置信区间SAS 系统统The REG ProcedureCorrelation Variablexy x1.00000.7057 y0.70571.0000SAS输出结果:说明:proc reg corr; 选项corr输出变量间的简单 相关系数 The REG Procedure Model: MODEL1 Dependent Variable: y Analysis of Variance SourceDFSum of SquaresMean SquareF ValuePr > FModel1137.80902137.8090223.81 |t|Intercept12.007461.530371.310.2020 x10.077090.015804.88 F Model22852.83453 1426.4172615.37 0.0027 Error7649.6094792.80135 Corrected Total93502.44400 Root MSE9.63335 R-Square0.8145 Dependent Mean28.56000 Adj R-Sq0.7615 Coeff Var33.73020 Parameter EstimatesVariableDFParameter EstimateStandard Errort ValuePr > |t| Intercept1-135.0996261.37574-2.200.0636 x1110.195684.316042.360.0502 x211.283601.370170.940.3800求二元回归方程Output StatisticsObsDependent VariablePredicted ValueStd Error Mean Predict95% CL PredictResidual 111.800021.67184.9777-3.968747.3123-9.8718 ……………………………………………………………………………… 100.5000-1.53626.7356-29.331426.25902.0362 11.31.09738.9945-0.067562.2621.预测出1977年最终病情指数值95%的预测区间为[-0.0675,62.2621]2:三元线性回归P180例8.4 甘蔗糖分与气象资资料如表8.5。

      试试求y关于x1, x2,x3的线线性回归归方程,并对对方程作显显著性测验测验 当 方程达显显著时时,再对对1984年糖分作预测预测 年份糖份 (y)9~12月份降 雨量(x1)10月份相对对 湿度(x2)12月份最低 温度(x3) 64/6513.93408.6834.3 65/6613.85460.9833.0 66/6714.21151.8824.7 ………………………… 83/84390.0804.6data sgca;input y x1-x3;cards; 13.93 408.6 834.3 13.85 460.9 833.0 ………………………………….. 11.59 480.4 831.5 . 390.0 804.6 ; proc reg; model y=x1-x3/stb cli; run;SAS结果及解释P147Analysis of VarianceSourceD FSum of SquaresMean SquareF Value Pr > F Model37.79038 2.596799.08 0.0011 Error154.29100 0.28607 Corrected Total18 12.08138 Parameter Estima。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.