电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

SAS系统和数据分析协方差分析

18页
  • 卖家[上传人]:cl****1
  • 文档编号:470570460
  • 上传时间:2022-10-30
  • 文档格式:DOCX
  • 文档大小:84.24KB
  • / 18 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、第二十六课协方差分析当定量的影响因素对观察结果有难以控制的影响,甚至还有交互作用时,采用协方差分 析,这些影响变量称为协变量,扣除(或消除)协变量的影响,可以得到修正后的均值估计。一、协方差分析概述1. 协方差分析概念协方差分析(analysis of covariance)又称带有协变量的方差分析(analysis of variance with covariates),是将回归分析与方差分析结合起来使用的一种分析方法。在各种试验设计中,对 主要变量y研究时,常常希望其他可能影响和干扰y的变量保持一致以到达均衡或可比,使 试验误差的估计降到最低限度,从而可以准确地获得处理因素的试验效应。但是有时,这些 变量难以控制,或者根本不能控制。为此需要在试验中同时记录这些变量的值,把这些变量 看作自变量,或称协变量(covariate),建立因变量y随协变量变化的回归方程,这样就可以 利用回归分析把因变量y中受协变量影响的因素扣除掉,从而,能够较合理地比较定性的影 响因素处在不同水平下,经过回归分析手段修正以后的因变量的总体均值之间是否有显著性 的差别。简单地说,协方差分析是扣除协变量的影响

      2、,或者将这些协变量处理成相等,再对 修正的y的均值作方差分析。2. 协方差分析的假定协方差分析需要满足的假定为: 各样本来自具有相同方差b 2的正态分布总体,即要求各组方差齐性。 协变量与主要变量y间的总体回归系数不等于0。 各组的回归线平等,即回归系数卩二卩二1 2如果上述的假定满足,就作协方差分析。前述的各种试验设计,如完全随机化设计、随 机区组设计、析因设计、拉丁方设计等,都可以带一个或多个协变量,按设计方案扣除协变 量的影响后,对主要变量y的修正均值作比较,得出统计结论。3. 协方差分析的模型最简单的单因素一元协方差分析的模型,是由单因素效应模型y二卩+ a +加上协 iji ij变量的影响因素0 (x -x)而得出:y =卩 + a + 0 (x x ) + 匕(26.ijiijij其中,x为协变量,x为协变量在分类水平i和j上的记录值,x为所有协变量的平均 ij值,0为相关的回归系数。设00二卩-0x,为平均截距。上式可以化简成:上海财经大学经济信息管理系IS/SHUFE(26.2)(26.3)y P + a + (3x + ij 0 i ij ij设P P + a,上式可

      3、以化简成:0i0 iy P + Px + ij0 iij ij很明显p o是第/组回归线的截距,等于回归线的平均截距p o加上本组的效应a。这个式揭示了,观察值y的模型可以表示成一组相似的回归线,且各组具有共同的回归系数P, ij和各组自己的截距P -B +a。0i0 i用SAS中的glm过程进行协方差分析时,要注意不同试验设计时class语句和model语句的写法。设分类变量为A、B,协变量为X,观察值为Y则有: 单因素k水平设计的协方差分析模型class A;model X A ; 随机区组设计的协方差分析模型class A B;model X A B ; 两因素析因设计的协方差分析模型class A B;model X A B A*B;二、实例分析1. 一元协方差分析例261研究牡蛎在不同温度的水中不同位置上的生长情况。有人做了如下试验:分别 在通向发电站的入口处(温度较低)不同位置(底部和表层)和出口处(温度较高)不同位 置(底部和表层)及电站附近的深水处(底部和表层的中间)总共5个不同位置点上,随机 地各放4袋牡蛎(每袋中有10个),共5X4=20袋。在将每袋牡蛎放入位置点之

      4、前,先洗干 净称出每袋的初始体重,放在5个不同点一个月后再称出最后体重。试验结果数据如表26.1 所示。表26.1牡蛎在不同温度和位置上的生长数据位置trt重复数rep (x为初始体重,y为最后体重)1234xyxyxyxy1 (入口底部)27.232.632.036.633.037.726.831.02 (入口顶部)28.633.826.831.726.530.726.830.43 (出口底部)28.635.222.429.123.228.924.430.24 (出口顶部)29.335.021.827.030.336.424.330.55 (附近中部)20.424.619.623.425.130.318.121.8程序如下:datagrowth;do trt=1 to 5;do rep=1 to 4;input x y;output;end;end;cards;27.232.632.036.633.037.726.831.028.633.826.831.726.530.726.830.428.635.222.429.123.228.924.430.229.335.021.827.03

      5、0.336.424.330.520.424.619.623.425.130.318.121.8proc anova data二growth;class trt;model y=trt;proc glm data二growth;class trt;model y=trt x /solution;means trt;lsmeans trt /stderr tdiff;contrast trt12 vs trt34 trt -1 -1 1 1 0;estimate trt1adj mean intercept 1trt 10000x25.76;estimate trt2adj mean intercept 1trt 01000x25.76;estimate adj trt diff trt 1 -1 0 0 0;estimate trt1unadj mean intercept1 trt10000x 29.75;estimate trt2unadj mean intercept1 trt01000x 27.175;estimate unadj trt diff trt 1 -1 0 0 0

      6、x 2.575;run;程序说明:定性变量trt的5个不同位置点对y可能有较大的影响,因此class语句中分 组变量为trt,先选用anova过程进行方差分析。然而,牡蛎的初始体重x对牡蛎的最后体重 y可能也有一定的影响,故适合选用glm过程进行协方差分析,在model语句中不仅包括分 组变量trt,而且应包括协变量x。选择项solution要求输出回归系数的估计值及其标准误差和 假设检验等结果。means和lsmeans语句要求输出分组变量trt各水平下y的未修正均值和修 正后的均值,选择项stderr要求输出y的修正均值的标准误差、各修正均值与0比较的假设 检验结果;选择项tdiff要求输出y的各修正均值之间两两比较所对应的t值和p值。Contrast语句是用来比较入口处底部和顶部均值之和与出口处底部和顶部均值之和是否 相等。前三条estimate语句是用来估计入口处底部和顶部调整后的均值及它们之差,并假设 检验是否为0,后三条estimate语句是用来估计入口处底部和顶部未调整的均值及它们之差, 并假设检验是否为0。程序输出的主要结果如表26.2 (a)、表26.2 (b)、表2

      7、6.2 (c)所示。表 26.2 (a)单因素trt 一元x的协方差分析The SAS SystemAnalysis of Variance ProcedureDependent Variable: YSourceDFSum of SquaresMean SquareF ValuePr FModel4198.4070000049.601750004.640.0122Error15160.2625000010.68416667CorrectedTotal 19358.66950000R-SquareC.V.Root MSEY Mean0.55317510.597063.2686643630.84500000SourceDFAnova SSMean SquareF ValuePr FTRT4198.4070000049.601750004.640.0122General Linear ModelsProcedureDependentVariable: YSourceDFSum of SquaresMean SquareF ValuePr FModel5354.4471767570.8894

      8、3535235.050.0001Error144.222323250.30159452CorrectedTotal 19358.66950000R-SquareC.V.Root MSEY Mean0.9882281.7804380.5491762230.84500000SourceDFType I SSMean SquareF ValuePr FTRT4198.4070000049.60175000164.470.0001X1156.04017675156.04017675517.380.0001SourceDFType III SSMean SquareF ValuePr FTRT412.089359283.0223398210.020.0005X1156.04017675156.04017675517.380.0001T for H0:Pr |T|Std ErrorofParameterEstimateParameter=0EstimateINTERCEPT2.494859769 B2.430.02931.02786287表26.2(a)中结果分析:对分组变量trt的方差分析表明,即使当初始体重x不考虑,各分 组最后体重均值的区别也统计显著(0.0122V0.05),其中分组变量trt的平方和为198.40700000。 而在协方差分析中,分组变量trt的类型1的平方和等于方差分析中的平方和198.40700000, 分组变量trt的类型3的平方和为12.08935928,大大小于类型1的平方和,是因为类型3的 平方和反映了经过

      《SAS系统和数据分析协方差分析》由会员cl****1分享,可在线阅读,更多相关《SAS系统和数据分析协方差分析》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    监控施工 信息化课堂中的合作学习结业作业七年级语文 发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.