协方差分析
协方差分析协方差分析 第一节第一节 协方差分析的意义协方差分析的意义和功用和功用 方差分析(六)下列数据是研究镉作业工人暴露于烟尘的年数与肺活量的关系。按暴露年数将工人分为两组:甲组暴露10年,乙组暴露<10年。两组工人年龄未经控制。问该两组暴露于镉作业工人平均肺活量是否相同?镉作业工人接触烟尘年数与肺活量的关系研究镉作业工人接触烟尘年数与肺活量的关系研究 甲组(暴露甲组(暴露 1010年)年) 乙组(暴露乙组(暴露<10<10年)年) x1(x1(年龄年龄) y1() y1(肺活量,肺活量,L) L) x2(x2(年龄年龄) y2() y2(肺活量,肺活量,L) L) 49 4.6249 4.62 40 4.29 40 4.29 41 4.52 41 4.52 51 3.71 51 3.71 45 4.02 45 4.02 50 3.09 50 3.09 52 2.70 52 2.70 47 4.31 47 4.31 61 2.70 61 2.70 65 3.03 65 3.03 58 2.73 58 2.73 59 3.67 59 3.67 43 4.9143 4.9139 4.7339 4.7338 4.5838 4.5842 4.1242 4.1243 4.8943 4.8943 4.6243 4.6237 4.3037 4.3050 3.7050 3.7050 3.5050 3.5045 4.2045 4.2048 4.0648 4.0651 4.5151 4.5146 4.6646 4.6658 3.8858 3.8838 4.6438 4.6438 5.09 38 5.09 未经年龄校正时不同暴露年限的平均肺活量有差异(P=0.005) 不同暴露年限的平均年龄也有差异P=0.01问题:不同暴露年限的平均肺活量有差异吗?问题:不同暴露年限的平均肺活量有差异吗?方差不齐用校正t检验如何分析?假设假设1 1:肺活量与暴露无关而与年龄有关?:肺活量与暴露无关而与年龄有关?假设假设2 2:肺活量与暴露、年龄均有关?:肺活量与暴露、年龄均有关?假设假设3 3:肺活量仅与暴露有关而与年龄无关?:肺活量仅与暴露有关而与年龄无关?假设假设4 4:肺活量与暴露、年龄均无关?:肺活量与暴露、年龄均无关?研究因素(变量):暴露年限研究因素(变量):暴露年限控制因素(变量):年龄控制因素(变量):年龄结局变量:结局变量: 肺活量肺活量在不同的暴露水平上肺活量与年龄均呈线性关系!在不同的暴露水平上肺活量与年龄均呈线性关系!在不同的暴露水平上肺活量与年龄均呈线性关系!在不同的暴露水平上肺活量与年龄均呈线性关系!直接比较不同暴露年限的平均肺活量显然不合理如何分析比较:控制(或消除)年龄对肺活量的线性影响后,再比较不同暴露年限的平均肺活量!方法:协方差分析(线性回归+方差分析)消除了年龄对肺活量的线性影响后,不同暴露年限的平均肺活量无统计学上的差异一、协方差分析的意义一、协方差分析的意义 协方差协方差 是两个变量的协变异数是两个变量的协变异数 ,用,用COV(x,y)COV(x,y)表示。表示。 对于一个具有对于一个具有N N对对(x,y)(x,y)的的有限总体有限总体, x x与与y y的协方差定义为双变量离均差乘积和的协方差定义为双变量离均差乘积和的平均数,即:的平均数,即: 对于具有对于具有n n对观测值的样本,对观测值的样本,x x与与y y的的样样本协方差本协方差COVCOV(x, yx, y)定义为双变量离均差)定义为双变量离均差乘积和与自由度的商,即:乘积和与自由度的商,即: 样本样本协方差协方差亦称为亦称为均积均积, , 简记为简记为MPMP,是总体协方差的估计值。是总体协方差的估计值。 方差方差 是用来度量单个变量是用来度量单个变量 “ 自身变自身变异异”大小的总体参数,方差越大,该变量的大小的总体参数,方差越大,该变量的变异越大;变异越大; 协方差协方差是用来度量两个变量之间是用来度量两个变量之间 “协协同变异同变异”大小的总体参数,即二个变量相互大小的总体参数,即二个变量相互影响大小的参数,协方差的绝对值越大,二影响大小的参数,协方差的绝对值越大,二个变量相互影响越大。个变量相互影响越大。 对于仅涉及单个变量的试验资料,由于其对于仅涉及单个变量的试验资料,由于其总变异仅为总变异仅为“自身变异自身变异”(如单因素完全随机(如单因素完全随机设计试验资料,设计试验资料,“自身变异自身变异”是指由是指由处理处理和和随随机误差机误差所引起的变异所引起的变异),因而可以用方差分析),因而可以用方差分析法进行分析;法进行分析; 对于涉及两个变量的试验资料,由于每个对于涉及两个变量的试验资料,由于每个变量的变量的总变异总变异既包含了既包含了“自身变异自身变异”又包含了又包含了“协同变异协同变异”(是指(是指由另一个变量所引起的变由另一个变量所引起的变异异),须采用),须采用协方差分析协方差分析法来进行分析,才能法来进行分析,才能得到正确结论。得到正确结论。 二、协方差分析的二、协方差分析的功用功用 (一)对试验进行(一)对试验进行统计控制统计控制 要提高试验结果的正确性,必须严格控制试验要提高试验结果的正确性,必须严格控制试验条件的均匀性,使各处理处于尽可能一致的试验条条件的均匀性,使各处理处于尽可能一致的试验条件下,这一做法在统计上叫做件下,这一做法在统计上叫做试验控制试验控制。 但试验控制有时不一定能实施。例如,研究棉但试验控制有时不一定能实施。例如,研究棉花的蕾铃脱落率要求各处理的单株有相同蕾铃数,花的蕾铃脱落率要求各处理的单株有相同蕾铃数,研究不同肥料对梨树的单株产量的影响要求各株梨研究不同肥料对梨树的单株产量的影响要求各株梨树起始干周完全相同等,都不易达到。在这些情况树起始干周完全相同等,都不易达到。在这些情况下,要消除起始条件不等对试验结果的影响,提高下,要消除起始条件不等对试验结果的影响,提高试验结果分析的正确性,就应采用协方差分析。试验结果分析的正确性,就应采用协方差分析。 如果那些不能很好地进行试验控制的因素如果那些不能很好地进行试验控制的因素 是可量测的,且又和试验结果之间存在是可量测的,且又和试验结果之间存在直线回直线回归关系归关系,就可,就可利用这种直线回归关系将各处理利用这种直线回归关系将各处理的观测值都矫正到初始条件相同时的结果的观测值都矫正到初始条件相同时的结果,使,使得处理间的比较能在相同基础上进行,而得出得处理间的比较能在相同基础上进行,而得出正确结论。这一做法在统计上称为正确结论。这一做法在统计上称为统计控制统计控制。 这时所进行的协方差分析是将这时所进行的协方差分析是将回归分析回归分析和和方差分析方差分析结合起来的一种统计分析方法,这种结合起来的一种统计分析方法,这种协方差分析称为协方差分析称为回归模型的协方差分析回归模型的协方差分析。 (二)估计(二)估计协方差分量协方差分量 方差分析中根据均方方差分析中根据均方MSMS与期望均方与期望均方EMSEMS间的关系,可获得不同变异来源的方差分量间的关系,可获得不同变异来源的方差分量估计值;在协方差分析中,根据估计值;在协方差分析中,根据均积均积MPMP与与期期望均积望均积EMPEMP间的关系,可获得不同变异来源间的关系,可获得不同变异来源的协方差分量估计值。的协方差分量估计值。 这种协方差分析称为这种协方差分析称为相关模型的协方差相关模型的协方差分析分析。 第二节第二节 单因素完全随机设计试验资料的单因素完全随机设计试验资料的协方差分析协方差分析 【例例1010··1 1】 为研究为研究A A1 1、A A2 2、A A3 3、A A4 4 4 4种不种不同肥料(同肥料(k=4k=4)对梨树单株产量的影响,对梨树单株产量的影响, 选择选择4040株梨树作试验,株梨树作试验, 把把4040株梨树完全随机分为株梨树完全随机分为4 4组组, ,每组包含每组包含1010株梨树株梨树(n=10)(n=10),每组施用每组施用1 1种肥种肥料。各株梨树的起始干周(料。各株梨树的起始干周(x,cmx,cm)和单株产量和单株产量(y, kgy, kg)列于表列于表10101 1, 试检验试检验4 4种肥料的单种肥料的单株产量是否有显著差异。株产量是否有显著差异。 肥肥肥肥料料料料变变变变 量量量量观观观观 测测测测 值值值值总总总总 和和和和平平平平 均均均均A A1 13 36 63 30 02 26 62 23 32 26 63 30 02 20 01 19 92 20 01 16 6 246246 24.6 24.6 8 89 9 8 80 0 7 74 4 8 80 0 8 85 5 6 68 8 7 73 3 6 68 8 8 80 0 5 58 8 755755 75.575.5A A2 22 28 82 27 72 27 72 24 42 25 52 23 32 20 01 18 81 17 72 20 0 229229 22.922.96 64 48 81 17 73 36 67 77 77 76 67 76 64 46 65 55 59 95 57 7 674674 67.467.4A A3 32 28 83 33 32 26 62 22 22 23 32 20 02 22 22 23 31 18 81 17 7 232232 23.223.25 55 56 62 25 58 85 58 86 66 65 55 56 60 0 7 71 15 55 54 48 8 588588 58.858.8A A4 43 32 22 23 32 27 72 23 32 27 72 28 82 20 02 24 41 19 91 17 7 240240 24.024.05 52 25 58 86 64 46 62 25 54 45 54 45 55 54 44 45 51 15 51 1 545545 54.554.5 947947 23.6723.675 5 表表表表101010101 1 1 1 梨树梨树梨树梨树4 4 4 4种肥料比较试验的起始干周种肥料比较试验的起始干周种肥料比较试验的起始干周种肥料比较试验的起始干周(x,cmx,cm)与单株产量与单株产量与单株产量与单株产量(y,kgy,kg) 试验用试验用4 4种肥料分别施种肥料分别施1010株梨树,各组株梨树,各组的单株产量的单株产量 y y 既包含了不同肥料所引起的既包含了不同肥料所引起的“自身变异自身变异”,也包含了不同的起始干周,也包含了不同的起始干周x x所引起的所引起的 “协同变异协同变异”,因此应,因此应采用协方采用协方差分析法将差分析法将“协同变异协同变异”从从 y y 的总变异中的总变异中剔除,获得剔除,获得y y的的“自身变异自身变异”,然后才能正,然后才能正确地检验确地检验4 4种肥料平均单株产量是否有显著种肥料平均单株产量是否有显著差异。差异。 表表10101 1中观测值不仅具有肥料效应和随中观测值不仅具有肥料效应和随机误差,而且还受到起始干周的影响。故单因机误差,而且还受到起始干周的影响。故单因素完全随机设计试验资料观测值的数据结构式素完全随机设计试验资料观测值的数据结构式为为: : (一)试验资料的数学模型一)试验资料的数学模型 其中其中 x和和y和分别是和分别是x和和y的总体平均数;的总体平均数; 为第为第i个处理效应个处理效应(固定效应固定效应); 为各组依总体的回归系数为各组依总体的回归系数 的加权的加权 平均数平均数(假定假定 成立成立), 为由于为由于 偏离偏离x所引起的所引起的y的变异部分;的变异部分; 为为 随随 机机 误误 差差 、相、相 互互 独独 立立 、且、且 都都 服服 从从 N(0,2)。 (10-3)(10-3)式式就就是是单单因因素素完完全全随随机机设设计计试试验验资料协方差分析的数学模型。资料协方差分析的数学模型。 由由(10-3)(10-3)式移项可得式移项可得 若将若将y yijij用样本统计量来表示,则有用样本统计量来表示,则有: : 若令若令 或或 , ,则则(10-4)(10-4)式或式或(10-7)(10-7)式说明式说明, ,在观测值中剔除处理效应后,在观测值中剔除处理效应后,即误差项,进行即误差项,进行 与与 的线性回归分析,可的线性回归分析,可求出求出 的估计值的估计值b be e; 若令若令 或或 , ,则则(10-5)(10-5)式或式或(10-8)(10-8)式说明式说明, ,在对观测值进行回在对观测值进行回归矫正后归矫正后, , 对对 进行方差分析就排出了进行方差分析就排出了x xijij不不一致对一致对y yijij的影响。的影响。 (二)计算变量(二)计算变量x x和和y y的各项自由度、平方和的各项自由度、平方和与乘积和与乘积和 表表表表10-210-210-210-2、 表表表表10-110-110-110-1资料的自由度、平方和与乘积和资料的自由度、平方和与乘积和资料的自由度、平方和与乘积和资料的自由度、平方和与乘积和 变异来源变异来源变异来源变异来源dfdfSSSSx xSSSSy ySPSP肥料间肥料间肥料间肥料间3 317.87517.8752610.2610.9 973.8573.85肥料内(误差)肥料内(误差)肥料内(误差)肥料内(误差) 3636878.9878.91951.1951.0 0646.8646.8总总总总变异变异变异变异3939896.775896.7754561.4561.9 9720.6720.65 5乘积和计算如下乘积和计算如下 表表表表10-310-310-310-3、起始干周、起始干周、起始干周、起始干周x x x x和单株产量和单株产量和单株产量和单株产量y y y y的方差分析表的方差分析表的方差分析表的方差分析表 变异变异变异变异来源来源来源来源dfdf x x x x变量变量变量变量 y y y y变量变量变量变量临界临界F F值值SSSSMSMSF FSSSSMSMSF F肥料间肥料间肥料间肥料间3 317.87517.8755.9845.9840.240.244 42610.2610.9 9870.3870.316.05916.059*F F0.050.05=2.8=2.86 6F F0.010.01=4.3=4.38 8肥料内肥料内肥料内肥料内(误差)(误差)(误差)(误差)3636878.9878.924.4124.414 41951.1951.0 054.1954.194 4总总总总变异变异变异变异3939896.77896.775 54561.4561.9 9(三)对(三)对x和和y作方差分析作方差分析 F F检验结果表明,检验结果表明,4 4种肥料的供试梨树种肥料的供试梨树起始干周差异不显著,单株产量差异极显著。起始干周差异不显著,单株产量差异极显著。 这里对这里对y y进行的进行的F F检验是在没有考虑检验是在没有考虑x x的的影响下进行的影响下进行的, , 若若x x与与y y之间没有显著的回归之间没有显著的回归关系关系, ,即即x x对对y y没有显著影响,上面对没有显著影响,上面对y y进行的进行的F F检验结果可以接受;检验结果可以接受; 若若x x与与y y之间有显著的之间有显著的回归关系回归关系, ,即即x x对对y y有显著影响有显著影响, , 则需对则需对y y矫正矫正后再进行的后再进行的F F检验检验, ,才能获得正确结论。才能获得正确结论。 (四)计算回归系数并进行显著性检验(四)计算回归系数并进行显著性检验 回归系数由误差项的统计数计算。回归系数由误差项的统计数计算。 b be e=0.7359=0.7359表示起始干周改变表示起始干周改变1cm1cm,单株单株产量将平均改变产量将平均改变0.7359 kg0.7359 kg。 对对b be e进行显著性检验如下:进行显著性检验如下: ( (五五) )对矫正后的单株产量作方差分析对矫正后的单株产量作方差分析 矫正单株产量的总平方和与自由度,即总矫正单株产量的总平方和与自由度,即总离回归平方和与自由度,记为离回归平方和与自由度,记为SSSST T、dfdfT T: 1、求矫正后的单株产量的各项平方和及自、求矫正后的单株产量的各项平方和及自由度由度 矫正单株产量的误差平方和与自由度,即矫正单株产量的误差平方和与自由度,即误差离回归平方和与自由度,记为误差离回归平方和与自由度,记为SSSSe e、dfdfe e 矫正单株产量处理间平方和与自由度,记矫正单株产量处理间平方和与自由度,记为为SSt、dft 2 2、对矫正单株产量进行方差分析对矫正单株产量进行方差分析 表表10-4 10-4 矫正单株产量的方差分析表矫正单株产量的方差分析表 变异来源变异来源变异来源变异来源dfdfSSSSMSMSF F值值值值肥料间肥料间肥料间肥料间3 32507.7772507.777835.92835.926 619.83519.835*肥料内肥料内肥料内肥料内(误差)(误差)(误差)(误差)35351475.0071475.00742.14342.143总总总总变异变异变异变异38383982.7843982.784 F=19.835F=19.835F F0.01(3,35)0.01(3,35),p p0.010.01,不同肥料不同肥料的矫正单株产量间存在极显著的差异,须进一的矫正单株产量间存在极显著的差异,须进一步进行多重比较。步进行多重比较。 3 3、根据线性回归关系计算各肥料的矫正、根据线性回归关系计算各肥料的矫正平均单株产量平均单株产量 矫正平均单株产量计算公式如下:矫正平均单株产量计算公式如下: 其中:其中: 为第为第i i处理矫正单株平均产量;处理矫正单株平均产量; 为第为第i i处理实际单株平均产量;处理实际单株平均产量; 为第为第i i处理实际平均起始干周;处理实际平均起始干周; 为全试验的平均数;为全试验的平均数; 为误差回归系数。为误差回归系数。 4 4、各肥料矫正单株平均产量间的多重比较、各肥料矫正单株平均产量间的多重比较 (1 1)t t检验法检验法 例如,检验例如,检验A A1 1与与A A2 2矫正单株平均产量间的矫正单株平均产量间的差异显著性差异显著性: 查查 t t 值表值表, t, t0.05(35) 0.05(35) = 2.030= 2.030,t t t t0.0(35)0.0(35),p p0.050.05,表明肥料表明肥料A A1 1与与A A2 2矫正单株平均产量间的矫正单株平均产量间的差异不显著。差异不显著。 其余的每两处理矫正平均数间的比较都须另其余的每两处理矫正平均数间的比较都须另行算出行算出 , ,再进行再进行t t检验。检验。 (2 2)LSD法法 当误差项自由度在当误差项自由度在2020以上,以上,x x变量的变异不变量的变异不甚大甚大( (即即x x变量各处理平均数间差异不显著变量各处理平均数间差异不显著) ),为,为简便起见,可计算一个平均的简便起见,可计算一个平均的 ,采用,采用LSDLSD法法进行多重比较。进行多重比较。 查临界查临界t t值值 t t,dfe,dfe,计算出最小显著差数:,计算出最小显著差数: 本例本例 查临界查临界t t值得值得 t t0.05(35)0.05(35)= =2.0302.030,t t0.01(350.01(35)= =2.7242.724 于是于是 LSDLSD0.050.05=2.030=2.030××2.913=5.9132.913=5.913 LSD LSD0.010.01=2.724=2.724××2.913=7.9352.913=7.935 表表10-5 10-5 不同肥料矫正单株平均产量多不同肥料矫正单株平均产量多重比较表重比较表(LSD(LSD法法) ) 肥料肥料 矫正单株产量矫正单株产量平均重平均重 - -54.26154.261 - -56.15056.150 - -67.97067.970A A1 174.81974.81920.55820.558*18.66818.668*6.8496.849* *A A2 267.97067.97013.70913.709*11.82011.820*A A3 356.15056.1501.8891.889A A4 454.26154.261 多重比较结果表明:多重比较结果表明: 除除A A3 3、A A4 4矫正单株矫正单株平均产量间的差异不显著外平均产量间的差异不显著外 ,其余各种肥料,其余各种肥料两两间单株平均产量差异显著或极显著。两两间单株平均产量差异显著或极显著。 这里表现为肥料这里表现为肥料A A1 1的单株平均产量显著或的单株平均产量显著或极显著高于其余极显著高于其余3 3种肥料的单株平均产量;肥种肥料的单株平均产量;肥料料A A2 2的单株平均产量极显著高于肥料的单株平均产量极显著高于肥料A A3 3、A A4 4的的单株平均产量。单株平均产量。 4 4种肥料以种肥料以A A1 1的单株产量最高的单株产量最高, A, A2 2次之次之, , A A3 3、A A4 4的单株产量最低。的单株产量最低。 (3) LSR 法 当误差自由度在当误差自由度在2020以上,以上,x x变量的变异不变量的变异不甚大,还可以计算出平均的矫正平均数标准甚大,还可以计算出平均的矫正平均数标准误误 ,利用,利用LSRLSR 法进行多重比较。法进行多重比较。 由由误误差差自自由由度度dfdfe e和和秩秩次次距距k k查查SSRSSR值值(或(或q q值),计算最小显著极差:值),计算最小显著极差: 对于对于【例例1010··1 1】 SSRSSR值与值与LSRLSR值见表值见表10106 6。 表表10106 SSR6 SSR值与值与LSRLSR值表值表秩次距秩次距k k2 23 34 4SSRSSR0.050.052.8752.8753.0253.0253.113.11SSRSSR0.010.013.8553.8554.0254.0254.134.13LSRLSR0.050.055.9225.9226.2316.2316.4066.406LSRLSR0.010.017.9417.9418.2918.2918.5078.507表表表表10-7 10-7 10-7 10-7 不同肥料的矫正单株产量平均重多重比不同肥料的矫正单株产量平均重多重比不同肥料的矫正单株产量平均重多重比不同肥料的矫正单株产量平均重多重比较表较表较表较表(SSR(SSR(SSR(SSR法法法法) ) ) )肥料肥料矫矫 正正 单单 株株 产产量量平均重平均重 - - 54.26154.261 - - 56.15056.150 - - 67.97067.970A A1 174.81974.81920.55820.558*18.668*18.668*6.849*6.849*A A2 267.97067.97013.70913.709*11.82011.820*A A3 356.15056.150 1.8891.889-56.150-56.150A A4 454.26154.261- -54.26154.261用用SSRSSR法进行多重比较的结果与法进行多重比较的结果与LSDLSD法相同。法相同。 第三节第三节 单因素随机区组设计试验资料单因素随机区组设计试验资料 的协方差分析的协方差分析 【例例1010··3 3】 对对6 6个菜豆品种(个菜豆品种(k=6k=6)进进行维生素行维生素C C含量(含量(y y,mg/100gmg/100g)比较试验,比较试验,4 4次重复(次重复(n=4n=4),),随机区组设计。随机区组设计。 根据前人的研究根据前人的研究根据前人的研究根据前人的研究, , , , 菜豆维生素菜豆维生素菜豆维生素菜豆维生素C C C C含量不仅与品含量不仅与品含量不仅与品含量不仅与品种有关种有关种有关种有关, , , ,而且与豆荚的成熟度有关。而且与豆荚的成熟度有关。而且与豆荚的成熟度有关。而且与豆荚的成熟度有关。 但在试验中又但在试验中又但在试验中又但在试验中又无法使所有小区的豆荚都同时成熟无法使所有小区的豆荚都同时成熟无法使所有小区的豆荚都同时成熟无法使所有小区的豆荚都同时成熟 , , , ,所以同时测定所以同时测定所以同时测定所以同时测定了了了了100g100g100g100g所采豆荚干物重百分率所采豆荚干物重百分率所采豆荚干物重百分率所采豆荚干物重百分率x x x x, 作为豆荚成熟度作为豆荚成熟度作为豆荚成熟度作为豆荚成熟度指标。测定结果列于表指标。测定结果列于表指标。测定结果列于表指标。测定结果列于表10-710-710-710-7,试作协方差分析。,试作协方差分析。,试作协方差分析。,试作协方差分析。 表表10-7 10-7 菜豆品种的维生素菜豆品种的维生素C C含量与豆荚干含量与豆荚干物重百分率测定结果物重百分率测定结果 品品品品种种种种区组区组区组区组I I I I 区组区组区组区组IIIIIIII区组区组区组区组IIIIIIIIIIII区组区组区组区组IVIVIVIV合计合计合计合计平均平均平均平均x xi1i1y yi1i1x xi2i2y yi2i2x xi3i3y yi3i3x xi4i4y yi4i4x xi i· ·y yi i· ·A A1 134.034.093.093.033.433.494.894.834.734.791.791.738.938.980.80.8 8141.141.0 0 360.3360.335.235.25 5 90.0890.08A A2 239.639.647.347.339.839.851.551.551.251.233.333.352.052.027.27.2 2182.182.6 6 159.3159.345.645.65 5 39.83 39.83 A A3 331.731.781.481.430.130.1109.109.0 033.833.871.671.639.639.657.57.5 5135.135.2 2 319.5319.533.833.80 0 79.8879.88A A4 437.737.766.966.938.238.274.174.140.340.364.764.739.439.469.69.3 3155.155.6 6275.0275.038.938.90 0 68.7568.75A A5 524.924.9119.119.5 524.024.0128.128.5 524.924.9125.125.6 623.523.5129.129.0 097.3 97.3 502.6502.624.324.32 2 125.6125.65 5 A A6 630.330.3106.106.6 629.129.1111.111.4 431.731.799.099.028.328.3126.126.1 1119.119.4 4 443.1443.129.829.85 5 110.7110.78 8 198.198.2 2194.194.6 6216.216.6 6221.221.7 7831.831.1 134.634.62 2514.514.7 7569.569.3 3485.485.9 9489.489.9 92059.2059.8 8 (一)试验资料的数学模型(一)试验资料的数学模型 这个试验是单因素随机区组试验这个试验是单因素随机区组试验, ,总变总变异可分解成处理、区组、误差异可分解成处理、区组、误差3 3项,因此,项,因此,单因素随机区组设计试验资料观测值单因素随机区组设计试验资料观测值y yijij的的数据结构式为:数据结构式为: 其中,其中,R Rj j为第为第j j个区组效应,个区组效应, 、 、 、 、 、 的意义同前。的意义同前。 移项可得移项可得 若用样本统计量来表示若用样本统计量来表示 ,则为,则为 其其中中,r rj j是是RjRj的的估估计计值值, 、 、t ti i、b be e、e eijij的意义同前。的意义同前。 若令若令 或或 , ,则则(10-20)(10-20)式或式或(10-23)(10-23)式说明式说明, , 在观测值在观测值y yijij中剔除处理中剔除处理效应、区组效应后,即误差项,进行效应、区组效应后,即误差项,进行 Y Yijij与与x xijij的线性回归分析,可求出的线性回归分析,可求出 的估计值的估计值b be e; 若令若令 或或 , ,则则(10-(10-21)21)式或式或(10-24)(10-24)式说明式说明, ,在对观测值在对观测值y yijij进行回进行回归矫正后归矫正后, , 对对y yijij进行方差分析就排出了进行方差分析就排出了 x xijij不一致对不一致对y yijij的影响。的影响。 (二)计算变量(二)计算变量x x和和y y的各项自由度、平方的各项自由度、平方和与乘积和和与乘积和 表表表表10-8 10-8 10-8 10-8 表表表表10-10-10-10-资料的自由度、平方和与乘积和资料的自由度、平方和与乘积和资料的自由度、平方和与乘积和资料的自由度、平方和与乘积和变异来源变异来源变异来源变异来源 dfdf SSSSx x SSSSy y SPSP区组区组区组区组3 389.507989.5079 737.565737.565- -219.8092219.8092品种间品种间品种间品种间5 51079.151079.1521 21 18678.218678.21515- -4407.6574407.6575 5品种内品种内品种内品种内(误差)(误差)(误差)(误差)1515 134.969134.9696 6 1693.081693.085 5- -360.0390360.0390总变异总变异总变异总变异2323 1303.621303.6296 96 21108.821108.86565- -4987.5074987.5075 5品种品种品种品种+误差误差误差误差2020 1214.121214.12171720371.320371.30000- -4767.6964767.6965 5 乘积和计算如下:乘积和计算如下: (三)对(三)对x x和和y y作方差分析作方差分析 表表表表10-9 10-9 10-9 10-9 豆荚干物重百分率豆荚干物重百分率豆荚干物重百分率豆荚干物重百分率x x x x和维生素和维生素和维生素和维生素C C C C含量含量含量含量y y y y的方的方的方的方差分析表差分析表差分析表差分析表 变异来变异来源源dfdf x x变量变量 y y变量变量临界临界F F值值SSSSMSMSF FSSSSMSMSF F品种间品种间5 51079.1521079.1521 1 215.830215.8304 423.9923.99*18678.2118678.215 5 3735.64303735.643033.1033.10 *F F0.010.01=4.6=4.69 9品种内品种内(误差)(误差)1515134.9696134.96968.99808.99801693.0851693.085 112.8723112.8723品种品种+ +误误差差20201214.1211214.1217 720371.3020371.300 0 F F检验结果表明,检验结果表明,6 6个品种的豆荚干物重百个品种的豆荚干物重百分率和维生素分率和维生素C C含量差异均极显著。含量差异均极显著。 (四)计算回归系数(四)计算回归系数b be e并进行显著性检验并进行显著性检验 对对b be e进行显著性检验如下:进行显著性检验如下: (五)对矫正后的维生素(五)对矫正后的维生素C C含量作方差分析含量作方差分析 矫正总平方和与自由度,即总离回归平方矫正总平方和与自由度,即总离回归平方和与自由度,记为和与自由度,记为SSSST T、dfdfT T: 矫正误差项平方和与自由度,即误差离矫正误差项平方和与自由度,即误差离回归平方和与自由度,记为回归平方和与自由度,记为SSSSe e、dfdfe e SSSSe e= =SSSSerer=732.6607 =732.6607 dfdfe e= =dfdferer=14=14 矫正品种间平方和与自由度,记为矫正品种间平方和与自由度,记为SSSSt t、dfdft t : SSSSt t= SS= SST T- -SSSSe e =1649.1818-732.6607=916.5211 =1649.1818-732.6607=916.5211 dfdft t= = dfdfT T- - dfdfe e=k-1=4-1=3 =k-1=4-1=3 2 2、对矫正维生素、对矫正维生素C C含量进行方差分析含量进行方差分析 表表表表10-10 10-10 10-10 10-10 矫正维生素矫正维生素矫正维生素矫正维生素C C C C含量的方差分析表含量的方差分析表含量的方差分析表含量的方差分析表 变异来源变异来源dfdfSSSSMSMSF F值值品种间品种间5 5916.5211916.5211183.3042183.30423.503.50* *品种内(误差)品种内(误差)1414732.6607732.660752.332952.3329总总变异变异19191649.18181649.1818 F F0.05(5,14)0.05(5,14)=2.96=2.96,F F0.01(5,14)0.01(5,14)=4.69=4.69, 由于由于F F0.05(5,14)0.05(5,14)F FF F0.01(5,14)0.01(5,14),0.010.01p p0.050.05,表明表明不同品种的矫正维生素不同品种的矫正维生素C C含量间存在显著差异,含量间存在显著差异,故须进一步进行多重比较。故须进一步进行多重比较。 3 3、根据直线回归关系计算各品种的矫、根据直线回归关系计算各品种的矫正平均维生素正平均维生素C C含量含量 4 4、各品种矫正平均维生素、各品种矫正平均维生素C C含量间的多重比较含量间的多重比较 由于由于6 6个品种的豆荚干物重百分率个品种的豆荚干物重百分率x x差异极差异极显著显著, ,只能用只能用t t检验法检验两个品种矫正平均维检验法检验两个品种矫正平均维生素生素C C含量间的差异显著性。含量间的差异显著性。 例如,检验品种例如,检验品种A A5 5与与A A6 6矫正平均维生素矫正平均维生素C C含量间的差异显著性:含量间的差异显著性: 于是于是 表明品种表明品种A5与与A6矫正平均维生素矫正平均维生素C含量间含量间差异不显著。差异不显著。 再如,检验品种再如,检验品种A6与与A2矫正平均维生素矫正平均维生素C含量间的差异显著性含量间的差异显著性: t0.05(14)=2.145,t0.01(14)=2.977, t0.05(15) t t0.01(15), 0.01p0.05 表明表明A6与与A2矫正平均维生素矫正平均维生素C含量间差含量间差异显著。异显著。 其它品种矫正平均维生素其它品种矫正平均维生素C含量两两之含量两两之间的差异显著检验类似。间的差异显著检验类似。 表表10-11 10-11 三组大鼠的进食量(三组大鼠的进食量(x,gx,g)与所增体重(与所增体重(y,gy,g)区组区组 核黄素缺乏组核黄素缺乏组 限食量组限食量组 不限食量组不限食量组 x y x y x y x y x y x y 1 256.9 27.0 260.3 32.0 544.7 160.31 256.9 27.0 260.3 32.0 544.7 160.3 2 271.6 41.7 271.1 47.7 481.2 96.1 2 271.6 41.7 271.1 47.7 481.2 96.1 3 210.2 25.0 214.7 36.7 418.9 114.6 3 210.2 25.0 214.7 36.7 418.9 114.6 4 300.1 52.0 300.1 65.0 566.6 134.8 4 300.1 52.0 300.1 65.0 566.6 134.8 5 262.2 14.5 269.7 39.0 394.5 76.3 5 262.2 14.5 269.7 39.0 394.5 76.3 6 304.4 48.8 307.5 37.9 426.6 72.8 6 304.4 48.8 307.5 37.9 426.6 72.8 7 272.4 48.0 278.9 51.5 416.1 99.4 7 272.4 48.0 278.9 51.5 416.1 99.4 8 248.2 9.5 256.2 26.7 549.9 133.7 8 248.2 9.5 256.2 26.7 549.9 133.7 9 242.8 37.0 240.8 41.0 580.5 147.0 9 242.8 37.0 240.8 41.0 580.5 147.0 10 342.9 56.5 340.7 61.3 608.3 165.8 10 342.9 56.5 340.7 61.3 608.3 165.8 11 356.9 76.0 356.3 102.1 559.6 169.8 11 356.9 76.0 356.3 102.1 559.6 169.8 12 198.2 9.2 199.2 8.1 371.9 54.3 12 198.2 9.2 199.2 8.1 371.9 54.3结果(解释略)结果(解释略)General Linear Models ProcedureGeneral Linear Models ProcedureDependent Variable: YDependent Variable: YSource DF Sum of Squares Mean Square F Value Pr > FSource DF Sum of Squares Mean Square F Value Pr > FModel 14 73431.56387003 5245.11170500 47.25 0.0001Model 14 73431.56387003 5245.11170500 47.25 0.0001Error 21 2331.04585219 111.00218344Error 21 2331.04585219 111.00218344Corrected Total 35 75762.60972222Corrected Total 35 75762.60972222 R-Square C.V. Root MSE Y Mean R-Square C.V. Root MSE Y Mean 0.969232 15.67886 10.53575737 67.19722222 0.969232 15.67886 10.53575737 67.19722222Source DF Type III SS Mean Square F Value Pr > FSource DF Type III SS Mean Square F Value Pr > FX 1 6077.12359225 6077.12359225 54.75 0.0001X 1 6077.12359225 6077.12359225 54.75 0.0001A 11 3766.10034965 342.37275906 3.08 0.0128A 11 3766.10034965 342.37275906 3.08 0.0128B 2 452.99349771 226.49674886 2.04 0.1550B 2 452.99349771 226.49674886 2.04 0.1550校正了进食量(X)后不同饲料组所增平均体重比较多元完全随机设计的协方差分析多元完全随机设计的协方差分析 如果需控制的因素在二个以上,则为多元协方差分析。如测量了30名初生儿至3周岁儿童的身高、体重和体表面积,男女各15名,考虑男女身高、体重相同时体表面积是否相同,即能否将男女由身高、体重推算体表面积的推算公式合并为一个,则需进行多元协方差分析。3030名婴幼儿身高(名婴幼儿身高(cm)cm)、体重(体重(kgkg)及体表面积(及体表面积(cmcm2 2) 男男(=1) (=1) 女女(=2)(=2)身高身高(x1) (x1) 体重体重(x2) (x2) 体表面积体表面积(y)(y)身高身高(x1) (x1) 体重体重(x2) (x2) 体表面积体表面积(y)(y) 54 3 2446.2 54 3 2117.3 54 3 2446.2 54 3 2117.3 50.5 2.25 1928.4 53 2.25 2200.2 50.5 2.25 1928.4 53 2.25 2200.2 51 2.5 2094.5 51.5 2.5 2200.2 51 2.5 2094.5 51.5 2.5 2200.2 56.5 3.5 2506.7 51 3 1950.3 56.5 3.5 2506.7 51 3 1950.3 52 3 2121.0 51 3 1632.5 52 3 2121.0 51 3 1632.5 76 9.5 3845.9 77 7.5 3934.0 76 9.5 3845.9 77 7.5 3934.0 80 9 4380.8 77 10 4180.4 80 9 4380.8 77 10 4180.4 74 9.5 4314.2 77 9.5 4246.1 74 9.5 4314.2 77 9.5 4246.1 80 9 4078.4 74 9 3358.8 80 9 4078.4 74 9 3358.8 76 8 4143.5 73 7.5 3809.7 76 8 4143.5 73 7.5 3809.7协方差分析条件正态分布(因变量)方差齐性回归线平行H0:1=2方法:1)回归系数比较的t检验 2)多元线性回归