
协方差分析理论与案例.docx
12页协方差分析理论与案例假设我们有N个个体的K个属性在T个不同时期的样本观测值,用,,…,N,t=1,…,T,k=1,…,K表示一般假定的观测值是某随机实验的结果,该实验结果在属性向量和参数向量下的条件概率分布为使用面板数据的最终目标之一就是利用获取的信息对参数进行统计推断,譬如常假设假定的是关于的线性函数的简单模型协方差分析检验是识别样本波动源时广泛采用的方法方差分析:常指一类特殊的线性假设,这类假设假定随机变量y的期望值仅与所考察个体所属的类(该类由一个或多个因素决定)有关,但不包括与回归有关的检验而协方差分析模型具有混合特征,既像回归模型一样包含真正的外生变量,同时又像通常的方差一样允许每个个体的真实关系依赖个体所属的类常用来分析定量因素和定性因素影响的线性模型为:从两个方面对回归系数估计量进行检验:首先,回归斜率系数的同质性;其次,回归截距系数的同质性检验过程主要有三步:(1) 检验各个个体在不同时期的斜率和截距是否都相等;(2) 检验(各个体或各时期的)回归斜率(向量)是否都相等;(3) 检验各回归截距是否都相等显然,如果接受完全同同质性假设(1),则检验步骤中止但如果拒绝了完全同质性性假设,则(2)将确定回归斜率是否相同。
如果没有拒绝斜率系数的同质性假设,则(3)确定回归截距是否相等1)是从(2)、(3)分离出来的基本思想:在作两组或多组均数,,…,的假设检验前,用线性回归分析方法找出协变量X与各组Y之间的数量关系,求得在假定X相等时修定均数,,…,然后用方差分析比较修正均数间的差别,这就是协方差分析的基本思想协方差分析的应用条件:⑴要求各组资料都来自正态总体,且各组的方差相等;(检验或方差分析的条件)⑵各组的总体回归系数相等,且都不等于0(回归方程检验)因此,应用协方差分析前,要对资料进行方差齐性检验和回归系数的假设检验(斜率同质性检验),只有满足上述两个条件之后才能应用,否则不宜使用⑴各比较组协变量X与分析指标Y存性关系(按直线回归分析方法进行判断)⑵各比较组的总体回归系数相等,即各直线平行(绘出回归直线,看是否平行) 协方差分析适用的资料:完全随机设计、随机区组设计、拉丁方设计、析因设计等资料;协变量X可以仅有一个,称一元协方差分析;协变量也可以有多个,称多元协方差分析 协方差计算公式:相关系数:将公式右端的分子分母同除以自由度(n-1),得:其中:是x的均方MSx,它是x的方差 的无偏估计量;是y的均方MSy,它是y的方差的无偏估计量;称为x与y的平均的离均差的乘积和,简称均积,记为MPxy,即与均积相应的总体参数叫协方差(covariance),记为COV(x,y)或。
统计学证明了,均积MPxy是总体协方差COV(x,y)的无偏估计量,即 EMPxy= COV(x,y)于是,样本相关系数r可用均方MSx、MSy,均积MPxy表示为:相应的总体相关系数ρ可用x与y的总体标准差、,总体协方差COV(x,y)或表示如下:均积与均方具有相似的形式,也有相似的性质在方差分析中,一个变量的总平方和与自由度可按变异来源进行剖分,从而求得相应的均方统计学已证明:两个变量的总乘积和与自由度也可按变异来源进行剖分而获得相应的均积这种把两个变量的总乘积和与自由度按变异来源进行剖分并获得相应均积的方法亦称为协方差分析1.协方差分析是将线性回归与方差分析相结合的一种分析方法;2.把对反应变量Y有影响的因素X看作协变量,建立Y对X的线性回归,利用回归关系把X值;3.化为相等,再进行各组Y的修正均数间比较修正均数是假设各协变量取值固定在其总均数时的反应变量Y的均数其实质是从Y的总离均差平方和中,扣除协变量X对Y的回归平方和,对离回归平方和作进一步分解后再进行方差分析方差分析的前提是除随机误差外,水平变量是影响观测值的唯一变量,方差分析数据结构:第i组第j个观测值随机误差第i组的组效应一般均值协方差分析将方差分析与回归分析结合了起来,协方差分析数据结构:协变量效应回归系数协方差案例: 设有k个处理、n次重复的双变量试验资料,每处理组内皆有n对观测值x、y,则该资料为具kn对x、y观测值的单向分组资料,其数据一般模式如表10—1所示。
表 1 kn对观测值x、y的单向分组资料的一般形式处 理处理1处理2…处理i…处理k观测指标x yx y…x y…x y观测值xij、yij(i=1,2,…kj=1,2,…n)x11x12…x1j…x1ny11y12…y1j…y1nx21x22…x2j…x2ny21y22…y2j…y2n………………xi1xi2…xij…xinyi1yi2…yij…yin……………xk1xk2…xkj…xknyk1yk2…ykj…ykn总 和x1.y1.x2.y2.…xi.yi.…xk.yk.平均数…… 表1的x和y变量的自由度和平方和的剖分参见单因素试验资料的方差分析方法一节其乘积和的剖分则为: 总变异的乘积和是与和与的离均差乘积之和,即: (1) =kn-1 其中, 处理间的乘积和是与和与的离均差乘积之和乘以n,即: (10-6) 处理内的乘积和是与和与的离均差乘积之和,即: (10-7) =k(n-1) 以上是各处理重复数n相等时的计算公式,若各处理重复数n不相等,分别为n1、n2、…、nk,其和为,则各项乘积和与自由度的计算公式为: =-1 (10-8) -=SPT-SPt =-k =dfT-dft (10-9) 有了上述SP和df,再加上x和y的相应SS,就可进行协方差分析。
例10.1】 为了寻找一种较好的哺乳仔猪食欲增进剂,以增进食欲,提高断奶重,对哺乳仔猪做了以下试验:试验设对照、配方1、配方2、配方3共四个处理,重复12次,选择初始条件尽量相近的长白种母猪的哺乳仔猪48头,完全随机分为4组进行试验,结果见表10—2,试作分析此例, =18.25+15.40+15.65+13.85=63.15 =141.80+130.10+144.80+133.80=550.50 k=4,n=12,kn=4×12=48 表10—2 不同食欲增进剂仔猪生长情况表 (单位:kg)处 理对照配方1配方2配方3观 测指 标初生重x50日龄重y初生重x50日龄重y初生重x50日龄重y初生重x50日龄重y观 察 值xij,yij1.50 12.401.35 10.201.15 10.001.20 12.401.85 12.001.20 9.401.10 10.601.00 9.801.35 10.801.45 12.201.10 10.401.15 11.601.45 10.001.20 10.301.05 9.201.10 10.601.40 11.001.40 11.301.40 13.001.00 9.201.45 11.801.30 11.401.45 13.501.45 13.901.50 12.501.15 12.801.30 13.001.35 12.801.55 13.401.30 10.901.70 14.801.15 9.301.40 11.201.35 11.601.40 12.301.10 9.601.50 11.601.15 8.501.45 13.201.20 12.401.60 12.601.35 12.201.25 12.001.05 11.201.70 12.501.20 9.301.30 12.801.10 11.00总 和 xi.,yi.18.25 141.8015.40 130.8015.65 144.8013.85 133.80平 均 1.52 11.821.28 10.841.30 12.071.15 1.15 协方差分析的计算步骤如下: (一)求x变量的各项平方和与自由度 1、总平方和及自由度=kn-1=4×12-1=472、处理间平方和与自由度 =k-1=4-1=3 3、处理内平方和与自由度 =-=1.75-0.83=0.92 =-=47-3=44 (二)求y变量各项平方和与自由度 1、总平方和与自由度=kn-1=4×12-1=47 2、处理间平方和与自由度=k-1=4-1=3 3、处理内平方和与自由度 =-=96.76-11.68=85.08 =-=47-3=44 (三)求x和y两变量的各项离均差乘积和与自由度 1、总乘积和与自由度=kn-1=4×12-1=47 2、处理间乘积和与自由度 =1.64 =k-1=4-1=3 3、处理内乘积和与自由度 =-=8.25-1.64=6.61 =-=47-3=44 平方和、乘积和与自由度的计算结果列于表10—3。
表10—3 x与y的平方和与乘积和表变异来源df处理间(t)30.8311.68。
