
讲稿方差分析.doc
9页1方差分析(ANOVA)一. 方差分析的概念方差分析(analysis of variance, ANOVA)又称变异数分析或 F 检验,其目的是推断两组或多组资料的总体均数是否相同,检验两个或多个均数的差异是否有统计学意义我们要学习的主要内容包括单因素方差分析,即完全随机(成组)设计的方差分析和两因素方差分析即随机区组(配伍组)设计的方差分析方差分析除用于两个或多个均数的比较外,还可分析两个或多个研究因素的交互作用以及回归方程的线性假设检验等根据资料设计的类型及研究目的,可将总变异分解为两个或多个部分,每个部分的变异可由某因素的作用来解释,通过比较可能由某因素所致的变异与随机误差(如组内变异) ,即可了解该因素对测定结果有无影响此外,多个均数间的比较,由于涉及的对比组数大于 2,若仍用两组比较的t检验,对每两个对比组作比较,会使犯第一类错误的概率()增大例如:有 5 个均数的比较,可以用 10 次 t 检验比较,若每次比较的检验水准=0.05,则每次比较不犯第一类错误的概率为(1-0.05)=0.95,那么 10 次比较均不犯第一类错误的概率为 0.9510=0.5987,这时犯第一类错误的概率,也就是总的显著性水准变为 1-0.95 10=0.4013,比 0.05 大多了,大大增加了犯第一类错误的概率,可能把本来无差别的两个总体均数判为有差别。
因此,多个均数比较不宜用前述t检验分别作两两比较2二.方差分析的应用条件方差分析的应用条件如下:1.正态分布,要求资料服从正态分布,偏态分布资料不适用方差分析对偏态分布的资料应考虑使用秩和检验,或用变量变换方法将数据转变为正态或接近正态后再进行方差分析2.方差齐性,即各组的方差要相等,若组间方差不齐则不适用方差分析故方差分析前,应做多个方差的齐性检验3.各样本是相互独立的随机样本三.完全随机(成组)设计的方差分析下面我们用一个简单的例子来说明其基本思想:三种方案治疗后血红蛋白增加量(g/L)方案 观察值 nA 24 36 25 14 26 34 23 7B 20 18 17 10 19 24 6C 20 11 6 3 0 -1 4 5 8三种人的载脂蛋白测定结果糖尿病 IGT 正常人85.7 96.0 144.0105.2 124.5 117.0109.5 105.1 110.096.0 76.4 109.0115.2 95.3 103.095.3 110.0 123.0110.0 95.2 127.0100.0 99.0 121.0125.0 120.0 159.03111.0 115.0106.5从以上资料可以看出,30 个观对象的载脂蛋白量各不相同,就其变异情况来分析,其总变异有以下两个来源:组内变异:每组内部各个观察对象的载脂蛋白量各不相同,就其原因主要是由于随机误差所引起的。
这种变异,叫做组内变异组间变异:三组患者的载脂蛋白量的均数不相等,导致不相等的原因,一是不同人群(处理不同)的影响,二是随机误差所引起这种变异,叫做组间变异方差分析就是对数据中所包含的变异进行分析,并找出总变异中的各组成部分,如上述完全随机设计的例子,其总变异与及各组部分的关系为:SS 总 = SS 组间 +SS 组内 v 总 = v 组间 +v 组内 完全随机设计的方差分析,其假设如下:H0: 各总体均数相等H1: 各总体均数不等或不全相等=0.05完全随机设计的方差分析变异分解表变异来源 SS自由度vMS(方差,均方) F 值 P 值组间 SS 组间 v 组间 MS 组间 = SS 组间 / v 组间MS 组间 / MS 组内F≥F ,1,2P≤组内 SS 组内 v 组内 MS 组内 = SS 组内 / v 组 F 4内合计 SS 总 v 总完全随机设计的方差分析,其 F 值就是用组间均方去除以组内均方(MS组间 /MS 组内 )的商若 F,各均数间的差异没有统计学意义;若 F ≥F ,1,2 则 P≤ ,各总体均数不等或不全相等,即各组均数间的差异有统计学意义,此时,还需进行后述的多重比较。
四. 随机区组(配伍)设计的方差分析对随机区组(配伍) 设计的多个均数比较,应采用随机区组(配伍) 设计的方差分析,即两因素方差分析三种营养素喂养小白鼠的增重(g)区组号 A 营养素 B 营养素 C 营养素1 50.1 58.2 64.52 47.8 48.5 62.43 53.1 53.8 58.64 63.5 64.2 72.55 71.2 68.4 79.36 41.4 45.7 38.47 61.9 53.0 51.28 42.2 39.8 46.2随机区组(配伍) 设计的方差分析的基本步骤相同,只是随机区组(配伍) 设计方差分析变异的分解方式不同,对随机区组(配伍组)设计的资料,总变异可分解为处理组变异、区组组变异和随机误差,其总变异与及各组部分的关系为:5SS 总 =SS 处理 +SS 区组 +SS 误差v 总 =v 处理 +v 区组 +v 误差随机区组设计的方差分析,可有两个假设,具体如下:各处理间比较的假设H0: 各总体均数相等H1: 各总体均数不等或不全相等=0.05各区组间比较的假设H0: 各总体均数相等H1: 各总体均数不等或不全相等=0.05随机区组设计的方差分析变异分解表变异来源SS v自由度MS(方差,均方) F 值 P 值处理 SS 处理 v 处理 MS 处理 = SS 处理 / v 处理MS 处理 / MS 误差F≥F ,1,2P≤区组 SS 区组 v 区组 MS 区组 = SS 区组 / v 区组MS 区组 / MS 误差F 合计 SS 总 v 总6随机区组设计的方差分析,可计算得到两个 F 值,即 F1=MS 处理 / MS 误差和 F2=MS 区组 / MS 误差 ,若 F1,各均数间的差异没有统计学意义;若 F1≥F ,1,2 则 P≤,各组均数间的差异有统计学意义;若 F2,各区组间的差异没有统计学意义;若 F2≥F ,1,2 则 P≤,各区组间的差异有统计学意义。
五.多个均数的两两比较经过方差分析若拒绝了检验假设,只能说明多个样本所代表的总体均数不相等或不全相等若要得到各组均数间更详细的信息,应在方差分析的基础上进行多个均数间的两两比较,即多个均数间的多重比较多个均数间的多重比较(multiple comparison) ,又称两两比较由于涉及的对比组数大于 2,若仍用前述比较的t检验,对每两个对比组作比较,会使犯第一类错误的概率()增大例如:有 5 个均数的比较,可以用 10 次 t 检验比较,若每次比较的检验水准=0.05,则每次比较不犯第一类错误的概率为(1-0.05)=0.95,那么 10 次比较均不犯第一类错误的概率为 0.9510=0.5987,这时犯第一类错误的概率,也就是总的显著性水准变为 1-0.95 10=0.4013,比0.05 大多了,大大增加了犯第一类错误的概率,可能把本来无差别的两个总体均数判为有差别因此,多重比较不宜用前述t检验分别作两两比较多个均数的比较一般分为二种情况:一是在研究设计阶段未预先考虑或未预料到,经数据结果的提示后,才决定的多个均数间的两两比较,常见于探索性研究(exploratory research) ,这类情况下往往涉及到每两个均数的比较。
二是在设计阶段就根据研究目的或专业知识而决定的某些均数间的两两比较,常7见于事先有明确假设的证实性实验研究(con-firmatory research) ,这种情况又可分两种不同的比较,即多个处理组与对照组的比较,如处理后不同时间与处理前的比较等,或某一对或某几对专业上有特殊意义的均数间的差别比较;现分述这两种情况下适用的统计方法1.SNK 检验SNK (Student-Newman-kueuls)检验,亦称 q 检验,主要用于多个均数两两间的全面比较其基本步骤为:①建立检验假设②样本均数从大到小排序③计算 q 值q = SEAB = ④确定 a 值,查 q 界值表判断结果2.Dunnett 检验Dunnett 检验适用于多个试验组均数与一个对照组均数间的比较q’ = SEi0= 查 Dunnett 检验用表,判断结果3.LSD 检验8最小显著差法(LSD,least significant difference),主要用于检验某一对或某几对专业上有特殊意义的均数间的差别比较t = SEAB= 查 t 检验用表,判断结果六、方差分析注意事项1.方差分析是一大类分析方法,除用于两个或多个均数的比较外,还有交叉设计、析因设计、拉丁方、正交等设计的方差分析,还可分析两个或多个研究因素的交互作用以及回归方程的线性假设检验等。
做方差分析时,可根据资料设计的类型及研究目的,可将总变异分解为两个或多个部分,每个部分的变异可由某因素的作用来解释,通过比较可能由某因素所致的变异与误差(或组内)变异,即可了解该因素对测定结果有无影响2.方差分析的应用条件与 t 检验相似,即要求资料服从正态分布,方差齐性,即各组的方差要相等故方差分析前,应做多个方差齐性检验,正态性判断若是不服从正态分布资料的资料或方差不齐不能用方差分析,这时可对偏态分布的资料应考虑使用秩和检验,或用变量变换方法将数据转变为正态或接近正态且方差相等后,再进行方差分析3.三个及多个均数间的比较,不可使用多个 t 检验,若用前述t检验进行比较,则会使犯第一类错误的概率()增大,可能把本来无差别的两个总体均数判为有差别,因此,多组均数的比较不宜用t检验分别作两两比较。












