
第7章-方差分析课件.ppt
66页•在实际研究中,比较两组资料总体均数是否有差异时,可采用前面介绍的t,当组数大于2时,即检验两组以上总体均数是否相等时,继续使用检验会增加犯第1类错误的概率,故引入介绍本章介绍的方差分析(ANOVA)用以检验分析方差分析的基本思想•方差分析的基本思想是根据资料的设计类型和研究目的,全部观察值总的离散度和自由度被研究者分解为相应几个部分,除了随机误差外,其余每个部分的变异可由某个因素的作用加以解释,通过比较不同变异来源的均方,借助F分布作出统计推断,从而了解该因素对观测指标有无影响方差分析的应用条件:•任何两个观察值之间独立,互不相关•各水平下的观察值均服从正态分布,即各样本来自正态总体•各处理组的方差相等(方差齐性) 主要内容完全随机设计方差分析(one-way anova)随机区组设计方差分析(two-way anova)析因设计方差分析(factorial design)重复设计方差分析(repeated measures anova)多个均数之间的两两比较多组均数比较方差齐性检验spss软件的实现完全随机设计方差分析•完全随机设计资料的方差分析用于成组设计的多个样本均数的比较可用单因素方差分析。
该分析中仅涉及一个研究因素,此因素有K(K≥2)个水平或状态•例7-1-1某研究者从某社区随机抽取了11名正常人、9名心脏病患者和10名高血压患者进行血压测定,问三种人的收缩压有无差别? Page 8各种变异的表示方法nSS总n总nMS总SS组内组内MS组内SS组间组间MS组间三者之间的关系:SS总= SS组内+ SS组间总= 组内+ 组间 完全随机设计方差分析的计算公式完全随机设计方差分析的计算公式SS总总-SS组间组间SS总-SS组间Page 10方差分析的步骤1.建立假设 H0 :1 = 2 = 3 =….即总体均数相等 H1 :总体均数不全相等2.确定显著性水平,用 表示,常取0.053.计算统计量F4.求概率值P5.做出推论:统计学结论和专业结论例7-1-1结果分析随机区组方差分析 随机区组设计(randomized block design)又称配伍组设计,该方法属于两因素方差分析(two-way ANOVA),用于多个样本均数的比较随机区组设计的多个样本均数的比较可用多个样本均数比较的两因素方差分析两因素是指主要的研究因素和配伍组(区组)因素,研究因素有k个水平,共有n个区组 例7-2-1 某研究者用甲乙丙三种不同的饲料喂养鼠,目的是了解不同饲料增重的效果有无差异,采用随机区组设计的方法,以窝别作为划分区组的特征,以消除遗传因素对体重增长的影响,测得鼠体重增加,请做分析 分析变异总变异总变异:24只鼠的增重不等,与均数之间存在差别处理间变异处理间变异:喂不同饲料的鼠增重不同区组间变异区组间变异:不同窝别的鼠增重不同误差误差:各组内鼠增重不同•变异之间的关系:SS总= SS处理+ SS区组区组+ SS误差总= 处理+ 区组区组+ 误差•SS总•总SS误差误差MS误差SS处理处理MS处理SS区组区组 区组区组MS区组区组随机区组设计方差分析步骤:1.建立假设: 对于处理组:H0:3种食物喂养的家兔体重增量相等H1:3种食物喂养的家兔体重增量不全相等 对于区组:H0:8个区组家兔体重增量相等H1:8个区组家兔体重增量不全相等2.确定显著性水平,常取0.05。
3.计算统计量F:F1=MS处理/MS误差F2=MS区组/MS误差4.求概率值P5.做出推论结果显示区组F值为13.956,p<0.0001,有统计学意义,拒绝H0,即可以认为8个区组之间的体重增重有差异进一步想了解具体哪些区组有差异,可以进行SNK检验处理组F值为2.979,P为0.084,无统计学意义,不拒绝H0,即可以认为3个处理组间体重增重相等析因设计方差分析 析因设计是在两个或多个实验因素的各水平组合析因设计是在两个或多个实验因素的各水平组合的基础上,研究各实验因素的主效应以及各因素的基础上,研究各实验因素的主效应以及各因素之间的交互作用方差分析中,影响观察指标的之间的交互作用方差分析中,影响观察指标的因素称为因子(因素称为因子(factor);factor);因子所处的状态称为因因子所处的状态称为因子的一个水平(子的一个水平(level of factor);level of factor);各因子水平各因子水平的组合称为处理(的组合称为处理(treatment)treatment) 例7-5-1 某研究者想了解药物A和药物B对于晚期胃癌患者的镇痛作用,以及两者不同剂量之间有无交互作用。
A药使用两种剂量治疗,分别是5mg和10mg,B药使用两种剂量治疗,分别是10mg和20mg研究者将12名病情相似的患者随机分为四组,分别接受A药和B药不同剂量组合下的用药治疗,测得的镇痛时间表7-5-1 不同处理下的镇痛时间(分) 总变异和与自由度的分解 药物A与药物B交互效应A*B的P>0.05,无统计学意义,不拒绝H0,即尚不能认为两种药物不同剂量间存在交互作用主因素A的P<0.05,拒绝H0,有统计学意义;主因素B的P>0.05,不拒绝H0,无统计学意义结论为药物A对晚期胃癌患者有镇痛作用,药物B对晚期胃癌患者无镇痛作用 重复测量设计的方差分析 重复测量资料(repeated measurement data)是由在不同时间点上对同一对象的同一观察指标进行多次测量所得是在科研工作中常见的方法,常用来分析在不同时间点上该指标的差异变异的分解重复测量资料方差分析的前提条件•进行重复测量资料的方差分析,比较复杂,除需满足一般方差分析的条件外,还必须进行协方差阵(covariance matrix)的球形假设检验若不满足球形对称性质,则方差分析的F值是有偏的,从而它增大了第一类错误的概率。
当在假设检验拒绝零假设时,可通过对受试对象内所有变异的自由度(时间效应、处理和时间的交互效应以及个体误差)进行校正我们通常采Mauchly检验( Mauchly’s test)来判断资料的球形对称性•例7-5-2 某研究者欲了解一套新的锻炼方法的减肥效果,该研究者在某小学随机抽取了12名肥胖学生,随机分成两组,第一组每天下午按新的锻炼方法锻炼,第二组不参与新的锻炼方法,并于实验开始的第1、2、3个月予以评价学生体重减重情况表7-5-3 12名学生体重减重情况(斤) Page 30随机区组与重复测量资料的区别主要有二:(1)重复测量资料中同一受试对象的数据高度相关,下表显示了试验的观察对象在不同的时间点之间相关,相关系数均大于0.8,均有统计学意义(p<0.05),而在随机区组设计中则没有该特点出现Page 312)在重复测量资料中,处理因素可以在受试对象间随机分配,但受试对象内的各时间点不能随机分配,往往是固定不变的;随机区组设计资料中每个区组内的受试对象彼此相互独立,互不影响,处理仅仅在区组内随机分配,同一区组内的受试对象接受不同的处理按α=0.05水准,处理的效应P>0.05,不拒绝H0,无统计学意义,可认为锻炼组和不锻炼组的体重减重差异无统计学意义。
时间的效应P<0.05,时间对体重减重的影响有统计学意义处理与时间的交互效应的P<0.05,有统计学意义,即有交互作用 多个均数之间的两两比较1)检验几个特定的总体均数是否相等:例如多个处理组与对照组的比较,处理后不同时间与处理前的比较,以及某几个特定的处理组的比较等2)检验全部K个总体均数是否相等,即所有各组所对应的总体均数是否都相等,这些情况下往往涉及到每两个均数的两两比较一、多个样本均数间每两个均数的比较:一、多个样本均数间每两个均数的比较:即即SNK-q检验检验•对例7-1-1资料做两两比较•H0:任两 对比组的总体均数相等,即μA= μB H1:任两 对比组的总体均数不等,即μA≠ μB α=0.05计算q值1.将各组样本均数从大到小排列组次 1 2 3均数 121.30 106.18 102.72组别 高血压 正常人 血压异常 2.根据公式计算q值,查q界值表(a, ))3.计算组间跨度a:中间涵盖的均数个数4.误差自由度 SNK检验显示1和2组之间无统计学差异,可以认为它们血压均值相等,第3组分别与第1组和第2组间有统计学意义,故可以认为3、1和3、2两组血压均值不相等。
Dunnett-t检验:它适用于k-1个试验组与一个对照组均数差别的多重比较公式为:Bonfferoni法’=α/m 多组均数比较方差齐性检验•Levene方差齐性检验也称为Levene检验( Levene's Test)由H. Levene在1960年提出,可以对任意分布时的方差齐性进行检验 •对例7-1-1的方差分析结果利用Levene检验做方差齐性检验(1)建立假设: H0: 即三个总体方差全相等 H1:三个总体方差不全相等(2)计算统计量,确定P值并作出推断结论: 通过spss16.0得出按a=0.05标准,方差齐性Levene检验显示F为0.294,P为0.748,故可以认为bp三组数据方差齐性 SPSS软件实现例7-1-1的SPSS操作方法1)建立数据库将血压值组命名为bp将分组命名为“group”,各组分别用数字1、2和3表示2)SPSS软件实现方法(1)点击Analyze选项中的Compare Means的One-way Anova,将bp导入到Dependent List框中,将类型group导入到 Factor框中。
点击进入Post Hoc Multiple Comparisons,选择SNK,点击continue•点击Option,在Option对话框中选择Homogeneity of variance test,点击continue,选择OK3)主要的输出结果和解释•按α=0.05标准,方差齐性Levene检验显示P>0.05,故可以认为bp三组数据方差齐性,由组间与组内均方算出得F值为74.888,P为0.000,拒绝H0,差异有统计学意义,所以可以认为bp三组之间的血压均值不全相等为了进一步了解三组间均值两两比较情况,SNK检验显示1、2组,1、3组和2、3组之间差异均有统计学意义,可以认为它们血压均值完全不相等 例7-2-1的SPSS操作方法•1 1)建立数据库)建立数据库 将饲料命名为“nutrition”,其中“1”表示甲饲料,“2”表示乙饲料,“3”表示丙饲料将区组命名为“block”,其中“1”表示第一区组,“2”表示第二区组,以此类推将鼠增重体重命名为“weight” 2)SPSS软件实现方法(1)点击Analyze选项中的General Linear Model的Univariate,将weight导入到Dependent Variate框中,将类型block和nutrition导入到Fixed Factor(s)框中(2)点击model,选择custom自定义模型,在Build Term(s)中选择Main effects,将左边框中的block和nutrition两组添加到右边Model,点击Continue•点击进入Post Hoc Multiple Comparisons for Observed Means对话框,在Factor中选择nutrition进入右边Post Hoc Tests for对话框,并选择SNK进行均数两两比较,点击Continue3)主要的输出结果和解释•在输出的结果中给出了随机区组设计的基本结果。
结果主要包括处理nutrition及区组block的平方和,均方和各组F值以及P值结果显示区组F值为13.521,P<0.001,有统计学意义,拒绝H0,即可以认为八个区组之间的体重有差异进一步想了解具体哪些区组有差异,可以进行SNK检验处理组F值为2.719,P为0.101,无统计学意义,不拒绝H0,即可以认为处理组间体重相等例7-5-1的SPSS操作方法1)建立数据库 将药物A命名为“A”,其中“1”表示10mg,“0”表示5mg将药物B命名为“B”,其中“1”表示20mg,“0”表示10mg将镇痛的时间命名为“t” 2)SPSS软件实现方法•(1)点击Analyze选项中的General Linear Model的Univariate,将镇痛时间导入到Dependent Variate框中,将类型A和B导入到Fixed Factor(s)框中,点击OK•(2)点击Plots选项,把A添加到Horizontal Axis,把B添加到Spearate Lines,点击Add选项,点击Continue,点击OK 3)主要的输出结果和解释•在输出的结果中给出了析因分析的基本结果。
结果主要包括A、B及A*B的平方和,均方和各组F值以及P值•按α=0.05的水准,药物A与药物B交互效应A*B的F值为1.146,P>0.05,无统计学意义,不拒绝H0,即尚不能认为两种药物间存在交互作用药物A的P<0.05,拒绝H0,有统计学意义;药物B的P>0.05,不拒绝H0,无统计学意义结论为药物A对晚期胃癌患者镇痛有作用,药物B对晚期胃癌患者镇痛无作用 例7-5-2的SPSS操作方法•1)建立数据库 将锻炼组命名为“1”,将不锻炼组的命名为“2”将第1月、第2月与第3月体重减重分别命名为“one”、“two”和“three” 2)SPSS软件实现方法•(1)点击Analyze选项中的General Linear Model的Repeated Measures,定义trial入到Define factors框中,Numbers of levers为3,点击add添加,点击Define•在左边的选项框中,选择“one”、“two”、“three”进入Within-Subjects Variables中,将组别选入Between-Subjects Factors,点击OK 3)主要的输出结果和解释•球形检验结果见图7-6-18,可见卡方为0.153,P为0.926,表明符合球形分布,以一元方差结果为准 •Sphericity Assumed即为球形分布假设成立时得结果,就是本例中所要看的。
测试时间factor1组中F为129.068,P<0.05,拒绝H0,具有统计学意义,故可认为不同测试时间点间体重减重不同,受时间影响测试时间组factor1与组别交互组间F为4.386,P为0.026,拒绝H0,具有统计学意义,故可认为测试时间组factor1与组别之间有交互作用组别F值为0.397,P为0.543,不拒绝H0,无统计学意义,故不能认为锻炼组和不锻炼组的减肥效果有差异 小结小结 (一)掌握内容(一)掌握内容•方差分析的基本思想:多组计量资料总变异的分解,组间变异和组内方差分析的基本思想:多组计量资料总变异的分解,组间变异和组内变异的概念、多组均数比较的检验假设与变异的概念、多组均数比较的检验假设与F值的意义、方差分析的应值的意义、方差分析的应用条件用条件•常用实验设计的方差分析常用实验设计的方差分析完全随机设计资料的单因素方差分析:适用的资料类型、总变异分完全随机设计资料的单因素方差分析:适用的资料类型、总变异分解、方差分析的计算解、方差分析的计算随机区组设计资料的单因素方差分析:适用的资料类型、总变异分随机区组设计资料的单因素方差分析:适用的资料类型、总变异分解、方差分析的计算解、方差分析的计算多个样本均数间的多重比较方法:多个样本均数间的多重比较方法:SNK检验法、检验法、 Dunnett-t检验法等。
检验法等•(二)熟悉内容:多组资料的方差齐性检验、变量变换方法(二)熟悉内容:多组资料的方差齐性检验、变量变换方法•(三)了解内容:两因素析因设计分析、重复测量设计资料方差分析、(三)了解内容:两因素析因设计分析、重复测量设计资料方差分析、SPSS操作操作。












