
第九章方差分析v电子教案.ppt
28页第九章 方差分析【内容提要】本章介绍方差分析第一节介绍方差分析基本概念及原理第二节介绍单因素方差分析第三节介绍双因素方差分析第一节 方差分析引论方差分析(analysisi of variance,ANOVA)是检验多个总体均值是否相等的统计方法它是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响表面上看,方差分析是检验多个总体的均值是否相同,但本质上它所研究的是分类型自变量对数值型因变量的影响方差分析中的几个术语1、观测变量 观测变量是试验的结果,即前面所说的数值型因变量,又称响应变量2、因子 因子又称因素或控制变量,是在试验中或在抽样时发生变化的“量”,也即前面所说的分类型自变量如果在实验中的因子只有一个,这时的方差分析称为单因素方差分析;在实验中得因子不只一个时,就称为多因素方差分析3、水平 我们将因子的不同类别称为因子的不同水平4、交互影响 如果因子间存在相互作用,我们称之为存在“交互影响”. 如果因子间是互相独立的,则称为“无交互影响” 1、方差的分解方差分析认为观测变量值的变化受两类因素的影响:第一类是因子(控制变量)不同水平所产生的影响;第二类是随机因素所产生的影响,这里随机因素是指那些人为很难控制的因素,主要指试验过程中的抽样误差。
方差分析认为:如果因子的不同水平对观测变量产生了显著影响,那么,它和随机因素共同作用必然使得观测变量值有显著变动;反之,如果因子的不同水平没有对观测变量产生显著影响,那么,观测变量值的变动就不会明显地表现出来,其变动可以归结为随机因素影响造成的 离差平和的分解是我们进入方差分析的“切入点”,这种离差平方和的构成形式为我们分析现象变化提高了重要的信息 组内离差平方和(SSE)反映的是由抽样误差即随机因素所产生的样本数据波动,它衡量的是因子的同一水平(即同一总体)下的样本数据的波动 组间离差平方和(SSA)明显高于组内离差平方和,说明观测变量样本数据波动的主要来源是组间离差平方和,可以认为因子对观测变量存在显著影响;反之,如果波动的主要部分来自组内离差平方和,则因子的影响就不明显,没有充足理由认为因子对观测变量有显著影响2、检验统计量方差分析采用的检验统计量为F统计量因子或因子间“交互作用”对观测变量的影响是否显著,关键要看组间离差平方和与组内离差平方和的比较结果为了消除样本容量、水平个数对离差平方和大小的影响,我们用“均方差(Mean Square)”作为不同来源离差平方和比较的基础均方差是用离差平方和除以其对应的“自由度”。
因此,我们得到检验因子影响是否显著的F检验统计量: F统计量越大,越说明组间方差是主要来源方差,因子对观测变量的影响是显著的;F越小,越说明随机因素是导致观测变量变动的主要来源,因子对观测变量的影响是不显著四、方差分析中的基本假定方差分析中有三个基本假定:(1)对于每个总体来说,因变量都应服从正态分布2)对于每个总体,用表示的因变量的方差都是相等的3)观测变量值是独立的五、方差分析问题的一般提法设因子有k个水平,每个水平的均值分别用,要检验k个水平(总体)的均值是否相等,需要提出如下假设: 自变量对因变量没有显著影响 不全相等 自变量对因变量有显著影响第二节 单因素方差分析单因素方差分析用来研究一个因子的不同水平是否对观测变量产生了显著影响这里,由于仅研究单个因子对观测变量的影响,因此成为单因素方差分析例如,分析不同施肥量是否给农作物产量带来显著影响,考察地区差异是否会影响销售利润率,研究学历对工资收入的影响等这些问题都可以通过单因素方差分析得到答案一、单因素方差分析的离差平方和的分解二、单因素方差分析的基本步骤1、提出方差分析的原假设和备择假设设因子有k个水平,每个水平的均值分别用,要检验k个水平(总体)的均值是否相等,需要提出如下假设: 自变量对因变量没有显著影响 不全相等 自变量对因变量有显著影响2、建立方差分析的F检验统计量F检验统计量的计算方法为:3、统计决策根据给定的显著性水平,在F分布表中查分子自由度、分母自由度为相应的临界值。
如果检验统计量F ,则拒绝原假设,即不成立,表明(j=1,2,k)之间的差异是显著的也就是说,因子对因变量的影响是显著的如果检验统计量F ,则不拒绝原假设,没有证据表明(j=1,2,k)之间的差异是显著的,也就是说,不能认为因子对因变量有显著影响三、利用Excel进行方差分析1、方差分析表运用Excel进行方差分析输出的方差分析表一般形式如下:方差分析表的一般形式误差来源SS(平方和)df(自由度)MS(均方)F值P值F临界值组间(因子影响)SSAMSAMSA/MSE组内(误差)SSEMSE总计SST四、多重比较检验前面所讲述的单因素方差分析只能判断因子是否对观测变量产生了显著影响,即不同水平下的总体均值是否全相等如果因子确实对观测变量产生了显著影响,进一步还应确定究竟哪些总体均值之间不相等呢?这就需要进一步的分析,所使用的方法就是多重比较检验方法,它是通过对总体均值之间的配对比较来进一步检验到底哪些均值之间存在差异多重比较检验的方法有许多种,由Fisher提出的最小显著差异方法(Least Significant Difference),简记为LSD该方法具有检验敏感性高的特点,即水平间的均值只要存在一定程度的微小差异就可能被检验出来。
参见课本例9.2第三节 双因素方差分析一、双因素方差分析的基本思想在实际问题中往往需要考察多个因子对观测变量的影响,这时就需要进行多因素方差分析当方差分析中涉及两个因子时,称为双因素方差分析二、无交互作用的双因素方差分析1、数据结构无交互作用的双因素方差分析的数据结构如表 无交互作用的双因素方差分析数据结构表双因素 因子Bj B1 B2 Br因子Ai A1 X11 X12 X1r A2 X21 X22 X2r Ak Xk1 Xk2 Xkr2、分析步骤与单因素方差分析类似,双因素方差分析也包括提出假设、确定检验的统计量、决策分析等步骤1)提出假设(2)确定检验统计量(3)统计决策用Excel进行无交互作用的双因素方差分析 运用Excel作无交互作用的双因素方差分析的基本步骤:(1)在选择“工具”下拉菜单栏中选择“数据分析”;(2)在“分析工具”中选择“方差分析:无重复双因素分析”,点击“确定”;(3)在弹出的对话框中,在“输入区域”中输入数据所在单元格区域三、有交互作用的双因素方差分析1、数据结构有交互作用的双因素方差分析数据结构表双因素 因子Bj B1 B2 Br因子AiA1X111X121X1r1X112X122X1r2X11mX12mX1nmA2X211X221X2r1X212X222X2n2X21mX22mX2nmAkXk11Xk21Xkr1Xk12Xk22Xkr2Xk1mXk2mXkrm2、分析步骤与无交互作用的方差分析方法类似,有交互作用的双因素方差分析也需要提出假设、构造检验的统计量、决策分析等步骤。
提出假设时,需要对行变量、列变量和交互作用变量分别提出假设,方法与上述类似3、用Excel进行有交互作用的双因素方差分析 运用Excel作有交互作用的双因素方差分析的基本步骤:(1)在选择“工具”下拉菜单栏中选择“数据分析”;(2)在“分析工具”中选择“方差分析:可重复双因素分析”,点击“确定”;(3)在弹出的对话框中,在“输入区域”中输入数据所在单元格区域本章小结:1、方差分析是检验多个总体均值是否相等的统计方法它是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响表面上看,方差分析是检验多个总体的均值是否相同,但本质上它所研究的是分类型自变量对数值型因变量的影响2、单因素方差分析用来研究一个因子的不同水平是否对观测变量产生了显著影响,由于仅研究单个因子对观测变量的影响,因此成为单因素方差分析3、在实际问题中往往需要考察多个因子对观测变量的影响,这时就需要进行多因素方差分析当方差分析中涉及两个因子时,称为双因素方差分析。












