
第7章方差分析与实验设计ppt课件.ppt
84页作者作者 贾俊平贾俊平统计学统计学统统 计计 学学( (第三版第三版) )201920197 - 2统计学学STATISTICS(第三版第三版)警惕过多地假设检验他对数据越苛求,数据会越多地向他招认,但在要挟下得到的供词,在科学询查的法庭上是不允许的 ——Stephen M.Stigler统计名言名言第第 7 章章 方差分析与实验设计方差分析与实验设计7.1 方差分析的根本原理方差分析的根本原理7.2 单因子方差分析因子方差分析7.3 双因子方差分析双因子方差分析7.4 实验设计初步初步7 - 4统计学学STATISTICS(第三版第三版)学习目的学习目的l方差分析的根本思想和原理方差分析的根本思想和原理l单因子方差分析单因子方差分析l多重比较多重比较l双因子方差分析的方法双因子方差分析的方法l实验设计方法与数据分析实验设计方法与数据分析7 - 5统计学学STATISTICS(第三版第三版)不同运动队的平均成果之间能否有显著差别?不同运动队的平均成果之间能否有显著差别?不同运动队的平均成果之间能否有显著差别?不同运动队的平均成果之间能否有显著差别?n n奥奥运运会会女女子子团团体体射射箭箭竞竞赛赛,,每每个个对对有有3 3名名运运发发动动。
进进入入最最后后决决赛赛的的运运动动队队需需求求进进展展4 4组组射射击击,,每每个个队队员员进进展展两两次次射射击击这这样样,,每每个个组组共共射射出出6 6箭箭,,4 4组共射出组共射出2424箭箭n n在在20192019年年8 8月月1010日日进进展展的的第第2929届届北北京京奥奥运运会会女女子子团团体体射射箭箭竞竞赛赛中中,,获获得得前前3 3名名的的运运动动队队最最后后决决赛赛的的成成果如下表所示果如下表所示7 - 6统计学学STATISTICS(第三版第三版)不同运动队的平均成果之间能否有显著差别?不同运动队的平均成果之间能否有显著差别?不同运动队的平均成果之间能否有显著差别?不同运动队的平均成果之间能否有显著差别?n n每每个个队队伍伍的的2424箭箭成成果果可可以以看看作作是是该该队队伍伍射射箭箭成成果果的的一一个个随随机机样样本本获获得得金金牌牌、、银银牌牌和和铜铜牌牌的的队队伍伍之之间间的的射射箭箭成成果果能否有能否有显显著差著差别别呢?呢?n n假假设设采采用用第第6 6章章引引见见的的假假设设检检验验方方法法,,用用分分布布做做两两两两的的比比较较,,那那么么需需求求做做次次比比较较。
这这样样做做不不仅仅繁繁琐琐,,而而且且每每次次检检验验犯犯第第Ι Ι类类错错误误的的概概率率都都是是,,作作多多次次检检验验会会使使犯犯第第Ι Ι类类错错误误的的概概率率相相应应地地添添加加,,检检验验完完成成时时,,犯犯第第Ι Ι类类错错误误的的概概率率会会大大于于同同时时,,随随着着检检验验的的次次数数的的添添加加,,偶偶尔尔要要素素导导致致差差别别的的能能够够性也会添加性也会添加n n采采用用方方差差分分析析方方法法很很容容易易处处理理这这样样的的问问题题,,它它是是同同时时思思索索一一切切的的样样本本数数据据,,一一次次检检验验即即可可判判别别多多个个总总体体的的均均值值能能否否一一样样,,这这不不仅仅排排除除了了犯犯错错误误的的累累积积概概率率,,也也提提高高了了检检验验的的效效率率方方差差分分析析方方法法就就很很容容易易处处理理这这样样的的问问题题,,它它是是同同时时思思索索一一切切的的样样本本数数据据,,一一次次检检验验即即可可判判别别多多个个总总体体的的均均值值能能否否一一样样,,这这不不仅仅排排除除了了犯犯错错误误的的累累积积概概率率,,也也提提高高了了检检验验的效率的效率 7.1 方差分析的根本原理方差分析的根本原理 7.1.1 什么是方差分析?什么是方差分析? 7.1.2 从从误差分析入手差分析入手 7.1.3 在什么在什么样的前提下分析的前提下分析??第第 7 章章 方差分析与实验设计方差分析与实验设计7.1.1 什么是方差分析?什么是方差分析?7.1 方差分析的根本原理方差分析的根本原理7 - 9统计学学STATISTICS(第三版第三版)什么是方差分析什么是方差分析(ANOVA)?(analysis of variance) 1.1.方方差差分分析析的的根根本本原原理理是是在在2020世世纪纪2020年年代代由由英英国国统统计计学学家家Ronald Ronald A.FisherA.Fisher在在进进展展实实验验设设计计时时为为解解释释实实验验数据而首先引入的数据而首先引入的 2.2.检验检验多个多个总总体均体均值值能否相等能否相等3.3.经过经过分析数据的分析数据的误误差判差判别别各各总总体均体均值值能否相等能否相等4.4.研研讨讨分分类类型自型自变变量量对对数数值值型因型因变变量的影响量的影响 5.5.一个或多个分一个或多个分类类型自型自变变量量6.6.两个或多个两个或多个 (k (k 个个) ) 处处置程度或分置程度或分类类7.7.一个数一个数值值型因型因变变量量8.8.有有单单因子方差分析和双因子方差分析因子方差分析和双因子方差分析9.9.单单因子方差分析:涉及一个分因子方差分析:涉及一个分类类的自的自变变量量10.10.双因子方差分析:涉及两个分双因子方差分析:涉及两个分类类的自的自变变量量7 - 10统计学学STATISTICS(第三版第三版)什么是方差分析什么是方差分析? (例题分析例题分析)【【【【 例例例例 】确定超市的位置和】确定超市的位置和】确定超市的位置和】确定超市的位置和竞竞争者的数量争者的数量争者的数量争者的数量对销对销售售售售额额能否有能否有能否有能否有显显著影响,著影响,著影响,著影响,获获得的年得的年得的年得的年销销售售售售额额数据数据数据数据( (单单位:万元位:万元位:万元位:万元) )如下表如下表如下表如下表因子因子因子因子程度或程度或程度或程度或处处置置置置样样本数据本数据本数据本数据7 - 11统计学学STATISTICS(第三版第三版)什么是方差分析什么是方差分析? (例题分析例题分析)1.1.假假设设只只思思索索“ “超超市市位位置置〞〞对对销销售售额额能能否否有有显显著著影影响响,,实实践践上也就是要判上也就是要判别别不同位置超市的不同位置超市的销销售售额额均均值值能否一能否一样样2.2.假假设设它它们们的的均均值值一一样样,,意意味味着着“ “超超市市位位置置〞〞对对销销售售额额没没有有显显著著影影响响;;假假设设均均值值不不全全一一样样,,那那么么意意味味着着“ “超超市市位位置置〞〞对销对销售售额额有有显显著影响著影响3.3.“ “超超市市位位置置〞〞就就是是分分类类自自变变量量,,“ “销销售售额额〞〞那那么么是是数数值值因因变变量量。
“超超市市位位置置〞〞是是要要检检验验的的对对象象,,称称为为因因子子(factor)(factor),,商商业业区区、、居居民民小小区区、、写写字字楼楼是是因因子子的的3 3个个取取值值,,称称为为程程度度(level)(level)或或处处置置(treatment)(treatment)每每个个因因子子程程度度下下得得到到的的销销售售额额为样为样本本观测值观测值4.4.方方差差分分析析要要处处理理的的问问题题就就是是判判别别超超市市的的位位置置对对销销售售额额能能否否有有显显著著影影响响设设商商业业区区、、居居民民小小区区和和写写字字楼楼3 3个个位位置置超超市的市的销销售售额额均均值值能否一能否一样样 7.1.2 从误差分析入手从误差分析入手7.1 方差分析的根本原理方差分析的根本原理7 - 13统计学学STATISTICS(第三版第三版)方差分析的根本原理方差分析的根本原理(误差分解误差分解)1.总误总误差差差差(total error)(total error)2.反映全部反映全部反映全部反映全部观测观测数据的数据的数据的数据的误误差称差称差称差称3.所抽取的全部所抽取的全部所抽取的全部所抽取的全部3636家超市的家超市的家超市的家超市的销销售售售售额额之之之之间间差差差差别别 4.随随随随机机机机误误差差差差(random (random error)—error)—组组内内内内误误差差差差(within-group (within-group error)error)5.由于抽由于抽由于抽由于抽样样的随机性呵斥的的随机性呵斥的的随机性呵斥的的随机性呵斥的误误差差差差6.反映反映反映反映样样本内部数据之本内部数据之本内部数据之本内部数据之间间的随机的随机的随机的随机误误差差差差7.处处 置置置置 误误 差差差差 (treatment (treatment error)—error)—组组 间间 误误 差差差差 (between-(between-group error)group error)8.不同的不同的不同的不同的处处置影响所呵斥的置影响所呵斥的置影响所呵斥的置影响所呵斥的误误差差差差9.反映反映反映反映样样本之本之本之本之间间数据的差数据的差数据的差数据的差别别 7 - 14统计学学STATISTICS(第三版第三版)方差分析的根本原理方差分析的根本原理(误差分解误差分解)1.1.数据的数据的误误差用平方和差用平方和(sum of squares)(sum of squares)表示,表示,记为记为SSSS2.2.总总平方和平方和(sum of squares for total)(sum of squares for total)记为记为SSTSST3.3.反映全部数据反映全部数据总误总误差大小的平方和差大小的平方和4.4.抽取的全部抽取的全部3636家超市家超市销销售售额额之之间间的的误误差平方和差平方和5.5.组组内平方和内平方和(within-group sum of squares)(within-group sum of squares)记为记为SSSS组组内内6.6.反映反映组组内内误误差大小的平方和差大小的平方和 7.7.比如,每个位置超市比如,每个位置超市销销售售额额的的误误差平方和差平方和 8.8.只包含随机只包含随机误误差差9.9.组组间间平平方方和和(between-group (between-group sum sum of of squares)squares)记记为为SSSS组组间间10.10.反映反映组间误组间误差大小的平方和差大小的平方和 11.11.比如,同位置超市比如,同位置超市销销售售额额之之间间的的误误差平方和差平方和 12.12.既包括随机既包括随机误误差,也包括差,也包括处处置置误误差差7 - 15统计学学STATISTICS(第三版第三版)方差分析的根本原理方差分析的根本原理(误差分解误差分解)误差平方和的分解及其关系误差平方和的分解及其关系总误差差总平方和平方和(SST)随机随机误差差处置置误差差组内平方和内平方和(SS组内内)组间平方和平方和(SS组间)==++7 - 16统计学学STATISTICS(第三版第三版)方差分析的根本原理方差分析的根本原理(误差分析误差分析)1.误误差差的的大大小小用用均均方方(mean (mean square)square)来来表表示示,,也也称称为为方差方差(variance)(variance)2.平方和除以相平方和除以相应应的自在度的自在度3.总总平平方方和和(SST)(SST)的的自自在在度度为为n-1n-1;;组组内内平平方方和和(SS(SS组组内内) )的的自自在在度度为为n-k n-k ;;组组间间平平方方和和(SS(SS组组间间) )的的自自在度在度为为k-1k-14.组组内内平平方方和和除除以以相相应应的的自自在在度度结结果果称称为为组组内内方方差差(within-group (within-group variance)variance);;组组间间平平方方和和除除以以相相应应的的自自 在在 度度 结结 果果 称称 为为 组组 间间 方方 差差 (between-group (between-group variance)variance)7 - 17统计学学STATISTICS(第三版第三版)方差分析的根本原理方差分析的根本原理(误差分析误差分析)1.判别原假设能否成立,就是判别组间方差与组内方差能否有显著差别2.假设原假设成立,组间均方与组内均方的数值就应该很接近,它们的比值就会接近13.假设原假设不成立,组间均方会大于组内均方,它们之间的比值就会大于14.当这个比值大到某种程度时,就可以说不同程度之间存在着显著差别,即自变量对因变量有影响7.1.3 在什么样的前提下分析?在什么样的前提下分析?7.1 方差分析的根本原理方差分析的根本原理7 - 19统计学学STATISTICS(第三版第三版)方差分析的根本假定方差分析的根本假定1.1.正正态态性性(normality)(normality)。
每每个个总总体体都都应应服服从从正正态态分分布布,,即即对对于于因因子子的的每每一一个个程程度度,,其其观观测测值值是是来来自自正正态态分分布布总总体体的的简简单单随机随机样样本本2.2.在在例例7.17.1中中,,要要求求每每个个位位置置超超市市的的销销售售额额必必需需服服从从正正态态分分布布3.3.检检验验总总体体能能否否服服从从正正态态分分布布的的方方法法有有很很多多,,包包括括对对样样本本数数据据作作直直方方图图、、茎茎叶叶图图、、箱箱线线图图、、正正态态概概率率图图做做描描画画性性判判别别,,也可以也可以进进展非参数展非参数检验检验等等 4.4.方方差差齐齐性性(homogeneity (homogeneity variance)variance)各各个个总总体体的的方方差差必必需需一一样样,,对对于分于分类变类变量的个程度,有量的个程度,有 12=12= 22=…=22=…= k2k25.5.在例在例7.17.1中,要求不同位置超市的中,要求不同位置超市的销销售售额额的方差都一的方差都一样样6.6.独独立立性性(independence)(independence)。
每每个个样样本本数数据据是是来来自自因因子子各各程程度度的独立的独立样样本本( (该该假定不假定不满满足足对结对结果影响果影响较较大大) )7.7.在在例例7.17.1中中,,3 3个个样样本本数数据据是是来来自自不不同同位位置置超超市市的的3 3个个独独立立样样本本7 - 20统计学学STATISTICS(第三版第三版)方差分析中根本假定方差分析中根本假定 假设原假设成立,即假设原假设成立,即H0 H0 ::m1=m2=m3m1=m2=m3不同位置超市的平均销售额相等不同位置超市的平均销售额相等 意味着每个样本都来自均值为意味着每个样本都来自均值为、方差为、方差为 2 2的同的同一正态总体一正态总体 X X Xf(X)f(X)f(X) 1 1 2 2 3 3 4 4 7 - 21统计学学STATISTICS(第三版第三版)方差分析中根本假定方差分析中根本假定假设备择假设成立,即假设备择假设成立,即H1 H1 ::mi (i=1,2,3)mi (i=1,2,3)不全相等不全相等至少有一个总体的均值是不同的至少有一个总体的均值是不同的3 3个样本分别来自均值不同的个样本分别来自均值不同的3 3个正态总体个正态总体 X X Xf(X)f(X)f(X) 1 1 2 2 3 3 7.2 单因子方差分析因子方差分析 7.2.1 检验步步骤 7.2.2 关系有多关系有多强?? 7.2.3 哪些均哪些均值之之间有有显著差著差别?? 第第 7 章章 方差分析与实验设计方差分析与实验设计7.2.1 检验步骤检验步骤7.2 单因子方差分析因子方差分析7 - 24统计学学STATISTICS(第三版第三版)单因子方差分析单因子方差分析(one-way analysis of variance)1.只思索一个分类型自变量影响的方差分析2.比如,在例7.1中,只思索超市位置一个因子对销售额度影响,或者只思索竞争者数量对销售额的影响,都属于单因子方差分析3.分析步骤包括4.提出假设5.构造检验统计量6.做出决策 7 - 25统计学学STATISTICS(第三版第三版)提出假设提出假设1.普通提法2.H0 :m1 = m2 =…= mk 3.自变量对因变量没有显著影响 4.H1 :m1 ,m2 ,… ,mk不全相等5.自变量对因变量有显著影响 6.留意:回绝原假设,只阐明至少有两个总体的均值不相等,并不意味着一切的均值都不相等 7 - 26统计学学STATISTICS(第三版第三版)构造检验的统计量构造检验的统计量F1.将将组组间间方方差差MSMS组组间间除除以以组组内内方方差差MSMS组组内内即即得得到所需求的检验统计量到所需求的检验统计量F F2.当当H0H0为为真真时时,,二二者者的的比比值值服服从从分分子子自自在在度度为为k-1k-1、、分母自在度为分母自在度为 n-k n-k 的的 F F 分布,即分布,即 组间组间平方和平方和平方和平方和组组内平方和内平方和内平方和内平方和7 - 27统计学学STATISTICS(第三版第三版)做出决策做出决策 将统计量的值F与给定的显著性程度的临界值F进展比较(或计算出统计量的P值),做出决策假设P< ,回绝原假设H0 ,阐明均值之间的差别是显著的,所检验的因子对察看值有显著影响假设F>F ,不回绝原假设H0 ,无证听阐明所检验的因子对察看值有显著影响 7 - 28统计学学STATISTICS(第三版第三版)作出决策作出决策(F分布与回绝域分布与回绝域)假设均值相等,假设均值相等,假设均值相等,假设均值相等,假设均值相等,假设均值相等,F=MSF=MSF=MS组间组间组间组间组间组间/MS/MS/MS组内组内组内组内组内组内1 1 1a a F 分布分布F(k-1,n-k)0 0回回回回绝绝H0H0不回不回不回不回绝绝H0H0H0H0F F7 - 29统计学学STATISTICS(第三版第三版)单因子方差分析单因子方差分析(例题分析例题分析)【例】检验【例】检验【例】检验【例】检验超市位超市位超市位超市位置对销置对销置对销置对销售额能售额能售额能售额能否有显否有显否有显否有显著影响著影响著影响著影响( (=0.05) =0.05) 7 - 30统计学学STATISTICS(第三版第三版)单因子方差分析单因子方差分析(例题分析例题分析)1.提出假设。
设不同位置超市销售额的均值分别为1(商业区)、 2(居民小区)和3 (写字楼) ,提出的假设为2.H0 :1 2 3 3.H1 :1 , 2 , 3 不全相等4.检验方差分析的前提5.进展分析并做出决策7 - 31统计学学STATISTICS(第三版第三版)单因子方差分析单因子方差分析(方差分析假定的判别方差分析假定的判别)箱线图分析好似不一样?好似不一样?7 - 32统计学学STATISTICS(第三版第三版)单因子方差分析单因子方差分析(方差分析假定的判别方差分析假定的判别)概率图分析7 - 33统计学学STATISTICS(第三版第三版)用用Excel进展方差分析进展方差分析第第第第1 1步:步:步:步:选择选择“ “工具工具工具工具 〞下拉菜〞下拉菜〞下拉菜〞下拉菜单单第第第第2 2步:步:步:步:选择选择【数据分析】【数据分析】【数据分析】【数据分析】选项选项第第第第3 3步:在分析工具中步:在分析工具中步:在分析工具中步:在分析工具中选择选择【【【【单单因子方差分析】因子方差分析】因子方差分析】因子方差分析】 ,,,, 然后然后然后然后选择选择【确定】【确定】【确定】【确定】第第第第4 4步:当步:当步:当步:当对话对话框出框出框出框出现时现时 在在在在【【【【输输入入入入区区区区域域域域 】】】】方方方方框框框框内内内内键键入入入入数数数数据据据据单单元元元元格格格格区区区区域域域域 在在在在【【【【】】】】方方方方框框框框内内内内键键入入入入0.05(0.05(可可可可根根根根据据据据需需需需求求求求确确确确定定定定) ) 在【在【在【在【输输出出出出选项选项 】中】中】中】中选择输选择输出区域出区域出区域出区域 用用Excel进展方差分析展方差分析7 - 34统计学学STATISTICS(第三版第三版)单因子方差分析单因子方差分析(例题分析例题分析)回绝回绝H07.2.2 关系有多强?关系有多强?7.2 单因子方差分析因子方差分析7 - 36统计学学STATISTICS(第三版第三版)关系强度的丈量关系强度的丈量 1.回回绝绝原原假假设设阐阐明明因因子子( (自自变变量量) )与与观观测测值值之之间间有有显显著著关系关系2.组组间间平平方方和和(SS(SS组组间间) )度度量量了了自自变变量量( (超超市市位位置置) )对对因因变变量量( (销销售售额额) )的影响效的影响效应应3.当当组组间间平平方方和和比比组组内内平平方方和和(SSE)(SSE)大大,,而而且且大大到到一一定定程程度度时时,,就就意意味味着着两两个个变变量量之之间间的的关关系系显显著著,,大大得得越越多多,,阐阐明明它它们们之之间间的的关关系系就就越越强强。
反反之之,,就就意意味味着着两两个个变变量量之之间间的的关关系系不不显显著著,,小小得得越越多多,,阐阐明它明它们们之之间间的关系就越弱的关系就越弱7 - 37统计学学STATISTICS(第三版第三版)关系强度的丈量关系强度的丈量 1.1.变变量量间间关关系系的的强强度度用用自自变变量量平平方方和和(SS(SS组组间间) ) 占占总总平方和平方和(SST)(SST)的比例大小来反映的比例大小来反映2.2.自变量平方和占总平方和的比例记为自变量平方和占总平方和的比例记为R2 ,R2 ,即即3.3.其平方根其平方根R R可以用来丈量两个变量之间的关系强度可以用来丈量两个变量之间的关系强度 例例题题分分析析::R2=44.74%,,R=0.6689阐阐明明超超市市位位置置(自自变变量量)对对销销售售额额(因因变变量量)的的影影响响效效应应占占总总效效应应的的44.74%虽虽然然并并不不高高,,但但超超市市位位置置对对销销售售额额的的影影响响都都曾曾经经到到达达了了统统计计上上显显著著的的程程度度R阐阐明明超超市市位位置置与与销销售售额之间已到达中等以上的相关额之间已到达中等以上的相关7.2.2 哪些均值之间有显著差别?哪些均值之间有显著差别?7.2 单因子方差分析因子方差分析7 - 39统计学学STATISTICS(第三版第三版)多重比较的意义多重比较的意义1.在回绝原假设的条件下,经过对总体均值之间的配对比较来进一步检验究竟哪些均值之间存在差别2.比较方法有多种,假设Fisher提出的最小显著差别方法,简写为LSD7 - 40统计学学STATISTICS(第三版第三版)多重比较的多重比较的LSD方法方法1.提出假设提出假设2.H0: H0: mi=mj mi=mj ( (第第i i个个总总体体的的均均值值等等于于第第j j个个总总体体的的均均值值) )3.H1: H1: mimimj mj ( (第第i i个个总总体体的的均均值值不不等等于于第第j j个个总总体体的的均值均值) )4.计算检验的统计量计算检验的统计量: : 5.计算计算LSDLSD6.决策:假设决策:假设 ,回绝,回绝H0H07 - 41统计学学STATISTICS(第三版第三版)多重比较的多重比较的LSD方法方法(例题分析例题分析)第第第第1 1步:提出假设步:提出假设步:提出假设步:提出假设检验检验检验检验1 1::::检验检验检验检验2 2::::检验检验检验检验3 3::::第第第第2 2步:计算检验统计量步:计算检验统计量步:计算检验统计量步:计算检验统计量检验检验检验检验1 1::::检验检验检验检验2 2::::检验检验检验检验3 3::::7 - 42统计学学STATISTICS(第三版第三版)多重比较的多重比较的LSD方法方法(例题分析例题分析)第第第第3 3步:计算步:计算步:计算步:计算LSDLSD第第第第4 4步:做出决策步:做出决策步:做出决策步:做出决策不回不回绝绝H0H0,没有,没有证证听听阐阐明商明商业业区和居区和居民小区的超市民小区的超市销销售售额额之之间间有有显显著差著差别别 回回绝绝H0H0,商,商业业区和写字楼的超市区和写字楼的超市销销售售额额之之间间有有显显著差著差别别 回回绝绝H0H0,居民小区和写字楼的超市,居民小区和写字楼的超市销销售售额额之之间间有有显显著差著差别别 7 - 43统计学学STATISTICS(第三版第三版)用用SPSS进展方差分析和多重比较进展方差分析和多重比较 在在在在用用用用SPSSSPSS中中中中进进展展展展方方方方差差差差分分分分析析析析时时,,,,需需需需求求求求把把把把多多多多个个个个样样本本本本的的的的观观测测值值作作作作为为一一一一个个个个变变量量量量输输入入入入( (本本本本例例例例为为“ “赞赞扬扬次次次次数数数数〞〞〞〞) ),,,,然然然然后后后后设设计计另另另另一一一一个个个个变变量量量量用用用用于于于于标标志志志志每每每每个个个个观观测测值值所所所所属属属属的的的的样样本本本本( (本本本本例例例例为为“ “行行行行业业〞〞〞〞,,,,1 1表表表表示示示示零零零零售售售售业业,,,,2 2表表表表示示示示旅旅旅旅游游游游业业,,,,3 3表表表表示示示示航航航航空空空空公公公公司司司司,,,,4 4表表表表示示示示家家家家电电制造制造制造制造业业) )第第第第1 1步步步步::::选选择择【【【【AnalyzeAnalyze】】】】 【【【【Compare Compare MeansMeans】】】】 【【【【One-Way-ANOVAOne-Way-ANOVA】】】】进进入主入主入主入主对话对话框框框框第第第第2 2步步步步::::因因因因变变量量量量( (赞赞扬扬次次次次数数数数) )选选入入入入【【【【Dependent Dependent ListList】】】】,,,,将将将将自自自自变变量量量量( (行行行行业业) )选选入【入【入【入【Factor)Factor)】】】】第第第第3 3步步步步 ( (需需需需求求求求多多多多重重重重比比比比较较时时) )点点点点击击【【【【Post-HocPost-Hoc】】】】从从从从中中中中选选择择一一一一种种种种方方方方法法法法,,,,如如如如LSDLSD;;;; ( (需需需需求求求求均均均均值值图图时时) )在在在在【【【【OptionsOptions】】】】下下下下选选中中中中【【【【Means Means plotplot】】】】 ,,,, ( (需需需需 求求求求 相相相相 关关关关 统统 计计 量量量量 时时 ) ) 选选 择择 【【【【DescriptiveDescriptive】】】】,,,,点点点点击击【【【【ContinueContinue】】】】回回回回到到到到主主主主对对话话框框框框。
点点点点击击【【【【OKOK】】】】 用用用用SPSSSPSS进进展方差分析展方差分析展方差分析展方差分析7 - 44统计学学STATISTICS(第三版第三版)用用SPSS进展方差分析和多重比较进展方差分析和多重比较方差齐性表检验方差齐性表检验方差分析表方差分析表7 - 45统计学学STATISTICS(第三版第三版)用用SPSS进展方差分析和多重比较进展方差分析和多重比较多重比较多重比较7 - 46统计学学STATISTICS(第三版第三版)用用SPSS进展方差分析和多重比较进展方差分析和多重比较带误差线带误差线(Error Bar)(Error Bar)的均值图的均值图(Means Plots)(Means Plots)总总体均体均体均体均值值95%95%的置信区的置信区的置信区的置信区间间7.3 双因子方差分析双因子方差分析 7.3.1 不思索交互作用不思索交互作用 7.3.3 思索交互作用思索交互作用第第 7 章章 方差分析与实验设计方差分析与实验设计7.3.1 不思索交互作用不思索交互作用7.3 双因子方差分析双因子方差分析7 - 49统计学学STATISTICS(第三版第三版)双因子方差分析双因子方差分析(two-way analysis of variance) 1.1.分分析析两两个个因因子子( (行行因因子子RowRow和和列列因因子子Column)Column)对对实实验验结结果的影响果的影响 2.2.假假设设两两个个因因子子对对实实验验结结果果的的影影响响是是相相互互独独立立的的,,分分别别判判别别行行因因子子和和列列因因子子对对实实验验数数据据的的影影响响,,这这时时的的双双因因子子方方差差分分析析称称为为无无交交互互作作用用的的双双因因子子方方差差分分析析或或 无无 反反 复复 双双 因因 子子 方方 差差 分分 析析 (Two-factor (Two-factor without without replication)replication)3.3.假假设设除除了了行行因因子子和和列列因因子子对对实实验验数数据据的的单单独独影影响响外外,,两两个个因因子子的的搭搭配配还还会会对对结结果果产产生生一一种种新新的的影影响响,,这这时时的的双双因因子子方方差差分分析析称称为为有有交交互互作作用用的的双双因因子子方方差差分分析析或或可可反反复复双双因因子子方方差差分分析析 (Two-factor (Two-factor with with replication )replication )7 - 50统计学学STATISTICS(第三版第三版)双因子方差分析的根本假定双因子方差分析的根本假定1.每个总体都服从正态分布2.对于因子的每一个程度,其察看值是来自正态分布总体的简单随机样本3.各个总体的方差必需一样4.对于各组察看数据,是从具有一样方差的总体中抽取的5.察看值是独立的7 - 51统计学学STATISTICS(第三版第三版)双因子方差分析双因子方差分析 (例题分析例题分析)不同品牌的彩电在不同品牌的彩电在不同品牌的彩电在不同品牌的彩电在5 5个地区的销售量数据个地区的销售量数据个地区的销售量数据个地区的销售量数据 品牌因子品牌因子品牌因子品牌因子地区因子地区因子地区因子地区因子地区地区地区地区1 1地区地区地区地区2 2地区地区地区地区3 3地区地区地区地区4 4地区地区地区地区5 5品牌品牌品牌品牌1 1品牌品牌品牌品牌2 2品牌品牌品牌品牌3 3品牌品牌品牌品牌4 4365365345345358358288 288 350350368368323323280 280 343343363363353353298 298 340340330330343343260 260 323323333333308308298 298 【【【【例例例例】】】】有有有有4 4个个个个品品品品牌牌牌牌的的的的彩彩彩彩电电在在在在5 5个个个个地地地地域域域域销销售售售售,,,,为为分分分分析析析析彩彩彩彩电电的的的的品品品品牌牌牌牌( (品品品品牌牌牌牌因因因因子子子子) )和和和和销销售售售售地地地地域域域域( (地地地地域域域域因因因因子子子子) )对对销销售售售售量量量量的的的的影影影影响响响响,,,,对对每每每每显显著著著著个个个个品品品品牌牌牌牌在在在在各各各各地地地地域域域域的的的的销销售售售售量量量量获获得得得得以以以以下下下下数数数数据据据据。
试试分分分分析析析析品品品品牌牌牌牌和和和和销销售售售售地域地域地域地域对对彩彩彩彩电电的的的的销销售量能否有售量能否有售量能否有售量能否有显显著影响?著影响?著影响?著影响?( (=0.05) =0.05) 7 - 52统计学学STATISTICS(第三版第三版)分析步骤分析步骤(提出假设提出假设)提出假设对行因子提出的假设为H0:m1 = m2 = … = mi = …= mk (mi为第i个程度的均值)H1:mi (i =1,2, … , k) 不全相等对列因子提出的假设为H0: m1 = m2 = … = mj = …= mr (mj为第j个程度的均值)H1: mj (j =1,2,…,r) 不全相等7 - 53统计学学STATISTICS(第三版第三版)双因子方差分析双因子方差分析(例题分析例题分析) 提出假提出假设设对对品牌因子提出的假品牌因子提出的假设为设为H0H0::m1=m2=m3=m4 m1=m2=m3=m4 ( (品品牌牌对对销销售售量量无无显显著著影影响响) )H1H1::mi (i =1,2, … , 4) mi (i =1,2, … , 4) 不全相等不全相等 ( (有有显显著影响著影响) )对对地域因子提出的假地域因子提出的假设为设为H0H0::m1=m2=m3=m4=m5 (m1=m2=m3=m4=m5 (地域地域对销对销售量无售量无显显著影响著影响) )H1H1::mj (j =1,2,…,5) mj (j =1,2,…,5) 不全相等不全相等 ( (有有显显著影响著影响) ) 7 - 54统计学学STATISTICS(第三版第三版)分析步骤分析步骤(构造检验的统计量构造检验的统计量)计算平方和(SS)总误差平方和行因子误差平方和 列因子误差平方和 随机误差项平方和7 - 55统计学学STATISTICS(第三版第三版)分析步骤分析步骤(构造检验的统计量构造检验的统计量) 总误差平方和(SST )、行因子平方和 (SS行)、列因子平方和(SS列) 、误差项平方和(SS残差) 之间的关系SST = SS行行 +SS列列+SS残差残差 7 - 56统计学学STATISTICS(第三版第三版)分析步骤分析步骤(构造检验的统计量构造检验的统计量)计算均方(MS)误差平方和除以相应的自在度三个平方和的自在度分别是总误差平方和SST的自在度为 kr-1行因子平方和SSR的自在度为 k-1列因子平方和SSC的自在度为 r-1误差项平方和SSE的自在度为 (k-1)×(r-1) 7 - 57统计学学STATISTICS(第三版第三版)分析步骤分析步骤(构造检验的统计量构造检验的统计量)计算均方(MS)行因子的均方,记为MS行,计算公式为列因子的均方,记为MS列,计算公式为误差项的均方,记为MS残差 ,计算公式为7 - 58统计学学STATISTICS(第三版第三版)分析步骤分析步骤(构造检验的统计量构造检验的统计量)计算检验统计量( F )检验行因子的统计量 检验列因子的统计量7 - 59统计学学STATISTICS(第三版第三版)分析步骤分析步骤(做出决策做出决策) 计算出统计量的P值与给定的显著性程度比较,假设PR< ,回绝原假设H0 ,阐明均值之间的差别是显著的,即所检验的行因子对察看值有显著影响假设PC < ,回绝原假设H0 ,阐明均值之间有显著差别,即所检验的列因子对察看值有显著影响 用用用用ExcelExcel进进展无反复双因子分析展无反复双因子分析展无反复双因子分析展无反复双因子分析7 - 60统计学学STATISTICS(第三版第三版)双因子方差分析双因子方差分析(关系强度的丈量关系强度的丈量)1.1.行行平平方方和和(SS(SS行行) )度度量量了了品品牌牌这这个个自自变变量量对对因因变变量量( (销销售售量量) )的影响效应的影响效应2.2.列列平平方方和和(SS(SS列列) )度度量量了了地地域域这这个个自自变变量量对对因因变变量量( (销销售售量量) )的影响效应的影响效应3.3.这这两两个个平平方方和和加加在在一一同同那那么么度度量量了了两两个个自自变变量量对对因因变变量量的的结合效应结合效应4.4.结合效应与总平方和的比值定义为结合效应与总平方和的比值定义为R2R25.5.其其平平方方根根R R反反映映了了这这两两个个自自变变量量合合起起来来与与因因变变量量之之间间的的关关系强度系强度 7 - 61统计学学STATISTICS(第三版第三版)双因子方差分析双因子方差分析(关系强度的丈量关系强度的丈量)例题分析品牌因子和地域因子合起来总共解释了销售量差别的83.94%其他因子(残差变量)只解释了销售量差别的16.06%R=0.9162,阐明品牌和地域两个因子合起来与销售量之间有较强的关系 7.3.2 思索交互作用思索交互作用7.3 双因子方差分析双因子方差分析7 - 63统计学学STATISTICS(第三版第三版)可反复双因子分析可反复双因子分析(提出假设提出假设)提出假提出假设设对对行因子提出的假行因子提出的假设为设为H0H0::m1 m1 = = m2 m2 = = … … = = mi mi = = …= …= mk mk (mi(mi为为第第i i个个程程度度的均的均值值) )H1H1::mi (i =1,2, … , k) mi (i =1,2, … , k) 不全相等不全相等对对列因子提出的假列因子提出的假设为设为H0H0:: m1 m1 = = m2 m2 = = … … = = mj mj = = …= …= mr mr (mj(mj为为第第j j个个程程度度的均的均值值) )H1H1:: mj (j =1,2,…,r) mj (j =1,2,…,r) 不全相等不全相等对对交互作用的假交互作用的假设为设为H0H0:不无交互作用:不无交互作用H1H1:: 有交互作用有交互作用7 - 64统计学学STATISTICS(第三版第三版)可反复双因子分析可反复双因子分析(平方和的计算平方和的计算)1.1.总平方和:总平方和:2.2.行变量平方和:行变量平方和:3.3.列变量平方和:列变量平方和:4.4.交互作用平方和:交互作用平方和:5.5.误差项平方和:误差项平方和:SST=SSSST=SS行行行行+SS+SS列列列列+SS+SS交互交互交互交互+SS+SS残残残残差差差差7 - 65统计学学STATISTICS(第三版第三版)可反复双因子分析可反复双因子分析(构造检验统计量构造检验统计量)1.1.检验行因子的统计量检验行因子的统计量2.2.检验列因子的统计量检验列因子的统计量3.3.检验交互作用的统计量检验交互作用的统计量计计算出算出算出算出统计统计量的量的量的量的P P值值,假,假,假,假设设P
为为为为分分分分析析析析不不不不同同同同种种种种类类类类对对对对产产产产量量量量的的的的影影影影响响响响,,,,需需需需求求求求选选选选择择择择一一一一些些些些地地地地块块块块,,,,在在在在每每每每个个个个地地地地块块块块种种种种上上上上不不不不同同同同种种种种类类类类的的的的小小小小麦麦麦麦,,,,然然然然后后后后获获获获得得得得产产产产量量量量数数数数据据据据进进进进展展展展分分分分析析析析这这这这一一一一过过过过程程程程就就就就是是是是实实实实验设计的过程验设计的过程验设计的过程验设计的过程 7 - 73统计学学STATISTICS(第三版第三版)完全随机化设计完全随机化设计(例题分析例题分析)实验数据:实验数据: 单单因子方差分析因子方差分析因子方差分析因子方差分析7 - 74统计学学STATISTICS(第三版第三版)完全随机化设计完全随机化设计(例题分析例题分析)方差分析:方差分析:7.4.2 随机化区组设计随机化区组设计7.4 实验设计初步初步7 - 76统计学学STATISTICS(第三版第三版)随机化区组设计随机化区组设计(randomized block design)1.先先按按一一定定规规那那么么将将实实验验单单元元划划分分为为假假设设干干同同质质组组,,称称为为“ “区区组组(block)(block)〞〞2.再将各种再将各种处处置随机地指派置随机地指派给给各个区各个区组组3.比比如如在在上上面面的的例例子子中中,,首首先先根根据据土土壤壤的的好好坏坏分分成成几几个个区区组组,,假假定定分分成成4 4个个区区组组::区区组组1 1、、区区组组2 2、、区区组组3 3、区、区组组4 4,每个区,每个区组组中有三个地中有三个地块块4.在在每每个个区区组组内内的的3 3个个地地块块以以抽抽签签的的方方式式决决议议所所种种的的小麦种小麦种类类5.分分组组后后再再将将每每个个种种类类( (处处置置) )随随机机地地指指派派给给每每一一个个区区组组的的设计设计就是随机化区就是随机化区组设计组设计6.实验实验数据采用无反复双因子方差分析数据采用无反复双因子方差分析7 - 77统计学学STATISTICS(第三版第三版)随机化区组设计随机化区组设计 (例题分析例题分析)实验数据:实验数据: 无反复双因子方差分析无反复双因子方差分析无反复双因子方差分析无反复双因子方差分析7 - 78统计学学STATISTICS(第三版第三版)随机化区组设计随机化区组设计(例题分析例题分析)方差分析:方差分析:7.4.3 因子设计因子设计7.4 实验设计初步初步7 - 80统计学学STATISTICS(第三版第三版)因子设计因子设计(factorial design)1.1.感感兴兴趣的因子有两个趣的因子有两个2.2.如:小麦种如:小麦种类类和施肥方式和施肥方式3.3.假假定定有有甲甲、、乙乙两两种种施施肥肥方方式式,,这这样样3 3个个小小麦麦种种类类和和两两种种施施肥肥方方式式的的搭搭配配共共有有3×2=63×2=6种种。
假假设设我我们们选选择择3030个个地地块块进进展展实实验验,,每每一一种种搭搭配配可可以以做做5 5次次实实验验,,也也就就是是每每个个种种类类( (处处置置) )的的样样本本量量为为5 5,,即即相相当当于于每每个个种种类类( (处处置置) )反复做了反复做了5 5次次实验实验4.4.思思索索两两个个因因子子( (可可推推行行到到多多个个因因子子) )的的搭搭配配实实验验设设计计称称为为因子因子设计设计5.5.该该设设计计主主要要用用于于分分析析两两个个因因子子及及其其交交互互作作用用对对实实验验结结果的影响果的影响6.6.实验实验数据采用可反复双因子方差分析数据采用可反复双因子方差分析7 - 81统计学学STATISTICS(第三版第三版)因子设计因子设计(例题分析例题分析)实验数据:实验数据: 可反复双因子方差分析可反复双因子方差分析可反复双因子方差分析可反复双因子方差分析7 - 82统计学学STATISTICS(第三版第三版)因子设计因子设计(例题分析例题分析)方差分析:方差分析:7 - 83统计学学STATISTICS(第三版第三版)本章小结本章小结l方差分析的思想和原理方差分析的思想和原理l方差分析中的根本假设方差分析中的根本假设l单因子方差分析单因子方差分析l双因子方差分析双因子方差分析l实验设计与数据分析实验设计与数据分析结结 束束。












