
工程统计学课件:第4章 方差分析.ppt
93页第四章第四章 方差分析方差分析 第四章第四章 方差分析方差分析4.1 方差分析引论方差分析引论 4.2 单因素方差分析单因素方差分析4.3 双因素方差分析双因素方差分析第第 4章章 方差分析方差分析 第四章第四章 方差分析方差分析学习目标学习目标1.解释方差分析的概念解释方差分析的概念2.解释方差分析的基本思想和原理解释方差分析的基本思想和原理3.掌握单因素方差分析的方法及应用掌握单因素方差分析的方法及应用4.理解多重比较的意义理解多重比较的意义5.掌握双因素方差分析的方法及应用掌握双因素方差分析的方法及应用 第四章第四章 方差分析方差分析4.1 方差分析引论方差分析引论4.1.1 方差分析及其有关术语方差分析及其有关术语4.1.2 方差分析的基本思想和原理方差分析的基本思想和原理4.1.3 方差分析的基本假定方差分析的基本假定4.1.4 问题的一般提法问题的一般提法---方差分析引论方差分析引论 第四章第四章 方差分析方差分析为什么不做两两比较?为什么不做两两比较?1.设设有有四四个个总总体体的的均均值值分分别别为为 1 、、 2、、 3 、、 4 ,,要要检检验验四四个个总总体体的的均均值值是是否否相相等等,,每每次次检检验验两两个个的的作作法法共共需需要要进进行行6次次不不同同的的检检验验,,每每次次检检验验犯犯第第一一类类错错误误的的概概率率为为 ,,连连续续作作6次次检检验验犯犯第第ⅠⅠ类类错错误误的的概概率率增增加加到到1-(1- )6=0.265,, 大大 于于 0.05。
相相 应应 的的 置置 信信 水水 平平 会会 降降 低低 到到0.956=0.7352.一一般般来来说说,,随随着着增增加加个个体体显显著著性性检检验验的的次次数数,,偶偶然然因因素素导导致致差差别别的的可可能能性性也也会会增增加加,,(并并非非均值真的存在差别均值真的存在差别)3.方方差差分分析析方方法法则则是是同同时时考考虑虑所所有有的的样样本本,,因因此此排排除除了了错错误误累累积积的的概概率率,,从从而而避避免免拒拒绝绝一一个个真真实的原假设实的原假设---方差分析引论方差分析引论 第四章第四章 方差分析方差分析什么是方差分析什么是方差分析(ANOVA)?1.检验多个总体均值是否相等检验多个总体均值是否相等§通通过过分分析析数数据据的的误误差差判判断断各各总总体体均均值值是是否否相相等等2.研究分类型自变量对数值型因变量的影响研究分类型自变量对数值型因变量的影响 n一个或多个分类型自变量一个或多个分类型自变量n两个或多个两个或多个 (k 个个) 处理水平或分类处理水平或分类n一个数值型因变量一个数值型因变量3.有单因素方差分析和双因素方差分析有单因素方差分析和双因素方差分析n单因素方差分析:涉及一个分类的自变量单因素方差分析:涉及一个分类的自变量n双因素方差分析:涉及两个分类的自变量双因素方差分析:涉及两个分类的自变量---方差分析引论方差分析引论 第四章第四章 方差分析方差分析什么是方差分析什么是方差分析? 消费者对四个行业的投诉次数消费者对四个行业的投诉次数消费者对四个行业的投诉次数消费者对四个行业的投诉次数 行业行业观测值观测值零售业零售业旅游业旅游业航空公司航空公司家电制造业家电制造业12345675766494034534468392945565131492134404451657758【【【【 例例例例 】】】】为了对几个行业的服务质量进行评价,消费者协会为了对几个行业的服务质量进行评价,消费者协会为了对几个行业的服务质量进行评价,消费者协会为了对几个行业的服务质量进行评价,消费者协会在在在在4 4个行业分别抽取了不同的企业作为样本。
最近一年中消个行业分别抽取了不同的企业作为样本最近一年中消个行业分别抽取了不同的企业作为样本最近一年中消个行业分别抽取了不同的企业作为样本最近一年中消费者对总共费者对总共费者对总共费者对总共2323家企业投诉的次数如下表家企业投诉的次数如下表家企业投诉的次数如下表家企业投诉的次数如下表 第四章第四章 方差分析方差分析什么是方差分析什么是方差分析?(例例)1.分分析析4个个行行业业之之间间的的服服务务质质量量是是否否有有显显著著差差异异,,也也就就是是要要判判断断“行行业业”对对“投投诉诉次次数数”是否有显著影响是否有显著影响2.作作出出这这种种判判断断最最终终被被归归结结为为检检验验这这四四个个行行业被投诉次数的均值是否相等业被投诉次数的均值是否相等3.若若它它们们的的均均值值相相等等,,则则意意味味着着“行行业业”对对投投诉诉次次数数是是没没有有影影响响的的,,即即它它们们之之间间的的服服务务质质量量没没有有显显著著差差异异;;若若均均值值不不全全相相等等,,则则意意味味着着“行行业业”对对投投诉诉次次数数是是有有影影响响的的,它们之间的服务质量有显著差异,它们之间的服务质量有显著差异---方差分析引论方差分析引论 第四章第四章 方差分析方差分析方差分析中的有关术语方差分析中的有关术语1.因素或因子因素或因子(factor)§所要检验的对象所要检验的对象l分分析析行行业业对对投投诉诉次次数数的的影影响响,,行行业业是是要要检检验验的的因因子子2.水平或处理水平或处理(treatment)§因子的不同表现因子的不同表现l零售业、旅游业、航空公司、家电制造业零售业、旅游业、航空公司、家电制造业3.观察值观察值§在每个因素水平下得到的样本数据在每个因素水平下得到的样本数据l每个行业被投诉的次数每个行业被投诉的次数---方差分析引论方差分析引论 第四章第四章 方差分析方差分析方差分析中的有关术语方差分析中的有关术语4. 总体总体§因素的每一个水平可以看作是一个总体因素的每一个水平可以看作是一个总体l零售业、旅游业、航空公司、家电制造业是零售业、旅游业、航空公司、家电制造业是4个总体个总体5. 样本数据样本数据§被被投投诉诉次次数数可可以以看看作作是是从从这这4个个总总体体中中抽抽取取的的样本数据样本数据---方差分析引论方差分析引论 第四章第四章 方差分析方差分析方差分析的基本思想和原理方差分析的基本思想和原理 零售业 旅游业 航空公司 家电制造 第四章第四章 方差分析方差分析方差分析的基本思想和原理方差分析的基本思想和原理1.从从散点图上可以看出散点图上可以看出n不同行业被投诉的次数有明显差异不同行业被投诉的次数有明显差异n同同一一个个行行业业,,不不同同企企业业被被投投诉诉的的次次数数也也明明显显不同不同n家家电电制制造造被被投投诉诉的的次次数数较较高高,,航航空空公公司司被被投投诉的次数较低诉的次数较低2.行行业与被投诉次数之间有一定的关系业与被投诉次数之间有一定的关系n如如果果行行业业与与被被投投诉诉次次数数之之间间没没有有关关系系,,那那么么它它们们被被投投诉诉的的次次数数应应该该差差不不多多相相同同,,在在散散点点图上所呈现的模式也就应该很接近图上所呈现的模式也就应该很接近---方差分析引论方差分析引论 第四章第四章 方差分析方差分析方差分析的基本思想和原理方差分析的基本思想和原理1.散散点点图图观观察察不不能能提提供供充充分分的的证证据据证证明明不不同同行行业被投诉的次数之间有显著差异业被投诉的次数之间有显著差异n这种差异可能是由于抽样的随机性造成的这种差异可能是由于抽样的随机性造成的2.需需要要有有更更准准确确的的方方法法来来检检验验这这种种差差异异是是否否显显著,也就是进行方差分析著,也就是进行方差分析n所所以以叫叫方方差差分分析析,,因因为为虽虽然然我我们们感感兴兴趣趣的的是是均均值值,,但但在在判判断断均均值值之之间间是是否否有有差差异异时时则则需需要要借借助助于于方方差差n这这个个名名字字也也表表示示::它它是是通通过过对对数数据据误误差差来来源源的的分分析析判判断断不不同同总总体体的的均均值值是是否否相相等等。
因因此此,,进进行行方方差分析时,需要考察数据误差的来源差分析时,需要考察数据误差的来源---方差分析引论方差分析引论 第四章第四章 方差分析方差分析方差分析的基本思想和原理方差分析的基本思想和原理1.组内误差组内误差§因因素素的的同同一一水水平平(总总体体)下下,,样样本本各各观观察察值值之之间间的的差异差异l比如,同一行业下不同企业被投诉次数之间的差异比如,同一行业下不同企业被投诉次数之间的差异§这这种种差差异异可可以以看看成成是是随随机机因因素素的的影影响响,,称称为为随随机机误差误差 2.组间误差组间误差§因素的不同水平因素的不同水平(不同总体不同总体)之间观察值的差异之间观察值的差异l比如,不同行业之间的被投诉次数之间的差异比如,不同行业之间的被投诉次数之间的差异§这这种种差差异异可可能能是是由由于于抽抽样样的的随随机机性性所所造造成成的的,,也也可可能能是是由由于于行行业业本本身身所所造造成成的的,,后后者者所所形形成成的的误误差是由系统性因素造成的,称为差是由系统性因素造成的,称为系统误差系统误差误差误差---方差分析引论方差分析引论 第四章第四章 方差分析方差分析方差分析的基本思想和原理方差分析的基本思想和原理1.组内误差组内误差-----随机误差随机误差2. 组间误差组间误差-----随机误差和系统误差随机误差和系统误差3. 如如果果不不同同水水平平对对结结果果没没有有影影响响,,那那么么在在组组间间误误差差中中只只存存在在随随机机误误差差,,而而没没有有系系统统误误差差。
这这时时,,组组间间和和组组内内误误差差经经过过平平均均后后的的数数值值((均均方方或或方方差差))就就应应该该很很接接近近,,比比值值会会接接近近1不不然然,,组组间均方会大于组内均方,它们之间的比值就会大于间均方会大于组内均方,它们之间的比值就会大于14. 当当这这个个比比值值大大到到某某种种程程度度时时,,就就可可以以说说不不同同水水平平之之间间存存在在着着显显著著差异,即自变量对因变量有影响差异,即自变量对因变量有影响§判判断断行行业业对对投投诉诉次次数数是是否否有有显显著著影影响响,,也也就就是是检检验验被被投投诉诉次次数数的的差差异异主主要要是是由由于于什什么么原原因因所所引引起起的的如如果果这这种种差差异异主主要要是是系系统统误误差差,,说说明明不不同同行行业业对对投投诉诉次次数数有有显显著著影响影响---方差分析引论方差分析引论 第四章第四章 方差分析方差分析方差分析的基本假定方差分析的基本假定在什么样的前提下分析?在什么样的前提下分析?---方差分析引论方差分析引论 第四章第四章 方差分析方差分析方差分析的基本假定方差分析的基本假定1.每个每个总体都应服从正态分布总体都应服从正态分布§对对于于因因素素的的每每一一个个水水平平,,其其观观察察值值是是来来自自服服从正态分布总体的简单随机样本从正态分布总体的简单随机样本§比比如如,,每每个个行行业业被被投投诉诉的的次次数数必必须须服服从从正正态态分布分布2.各个各个总体的方差必须相同总体的方差必须相同§各各组组观观察察数数据据是是从从具具有有相相同同方方差差的的总总体体中中抽抽取的取的§比如,比如,4个行业被投诉次数的方差都相等个行业被投诉次数的方差都相等3.观观察值是独立的察值是独立的§比比如如,,每每个个行行业业被被投投诉诉的的次次数数与与其其他他行行业业被被投诉的次数独立投诉的次数独立---方差分析引论方差分析引论 第四章第四章 方差分析方差分析方差分析中的基本假定方差分析中的基本假定1.在在上上述述假假定定条条件件下下,,判判断断行行业业对对投投诉诉次次数数是是否否有有显显著著影影响响,,实实际际上上也也就就是是检检验验具具有有相同方差的相同方差的4个正态总体的均值是否相等个正态总体的均值是否相等2.如如果果4个个总总体体的的均均值值相相等等,,可可以以期期望望4个个样样本的均值也会很接近本的均值也会很接近§4个个样样本本的的均均值值越越接接近近,,推推断断4个个总总体体均均值值相相等的证据也就越充分等的证据也就越充分§样样本本均均值值越越不不同同,,推推断断总总体体均均值值不不同同的的证证据据就越充分就越充分 ---方差分析引论方差分析引论 第四章第四章 方差分析方差分析方差分析中的基本假定方差分析中的基本假定 如果原假设成立,即如果原假设成立,即H H0 0 : 1 1 = = 2 2 = = 3 3 = = 4 4n n4 4个行业被投诉次数的均值都相等个行业被投诉次数的均值都相等n n意味着意味着每个样本都来自均值为每个样本都来自均值为、方差为、方差为 2 2的同一的同一正态总体正态总体 X X Xf(X)f(X)f(X) 1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 ---方差分析引论方差分析引论 第四章第四章 方差分析方差分析方差分析中的基本假定方差分析中的基本假定 若备择假设成立,即若备择假设成立,即H H1 1 : i i ( (i i=1,2,3,4=1,2,3,4) )不全相不全相等等n n至少有一个总体的均值是不同的至少有一个总体的均值是不同的n n4 4个样本分别来自均值不同的个样本分别来自均值不同的4 4个正态总体个正态总体 X X Xf(X)f(X)f(X) 3 3 3 3 1 1 1 1 2 2 2 2 4 4 4 4 ---方差分析引论方差分析引论 第四章第四章 方差分析方差分析问题的一般提法问题的一般提法1.设设因因素素有有k个个水水平平,,每每个个水水平平的的均均值值分分别别用用 1 , 2, , k 表示表示2.要要检检验验k个个水水平平(总总体体)的的均均值值是是否否相相等等,,需需要要提提出如下假设:出如下假设: §H0 :: 1 2 … k §H1 :: 1 , 2 , ,, k 不全相等不全相等3.设设 1为为零零售售业业被被投投诉诉次次数数的的均均值值,, 2为为旅旅游游业业被被投投诉诉次次数数的的均均值值,, 3为为航航空空公公司司被被投投诉诉次次数数的的均均值值,, 4为为家家电电制制造造业业被被投投诉诉次次数数的的均均值值,,提提出出的的假设为假设为§H0 :: 1 2 3 4 §H1 :: 1 , 2 , 3 , 4 不全相等不全相等---方差分析引论方差分析引论 第四章第四章 方差分析方差分析4.2 单因素方差分析单因素方差分析4.2.1 数据结构数据结构4.2.2 分析步骤分析步骤4.2.3 关系强度的测量关系强度的测量4.2.4 方差分析中的多重比较方差分析中的多重比较---单因素方差分析单因素方差分析 第四章第四章 方差分析方差分析单因素方差分析的数据结构单因素方差分析的数据结构观察值观察值观察值观察值 ( ( j j ) )因素因素因素因素( (A A) ) i i 水平水平水平水平A A1 1 水平水平水平水平A A2 2 … … 水平水平水平水平A Ak k12::n x11 x21 … xk1 x12 x22 … xk2 : : : : : : : : x1n x2n … xkn---单因素方差分析单因素方差分析 第四章第四章 方差分析方差分析分析步骤分析步骤•提出假设提出假设•构造检验统计量构造检验统计量•统计决策统计决策方差分析的步骤方差分析的步骤---单因素方差分析单因素方差分析 第四章第四章 方差分析方差分析提出假设提出假设1.一一般提法般提法§H0 :: 1 = 2 =…= k •自变量对因变量没有显著影响自变量对因变量没有显著影响 §H1 :: 1 ,, 2 ,,… ,, k不全相等不全相等•自变量对因变量有显著影响自变量对因变量有显著影响 2.注注意意::拒拒绝绝原原假假设设,,只只表表明明至至少少有有两两个个总总体体的的均均值值不不相相等等,,并并不不意意味味着着所所有有的的均值都不相等均值都不相等 ---单因素方差分析单因素方差分析 第四章第四章 方差分析方差分析构造检验的统计量构造检验的统计量构造统计量需要计算§水平的均值§全部观察值的总均值§误差平方和§均方(MS) ---单因素方差分析单因素方差分析 第四章第四章 方差分析方差分析构造检验的统计量构造检验的统计量1.假定从第i个总体中抽取一个容量为ni的简单随机样本,第i个总体的样本均值为该样本的全部观察值总和除以观察值的个数2.计算公式为 式中:式中: n ni i为第为第 i i 个总体的样本观察值个数个总体的样本观察值个数 x xij ij 为第为第 i i 个总体的第个总体的第 j j 个观察值个观察值 ---单因素方差分析单因素方差分析 第四章第四章 方差分析方差分析构造检验的统计量构造检验的统计量1.全部观察值的总和除以观察值的总个数2.计算公式为 ---单因素方差分析单因素方差分析 第四章第四章 方差分析方差分析构造检验的统计量构造检验的统计量 第四章第四章 方差分析方差分析构造检验的统计量构造检验的统计量1.全部观察值 与总平均值 的离差平方和2.反映全部观察值的离散状况3.其计算公式为§ 前例的计算结果前例的计算结果 SST SST = (57-47.869565)= (57-47.869565)2 2+ +…+…+(58-47.869565)(58-47.869565)2 2 =4 164.608 696 =4 164.608 696(计算总误差平方和计算总误差平方和 SST)---单因素方差分析单因素方差分析 第四章第四章 方差分析方差分析构造检验的统计量构造检验的统计量1.各各组组平平均均值值 与与总总平平均均值值 的的离差平方和离差平方和2.反映各总体的样本均值之间的差异程度反映各总体的样本均值之间的差异程度3.该平方和既包括随机误差,也包括系统误差该平方和既包括随机误差,也包括系统误差4.计算公式为计算公式为 § 前例的计算结果前例的计算结果 SSA SSA = 1456.608696= 1456.608696(计算组间平方和计算组间平方和 SSA)---单因素方差分析单因素方差分析 第四章第四章 方差分析方差分析构造检验的统计量构造检验的统计量1.每每个个水水平平或或组组的的各各样样本本数数据据与与其其组组平平均均值值的的离差平方和离差平方和2.反映每个样本各观察值的离散状况反映每个样本各观察值的离散状况3.该平方和反映的是随机误差的大小该平方和反映的是随机误差的大小4.计算公式为计算公式为 § 前例的计算结果前例的计算结果 SSE SSE = 2708= 2708(计算组内平方和计算组内平方和 SSE )---单因素方差分析单因素方差分析 第四章第四章 方差分析方差分析构造检验的统计量构造检验的统计量总总离离差差平平方方和和(SST)(SST)、、误误差差项项离离差差平平方方和和(SSE)(SSE)、、水平项离差平方和水平项离差平方和 (SSA) (SSA) 之间的关系之间的关系SST = SSA + SSE§ 前例的计算结果前例的计算结果 4164.608696=1456.608696+2708 4164.608696=1456.608696+2708 (三个平方和的关系三个平方和的关系)---单因素方差分析单因素方差分析 第四章第四章 方差分析方差分析构造检验的统计量构造检验的统计量1.各各误误差差平平方方和和的的大大小小与与观观察察值值的的多多少少有有关关,,为为消消除除观观察察值值多多少少对对误误差差平平方方和和大大小小的的影影响响,,需要将其平均,这就是均方,也称为方差需要将其平均,这就是均方,也称为方差2.由误差平方和除以相应的自由度求得由误差平方和除以相应的自由度求得3.三个平方和对应的自由度分别是三个平方和对应的自由度分别是§SST 的的自自由由度度为为n-1,,其其中中n为为全全部部观观察察值值的的个数个数§SSA的的自自由由度度为为k-1,,其其中中k为为因因素素水水平平(总总体体)的的个数个数§SSE 的的自由度为自由度为n-k(计算均方计算均方MS)---单因素方差分析单因素方差分析 第四章第四章 方差分析方差分析构造检验的统计量构造检验的统计量§SST SST 的的自自由由度度为为n n-1-1,,其其中中n n为为全全部部观观察察值值的的个个数数§SSASSA的的自自由由度度为为k k-1-1,,其其中中k k为为因因素素水水平平( (总总体体) )的的个数个数(计算均方计算均方MS)---单因素方差分析单因素方差分析 第四章第四章 方差分析方差分析构造检验的统计量构造检验的统计量§SSE SSE 的的自由度为自由度为n n- -k k§对对每每一一水水平平i i而而言言,,其其观观察察值值个个数数为为n ni i,,该该种种水水平平下下的的自自由由度度为为n ni i-1-1,,总总共共有有k k个个水水平平,,因因此此拥拥有有的的自自由由度为度为(计算均方计算均方MS)---单因素方差分析单因素方差分析 第四章第四章 方差分析方差分析构造检验的统计量构造检验的统计量1.组组间间方方差差::SSA的均方,记为MSA,计算公式为2.组组内内方方差差::SSE的的均均方方,,记记为为MSE,,计计算算公式为公式为(计算均方计算均方 MS)---单因素方差分析单因素方差分析 第四章第四章 方差分析方差分析构造检验的统计量构造检验的统计量1.将将MSA和和MSE进进行行对对比比,,即即得得到到所所需需要要的检验统计量的检验统计量F2.当当H0为为真真时时,,二二者者的的比比值值服服从从分分子子自自由由度度为为k-1、、分分母母自自由由度度为为 n-k 的的 F 分分布布,,即即 (计算检验统计量计算检验统计量 F )---单因素方差分析单因素方差分析 第四章第四章 方差分析方差分析构造检验的统计量构造检验的统计量如果均值相等,如果均值相等,如果均值相等,如果均值相等,如果均值相等,如果均值相等,F F F= = =MSAMSAMSA/ / /MSEMSEMSE1 1 1 F 分布分布F (k-1,n-k)0 0拒绝拒绝拒绝拒绝HH0 0不能拒绝不能拒绝不能拒绝不能拒绝H H H H0 0 0 0F F(F分布与拒绝域分布与拒绝域) 第四章第四章 方差分析方差分析统计决策统计决策 将统计量的值F与给定的显著性水平的临界值F进行比较,作出对原假设H0的决策§根根据据给给定定的的显显著著性性水水平平 ,,在在F F分分布布表表中中查查找找与与第第一一自自由由度度dfdf1 1==k k-1-1、、第第二二自自由由度度dfdf2 2= =n n- -k k 相相应应的的临界值临界值 F F §若若F F> >F F ,,则则拒拒绝绝原原假假设设H H0 0 ,,表表明明均均值值之之间间的的差差异异是是显显著著的的,,所所检检验验的的因因素素对对观观察察值值有有显显著著影响影响§若若F 反反之之,,就就意意味味着着两两个个变变量量之之间间的的关关系系不不显显著著,,小得越多,表明它们之间的关系就越弱小得越多,表明它们之间的关系就越弱关系强度的测量---单因素方差分析单因素方差分析 第四章第四章 方差分析方差分析1.变量间关系的强度用自变量平方和(SSA) 占总平方和(SST)的比例大小来反映2.自变量平方和占总平方和的比例记为R2 ,即3.其平方根R就可以用来测量两个变量之间的关系强度 关系强度的测量---单因素方差分析单因素方差分析 第四章第四章 方差分析方差分析 R R= =0.5914040.591404结论结论结论结论§行行业业( (自自变变量量) )对对投投诉诉次次数数( (因因变变量量) )的的影影响响效效应应占占 总总 效效 应应 的的 34.9759%34.9759%,, 而而 残残 差差 效效 应应 则则 占占65.0241%65.0241%即即行行业业对对投投诉诉次次数数差差异异解解释释的的比比例例达达到到近近35%35%,,而而其其他他因因素素( (残残差差变变量量) )所所解解释释的比例近的比例近65%65%以上以上 § R R= =0.5914040.591404,,表表明明行行业业与与投投诉诉次次数数之之间间有有中中等以上的关系等以上的关系 关系强度的测量---单因素方差分析单因素方差分析 第四章第四章 方差分析方差分析多重比较的意义多重比较的意义1.通通过过对对总总体体均均值值之之间间的的配配对对比比较较来来进进一一步检验到底哪些均值之间存在差异步检验到底哪些均值之间存在差异2.可可采采用用Fisher提提出出的的最最小小显显著著差差异异方方法法,,简写为简写为LSD3. LSD方方法法是是对对检检验验两两个个总总体体均均值值是是否否相相等等的的t检检验验方方法法的的总总体体方方差差估估计计加加以以修修正正(用用MSE来代替来代替)而得到的而得到的 ---单因素方差分析单因素方差分析 第四章第四章 方差分析方差分析多重比较的步骤多重比较的步骤1.提出假设提出假设§H H0 0: : m mi i= =m mj j ( (第第i i个个总总体体的的均均值值等等于于第第j j个个总总体体的的均均值值) )§H H1 1: : m mi i m mj j ( (第第i i个个总总体体的的均均值值不不等等于于第第j j个个总总体体的的均值均值) )2.计算检计算检验的统计量验的统计量: : 3.计算计算LSDLSD4.决策:若决策:若 ,,拒拒绝绝H H0 0;; 若若 ,不拒,不拒绝绝H H0 0---单因素方差分析单因素方差分析 第四章第四章 方差分析方差分析多重比较分析多重比较分析(例例)第第1步:步:提出假设§检验1:§检验2:§检验3:§检验4:§检验5:§检验6:---单因素方差分析单因素方差分析 第四章第四章 方差分析方差分析方差分析中的多重比较方差分析中的多重比较(例例)第第2步:步:计算检验统计量§检验1:§检验2:§检验3:§检验4:§检验5:§检验6:---单因素方差分析单因素方差分析 第四章第四章 方差分析方差分析方差分析中的多重比较方差分析中的多重比较(例例) 第第3步步::计算LSD§检验1:§检验2:§检验3:§检验4:§检验5:§检验6:---单因素方差分析单因素方差分析 第四章第四章 方差分析方差分析方差分析中的多重比较方差分析中的多重比较(例例) 第第4步:步:作出决策不能认为零售业与旅游业均值之间有显不能认为零售业与旅游业均值之间有显著差异著差异 不能认为零售业与航空公司均值之间有不能认为零售业与航空公司均值之间有显著差异显著差异 不能认为零售业与家电业均值之间有显不能认为零售业与家电业均值之间有显著差异著差异 不能认为旅游业与航空业均值之间有显不能认为旅游业与航空业均值之间有显著差异著差异 不能认为旅游业与家电业均值之间有显不能认为旅游业与家电业均值之间有显著差异著差异 航空业与家电业均值航空业与家电业均值有有显著差异显著差异 ---单因素方差分析单因素方差分析 第四章第四章 方差分析方差分析4.3 双因素方差分析双因素方差分析4.3.1 双因素方差分析及其类型双因素方差分析及其类型4.3.2 无交互作用的双因素方差分析无交互作用的双因素方差分析4.3.3 有交互作用的双因素方差分析有交互作用的双因素方差分析---双因素方差分析双因素方差分析 第四章第四章 方差分析方差分析双因素方差分析双因素方差分析1.分分析析两两个个因因素素(行行因因素素row和和列列因因素素column)对对试试验结果的影响验结果的影响 2.如如果果两两个个因因素素对对试试验验结结果果的的影影响响是是相相互互独独立立的的,,分分别别判判断断行行因因素素和和列列因因素素对对试试验验数数据据的的影影响响,,这这时时的的双双因因素素方方差差分分析析称称为为无无交交互互作作用用的的双双因因素素方方差差分分析析或或无无重重复复双双因因素素方方差差分分析析(two-factor without replication)3.如如果果除除了了行行因因素素和和列列因因素素对对试试验验数数据据的的单单独独影影响响外外,,两两个个因因素素的的搭搭配配还还会会对对结结果果产产生生一一种种新新的的影影响响,,这这时时的的双双因因素素方方差差分分析析称称为为有有交交互互作作用用的的双双因因素素方方差差分分析析或或可可重重复复双双因因素素方方差差分分析析 (two-factor with replication )---双因素方差分析双因素方差分析 第四章第四章 方差分析方差分析双因素方差分析的基本假定双因素方差分析的基本假定1.每个总体都服从正态分布每个总体都服从正态分布§对对于于因因素素的的每每一一个个水水平平,,其其观观察察值值是是来来自自正正态分布总体的简单随机样本态分布总体的简单随机样本2.各个总体的方差必须相同各个总体的方差必须相同§对对于于各各组组观观察察数数据据,,是是从从具具有有相相同同方方差差的的总总体中抽取的体中抽取的3.观察值是独立的观察值是独立的---双因素方差分析双因素方差分析 第四章第四章 方差分析方差分析无交互作用的双因素方差分析无交互作用的双因素方差分析(无重复双因素分无重复双因素分析析)---双因素方差分析双因素方差分析 第四章第四章 方差分析方差分析双因素方差分析双因素方差分析 (例例)不同品牌的彩电在不同品牌的彩电在不同品牌的彩电在不同品牌的彩电在5 5个地区的销售量数据个地区的销售量数据个地区的销售量数据个地区的销售量数据 品牌因素品牌因素地区因素地区因素地区地区1地区地区2地区地区3地区地区4地区地区5品牌品牌1品牌品牌2品牌品牌3品牌品牌4365345358288 350368323280 343363353298 340330343260 323333308298 【【【【例例例例】】】】有有4 4个个品品牌牌的的彩彩电电在在5 5个个地地区区销销售售,,为为分分析析彩彩电电的的品品牌牌( (品品牌牌因因素素) )和和销销售售地地区区( (地地区区因因素素) )对对销销售售量量的的影影响响,,对对每每个个品品牌牌在在各各地地区区的的销销售售量量取取得得以以下下数数据据。 试试分分析析品品牌牌和和销售地区对彩电的销售量是否有显著影响?销售地区对彩电的销售量是否有显著影响?( ( =0.05=0.05) ) ---双因素方差分析双因素方差分析 第四章第四章 方差分析方差分析数据结构数据结构 ---双因素方差分析双因素方差分析 第四章第四章 方差分析方差分析数据结构数据结构 是行因素的第是行因素的第i i个水平下各观察值的平均值个水平下各观察值的平均值 是列因素的第是列因素的第j j个水平下各观察值的平均值个水平下各观察值的平均值 是全部是全部 kr kr 个样本数据的总平均值个样本数据的总平均值 第四章第四章 方差分析方差分析分析步骤分析步骤(提出假设提出假设)提出假设n n对对行因素提出的假设为行因素提出的假设为•H H0 0::m m1 1 = = m m2 2 = = …… = = m mi i = = ……= = m mk k ( (m mi i为为第第i i个个水水平平的的均值均值) )•H H1 1::m mi i ( (i i =1,2, … , =1,2, … , k k) ) 不全相等不全相等n n对对列因素提出的假设为列因素提出的假设为•H H0 0:: m m1 1 = = m m2 2 = = …… = = m mj j = = ……= = m mr r ( (m mj j为为第第j j个个水水平平的的均值均值) )•H H1 1:: m mj j ( (j j =1,2,…,=1,2,…,r r) ) 不全相等不全相等---双因素方差分析双因素方差分析 第四章第四章 方差分析方差分析分析步骤分析步骤(构造检验的统计量构造检验的统计量)计算平方和(SS)n n总误差平方和总误差平方和n n行因素误差平方和行因素误差平方和 n n列因素误差平方和列因素误差平方和 n n随机误差项平方和随机误差项平方和---双因素方差分析双因素方差分析 第四章第四章 方差分析方差分析分析步骤分析步骤(构造检验的统计量构造检验的统计量) 总误差平方和(SST )、行因素平方和 (SSR)、列因素平方和(SSC) 、误差项平方和(SSE) 之间的关系SST = SSR +SSC+SSE ---双因素方差分析双因素方差分析 第四章第四章 方差分析方差分析分析步骤分析步骤(构造检验的统计量构造检验的统计量)计算均方(MS)§误差平方和除以相应的自由度误差平方和除以相应的自由度§三个平方和的自由度分别是三个平方和的自由度分别是•总误差平方和总误差平方和SSTSST的自由度为的自由度为 krkr-1-1•行因素平方和行因素平方和SSRSSR的自由度为的自由度为 k k-1-1•列因素平方和列因素平方和SSCSSC的自由度为的自由度为 r r-1-1•误差项平方和误差项平方和SSESSE的自由度为的自由度为 ( (k k-1)×(-1)×(r r-1)-1) ---双因素方差分析双因素方差分析 第四章第四章 方差分析方差分析分析步骤分析步骤(构造检验的统计量构造检验的统计量)计算均方(MS)§行因素的均方,记为行因素的均方,记为MSRMSR,计算公式为,计算公式为§列因素的均方,记为列因素的均方,记为MSCMSC ,计算公式为,计算公式为§误差项的均方,记为误差项的均方,记为MSEMSE ,计算公式为,计算公式为---双因素方差分析双因素方差分析 第四章第四章 方差分析方差分析分析步骤分析步骤(构造检验的统计量构造检验的统计量) 计算检验统计量(F)§检验行因素的统计量检验行因素的统计量 §检验列因素的统计量检验列因素的统计量---双因素方差分析双因素方差分析 第四章第四章 方差分析方差分析分析步骤分析步骤(统计决策统计决策) 将将统统计计量量的的值值F F与与给给定定的的显显著著性性水水平平 的的临临界界值值F F 进行比较,作出对原假设进行比较,作出对原假设H H0 0的决策的决策§根根据据给给定定的的显显著著性性水水平平 在在F F分分布布表表中中查查找找相相应应的临界值的临界值 F F §若若F FR R> >F F ,,拒拒拒拒绝绝绝绝原原假假设设H H0 0 ,,表表明明均均值值之之间间的的差差异异是是显显著著的的,,即即所所检检验验的的行行因因素素对对观观察察值值有有显显著著影响影响§若若F FC C > > F F ,,拒拒拒拒绝绝绝绝原原假假设设H H0 0 ,,表表明明均均值值之之间间有有显显著差异,即所检验的列因素对观察值有显著影响著差异,即所检验的列因素对观察值有显著影响 ---双因素方差分析双因素方差分析 第四章第四章 方差分析方差分析双因素方差分析表双因素方差分析表(基本结构基本结构)误差来源误差来源平方平方和和(SS)自由度自由度(df)均方均方(MS)F值值P值值F临界临界值值行因素行因素SSRSSRk-k-1 1MSRMSRMSRMSRMSEMSE列因素列因素SSCSSCr-1r-1MSCMSCMSCMSCMSEMSE误差误差SSESSE( (k-k-1)(1)(r r- -1)1)MSEMSE总和总和SSTSSTkr-kr-1 1 第四章第四章 方差分析方差分析双因素方差分析双因素方差分析(例题分析例题分析)提出假设提出假设n n对品牌因素提出的假设为对品牌因素提出的假设为•H H0 0:: 1 1= = 2 2= = 3 3= = 4 4 ( (品品牌牌对对销销售售量量无无显显著著影影响响) )•H H1 1:: i i ( (i i =1,2, … , 4)=1,2, … , 4) 不全相等不全相等 ( (有显著影响有显著影响) )n n对地区因素提出的假设为对地区因素提出的假设为•H H0 0:: 1 1= = 2 2= = 3 3= = 4 4= = 5 5 ( (地地区区对对销销售售量量无无显显著著影影响响) )•H H1 1:: j j ( (j j =1,2,…,5)=1,2,…,5) 不全相等不全相等 ( (有显著影响有显著影响) ) ---双因素方差分析双因素方差分析 第四章第四章 方差分析方差分析双因素方差分析双因素方差分析(例题分析例题分析) 结论:结论:结论:结论: § F FR R==18.10777>18.10777>F F ==3.49033.4903,,拒绝原假设拒绝原假设H H0 0,说明彩,说明彩电的品牌对销售量有显著影响电的品牌对销售量有显著影响§ F FC C==2.1008462.100846< < F F ==3.25923.2592,不拒绝原假设,不拒绝原假设H H0 0,无证,无证据表明销售地区对彩电的销售量有显著影响据表明销售地区对彩电的销售量有显著影响---双因素方差分析双因素方差分析 第四章第四章 方差分析方差分析双因素方差分析双因素方差分析(关系强度的测量关系强度的测量)1.1.行行平平方方和和( (SSRSSR) )度度量量了了品品牌牌这这个个自自变变量量对对因因变变量量( (销销售量售量) )的影响效应的影响效应2.2.列列平平方方和和( (SSCSSC) )度度量量了了地地区区这这个个自自变变量量对对因因变变量量( (销销售量售量) )的影响效应的影响效应3.3.这这两两个个平平方方和和加加在在一一起起则则度度量量了了两两个个自自变变量量对对因因变变量的联合效应量的联合效应4.4.联合效应与总平方和的比值定义为联合效应与总平方和的比值定义为R R2 25.5.其其平平方方根根R R反反映映了了这这两两个个自自变变量量合合起起来来与与因因变变量量之之间间的关系强度的关系强度 ---双因素方差分析双因素方差分析 第四章第四章 方差分析方差分析双因素方差分析双因素方差分析 (关系强度的测量关系强度的测量)例题分析n n品品牌牌因因素素和和地地区区因因素素合合起起来来总总共共解解释释了了销销售售量差异的量差异的83.94%83.94%n n其其他他因因素素( (残残差差变变量量) )只只解解释释了了销销售售量量差差异异的的16.06%16.06%n nR R=0.9162=0.9162,,表表明明品品牌牌和和地地区区两两个个因因素素合合起起来来与销售量之间有较强的关系与销售量之间有较强的关系 ---双因素方差分析双因素方差分析 第四章第四章 方差分析方差分析例例1 设甲、乙、丙、丁四个工人操作机器设甲、乙、丙、丁四个工人操作机器ⅠⅠ、、ⅡⅡ、、ⅢⅢ各一天,各一天, 其产品产量如其产品产量如a a下表,问工人和机器对产品产量是否有显著下表,问工人和机器对产品产量是否有显著 影响?影响? 工人工人 A甲甲 乙乙 丙丙 丁丁Ⅰ Ⅱ ⅢⅠ Ⅱ Ⅲ---双因素方差分析双因素方差分析 第四章第四章 方差分析方差分析例例1的上机操作的上机操作对应例对应例1 的数据输入方式的数据输入方式原始数据,行因素水平,列因素水平原始数据,行因素水平,列因素水平 第四章第四章 方差分析方差分析 第四章第四章 方差分析方差分析 第四章第四章 方差分析方差分析***在在 下接受,在下接受,在 下否决下否决在在 下否决下否决((A))((B))工人对产品产量有显著影响,而机器对产品产量的影响工人对产品产量有显著影响,而机器对产品产量的影响极极显著。 显著 第四章第四章 方差分析方差分析交互作用示意图交互作用示意图7/31/202476有交互作用的双因素方差分析(可重复双因素分析可重复双因素分析)---双因素方差分析双因素方差分析 第四章第四章 方差分析方差分析交互作用级交互作用级 因子间的交互作用会随着因子个数的增加而增加如四因子间的交互作用会随着因子个数的增加而增加如四个因子个因子A A,,B B,,C C,,D D间的交互作用有以下几类:间的交互作用有以下几类:(1)(1)二级交互作用有二级交互作用有6 6个:个: ABAB,, ACAC,, ADAD,, BCBC,, BDBD,, CDCD;;(2)(2) 三级交互作用有三级交互作用有4 4个:个: ABCABC,, ABDABD,, ACDACD,, BCDBCD(3)(3)四级交互作用有四级交互作用有1 1个:个: ABCD ABCD 交互作用共有交互作用共有1111个,比因子个数还多实践经验表个,比因子个数还多实践经验表 明,多数交互作用是不存在或者很小以至可以忽略不明,多数交互作用是不存在或者很小以至可以忽略不计的,一般我们主要考虑部分二级交互作用,但考察计的,一般我们主要考虑部分二级交互作用,但考察哪些二级交互作用由具体情况来决定。 哪些二级交互作用由具体情况来决定 77---双因素方差分析双因素方差分析 第四章第四章 方差分析方差分析可重复双因素分析可重复双因素分析(例例)【【【【例例例例】】】】城城市市道道路路交交通通管管理理部部门门为为研研究究不不同同的的路路段段和和不不同同的的时时间间段段对对行行车车时时间间的的影影响响,,让让一一名名交交通通警警察察分分别别在在两两个个路路段段和和高高峰峰期期与与非非高高峰峰期期亲亲自自驾驾车车进进行行试试验验,,通通过过试试验验共共获获得得了了2020个个行行车车时时间间( (单单位位::min)min)的的数数据据,,如如下下表表试试分分析析路路段段、、时时段段以以及及路路段段和和时时段段的的交交互互作用对行车时间的影响作用对行车时间的影响 ---双因素方差分析双因素方差分析 第四章第四章 方差分析方差分析交互作用的图示交互作用的图示(interaction)路段与时段对行车时间的影响交互作用交互作用交互作用交互作用无交互作用无交互作用无交互作用无交互作用行车时间行车时间路段路段1 1路段路段2 2高峰期高峰期非高峰期非高峰期行车时间行车时间路段路段1 1路段路段2 2高峰期高峰期非高峰期非高峰期---双因素方差分析双因素方差分析 第四章第四章 方差分析方差分析可重复双因素方差分析表可重复双因素方差分析表误差来源误差来源平方和平方和(SS)自由度自由度(df)均方均方(MS)F值值P值值F临界值临界值行因素行因素SSRSSRk-k-1 1MSRMSRF FR R列因素列因素SSCSSCr- r-1 1MSCMSCF FC C交互作用交互作用SSRCSSRC( (k-k-1)(1)(r r- -1)1)MSRCMSRCF FRCRC误差误差SSESSEKrKr( (mm-1)-1)MSEMSE总和总和SSTSSTn-n-1 1m为样本的行数为样本的行数 第四章第四章 方差分析方差分析可重复双因素分可重复双因素分析析(平方和的计算平方和的计算)设:设: 为对应于行因素的第为对应于行因素的第i i个水平和列因素的第个水平和列因素的第j j个个 水平的第水平的第l l行的观察值行的观察值 为行因素的第为行因素的第i i个水平的样本均值个水平的样本均值 为列因素的第为列因素的第j j个水平的样本均值个水平的样本均值 对应于行因素的第对应于行因素的第i i个水平和列因素的第个水平和列因素的第j j个水个水 平组合的样本均值平组合的样本均值 为全部为全部n n个观察值的总均值个观察值的总均值 ---双因素方差分析双因素方差分析 第四章第四章 方差分析方差分析可重复双因素分析可重复双因素分析(平方和的计算平方和的计算)1.1.总平方和:总平方和:2.2.行变量平方和:行变量平方和:3.3.列变量平方和:列变量平方和:4.4.交互作用平方和:交互作用平方和:5.5.误差项平方和:误差项平方和:SSTSST= =SSRSSR+ +SSCSSC+ +SSRCSSRC+ +SSESSE---双因素方差分析双因素方差分析 第四章第四章 方差分析方差分析例例3 P183 例题例题2因素因素A(能量)(能量)因素因素 B(蛋白质)(蛋白质)---双因素方差分析双因素方差分析 第四章第四章 方差分析方差分析输入数据时,输入数据时,C2表示行因素表示行因素水平,水平,C3表示列因素水平。 表示列因素水平第几次重复不必列明,软件第几次重复不必列明,软件自会识别自会识别双因素方差分析双因素方差分析 第四章第四章 方差分析方差分析---双因素方差分析双因素方差分析 第四章第四章 方差分析方差分析---双因素方差分析双因素方差分析 第四章第四章 方差分析方差分析---双因素方差分析双因素方差分析 第四章第四章 方差分析方差分析结果显示如结果显示如P185均均<0.01饲料中能量的高低、蛋白质含量的不同饲料中能量的高低、蛋白质含量的不同及两者的交互作用对鱼的体重的影响极及两者的交互作用对鱼的体重的影响极有统计意义有统计意义双因素方差分析双因素方差分析 第四章第四章 方差分析方差分析各因素,各水平,各交互作用下的均值各因素,各水平,各交互作用下的均值双因素方差分析双因素方差分析 第四章第四章 方差分析方差分析1、方差分析(、方差分析(ANOVA),一般用来分析一个定量因变量),一般用来分析一个定量因变量与一个或几个定性自变量(因素)之间的关系,它可与一个或几个定性自变量(因素)之间的关系,它可以同时对多个总体的均值是否相等进行整体检验以同时对多个总体的均值是否相等进行整体检验。 2、根据研究所涉及的因素的多少,方差分析可分为单因、根据研究所涉及的因素的多少,方差分析可分为单因素方差分析和多因素方差分析(包括双因素方差分析)素方差分析和多因素方差分析(包括双因素方差分析)3、方差分析中的基本假设是,来自各个总体的数据都服、方差分析中的基本假设是,来自各个总体的数据都服从正态分布,相互独立,且有相同的方差从正态分布,相互独立,且有相同的方差90小结小结---双因素方差分析双因素方差分析 第四章第四章 方差分析方差分析4、方差分析的基本思想是,将观察值之间的总变差分解为、方差分析的基本思想是,将观察值之间的总变差分解为由所研究的因素引起的变差和由随机误差项引起的变差,由所研究的因素引起的变差和由随机误差项引起的变差,通过对这两类变差的比较做出接受或拒绝原假设的判断通过对这两类变差的比较做出接受或拒绝原假设的判断的5、方差分析的主要步骤包括:建立假设;计算、方差分析的主要步骤包括:建立假设;计算F检验值;检验值;根据实际值与临界值的比较做出决策根据实际值与临界值的比较做出决策6、在方差分析中,当拒绝、在方差分析中,当拒绝H0时表示至少有两个均值有显著时表示至少有两个均值有显著差异。 但要知道哪些均值之间有显著差异还需要借助于差异但要知道哪些均值之间有显著差异还需要借助于多重比较的方法,例如多重比较的方法,例如LSD方法小结小结---双因素方差分析双因素方差分析 第四章第四章 方差分析方差分析本章小结本章小结1.方差分析方差分析(ANOVA)的概念的概念2.方差分析的思想和原理方差分析的思想和原理3.方差分析中的基本假设方差分析中的基本假设4.单因素方差分析单因素方差分析5.双因素方差分析双因素方差分析结结 束束。
