方差分析(培训课件)
一 方差分析的意义 工业生产中产品质量优劣,农业生产中产量高低,由诸多因素造成。如农业生产中,肥料,浇灌,良种,管理等;化工生产中,原料成分,催化剂,剂量,反应温度,压力,溶液,机器设备与操作人员水平。每种因素的改变,可影响产品质量与数量,那么在诸因素中找出对质量的某种指标有显著影响的因素,还要弄清这些显著因素在什么状态下(水平)起的作用大。方差分析方差分析就是根据试验结果进行分析,鉴别各个因素对试验结果影响的有效方法。试验指标:在试验中要考察的指标称为试验指标。因素:影响试验指标的条件称为因素。可控因素:如,反应温度,原料剂量,浓度。不可控因素:如,测量误差,气象条件等。水平:因素所处状态称为因素的水平。单因素试验:试验中只有一项因素在改变称为单因素试验。否则就称多因素试验。例1 设有三台机器,用来生产规模相同的铝合金薄板,取样测量薄板至千分之一厘米,得结果如下表所示;机器1 机器2 机器3 0.236 0.257 0.258 0.238 0.258 0.264 0.248 0.255 0.259 0.245 0.254 0.267 0.243 0.261 0.262 x=0.242 x=0.256 x=0.262 这里,试验指标是薄板的厚度。机器为因素,不同的三台机器是这个因素的三个不同的水平。试验的目的是为了考察各台机器所生产的薄板的厚度有无显著差异。例2 下面列出了随机选取的,用于计算器的四种类型的电路的响应时间(以毫秒计)。表9.2 电路的响应时间 类型1 类型2 类型3 类型4 19 20 16 18 22 21 15 22 20 33 16 19 18 27 26 15 40 17这里,试验指标是电路的响应时间。电路类型为因素,这一因素有四个不同的水平。试验的目的是为了考察各种类型的电路的响应时间有无显著差异。二 单因素试验 在例 1 中,我们在因素的每一个水平下进行了独立试验,其结果是一个随机变量。表中的数据可看成来自三个不同总体的样本值。将各个总体的均值依次记作1,2,3,按题意需检验假设 H0 :1 =2=3 H1 :1,2,3 不全相等。现在若假设各总体均为正态变量,且各总体的方差相等,那么这是一个检验同方差的多个正态总体均值是否相等的问题。设因素A有s个水平A1,A2,As,在水平Aj(j=1,2,s)下,进行了nj(nj2)次独立试验,得到如下表的结果 表9.4 水平观察值 A1 A2 As x11 x12 x1s x21 x22 x2s xn1 1 xn2 2 xns s 样本总和 T.1 T.2 T.s 样本均值 .总体均值 1 2 .s 我们假定:各个水平Aj(j=1,2,s)下的样本x1j,A2j,Anj j 来自具有相同方差s2,均值分别为j(j=1,2,s)的正态总体N(j,s2),j与s2未知。且设不同水平Aj 下的样本之间相互独立。其中j与s2均为未知参数,(1)式称为单因素试验方差分析的数学模型。方差分析的任务是对于模型(1):10 检验s 个总体N(1,s2),N(s,s2)的均值 是否相等 H0 :1 =2=s,(2)H1 :1,2,s 不全相等。20 作出未知参数1,2,s,s2的估计。利用这些记号,模型(1)可改写成而假设(2)等价假设 H0 :1 =2=s=0 (2)H1 :1,2,s 不全为零。这是因为当且仅当1 =2=s 时,j =,即 j=0.三 平方和的分解是数据的总平均。ST 又称总变差。记水平Aj下的样本平均值为 ,即则有于是我们将ST分解成为:其中(10)上述SE的各项表示在水平Aj 下,样本观察值与样本均值的差异,这是由随机误差引起的,SE称误差平方和误差平方和。而SA 的各项表示在水平 Aj 下样本平均值与数据总平均的差 异,这是由水平Aj及随机误差引起的.SA称效应平方和效应平方和。三 SE,SA 的统计特性单因素试验方差分析表 方差来源 平方和 自由度 均方 F 比 因素A SA s-1 误差 SE n-s 总和 ST n-1即有单因素试验方差分析表 方差来源 平方和 自由度 均方 F 比 因素A 0.00105333 2 0.00052661 32.92 误差 0.000192 12 0.000016 总和 0.00124533 14 五、未知参数的估计 我们已经知道,不管H0是否为真例例5 求例4中的未知参数s2,j,j(j=1,2,3)的点估计及均值差的置信度为0.95的置信区间。均值差的区间估计如下。由t0.025(n-s)=t0.025(12)=2.1788得故 u1-u2,u1-u3,及u2-u3,的置信度为0.95的置信区间分别为 例6 设在例2中的四种类型电路的响应时间的总体均为正态且各总体的方差相同。又设各样本相互独立。试取水平a=0.05,检验各个类型电路的响应时间是否有显著差异。解 分别以 1,2,3,4,记类型I,II,III,IV四种电路响应时间总体的平均值。我们需检验(a=0.05)H0:1=2=3=4,H1:1,2,3,4,不全相等。现在 n=18,s=4,n1=n2=5,n4=3,ST,SA,SE的自由度依次为17,3,14,结果载于下表。因F0.05(3,14)=3.343.76,故在水平0.05下拒绝H0,认为各类型电路的响应时间有显著差异。End