
第三章-假设检验.ppt
63页第三章 假设检验§1假设检验 所谓假设检验是指在母体上作某项假设,从母体中随机地抽取一个子样,用它检验此项假设是否成立 假设检验亦可以分成两类:(1)对母体分布中的参数作某项假设,一般是对母体的数字特征作一项假设,用母体中子样检验此项假设是否成立,称这一类为参数假设检验参数假设检验2)对母体分布作某项假设,用母体中子样检验此项假设是否成立,称这一类为分布分布假设检验假设检验例例1 某食品厂用自动装罐机装罐头食品,每罐标准重量为500克按以前生产经验标准差 为10克每隔一定时间需要检查机器工作情况现抽取10罐,称得其重量为(单位:克)495,510,505,498,503,492,502,512,497,506假定重量服从正态分布,试问这段时间机器工作是否正常?直观上看,可考察子样平均数 与500之差的大小,也就是要确定常数k,若 ,则认为机器工作正常,若 ,则认为机器工作不正常 按题意,罐头重量X是一个正态母体,其标准差 ,在此母体上假设平均数是500克,用H0表示此项假设, 假设H0 :于是X服从正态分布N(500,102)。
现在用抽得的子样判断假设H0是否成立若假设成立,则认为生产正常;反之认为不正常 在假设H0成立的前提下, 服从正态分布 ,因而服从标准正态分布N(0,1).给定小概率 (一般取5%,或1%,或10%),由附表1可得 ,使即括号内的事件是小概率事件,平均20次抽样只发生一次进行一次试验后得到子样平均数的值 若 ,则小概率事件发生,这与实际推断原理矛盾因为按实际推断原理,进行一次抽样小概率事件不可能发生,现在小概率事件竟然发生了在这种情形,应该拒绝假设H0 ,即不能认为平均罐重等于500克,若 ,则可以接受假设H0 ,即能够认为平均罐重等于500克现将例1中数学模型和检验方法一般化这个例子的目的是要检验正态母体的平均数假定母体X的分布是 ,且( 是已知数)在母体上作 假设H0 :给定 ( 是小概率),查附表1可得 进行一次抽样后获得子样平均值 。
若则拒绝假设H0 ,即不能认为母体平均数若则接受假设H0 ,即可认为母体平均数是例例2 某种产品在通常情况下废品率是5%,现从生产出的一批中随意地抽取50个,检验得知有4个废品,问能否认为这批产品的废品率为5%?(取小概率 =5%) 母体X的分布是二点分布B(1,p),即 P{X=1}=p, P{X=0}=1-p在母体上作 假设H0 :p=p0(取 p0=0.05)近似服从标准正态分布N(0,1)给定小概率 ,查附表1可得 ,使 即上式中花括号内是小概率事件进行一次抽样后得到子样废品率 的数值,如果使上面小概率事件发生,那么拒绝假设H0 ,否则接受H0 这就是说,若则拒绝假设H0 ,即不能认为这批产品的废品率是 p0 ,若则接受假设H0 ,即可以认为这批产品的废品率是p0 通常n≥50的子样可以认为是大子样在本例中,n=50,m=4, p0 =0.05故比较得 ,故接受假设H0 ,即可以认为这批产品的废品率是5%在假设检验中,小概率 通常取为5%或1%,或10%。
称为显著水平显著水平接受假设H0可说 无显著差异;拒绝假设H0可说 有显著差异; 服从正态分布 ,接受还是拒绝假设H0可根据 的值作出判断 若 落在 中,则接受H0 ;若 落在此区间外,则拒绝H0 区间 称为 的接受域接受域区域 称为 的拒绝域拒绝域或临界域临界域由于假设检验是根据一次抽样得到 的值,然后对H0是否成立作出判断,这样,判断的结果有可能发生错误 当H0 为真, H0被拒绝的错误称为第一第一类错误类错误犯第一类错误的概率恰好等于显著水平 当H0 不真, H0被接受的错误称为第二第二类错误类错误犯第二类错误的概率记为 假设检验方法的步骤如下:(1)在母体X上作假设H0 ;(2)找统计量,在H0成立的前提下导出它的概率分布;(3)给定显著水平 ,依据直观和实际推断原理作出拒绝区域;(4)依据一个子样的数值和拒绝区域,作出接受还是拒绝H0的判断。
关于参数假设检验,下面分四种类型作介绍 (1)检验母体平均数;(2)检验两个母体平均数相等;(3)检验母体方差;(4)检验两个母体方差相等检验时利用正态分布:称为u检验(法);利用 、t或F分布称为 检验检验、t检验检验或F检验(法)检验(法)§2检验母体平均数2.1 检验正态母体平均数(方差未知)检验正态母体平均数(方差未知)——t检验检验假定母体X服从正态分布 ,其中 未知在母体上 作假设H0 :可用 作检验由第二章3.3知统计量服从自由度为n-1的t分布给定显著水平 ,查附表2得 的值,使 即从一次抽样后所得子样值计算出 和 的数值,若则拒绝假设H0 ,即认为母体平均数与 有显著差异;若则接受假设H0 ,即认为母体平均数与 无显著差异例1 在上节例1中,如果母体标准差并不知道,由抽得的10罐重量,检验机器工作是否正常(给定显著水平 )解 对母体X作假设H0 : 。
现在用t检验法作检验前面已有 =502, =6.50由 ,查附表2得 又因而故机器工作正常2.2 用大子样检验母体平均数用大子样检验母体平均数——u检验检验设有母体X,它的分布是任意的,而一、二阶矩存在记 在母体上作 假设H0 : 用 做检验,由第二章3.2可得,当n很大时,统计量近似服从标准正态分布N(0,1)给定显著水平 ,存在 使即由一次抽样后所得子样值计算 和s的数值若则拒绝H0 ,即认为母体平均数与 有显著差异;若则接受H0 ,即认为母体平均数与 无显著差异但要求抽取的子样是大子样例例2 某电器元件的平均电阻一直保持在2.64 改变加工工艺后,测得100个元件的电阻,计算得平均电阻为2.62 ,标准差 s 为0.06 ,问新工艺对此元件(平均)电阻有无显著影响(给定显著水平 =0.01) 解解 改变加工工艺后电器元件的电阻构成一个母体。
在此母体上作假设H0 :用大子样作检验已知n=100, =2.62,s=0.06由 查附表1得 又所以故新工艺对元件的(平均)电阻有显著影响 在作参数假设检验后,如果拒绝了假设检验H0 ,有时还需要对参数作区间估计 现在对采用新工艺后元件的平均电阻作区间估计取置信概率为则置信下限置信上限2.3 检验两个正态母体平均数相等检验两个正态母体平均数相等——t检验检验 设两个正态母体X1与X2的分布分别为 和 假定两个母体的方差相等,记 在母体上作假设H0 :从两个母体中独立地各抽一个子样记子样容量、平均数和方差分别为 和 用 检验此项假设是否成立为此,在第二章3.5T的表达式中取 ,知 服从自由度为 的t分布,其中给定显著水平 ,由附表2可得使即由一次抽样后所得子样值计算得到 的数值。
若则拒绝H0,反之接受例3 对用二种不同热处理方法加工的金属材料做抗拉强度试验,得到的试验数据如下:甲种方法 31,34,29,26,32,35,38,34,30,29,32,31乙种方法 26,24,28,29,30,29,32,26,31,29,32,28设用二种热处理方法加工的金属材料抗拉强度各构成正态母体,且二个母体方差相等给定显著水平 ,问二种方法所得金属材料的(平均)抗拉强度有无显著差异解解 把各种热处理方法加工的金属材料抗拉强度分别看成母体本题是检验假设H0 : 的问题子样容量 通过计算可得 和因而 ,所以两种热处理方法加工的金属材料(平均)抗拉强度有显著差异例4 比较两种安眠药A与B的疗效以10个失眠患者为实验对象以X1表示使用A后延长的睡眠时间,X2表示用B后延长的睡眠时间对每个患者各服两种药分别实验一次,数据如下: (单位:小时)患者12345678910 X11.90.81.10.1-0.14.45.51.64.63.4 X20.7-1.6-0.2-1.2-0.13.43.70.802.0X= X1-X21.22.41.31.301.01.80.84.61.4给定显著水平 ,试问两种药的疗效有无显著差异。
解 对同一人使用各种药后延长的睡眠时间会有联系,如对重患者都延长得少,而对轻患者都延长得多,所以这两个子样不能认为是相互独立的简单随机子样因而,考虑数量指标 X= X1-X2 假定母体X具有正态分布 在母体上作 假设H0 :用表中X的10个子样值进行检验先算得又查表得,再算得易见,故两种药的疗效有显著差异2.4 用大子样检验两个母体平均数相等用大子样检验两个母体平均数相等——u检验检验设有两个母体X1和X2,它们的分布是任意的,而一、二阶矩存在在两个母体上作 假设H0 :现在独立地从各母体中取得一个子样子样容量、平均数和方差分别为 和 由第二章3.4知道,当n1和n2都很大时,近似服从标准正态分布N(0,1)给定 ,查附表1可得 ,使一次抽得两个大子样后,若则拒绝H0 ,即认为两个母体平均数有显著差异;若则接受H0 ,即认为两个母体平均数无显著差异例5 在二种工艺条件下纺得细纱,各抽100个试样,试验得强力数据,经计算得: 甲工艺乙工艺 试问二种工艺条件下细纱强力有无显著差异(取 )解 按题意,这是检验两个母体平均数相等的问题,计算得易见,故二种工艺条件下细 纱强力无显著差异§3 检验母体方差3.1 检验正态母体的方差检验正态母体的方差—— 检验检验设母体X具有正态分布 。
在母体上作 假设H0 :用母体中抽出的一个子样检验此假设是否成立显然可以用子样方差 作检验,由第二章3.6知服从自由度为n-1的 分布给定显著水平 ,查附表3可得 与 ,使即进行一次抽样后计算得子样方差 的数值则拒绝H0 ,即认为母体方差与 有显著差异若则接受H0 ,即认为母体方差与 无显著差异若例例1 一细纱车间纺出某种细纱支数标准差为1.2从某日纺出的一批细纱中,随机地抽16缕进行支数测量,算得子样标准差s*为2.1,问纱的均匀度有无显著变化(取 )?假定母体分布是正态的解解 该日纺出纱的支数构成一个正态母体,按题意要检验假设H0 : 是否成立计算由 查附表3得易见 ,因而这天细纱均匀度有显著变化3.2 检验两个正态母体方差相等检验两个正态母体方差相等——F检验检验设母体X1与X2分别服从正态分布 和 。
在两个母体上作假设H0 :现在独立地分别从各母体中抽一个子样,子样容量及子样方差分别为 和 显然可用 和 检验此假设在第二章3.7中知道统计量服从自由度为(n1-1,n2-1)的F分布给定显著水平 ,查附表4可得 与 ,使一次抽样后计算出 和 的数值,从而可得两者之比F的值若则拒绝H0 ,即认为两个母体方差有显著差异若则接受H0 ,即认为两个母体方差与无显著差异例例2 甲、乙二台机床加工同一种轴从这二台机床加工的轴中分别随机地抽取若干根,测得直径(单位:毫米)为:机床甲 20.5,19.8,19.7,20.4,20.1,20.0,19.0,19.9机床乙 19.7,20.8,20.5,19.8,19.4,20.6,19.2假定各台机床加工轴的直径分别构成正态母体试比较甲、乙二台机床加工的精度有无显著差异(取 )解 按题意,本题是检验两个正态母体方差是否相等的问题计算可得:因而给定查附表4得,于是易见, ,故认为两个正态母体方差无显著差异。
在检验假设H0 : 时,可以采用下面的简便方法 中的值都是大于1的,因而F检验的临界上限 而临界下限故1在区间之中不妨取子样方差大的母体为第一母体,子样方差小的母体为第二母体如此,考察F是否在区间中,只要看F的数值是否超过 值就可以了若则拒绝假设H0 ,若则接受假设H0 ,通常采用此法检验两个正态母体方差是否相等在母体上作的假设H0形式为: 假设H0亦称为原假设原假设或零假设零假设原假设H0的对立情形,称为备择假设或对立假设,记为H1例如因而原假设H0和备择假设H1是成对出现的这些假设中每一对都称为双侧假设,因为表示H1的参数区域都在表示H0的参数区域的两侧§4 单侧假设检验 在实际问题中还会遇到假设H0的形式为 等此时,假设H0仍可称为原假设原假设或零假设零假设;它的对立情形,称为备择假设或对立假设,记为H1。
由H0与相应的H1构成一对假设,称为单侧假设单侧假设如(1)某种产品要求废品率不高于5%今从一批产品中随机地取50个,检查到4个废品,问这批产品是否符合要求此例在母体上可作假设H0 : ,它的对立情形是H1 :P>0.05,为备择假设(4)某电工器材厂生产一种保险丝,规定保险丝熔化时间(单位:小时)的方差不超过400今从一批产品中抽得一个子样,问这批产品的方差是否符合要求?此例在母体上可作假设H0 : ,备择假设H1 :(2)某种金属经热处理后平均抗拉强度为42公斤/厘米2今改变热处理方法,取一个子样,问抗拉强度有无显著提高?此例在母体上可作假设H0 : 备择假设H1 :(6)假设某种产品经技术革新后平均日产量有没有显著提高,可在革新前和革新后随意地各记录若干天日产量如果把革新前日产量看成第一母体,革新后看成第二母体,此例需检验H0 : 备择假设H1 : 习惯上规定,在检验产品质量是否合格时,原假设H0取为合格的情况在技术革新或改变工艺后:检验某参数值有无显著变大(或边小),原假设H0总取不变大(或不变小)情形,即保守情形。
对单侧假设,表示H1的参数区域总在表示H0的参数区域的一侧,如(2)中 在 的右侧单侧”假设的名称由此而来 单侧假设检验方法导出的步骤类似于双侧假设检验,主要区别在第三步,由显著水平 作小概率事件时需依据H1来做例1 一台机床加工轴的平均椭圆度是0.095毫米,机床经过调整后取20根轴测量其椭圆度,计算得 毫米,标准差s*=0.025毫米问调整后机床加工轴的(平均)椭圆度有无显著降低(取 )?这里假定调整后机床加工轴的椭圆度是正态母体解 按题意,要检验 我们可用 作检验由本章2.1知,在 的前提下统计量服从自由度为n-1的t分布由附表2可查得 的值,使即 是概率为 的小概率事件直观上看,一次抽样后得到 和s*的值,如果满足 此时认为 较合理,即应该拒绝H0而接受H1 。
因此,可以得到下列检验方法:若则拒绝H0,即认为 ;若则接受H0,即认为 ;例2 改进某种金属的热处理方法,要检验抗拉强度(单位:公斤/厘米2)有无显著提高在改进前取12个试样,测量并计算得 在改进后又取12个试样,测量并计算得假定热处理前与热处理后金属抗拉强度分别为正态母体,且母体方差相等问热处理后抗拉强度有无显著提高( )?解 按题意,要检验 假设我们用两个子样作检验由本章2.3知道在 的前提下统计量服从自由度为 的t分布,其中给定显著水平 ,由附表2可得 的值,使即 是概率为 的小概率事件因此,可以得到下列检验方法:若则拒绝H0,即认为 ;若则接受H0,即认为 ;§5 分布假设检验如何检验一个母体是正态母体呢?我们可以用一个子样作检验。
一种简便的方法是用正态概率纸作检验;另一种方法是通过数值计算作检验 所谓分布假设检验分布假设检验是对母体分布作某项假设,用母体中抽取的子样检验此项假设是否成立在母体分布上作的假设可分为二类: 一类是假设母体的分布是已知分布假设母体的分布是已知分布,即作 假设H0 : F(x)=F0(x),其中F0(x)是已知的分布函数例如,检验一颗骰子的六面是否匀称,可作 假设H0 :骰子出现的点数X的分布列为 X 1 2 3 4 5 6 pi 另一类是假设母体分布的类型是已知的,即作 假设H0 : 其中分布函数F0的形式是已知的,而参数 未知例如,检验一个母体是否正态母体,可作假设H0 :或其中 未知分布假设检验的方法有几种,下面仅介绍其中的一种—— 检验法检验法假定母体分布是只有有限多项的离散分布,假设它的分布是已知的用式子表示,设A1,A2,…,Al是两两不相容事件完备组,即 , 作假设H0 :P(Ai)=pi, i=1,2,…,l其中p1,p2,…,pl是已知数。
现在做n次独立重复试验(即抽一子样),各事件Ai出现的实际频数分布为 事 件 A1, A2,…, Al, 实际频数 m1, m2,…, ml,而 用这个子样检验上面的假设再看理论频数分布理论频数分布 事 件 A1, A2,…, Al, 理论频数 np1, np2,…, npl,然后考察子样的实际频数mi对理论频数npi偏差的加权平方和这里 值的大小刻划子样实际频数分布对理论频数分布的拟合程度5.1)皮尔逊(皮尔逊(K.Pearson))定理定理设P(Ai)=pi, i=1,2,…,l,其中p1,p2,…,pl是已知数若 由(5.1)式给出,则 0 ,x<0即当 时 按分布收敛到自由度为L-1的 分布由定理可得,当n很大时, 近似地服从自由度为L-1的 分布利用统计量 可以检验假设H0给定显著水平 ,查附表3可查得的数值,使需要注意,直观上当 的值较小时应接受假设H0,故在图中概率为 的事件取在右侧,而不是取在两侧。
在抽得一个大子样 后,按(5.1)式计算得 的数值若则拒绝假设H0 ,即认为母体的分布与假设H0中分布有显著差异;若则接受假设H0 ,即认为母体的分布与假设H0中分布无显著差异;例1 检验一颗骰子的六个面是否匀称(取 )现在掷120次,结果如下: 点数 1, 2, 3, 4, 5,6 频数 21,28,19,24,16,12解 用上法检验,计算查附表3得 ,易见 ,所以接受H0,即可认为骰子六个面是均匀的下面介绍检验母体分布的形式为已知的假设作 假设H0 :其中F0已知,而 未知从母体中抽取一个大子样,得 的最大似然估计量^^ ^然后代入F0表达式,那么 ^^ ^ 变成已知函数取 ^^ ^把子样分成 L 个组,分点为a0,a1,a2,…,al,满足a0 把理论和实际频数分布列成下表:分组 , ,…… ,理论概率 p1 , p2 ,…… , pl理论频数 np1 , np2 ,…… , npl实际频数 m1 , m2 ,…… , ml实际频数对理论频数偏差的加权平方和为定理定理 设 成立若 由 给出,则当时, 渐近于自由度为l-k-1的 分布显然皮尔逊定理是它在k=0时的特殊情形抽取一个大子样后,按式算得 的数值若则拒绝H0 ,即认为母体的分布函数与F0有显著差异;若则接受假设H0 ,即认为母体的分布函数与 无显著差异;这种检验方法称为 检验法把子样中数据进行分组时,首先要用大子样,通常取 ,其次,要求各组的理论频数npi不少于5,组数可少于7组例2 考察某交换站一天中接错次数X.统计267天的记录,各天接错次数的频数分布列成下表:i: 一天接错次数mi:天数 npi94035.040-2 12.05 103530.633 54.76 112024.34 4 1110.39 121817.72 51418.1613 1211.92 62226.45 14 77.44 74333.0315 64.33 83136.09≥16 24.65i: 一天接错次数mi:天数 npi试检验X的分布与泊松分布有无显著差异(取 )解 先求泊松分布中参数λ的最大似然估计值^然后理论频数由于前面二组理论频数都小于5,合并得mi=6,npi=6.81;又最后二组理论频数也小于5,合并得mi=8,npi=8.98,经合并后,组数l=13. 计算得易见 ,故可认为X分布是泊松分布。












