
概率论与数理统计:第八章2讲.ppt
58页假设检验的相关概念假设检验的相关概念1. 显著性水平显著性水平2. 检验统计量检验统计量3. 原假设与备择假设原假设与备择假设假设检验问题通常叙述为假设检验问题通常叙述为:4. 拒绝域与临界点拒绝域与临界点 当检验统计量取某个区域当检验统计量取某个区域C中的值时中的值时, 我们我们拒绝原假设拒绝原假设H0, 则称区域则称区域C为为拒绝域拒绝域, 拒绝域的拒绝域的边界点称为边界点称为临界点临界点.如在前面实例中如在前面实例中, 5. 两类错误及记号两类错误及记号 假设检验的依据是假设检验的依据是: 小概率事件在一次试小概率事件在一次试验中很难发生验中很难发生, 但很难发生不等于不发生但很难发生不等于不发生, 因而因而假设检验所作出的结论有可能是错误的假设检验所作出的结论有可能是错误的. 这种这种错误有两类错误有两类:(1) 当原假设当原假设H0为真为真, 观察值却落入拒绝域观察值却落入拒绝域, 而作出了拒绝而作出了拒绝H0的判断的判断, 称做称做第一类错误第一类错误, 又叫又叫弃真错误弃真错误, 这类错误是这类错误是“以真为假以真为假”. 犯第一类犯第一类错误的概率是显著性水平错误的概率是显著性水平(2) 当原假设当原假设 H0 不真不真, 而观察值却落入接受域而观察值却落入接受域, 而作出了接受而作出了接受 H0 的判断的判断, 称做称做第二类错误第二类错误, 又又叫叫取伪错误取伪错误, 这类错误是这类错误是“以假为真以假为真”. 当样本容量当样本容量 n 一定时一定时, 若减少犯第一类错误若减少犯第一类错误的概率的概率, 则犯第二类错误的概率往往增大则犯第二类错误的概率往往增大.犯第二类错误的概率记为犯第二类错误的概率记为 若要使犯两类错误的概率都减小若要使犯两类错误的概率都减小, 除非增除非增加样本容量加样本容量.6. 显著性检验显著性检验7. 双边备择假设与双边假设检验双边备择假设与双边假设检验 只对只对犯第一类错误的概率加以控制犯第一类错误的概率加以控制, 而不考而不考虑犯第二类错误的概率的检验虑犯第二类错误的概率的检验, 称为称为显著性检验显著性检验.8. 右边检验与左边检验右边检验与左边检验右边检验与左边检验统称为右边检验与左边检验统称为单边检验单边检验.9. 单边检验的拒绝域单边检验的拒绝域假设检验的一般步骤假设检验的一般步骤3. 确定检验统计量以及拒绝域形式确定检验统计量以及拒绝域形式; 对于假设检验的第一步对于假设检验的第一步H0 的提出是至关重要的的提出是至关重要的,为为了保证了保证H0 提出的合理性提出的合理性,应注意遵循以下原则应注意遵循以下原则.(i) 将主观上产生怀疑或可能被拒绝的一方设为原假设将主观上产生怀疑或可能被拒绝的一方设为原假设;(ii) 将主观上要被保护的一方设为原假设将主观上要被保护的一方设为原假设;(iii) 如果在假设检验时作出某种错误的决策所付出的如果在假设检验时作出某种错误的决策所付出的代价很高代价很高,那么应该使作出这种错误决策的概率较低那么应该使作出这种错误决策的概率较低;(iv) 当样本观测值与假设检验的相应给定值非常接近当样本观测值与假设检验的相应给定值非常接近时时, 应该适当增加样本容量应该适当增加样本容量,继续观测进行检验继续观测进行检验;(v) 从某种意义的角度上讲从某种意义的角度上讲,在假设检验中在假设检验中,对于某问题对于某问题得到了拒绝得到了拒绝H0 的结论的结论,才真正具有指导意义才真正具有指导意义.一、单个总体一、单个总体 均值均值 的检验的检验一个有用的结论一个有用的结论有相同的拒绝域有相同的拒绝域.上述利用上述利用 t 统计量得出的检验法称为统计量得出的检验法称为t 检验法检验法.例例1 某切割机在正常工作时某切割机在正常工作时, 切割每段金属棒的切割每段金属棒的平均长度为平均长度为10.5cm, 今从一批产品中随机的抽取今从一批产品中随机的抽取15段进行测量段进行测量, 其结果如下其结果如下:假定切割的长度服从正态分布假定切割的长度服从正态分布,问该机切割的金问该机切割的金属棒的平均长度有无显著变化属棒的平均长度有无显著变化?解解查表得查表得t t分布表分布表二、单个总体二、单个总体 的方差的方差(1) 要求检验假设要求检验假设:根据根据第六章第六章§§2, 拒绝域为拒绝域为:(2)单边检验问题的拒绝域单边检验问题的拒绝域右边假设检验右边假设检验:拒绝域的形式为拒绝域的形式为:右边检验问题的拒绝域为右边检验问题的拒绝域为同理左边检验问题同理左边检验问题:拒绝域为拒绝域为解解认为该车床生产的产品没有达到所要求的精度认为该车床生产的产品没有达到所要求的精度. 例例2 某自动车床生产的产品尺寸服从某自动车床生产的产品尺寸服从正态分布正态分布,按规定产品尺寸的按规定产品尺寸的方差方差 不得超过不得超过0.1, 为检验该为检验该自动车床的工作精度自动车床的工作精度, 随机的取随机的取25件产品件产品, 测得样测得样本方差本方差 s2=0.1975, . 问该车床生产的产品问该车床生产的产品是否达到所要求的精度是否达到所要求的精度?三、两个总体三、两个总体 的均值差的均值差 利用利用t检验法检验具有相同方差的两正态总检验法检验具有相同方差的两正态总体均值差的假设体均值差的假设.根据根据第六章第六章§§2定理定理知知,其拒绝域的形式为其拒绝域的形式为故拒绝域为故拒绝域为 关于均值差的其它两个检验问题的拒绝域关于均值差的其它两个检验问题的拒绝域见表见表8.1, 当两个正态总体的方差均为已知当两个正态总体的方差均为已知(不一定相不一定相等等)时时,我们可用我们可用 Z 检验法来检验两正态总体均值检验法来检验两正态总体均值差的假设问题差的假设问题, 见表见表8.1 .例例3 在平炉上进行一项试验以确定改变操作方法在平炉上进行一项试验以确定改变操作方法的建议是否会增加钢的得率的建议是否会增加钢的得率, 试验是在同一只平试验是在同一只平炉上进行的炉上进行的. 每炼一炉钢时除操作方法外每炼一炉钢时除操作方法外, 其它其它条件都尽可能做到相同条件都尽可能做到相同.先采用标准方法炼一炉先采用标准方法炼一炉, 然后用建议的新方法炼一炉然后用建议的新方法炼一炉, 以后交替进行以后交替进行, 各各炼了炼了10炉炉, 其得率分别为其得率分别为(1)标准方法标准方法: 78.1, 72.4, 76.2, 74.3, 77.4, 78.4, 76.0, 75.5, 76.7, 77.3; (2)新方法新方法:79.1, 81.0, 77.3, 79.1, 80.0, 78.1, 79.1, 77.3, 80.2, 82.1; 设这两个样本相互独立设这两个样本相互独立, 且分别来自正态总且分别来自正态总体体问建议的新操作方法能否提高得率问建议的新操作方法能否提高得率?解解分别求出标准方法和新方法下的样本均值和样本分别求出标准方法和新方法下的样本均值和样本方差方差:即认为建议的新操作方法较原来的方法为优即认为建议的新操作方法较原来的方法为优.附表附表8.18.1查表查表8.1知其拒绝域为知其拒绝域为四、基于成对数据的检验四、基于成对数据的检验( ( t 检验检验 ) ) 有时为了比较两种产品有时为了比较两种产品, 或两种仪器或两种仪器, 两种两种方法等的差异方法等的差异, 我们常在相同的条件下作对比试我们常在相同的条件下作对比试验验, 得到一批成对的观察值得到一批成对的观察值. 然后分析观察数据然后分析观察数据作出推断作出推断. 这种方法常称为这种方法常称为逐对比较法逐对比较法.例例4 有两台光谱仪有两台光谱仪Ix , Iy ,用来测量材料中某种用来测量材料中某种金属的含量金属的含量, 为鉴定它们的测量结果有无显著差为鉴定它们的测量结果有无显著差异异, 制备了制备了9件试块件试块(它们的成分、金属含量、均它们的成分、金属含量、均匀性等各不相同匀性等各不相同), 现在分别用这两台机器对每现在分别用这两台机器对每一试块测量一次一试块测量一次, 得到得到9对观察值如下对观察值如下:问能否认为这两台仪器的测量结果有显著的差异问能否认为这两台仪器的测量结果有显著的差异?解解 本题中的数据是成对的本题中的数据是成对的, 即对同一试块测即对同一试块测出一对数据出一对数据, 我们看到一对与另一对之间的差我们看到一对与另一对之间的差异是由各种因素异是由各种因素, 如材料成分、金属含量、均如材料成分、金属含量、均匀性等因素引起的匀性等因素引起的. [这也表明不能将光谱仪这也表明不能将光谱仪Ix 对对9个试块的测量结果个试块的测量结果(即表中第一行即表中第一行)看成是一看成是一个样本个样本, 同样也不能将表中第二行看成一个样同样也不能将表中第二行看成一个样本本, 因此不能用表因此不能用表8.1中第中第4栏的检验法作检验栏的检验法作检验]. 而同一对中两个数据的差异则可看成是仅而同一对中两个数据的差异则可看成是仅由这两台仪器性能的差异所引起的由这两台仪器性能的差异所引起的. 这样这样, 局限局限于各对中两个数据来比较就能排除种种其他因于各对中两个数据来比较就能排除种种其他因素素, 而只考虑单独由仪器的性能所产生的影响而只考虑单独由仪器的性能所产生的影响.表中第三行表示各对数据的差表中第三行表示各对数据的差若两台机器的性能一样若两台机器的性能一样,随机误差可以认为服从正态分布随机误差可以认为服从正态分布, 其均值为零其均值为零.按表按表8.1中第二栏中关于单个正态分布均值的中第二栏中关于单个正态分布均值的 t 检检验验, 知拒绝域为知拒绝域为认为这两台仪器的测量结果无显著的差异认为这两台仪器的测量结果无显著的差异. 五、两个总体五、两个总体 的方差的方差需要检验假设需要检验假设:根据根据第六章第六章§§2定理定理知知检验问题的拒绝域为检验问题的拒绝域为上述检验法称为上述检验法称为 F 检验法检验法.例例5 两台车床加工同一零件两台车床加工同一零件, 分别取分别取6件和件和9件测件测量直径量直径, 得得: 假定零件直假定零件直径服从正态分布径服从正态分布, 能否据此断定能否据此断定解解本题为方差齐性检验本题为方差齐性检验:例例6 分别用两个不同的计算机系统检索分别用两个不同的计算机系统检索10个资料个资料, 测得平均检索时间及方差测得平均检索时间及方差(单位单位:秒秒)如下如下:解解假定假定检索时间服从正态分布检索时间服从正态分布, 问这两系统检索资问这两系统检索资料有无明显差别料有无明显差别? 根据题中条件根据题中条件, 首先应检验方差的齐性首先应检验方差的齐性.认为两系统检索资料时间无明显差别认为两系统检索资料时间无明显差别.• •正态总体均值、方差的检验法见下表正态总体均值、方差的检验法见下表 432 1765解解 补充补充1 1解解 补充补充2 2 练习练习: 为比较两台自动机床的精度,分别取为比较两台自动机床的精度,分别取容量为容量为10和和8的两个样本,测量某个指标的的两个样本,测量某个指标的尺寸尺寸(假定服从正态分布假定服从正态分布),得到下列结果:,得到下列结果:在在 =0.1时,时, 问这两台机床是否有同样的问这两台机床是否有同样的精度精度?车床甲:车床甲:1.08, 1.10, 1.12, 1.14, 1.15, 1.25, 1.36, 1.38,1.40,1.42车床乙:车床乙:1.11, 1.12, 1.18, 1.22, 1.33, 1.35, 1.36, 1.38解解: :设设两台自动机床的方差分别为两台自动机床的方差分别为在在 =0.1=0.1下检验假设下检验假设: : 其中其中 为两样本的样本方差为两样本的样本方差取统计量取统计量否定域为否定域为 W:或或由样本值可计算得由样本值可计算得F的实测值为的实测值为: :查表得查表得由于由于 0.304<1.51<3.68,, 故接受故接受H0 .否定域为否定域为 W:或或F=1.51这时可能犯第二类错误这时可能犯第二类错误. 许宝騄许宝騄 简介简介•许宝騄(1910—1970年)是20世纪中最富有创造性的统计学家之一,是中国最早在概率论与数理统计研究方向达到世界先进水平的杰出数学家。
他加强了强大数定律;研究了中心极限定理中误差大小的精确估计;发展了矩阵变换技巧;得到了高斯-马尔科夫(Gauss-Markov)模型中方差的最优估计;揭示了线性假设似然比检验的第一个优良性质等其研究成果已经成为当代概率论与数理统计理论的重要组成部分,至今“许方法”仍被认为是解决检验问题的最实用方法 •少年时代的许宝騄受益于表姐夫徐传元(毕业于美国麻省理工学院)的指导1928年,许宝騄考入燕京大学化学系,但对数学的浓厚兴趣,促使他改攻数学,并于1930年考入清华大学数学系期间,深受熊庆来(1893—1969年) 、孙光远(1900—1979年)和杨武之(1896—1973年)的教诲1933年,以优异成绩获得理学士学位1936年,通过赴英庚子赔款公费留学考试,进入伦敦大学学院(University College)的高尔顿( Francis Galdon,1822—1911)实验室和统计系学习数理统计学1938年获得哲学博士学位,两年后又获得理学博士学位 •1940年年,许宝騄回到抗日烽火中的祖国许宝騄回到抗日烽火中的祖国,受聘为北京大学教授受聘为北京大学教授,在西南联合大学任教在西南联合大学任教。
1945年年,应加州伯克利大学和哥伦比应加州伯克利大学和哥伦比亚大学的联合邀请而前往美国亚大学的联合邀请而前往美国1947年年10月月,谢绝众多朋友谢绝众多朋友的挽留的挽留,毅然回到中国毅然回到中国,此后一直在北京大学任教此后一直在北京大学任教 许宝騄是中央研究院第一届当选的许宝騄是中央研究院第一届当选的5名数学所院士之一名数学所院士之一 1955年当选为中国科学院学部委员年当选为中国科学院学部委员1979年美国年美国《《数理统数理统计学年鉴计学年鉴》》高度评价了他对概率论与数理统计学科所做出高度评价了他对概率论与数理统计学科所做出的卓越贡献的卓越贡献1981年和年和1983年年,科学出版社和德国施普林格科学出版社和德国施普林格( Sp ringer2Verlag)出版社分别出版了出版社分别出版了《《许宝騄文集许宝騄文集》》和和《《许宝騄选集许宝騄选集》》在美国斯坦福大学统计系走廊里至今悬在美国斯坦福大学统计系走廊里至今悬挂着许宝騄的画像挂着许宝騄的画像 1984年年,为了纪念许宝騄及推进我国统计学的发展为了纪念许宝騄及推进我国统计学的发展,数学家钟数学家钟开莱、郑清水、徐利治发起设立开莱、郑清水、徐利治发起设立“许宝騄统计数学奖许宝騄统计数学奖”,奖奖励励35岁以下研究数理统计与理论统计的青年工作者。
这是岁以下研究数理统计与理论统计的青年工作者这是我国最高的数学奖项之一我国最高的数学奖项之一。












