
假设检验 统计学课件.ppt
85页8 - 1统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院第第 8 章章 假设检验假设检验作者:中国人民大学统计学院作者:中国人民大学统计学院贾俊平贾俊平统计学8 - 2统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院第第 8 章章 假设检验假设检验8.1 假设检验的基本问题假设检验的基本问题 8.2 一个总体参数的检验一个总体参数的检验8.3 两个总体参数的检验两个总体参数的检验8.4 检验问题的进一步说明检验问题的进一步说明8 - 3统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院学习目标学习目标1.了解假设检验的基本思想了解假设检验的基本思想 2.掌握假设检验的步骤掌握假设检验的步骤3.对实际问题作假设检验对实际问题作假设检验4.利用置信区间进行假设检验利用置信区间进行假设检验5.利用利用P - 值进行假设检验值进行假设检验8 - 4统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院8.1 假设检验的基本问题假设检验的基本问题8.1.1 假设问题的提出假设问题的提出8.1.2 假设的表达式假设的表达式8.1.3 两类错误两类错误8.1.4 假设检验的流程假设检验的流程8.1.5 利用利用P值进行决策值进行决策8.1.6 单侧检验单侧检验8 - 5统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院假设问题的提出假设问题的提出8 - 6统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院什么是假设什么是假设?(hypothesis) 对总体参数的的数值所作的一种陈述n n总体参数包括总体参数包括总体均值总体均值总体均值总体均值、、比例比例比例比例、、方差方差方差方差等等n n分析分析之前之前之前之前必需陈述必需陈述8 - 7统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院什么是假设检验什么是假设检验? (hypothesis testing)1.事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立2.有参数假设检验和非参数假设检验3.采用逻辑上的反证法,依据统计上的小概率原理8 - 8统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院提出原假设和备择假设提出原假设和备择假设 什么是原假设?什么是原假设?(null hypothesis)1.待检验的假设,又称“0假设”2.研究者想收集证据予以反对的假设3. 总是有等号 , 或 4. 表示为 H0n nH H0 0:: 某一数值某一数值 n n指定为指定为 = = 号,即号,即 或或 n n例如例如, H, H0 0:: 31903190((克)克)8 - 9统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院 什么是备择假设?什么是备择假设?(alternative hypothesis)1.与原假设对立的假设,也称“研究假设”2.研究者想收集证据予以支持的假设总是有不等号: , 或 3.表示为 H1n nH H1 1:: < <某一数值,或某一数值,或 某一数值某一数值n n例如例如, H, H1 1:: < 3910(< 3910(克克) ),或,或 3910(3910(克克) )提出原假设和备择假设提出原假设和备择假设8 - 10统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院假设检验中的两类错误假设检验中的两类错误(决策风险决策风险)8 - 11统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院假设检验中的两类错误假设检验中的两类错误1.1.第一类错误(弃真错误)第一类错误(弃真错误)第一类错误(弃真错误)第一类错误(弃真错误)n n原假设为真时拒绝原假设原假设为真时拒绝原假设n n会产生一系列后果会产生一系列后果n n第一类错误的概率为第一类错误的概率为 l l被称为显著性水平被称为显著性水平2.2.第二类错误(取伪错误)第二类错误(取伪错误)第二类错误(取伪错误)第二类错误(取伪错误)n n原假设为假时接受原假设原假设为假时接受原假设n n第二类错误的概率为第二类错误的概率为(Beta)(Beta)8 - 12统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院假设检验的流程假设检验的流程§提出假设提出假设§确定适当的检验统计量确定适当的检验统计量§规定显著性水平规定显著性水平 §计算检验统计量的值计算检验统计量的值§作出统计决策作出统计决策8 - 13统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院 什么是检验统计量?什么是检验统计量?1. 用于假设检验决策的统计量2. 选择统计量的方法与参数估计相同,需考虑n n是大样本还是小样本是大样本还是小样本n n总体方差已知还是未知总体方差已知还是未知3.检验统计量的基本形式为确定适当的检验统计量确定适当的检验统计量8 - 14统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院规定显著性水平规定显著性水平 (significant level) 什么是显著性水平?什么是显著性水平?1. 是一个概率值2. 原假设为真时,拒绝原假设的概率n n被称为抽样分布的拒绝被称为抽样分布的拒绝域域3. 表示为 (alpha)n n常用的常用的 值有值有0.01, 0.05, 0.100.01, 0.05, 0.104. 由研究者事先确定8 - 15统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院作出统计决策作出统计决策1.计算检验的统计量2.根据给定的显著性水平,查表得出相应的临界值z或z,t或t3.将检验统计量的值与 水平的临界值进行比较4.得出拒绝或不拒绝原假设的结论8 - 16统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院利用利用P值进行决策值进行决策8 - 17统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院什么是什么是P 值值?(P-value)1.是一个概率值2.如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率n n左侧检验时,左侧检验时,P P- -值为曲线上方值为曲线上方小于等于小于等于小于等于小于等于检检验统计量部分的面积验统计量部分的面积n n右侧检验时,右侧检验时,P P- -值为曲线上方值为曲线上方大于等于大于等于大于等于大于等于检检验统计量部分的面积验统计量部分的面积3.被称为观察到的(或实测的)显著性水平n nH H0 0 能被拒绝的最小值能被拒绝的最小值8 - 18统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院双侧检验的双侧检验的P 值值 / / 2 2 / / 2 2 Z Z拒绝拒绝拒绝拒绝拒绝拒绝拒绝拒绝H HH0 00值值值临界值临界值临界值计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量临界值临界值临界值1/2 1/2 1/2 P P P 值值值1/2 1/2 1/2 P P P 值值值8 - 19统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院左侧检验的左侧检验的P 值值H HH0 00值值值临界值临界值临界值 样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布1 - 1 - 1 - 置信水平置信水平置信水平置信水平计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量P P P 值值值8 - 20统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院右侧检验的右侧检验的P 值值H HH0 00值值值临界值临界值临界值 拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布1 - 1 - 1 - 置信水平置信水平置信水平置信水平置信水平置信水平计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量P P P 值值值8 - 21统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院利用利用 P 值进行检验值进行检验(决策准则决策准则)1.单侧检验n n若若p-p-值值 , ,不拒绝不拒绝 H H0 0n n若若p-p-值值 < < , , 拒绝拒绝 H H0 02.双侧检验n n若若p-p-值值 , , 不拒绝不拒绝 H H0 0n n若若p-p-值值 < < , , 拒绝拒绝 H H0 08 - 22统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院双侧检验和单侧检验双侧检验和单侧检验8 - 23统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院双侧检验与单侧检验双侧检验与单侧检验 (假设的形式假设的形式)假设假设研究的问题研究的问题双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验H0= = 0 0 0 0 0 0H1≠ ≠ 0 0< 0 0> 0 08 - 24统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院双侧检验双侧检验(原假设与备择假设的确定原假设与备择假设的确定)1.属于决策中的假设检验决策中的假设检验2.不论是拒绝H0还是不拒绝H0,都必需采取相应的行动措施3.例如,某种零件的尺寸,要求其平均长度为10cm,大于或小于10cm均属于不合格n n我我们们想想要要证证明明( (检检验验) )大大于于或或小小于于这这两两种种可可能能性性中的任何一种是否成立中的任何一种是否成立4.建立的原假设与备择假设应为 H0: 10 H1: 108 - 25统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院双侧检验双侧检验(显著性水平与拒绝域显著性水平与拒绝域 )抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布H HH000值值值临界值临界值临界值临界值临界值临界值 /2 /2 /2 /2/2 样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域1 - 1 - 1 - 置信水平置信水平置信水平置信水平置信水平置信水平8 - 26统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院单侧检验单侧检验(显著性水平与拒绝域显著性水平与拒绝域)H H0 0值值临界值临界值 样本统计量样本统计量拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布1 - 1 - 置信水平置信水平置信水平置信水平8 - 27统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院8.2 一个总体参数的检验一个总体参数的检验8.2.1 检验统计量的确定检验统计量的确定8.2.2 总体均值的检验总体均值的检验8.2.3 总体比例的检验总体比例的检验8.2.4 总体方差的检验总体方差的检验8 - 28统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院一个总体参数的检验一个总体参数的检验Z 检验检验(单尾和双尾)(单尾和双尾) t 检验检验(单尾和双尾)(单尾和双尾)Z 检验检验(单尾和双尾)(单尾和双尾) 2 2检验检验(单尾和双尾)(单尾和双尾)均值均值一个总体一个总体比例比例方差方差8 - 29统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院总体总体均值检验均值检验8 - 30统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院总体均值的检验总体均值的检验(检验统计量检验统计量)总体总体 是否已知是否已知??用用样本标样本标准差准差S代替代替 t 检验检验小小小样本量样本量n否否否是是是z 检验检验 z 检验检验大大大8 - 31统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院总体均值的检验总体均值的检验 ( 2 已知或已知或 2未知大样本未知大样本)1. 假定条件n n总体服从正态分布总体服从正态分布n n若不服从正态分布若不服从正态分布, , 可用正态分布来近似可用正态分布来近似( (n n 30)30)2.使用Z-统计量n n 2 2 已知:已知:n n 2 2 未知:未知:8 - 32统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院 2 已知均值的检验已知均值的检验(例题分析例题分析)【【【【例例例例】】】】某某机机床床厂厂加加工工一一种种零零件件,,根根据据经经验验知知道道,,该该厂厂加加工工零零件件的的椭椭圆圆度度近近似似服服从从正正态态分分布布,,其其总总体体均均值值为为 0 0=0.081mm=0.081mm,,总总体体标标准准差差为为 = = 0.0250.025 。
今今换换一一种种新新机机床床进进行行加加工工,,抽抽取取n n=200=200个个零零件件进进行行检检验验,,得得到到的的椭椭圆圆度度为为0.0760.076mmmm试试问问新新机机床床加加工工零零件件的的椭椭圆圆度度的的均均值值与与以以前前有有无无显著差异?(显著差异?( ==0.050.05))双侧检验双侧检验8 - 33统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院 2 已知均值的检验已知均值的检验 (例题分析例题分析)H H0 0: : = 0.081 = 0.081H H1 1: : 0.081 0.081 = = 0.050.05n n = = 200200临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量: :Z Z0 01.961.96-1.96-1.96.025.025拒绝拒绝 H H0 0拒绝拒绝 H H0 0.025.025决策决策决策决策: :结论结论结论结论: : 在在 = 0.05= 0.05的水平上拒绝的水平上拒绝H H0 0有有证证据据表表明明新新机机床床加加工工的的零零件件的椭圆度与以前有显著差异的椭圆度与以前有显著差异8 - 34统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院 2 已知均值的检验已知均值的检验 (P 值的计算与应用值的计算与应用)第第1 1步步::进进入入ExcelExcel表表格格界界面面,,选选择择“ “插插入入” ”下下拉拉菜菜单单第第2 2步:步:选择选择“ “函数函数” ”点击点击第第3 3步步::在在函函数数分分类类中中点点击击“ “统统计计” ”,,在在函函数数名名的的菜菜 单下选择字符单下选择字符“ “NORMSDISTNORMSDIST” ”然后确定然后确定第第4 4步:步:将将Z Z的绝对值的绝对值2.832.83录入,得到的函数值为录入,得到的函数值为 0.9976725370.997672537 P P值值=2(1=2(1--0.997672537)=0.0046540.997672537)=0.004654 P P值远远小于值远远小于,故拒绝,故拒绝H H0 08 - 35统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院 2 已知均值的检验已知均值的检验 (小样本例题分析小样本例题分析)【【例例】】根据过去大量资料,某厂生产的灯泡的使用寿命服 从 正 态 分 布 N~(1020,1002)。
现从最近生产的一批产品中随机抽取16只,测得样本平均寿命为1080小时试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?(=0.05)单侧单侧检验检验8 - 36统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院 2 已知均值的检验已知均值的检验 (小样本例题分析小样本例题分析)H H0 0: : 1020 1020H H1 1: : > 1020 > 1020 = = 0.050.05n n = = 1616临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量: : 在在 = 0.05= 0.05的水平上拒绝的水平上拒绝H H0 0有证据表明这批灯泡的使用有证据表明这批灯泡的使用寿命有显著提高寿命有显著提高决策决策决策决策: :结论结论结论结论: :Z Z0 0拒绝域拒绝域0.050.051.6451.6458 - 37统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院 2 未知大样本均值的检验未知大样本均值的检验 (例题分析例题分析)【【【【例例例例】】】】某某电电子子元元件件批批量量生生产产的的质质量量标标准准为为平平均均使使用用寿寿命命12001200小小时时。
某某厂厂宣宣称称他他们们采采用用一一种种新新工工艺艺生生产产的的元元件件质质量量大大大大超超过过规规定定标标准准为为了了进进行行验验证证,,随随机机抽抽取取了了100100件件作作为为样样本本,,测测得得平平均均使使用用寿寿命命12451245小小时时,,标标准准差差300300小小时时能能否否说说该该厂厂生生产产的的电电子子元元件件质质量量显显著著地地高高于规定标准?于规定标准? ( ( ==0.050.05) )单侧单侧检验检验8 - 38统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院 2 未知大样本均值的检验未知大样本均值的检验 (例题分析例题分析)H H0 0: : 12001200H H1 1: : >1200 >1200 = = 0.050.05n n = = 100100临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量: : 在在 = 0.05= 0.05的水平上不拒绝的水平上不拒绝H H0 0不能认为该厂生产的元件寿命不能认为该厂生产的元件寿命显著地高于显著地高于12001200小时小时决策决策决策决策: :结论结论结论结论: :Z Z0 0拒绝域拒绝域0.050.051.6451.6458 - 39统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院总体均值的检验总体均值的检验 ( 2未知小样本未知小样本)1. 假定条件n n总体为正态分布总体为正态分布n n 2 2未知,且小样本未知,且小样本2. 使用t 统计量8 - 40统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院 2 未知小样本均值的检验未知小样本均值的检验 (例题分析例题分析)【【例例】】某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性水平检验机器性能良好的假设。
双侧检验双侧检验8 - 41统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院 2 未知小样本均值的检验未知小样本均值的检验 (例题分析例题分析)H H0 0: : = 5 = 5H H1 1: : 5 5 = 0.05= 0.05dfdf = 10= 10 - 1 = 9 - 1 = 9临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量: : 在在 = 0.05= 0.05的水平上拒绝的水平上拒绝H H0 0说明该机器的性能不好说明该机器的性能不好 决策:决策:决策:决策:结论:结论:结论:结论:t t0 02.2622.262-2.262-2.262.025.025拒绝拒绝 H H0 0拒绝拒绝 H H0 0.025.0258 - 42统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院 2 未知小样本均值的检验未知小样本均值的检验 (P 值的计算与应用值的计算与应用)第第1 1步步::进进入入ExcelExcel表表格格界界面面,,选选择择“ “插插入入” ”下下拉拉菜菜单单第第2 2步步::选选择择“ “函函数数” ”点点击击,,并并在在函函数数分分类类中中点点击击“ “统统 计计” ” ,然后,在函数名的菜单中选择字符,然后,在函数名的菜单中选择字符 “ “TDISTTDIST” ”,,确定确定第第3 3步:步:在弹出的在弹出的X X栏中录入计算出的栏中录入计算出的t t值值3.16 3.16 在自由度在自由度( (Deg-freedomDeg-freedom) )栏中录入栏中录入9 9 在在TailsTails栏中录入栏中录入2 2,表明是双侧检验,表明是双侧检验( (单测单测 检验则在该栏内录入检验则在该栏内录入1 1) ) P P值的结果为值的结果为0.01155<0.0250.01155<0.025,,拒绝拒绝H H0 08 - 43统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院 2 未知小样本均值的检验未知小样本均值的检验 (例题分析例题分析) 【【【【例例例例】】】】一一个个汽汽车车轮轮胎胎制制造造商商声声称称,,某某一一等等级级的的轮轮胎胎的的平平均均寿寿命命在在一一定定的的汽汽车车重重量量和和正正常常行行驶驶条条件件下下大大于于4000040000公公里里,,对对一一个个由由2020个个轮轮胎胎组组成成的的随随机机样样本本作作了了试试验验,,测测得得平平均均值值为为4100041000公公里里,,标标准准差差为为50005000公公里里。
已已知知轮轮胎胎寿寿命命的的公公里里数数服服从从正正态态分分布布,,我我们们能能否否根根据据这这些些数数据据作作出出结结论论,,该该制制造造商商的的产产品品同同他他所所说说的的标标准准相相符符??( ( = 0.05= 0.05) )单侧检验!单侧检验!8 - 44统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院均值的单尾均值的单尾 t 检验检验 (计算结果计算结果) H H0 0: : 40000 40000H H1 1: : < 40000 < 40000 = 0.= 0.0505dfdf = = 20 - 1 = 1920 - 1 = 19临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量: : 在在 = 0.05= 0.05的水平上不拒绝的水平上不拒绝H H0 0不能认为制造商的产品同他所不能认为制造商的产品同他所说的标准不相符说的标准不相符决策决策决策决策: : 结论结论结论结论: : -1.7291-1.7291t t0 0拒绝域拒绝域.05.058 - 45统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院总体比例的检验总体比例的检验(Z 检验检验)8 - 46统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院一个总体比例检验一个总体比例检验1.假定条件n n有两类结果有两类结果n n总体服从二项分布总体服从二项分布n n可用正态分布来近似可用正态分布来近似2.比例检验的 Z 统计量 0 0为假设的总体比例为假设的总体比例为假设的总体比例为假设的总体比例8 - 47统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院一个总体比例的检验一个总体比例的检验 (例题分析例题分析)【【【【例例例例】】】】一一项项统统计计结结果果声声称称,,某某市市老老年年人人口口((年年龄龄在在6565岁岁以以上上))的的比比重重为为14.714.7%%,,该该市市老老年年人人口口研研究究会会为为了了检检验验该该项项统统计计是是否否可可靠靠,,随随机机抽抽选选了了400400名名居居民民,,发发现现其其中中有有5757人人年年龄龄在在6565岁岁以以上上。
调调查查结结果果是是否否支支持持该该市市老老年年人人口口比比重重为为14.7%14.7%的看法?的看法?( ( = = 0.050.05) )双侧检验双侧检验8 - 48统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院一个总体比例的检验一个总体比例的检验 (例题分析例题分析)H H0 0: : = 14.7% = 14.7%H H1 1: : 14.7% 14.7% = 0.05= 0.05n n = = 400400临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量: :在在 = 0.05= 0.05的水平上不拒绝的水平上不拒绝H H0 0该市老年人口比重为该市老年人口比重为14.7%14.7%决策决策决策决策: :结论结论结论结论: :Z Z0 01.961.96-1.96-1.96.025.025拒绝拒绝 H H0 0拒绝拒绝 H H0 0.025.0258 - 49统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院总体方差的检验总体方差的检验( 2 检验检验)8 - 50统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院方差的卡方差的卡方方 ( 2) 检验检验1.检验一个总体的方差或标准差2.假设总体近似服从正态分布3.检验统计量样本方差样本方差样本方差样本方差假设的总体方差假设的总体方差假设的总体方差假设的总体方差8 - 51统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院方差的卡方差的卡方方 ( 2) 检验检验(例题分析例题分析)【【【【例例例例】】】】某某厂厂商商生生产产出出一一种种新新型型的的饮饮料料装装瓶瓶机机器器,,按按设设计计要要求求,,该该机机器器装装一一瓶瓶一一升升( (1000cm1000cm3 3) )的的饮饮料料误误差差上上下下不不超超过过1cm1cm3 3。
如如果果达达到到设设计计要要求求,,表表明明机机器器的的稳稳定定性性非非常常好好现现从从该该机机器器装装完完的的产产品品中中随随机机抽抽取取2525瓶瓶,,分分别别 进进 行行 测测 定定 ( (用用 样样 本本 减减1000cm1000cm3 3) ),,得得到到如如下下结结果果检检验验该该机机器器的的性性能能是是否否达达到到设设计计要求要求 ( ( =0.05=0.05) )0.3-0.4 -0.71.4-0.6-0.3 -1.50.6-0.91.3-1.30.71-0.50-0.60.7-1.5 -0.2 -1.9-0.51-0.2 -0.61.1绿色绿色绿色绿色健康饮品健康饮品健康饮品健康饮品绿色绿色绿色绿色健康饮品健康饮品健康饮品健康饮品双侧检验双侧检验8 - 52统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院方差的卡方差的卡方方 ( 2) 检验检验(例题分析例题分析)H H0 0: : 2 2 = 1 = 1H H1 1: : 2 2 1 1 = 0.= 0.0505dfdf = = 25 - 1 = 2425 - 1 = 24临界值临界值临界值临界值(s):(s):统计量统计量统计量统计量: : 在在 = 0.05= 0.05的水平上不拒绝的水平上不拒绝H H0 0不能认为该机器的性能未达到不能认为该机器的性能未达到设计要求设计要求 2 220 0 039.3639.3639.3612.4012.4012.40 /2 =.05/2 =.05/2 =.05决策决策决策决策: :结论结论结论结论: :8 - 53统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院8.3 两个总体参数的检验两个总体参数的检验8.3.1 检验统计量的确定检验统计量的确定8.3.2 两个总体均值之差的检验两个总体均值之差的检验8.3.3 两个总体比例之差的检验两个总体比例之差的检验8.3.4 两个总体方差比的检验两个总体方差比的检验8.3.5 检验中的匹配样本检验中的匹配样本8 - 54统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院两个正态总体参数的检验两个正态总体参数的检验两个总体的检验两个总体的检验Z 检验检验(大样本大样本)t 检验检验(小样本小样本)t 检验检验(小样本小样本)Z 检验检验F 检验检验独立样本独立样本独立样本配对样本配对样本配对样本均值均值比例比例方差方差8 - 55统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院独立样本总体均值之差的检验独立样本总体均值之差的检验8 - 56统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院两个总体均值之差的两个总体均值之差的检验检验 ( 12、、 22 已知已知)1.1.假定条件假定条件n n两个样本是独立的随机样本两个样本是独立的随机样本n n两个两个总体都是正态分布总体都是正态分布n n若不是正态分布若不是正态分布, , 可以用正态分布来近似可以用正态分布来近似( (n n1 1 3030和和 n n2 2 30)30)2.检验统计量为检验统计量为8 - 57统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院两个总体均值之差的检验两个总体均值之差的检验 (假设的形式假设的形式)假设假设研究的问题研究的问题没有差异没有差异有差异有差异均值均值1 1 均值均值2 2均值均值1 1 < 均值均值2 2均值均值1 1 均值均值2 2均值均值1 1 > 均值均值2 2H0 1 1 – – 2 2 = 0= 0 1 1 – – 2 2 0 0 1 1 – – 2 2 0 0H1 1 1 – – 2 2 0 0 1 1 – – 2 2 < 0< 0 1 1 – – 2 2 > 0> 08 - 58统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院两个总体均值之差的检验两个总体均值之差的检验 (例题分析例题分析) 双侧检验!双侧检验!【【【【例例例例】】】】有有两两种种方方法法可可用用于于制制造造某某种种以以抗抗拉拉强强度度为为重重要要特特征征的的产产品品。
根根据据以以往往的的资资料料得得知知,,第第一一种种方方法法生生产产出出的的产产品品其其抗抗拉拉强强度度的的标标准准差差为为8 8公公斤斤,,第第二二种种方方法法的的标标准准差差为为1010公公斤斤从从两两种种方方法法生生产产的的产产品品中中各各抽抽取取一一个个随随机机样样本本,,样样本本量量分分别别为为n n1 1=32=32,,n n2 2=40=40,,测测得得 x x1 1= = 5050公公斤斤,, x x2 2= = 4444公公斤斤问问这这两两种种方方法法生生产产的的产产品品平平均均抗抗拉拉强强度度是是否有显著差别?否有显著差别? ( ( = 0.05 = 0.05) )8 - 59统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院两个总体均值之差的检验两个总体均值之差的检验 (例题分析例题分析)H H0 0: : 1 1 1 1- - 2 2 2 2 = 0 = 0H H1 1: : 1 1 1 1- - 2 2 2 2 0 0 = = 0.050.05n n1 1 = = 32 32,,,,n n2 2 = = 4040临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量: :决策决策决策决策: :结论结论结论结论: : 在在 = 0.05= 0.05的水平上拒绝的水平上拒绝H H0 0有证据表明两种方法生产的产有证据表明两种方法生产的产品其抗拉强度有显著差异品其抗拉强度有显著差异Z Z0 01.961.96-1.96-1.96.025.025拒绝拒绝 H H0 0拒绝拒绝 H H0 0.025.0258 - 60统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院两个总体均值之差的两个总体均值之差的检验检验 ( 12、、 22 未知且不相等未知且不相等,小样本小样本)1.检验具有不等方差的两个总体的均值检验具有不等方差的两个总体的均值2.假定假定条件条件n n两个样本是独立的随机样本两个样本是独立的随机样本n n两个两个总体都是正态分布总体都是正态分布n n两个总体方差未知且不相等两个总体方差未知且不相等 1 1= = 3.检验检验统计量统计量其中:其中:其中:8 - 61统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院两个总体均值之差的两个总体均值之差的检验检验 ( 12、、 22 未知但相等未知但相等,小样本小样本)1.检验具有等方差的两个总体的均值检验具有等方差的两个总体的均值2.假定假定条件条件n n两个样本是独立的随机样本两个样本是独立的随机样本n n两个两个总体都是正态分布总体都是正态分布n n两个总体方差未知但相等两个总体方差未知但相等 1 1 3.检验检验统计量统计量8 - 62统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院两个总体均值之差的检验两个总体均值之差的检验 (例题分析例题分析)单侧检验单侧检验 【【例例】】 “ “多多吃吃谷谷物物,,将将有有助助于于减减肥肥。
”为为了了验验证证这这个个假假设设,,随随机机抽抽取取了了3535人人,,询询问问他他们们早早餐餐和和午午餐餐的的通通常常食食谱谱,,根根据据他他们们的的食食谱谱,,将将其其分分为为二二类类,,一一类类为为经经常常的的谷谷类类食食用用者者( (总总体体1 1) ),,一一类类为为非非经经常常谷谷类类食食用用者者( (总总体体2 2) )然然后后测测度度每每人人午午餐餐的的大大卡卡摄摄取取量量经经过过一一段段时时间间的的实实验验,,得得到到如如下下结果:检验该假设结果:检验该假设 ( ( = 0.05 = 0.05) )8 - 63统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院两个总体均值之差的检验两个总体均值之差的检验 (例题分析例题分析—用统计量进行检验用统计量进行检验)H H0 0: : 1 1 1 1- - 2 2 2 2 0 0H H1 1: : 1 1 1 1- - 2 2 2 2 < 0 < 0 = = 0.050.05n n1 1 = = 15 15,,,,n n2 2 = = 2020临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量: :决策决策决策决策: :结论结论结论结论: : 在在 = 0.05= 0.05的水平上拒绝的水平上拒绝H H0 0没有证据表明没有证据表明多吃谷物将有助多吃谷物将有助于减肥于减肥-1.694-1.694t t0 0拒绝域拒绝域.05.058 - 64统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院两个总体均值之差的检验两个总体均值之差的检验 (例题分析例题分析—用用Excel进行检验进行检验)第第1 1步步::选选择择“ “工工具具” ”下下拉拉菜菜单单,,并并选选择择“ “数数据据分分析析” ”选项选项第第2 2步:步:选择选择“ “t t检验,双样本异方差假设检验,双样本异方差假设检验,双样本异方差假设检验,双样本异方差假设” ”第第3 3步:步:当出现对话框后当出现对话框后 在在“ “变量变量1 1的区域的区域” ”方框内键入方框内键入数据区域数据区域 在在“ “变量变量2 2的区域的区域” ”方框内键入方框内键入数据区域数据区域 在在“ “假设平均差假设平均差” ”的方框内键入的方框内键入0 0 在在“ “α α(A)(A)” ”框内键入框内键入0.050.05 在在“ “输出选项输出选项” ”中选择输出区域中选择输出区域 选择选择“ “确定确定” ”8 - 65统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院两个匹配两个匹配(或配对或配对)样本的均值检验样本的均值检验8 - 66统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院两个总体均值之差的检验两个总体均值之差的检验(匹配匹配样本的样本的 t 检验检验)1. 检验两个总体的均值n n配对或匹配配对或匹配n n重复测量重复测量 ( (前前/ /后后) )3. 假定条件n n两个总体都服从正态分布两个总体都服从正态分布n n如果不服从正态分布,可用正态分布来近如果不服从正态分布,可用正态分布来近似似 ( (n n1 1 30 , 30 , n n2 2 30 ) 30 )8 - 67统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院匹配样本的匹配样本的 t 检验检验 (假设的形式假设的形式)假设假设研究的问题研究的问题没有差异没有差异有差异有差异总体总体1 1 总体总体2 2总体总体1 1 < 总体总体2 2总体总体1 1 总体总体2 2总体总体1 1 > 总体总体2 2H0 D D = = 0 0 D D 0 0 D D 0 0H1 D D 0 0 D D< 0< 0 D D > 0> 0注:注:D Di i = = X X1 1i i - - X X2 2i i ,,对第对第 i i 对观察值对观察值8 - 68统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院匹配样本的匹配样本的 t 检验检验 (数据数据形式形式) 观察序号观察序号样本样本1 1样本样本2 2差值差值1x 11x 21D1 = x 11 - x 212x 12x 22D1 = x 12 - x 22M MM MM MM Mix 1ix 2iD1 = x 1i - x 2iM MM MM MM Mnx 1nx 2nD1 = x 1n- x 2n8 - 69统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院匹配样本的匹配样本的 t 检验检验(检验统计量检验统计量)样本差值均值样本差值均值样本差值均值样本差值均值样本差值标准差样本差值标准差样本差值标准差样本差值标准差自由度自由度dfdf ==n nD D - 1- 1统计量统计量统计量统计量D D0 0::假设的差值假设的差值8 - 70统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院【【【【例例例例】】】】一一个个以以减减肥肥为为主主要要目目标标的的健健美美俱俱乐乐部部声声称称,,参参加加其其训训练练班班至至少少可可以以使使减减肥肥者者平平均均体体重重减减重重8.58.5kgkg以以上上。
为为了了验验证证该该宣宣称称是是否否可可信信,,调调查查人人员员随随机机抽抽取了取了1010名参加者,得到他们的体重记录如下表:名参加者,得到他们的体重记录如下表:匹配样本的匹配样本的 t 检验检验 (例题分析例题分析)在在 = 0.05= 0.05的显著性水平下,调查结果是否支持该的显著性水平下,调查结果是否支持该俱乐部的声称?俱乐部的声称?训练前训练前94.5101110103.59788.596.5101104116.5训练后训练后8589.5101.5968680.58793.593102单侧检验单侧检验8 - 71统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院样本差值计算表样本差值计算表样本差值计算表样本差值计算表训练前训练前训练后训练后差值差值Di94.5101110103.59788.596.5101104116.58589.5101.5968680.58793.5931029.511.58.57.51189.57.51114.5合计合计—98.5配对样本的配对样本的 t 检验检验(例题分析例题分析)8 - 72统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院配对样本的配对样本的 t 检验检验 (例题分析例题分析)差值均值差值均值差值均值差值均值差值标准差差值标准差差值标准差差值标准差8 - 73统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院H H0 0: : 1 1 – – 2 2 8.5 8.5H H1 1: : 1 1 – – 2 2 < 8.5< 8.5 = = 0.05 0.05dfdf = = 10 - 1 = 910 - 1 = 9临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量: :决策决策决策决策: :结论结论结论结论: : 在在 = 0.05= 0.05的水平上不拒绝的水平上不拒绝H H0 0不能认为该俱乐部的宣称不可信不能认为该俱乐部的宣称不可信配对样本的配对样本的 t 检验检验 (例题分析例题分析)-1.833-1.833t t0 0拒绝域拒绝域.05.058 - 74统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院配对样本的配对样本的 t 检验检验 (例题分析例题分析—用用Excel进行检验进行检验)第第第第1 1步:步:步:步:选择选择“ “工具工具” ” 第第第第2 2步:步:步:步:选择选择“ “数据分析数据分析” ”选项选项第第第第3 3步步步步::::在在分分析析工工具具中中选选择择“ “t t检检检检验验验验::::平平平平均均均均值值值值的的的的成成成成对对对对二二二二样本分析样本分析样本分析样本分析” ”第第第第4 4步:步:步:步:当出现对话框后当出现对话框后 在在“ “变量变量1 1的区域的区域” ”方框内键入方框内键入数据区域数据区域 在在“ “变量变量2 2的区域的区域” ”方框内键入方框内键入数据区域数据区域 在在“ “假设平均差假设平均差” ”方框内键入方框内键入8.58.5 显显著性水平保持默著性水平保持默认值认值8 - 75统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院两个总体比例之差的检验两个总体比例之差的检验8 - 76统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院1. 假定条件n n两个总体是独立的两个总体是独立的n n两个两个总体都服从二项分布总体都服从二项分布n n可以用正态分布来近似可以用正态分布来近似2.检验统计量两个总体比例之差的两个总体比例之差的Z检验检验8 - 77统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院两个总体比例之差的检验两个总体比例之差的检验(假设的形式假设的形式)假设假设研究的问题研究的问题没有差异没有差异有差异有差异比例比例1 1 ≥≥比例比例2 2比例比例1 1 < 比例比例2 2总体总体1 1 ≤≤比例比例2 2总体总体1 1 > 比例比例2 2H0P1–P2 = 0P1–P2 0P1–P2 0H1P1–P2 0P1–P2<0P1–P2 >08 - 78统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院两个总体比例之差的两个总体比例之差的Z检验检验 (例题分析例题分析)单侧检验单侧检验 【【【【例例例例】】】】对对两两个个大大型型企企业业青青年年工工人人参参加加技技术术培培训训的的情情况况进进行行调调查查,,调调查查结结果果如如下下::甲甲厂厂::调调查查6060人人,,1818人人参参加加技技术术培培训训。
乙乙厂厂调调查查4040人人,,1414人人参参加加技技术术培培训训能能否否根根据据以以上上调调查查结结果果认认为为乙乙厂厂工工人人参参加加技技术术培培训训的的人人数数比比例例高高于甲厂?于甲厂?( ( = 0.05 = 0.05) )8 - 79统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院两个总体比例之差的两个总体比例之差的Z检验检验 (例题分析例题分析)H H0 0: : 1 1 1 1- - 2 2 2 2 0 0H H1 1: : 1 1 1 1- - 2 2 2 2 < 0 < 0 = = 0.050.05n n1 1 = = 60 60,,,,n n2 2 = = 4040临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量: :决策决策决策决策: :结论结论结论结论: : 在在 = 0.05= 0.05的水平上不拒绝的水平上不拒绝H H0 0没没有有证证据据表表明明乙乙厂厂工工人人参参加加技技术培训的人数比例高于甲厂术培训的人数比例高于甲厂-1.645-1.645Z Z0 0拒绝域拒绝域 8 - 80统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院两个总体方差比的检验两个总体方差比的检验8 - 81统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院两个总体方差比的检验两个总体方差比的检验(F 检验检验)1.假定条件n n两个总体都服从正态分布,且方差相等两个总体都服从正态分布,且方差相等n n两个独立的随机样本两个独立的随机样本2.假定形式n nH H0 0:: 1 12 2 = = 2 22 2 或或 H H0 0:: 1 12 2 2 22 2 ( (或或 ) ) H H1 1:: 1 12 2 2 22 2 H H1 1:: 1 12 2 <<2 22 2 ( (或或 >)>)3.检验统计量n nF F = = S S1 12 2 / /S S2 22 2~~F F( (n n1 1 – 1 , – 1 , n n2 2 – 1) – 1)8 - 82统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院两个总体方差的两个总体方差的 F 检验检验(临界值临界值)0不能拒绝不能拒绝H0F拒绝拒绝H0 /2 /2拒绝拒绝 H08 - 83统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院两个总体方差的两个总体方差的 F 检验检验 (例题分析例题分析)H H0 0: : 1 1 1 12 22 2= = 2 2 2 22 2 2 2 H H1 1: : 1 1 1 12 22 2 2 2 2 22 2 2 2 = 0.05= 0.05n n1 1 = 15= 15,,,,n n2 2 = 20= 20临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量: :决策决策决策决策: :结论结论结论结论: : 在在 = 0.05= 0.05的水平上不拒绝的水平上不拒绝H H0 0不不能能认认为为这这两两个个总总体体的的方方差差有有显著差异显著差异 0FF F0.0975 0.0975 =0.352=0.352.025.025拒绝拒绝 H H0 0拒绝拒绝 H H0 0.025.025F F0.025 0.025 =2.62=2.628 - 84统计学统计学STATISTICS(第四版第四版)作者:贾俊平,中国人民大学统计学院本章小节本章小节1. 假设检验的概念和类型假设检验的概念和类型 2. 假设检验的过程假设检验的过程3.基于一个样本的假设检验问题基于一个样本的假设检验问题4. 基于两个样本的假设检验问题基于两个样本的假设检验问题5. 利用利用p - 值进行检验值进行检验结结 束束。
