
第8章假设检验剖析ppt课件.ppt
91页第第 8 章章 假设检验假设检验统计学第第 8 章章 假设检验假设检验8.1 假设检验的基本问题假设检验的基本问题 8.2 一个总体参数的检验一个总体参数的检验8.3 两个总体参数的检验两个总体参数的检验8.4 假设检验中的其他问题假设检验中的其他问题学习目标1.了解假设检验的基本思想了解假设检验的基本思想 2.掌握假设检验的步骤掌握假设检验的步骤3.对实际问题作假设检验对实际问题作假设检验4.利用置信区间进行假设检验利用置信区间进行假设检验5.利用利用P - 值进行假设检验值进行假设检验8.1 假设检验的基本问题8.1.1 假设问题的提出假设问题的提出8.1.2 假设的表达式假设的表达式8.1.3 两类错误两类错误8.1.4 假设检验的流程假设检验的流程8.1.5 利用利用P值进行决策值进行决策8.1.6 单侧检验单侧检验假设问题的提出假设问题的提出什么是假设?(hypothesis)• 对总体参数的的数值所作的一种陈述–总体参数包括总总体体均均值值、比例比例、方差方差等–分析之前之前必需陈述我认为该地区新生婴儿我认为该地区新生婴儿的平均体重为的平均体重为31903190克克! !什么是假设检验? (hypothesis testing)1.事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立2.有参数假设检验和非参数假设检验3.采用逻辑上的反证法,依据统计上的小概率原理提出原假设和备择假设• 什么是原假设?什么是原假设?(null hypothesis)1.待检验的假设,又称“0假设”2.研究者想收集证据予以反对的假设3. 总是有等号 , 或 4. 表示为 H0–H0: 某一数值 –指定为 = 号,即 或 –例如, H0: 3190(克) 什么是备择假设?什么是备择假设?(alternative hypothesis)1.与原假设对立的假设,也称“研究假设”2.研究者想收集证据予以支持的假设总是有不等号: , 或 3.表示为 H1–H1: <某一数值,或 某一数值–例如, H1: < 3910(克),或3910(克)提出原假设和备择假设提出原假设和备择假设假设检验中的两类错误假设检验中的两类错误(决策风险决策风险)假设检验中的两类错误•1. 第一类错误(弃真错误)第一类错误(弃真错误)–原假设为真时拒绝原假设–会产生一系列后果–第一类错误的概率为•被称为显著性水平•2. 第二类错误(取伪错误)第二类错误(取伪错误)–原假设为假时接受原假设–第二类错误的概率为(Beta) 错误和 错误的关系 你不能同时减你不能同时减少两类错误少两类错误! 和和和和 的关系就像的关系就像的关系就像的关系就像翘翘板,翘翘板,翘翘板,翘翘板, 小小小小 就就就就大,大,大,大, 大大大大 就小就小就小就小假设检验的流程假设检验的流程§提出假设提出假设§确定适当的检验统计量确定适当的检验统计量§规定显著性水平规定显著性水平 §计算检验统计量的值计算检验统计量的值§作出统计决策作出统计决策• 什么是检验统计量?什么是检验统计量?1. 用于假设检验决策的统计量2. 选择统计量的方法与参数估计相同,需考虑–是大样本还是小样本–总体方差已知还是未知3.检验统计量的基本形式为确定适当的检验统计量确定适当的检验统计量规定显著性水平(significant level)• 什么是显著性水平?什么是显著性水平?•1. 是一个概率值•2. 原假设为真时,拒绝原假设的概率–被称为抽样分布的拒绝域•3. 表示为 (alpha)–常用的 值有0.01, 0.05, 0.10•4. 由研究者事先确定作出统计决策1.计算检验的统计量2.根据给定的显著性水平,查表得出相应的临界值z或z,t或t3.将检验统计量的值与 水平的临界值进行比较4.得出拒绝或不拒绝原假设的结论利用利用P值进行决策值进行决策什么是P 值?(P-value)1.是一个概率值2.如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率–左侧检验时,P-值为曲线上方小于等于小于等于检验统计量部分的面积–右侧检验时,P-值为曲线上方大于等于大于等于检验统计量部分的面积3.被称为观察到的(或实测的)显著性水平–H0 能被拒绝的最小值双侧检验的P 值 / / 2 2 / / 2 2 Z Z拒绝拒绝拒绝拒绝拒绝拒绝拒绝拒绝H HH0 00值值值临界值临界值临界值计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量临界值临界值临界值1/2 1/2 1/2 P P P 值值值1/2 1/2 1/2 P P P 值值值左侧检验的P 值H HH0 00值值值临界值临界值临界值 样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布1 - 1 - 1 - 置信水平置信水平置信水平置信水平计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量P P P 值值值右侧检验的P 值H HH0 00值值值临界值临界值临界值 拒绝域拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布1 - 1 - 1 - 置信水平置信水平置信水平置信水平置信水平置信水平计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量P P P 值值值利用 P 值进行检验(决策准则)1.单侧检验–若p-值 ,不拒绝 H0–若p-值 < , 拒绝 H02.双侧检验–若p-值 , 不拒绝 H0–若p-值 < , 拒绝 H0双侧检验和单侧检验双侧检验和单侧检验双侧检验与单侧检验 (假设的形式)假设假设研究的问题研究的问题双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验H0= 0 0 0 0 0 0H1≠ 0 0< 0 0> 0 0双侧检验(原假设与备择假设的确定)1.属于决策中的假设检验决策中的假设检验2.不论是拒绝H0还是不拒绝H0,都必需采取相应的行动措施3.例如,某种零件的尺寸,要求其平均长度为10cm,大于或小于10cm均属于不合格–我们想要证明(检验)大于或小于这两种可能性中的任何一种是否成立4.建立的原假设与备择假设应为• H0: 10 H1: 10双侧检验(显著性水平与拒绝域 )抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布H HH000值值值临界值临界值临界值临界值临界值临界值 /2 /2 /2 /2/2 样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域1 - 1 - 1 - 置信水平置信水平置信水平置信水平置信水平置信水平单侧检验(显著性水平与拒绝域)H H0 0值值临界值临界值 样本统计量样本统计量拒绝域拒绝域抽样分布抽样分布抽样分布抽样分布1 - 1 - 置信水平置信水平置信水平置信水平8.2 一个总体参数的检验8.2.1 检验统计量的确定检验统计量的确定8.2.2 总体均值的检验总体均值的检验8.2.3 总体比例的检验总体比例的检验8.2.4 总体方差的检验总体方差的检验一个总体参数的检验Z 检验检验(单尾和双尾)(单尾和双尾) t 检验检验(单尾和双尾)(单尾和双尾)Z 检验检验(单尾和双尾)(单尾和双尾) 2 2检验检验(单尾和双尾)(单尾和双尾)均值均值一个总体一个总体比例比例方差方差总体总体均值检验均值检验总体均值的检验(检验统计量)总体总体 是否已知是否已知??用样本标用样本标准差准差S代替代替 t 检验检验小小小样本量样本量n否否否是是是z 检验检验 z 检验检验大大大总体均值的检验 (2 已知或2未知大样本)•1.假定条件–总体服从正态分布–若不服从正态分布, 可用正态分布来近似(n30)2.使用Z-统计量–2 已知:–2 未知:2 已知均值的检验(例题分析)•【【例例】】某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为= 0.025 。
今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm试问新机床加工零件的椭圆度的均值与以前有无显著差异?(=0.05)双侧检验双侧检验2 已知均值的检验 (例题分析)•H0: = 0.081•H1: 0.081• = 0.05•n = 200•临界值临界值(s):检验统计量检验统计量检验统计量检验统计量: :Z Z0 01.961.96-1.96-1.96.025.025拒绝拒绝 H H0 0拒绝拒绝 H H0 0.025.025决策决策决策决策: :结论结论结论结论: : 在在 = 0.05= 0.05的水平上拒绝的水平上拒绝H H0 0有有证证据据表表明明新新机机床床加加工工的的零零件件的椭圆度与以前有显著差异的椭圆度与以前有显著差异2 已知均值的检验 (P 值的计算与应用)•第1步:进入Excel表格界面,选择“插入”下拉菜单•第2步:选择“函数”点击•第3步:在函数分类中点击“统计”,在函数名的菜• 单下选择字符“NORMSDIST”然后确定•第4步:将Z的绝对值2.83录入,得到的函数值为• 0.997672537• P值=2(1-0.997672537)=0.004654• P值远远小于,故拒绝H02 已知均值的检验 (小样本例题分析)•【【例例】】根据过去大量资料,某厂生产的灯泡的使用寿命服 从 正 态 分 布 N~(1020,1002)。
现从最近生产的一批产品中随机抽取16只,测得样本平均寿命为1080小时试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?(=0.05)单侧检验单侧检验2 已知均值的检验 (小样本例题分析)•H0: 1020•H1: > 1020• = 0.05•n = 16•临界值临界值(s):检验统计量检验统计量检验统计量检验统计量: : 在在 = 0.05= 0.05的水平上拒绝的水平上拒绝H H0 0有证据表明这批灯泡的使用有证据表明这批灯泡的使用寿命有显著提高寿命有显著提高决策决策决策决策: :结论结论结论结论: :Z Z0 0拒绝域拒绝域0.050.051.6451.6452 未知大样本均值的检验 (例题分析)•【【例例】】某电子元件批量生产的质量标准为平均使用寿命1200小时某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准为了进行验证,随机抽取了100件作为样本,测得平均使用寿命1245小时,标准差300小时能否说该厂生产的电子元件质量显著地高于规定标准? (=0.05)单侧检验单侧检验2 未知大样本均值的检验 (例题分析)•H0: 1200•H1: >1200• = 0.05•n = 100•临界值临界值(s):检验统计量检验统计量检验统计量检验统计量: : 在在 = 0.05= 0.05的水平上不拒绝的水平上不拒绝H H0 0不能认为该厂生产的元件寿命不能认为该厂生产的元件寿命显著地高于显著地高于12001200小时小时决策决策决策决策: :结论结论结论结论: :Z Z0 0拒绝域拒绝域0.050.051.6451.645总体均值的检验 (2未知小样本)•1. 假定条件–总体为正态分布–2未知,且小样本•2. 使用t 统计量2 未知小样本均值的检验 (例题分析)•【【例例】】某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标 准 差 为 0.3cm, 试 以0.05的显著性水平检验机器性能良好的假设。
双侧检验双侧检验2 未知小样本均值的检验 (例题分析)•H0: = 5•H1: 5• = 0.05•df = 10 - 1 = 9•临界值临界值(s):检验统计量检验统计量检验统计量检验统计量: : 在在 = 0.05= 0.05的水平上拒绝的水平上拒绝H H0 0说明该机器的性能不好说明该机器的性能不好 决策:决策:决策:决策:结论:结论:结论:结论:t t0 02.2622.262-2.262-2.262.025.025拒绝拒绝 H H0 0拒绝拒绝 H H0 0.025.0252 未知小样本均值的检验 (P 值的计算与应用)•第1步:进入Excel表格界面,选择“插入”下拉菜单•第2步:选择“函数”点击,并在函数分类中点击“统• 计” ,然后,在函数名的菜单中选择字符• “TDIST”,确定•第3步:在弹出的X栏中录入计算出的t值3.16 • 在自由度(Deg-freedom)栏中录入9• 在Tails栏中录入2,表明是双侧检验(单测• 检验则在该栏内录入1)• P值的结果为0.01155<0.025,拒绝H02 未知小样本均值的检验 (例题分析)• 【【例例】】一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。
已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?( = 0.05)单侧检验!单侧检验!均值的单尾 t 检验 (计算结果) •H0: 40000•H1: < 40000• = 0.05•df = 20 - 1 = 19•临界值临界值(s):检验统计量检验统计量检验统计量检验统计量: : 在在 = 0.05= 0.05的水平上不拒绝的水平上不拒绝H H0 0不能认为制造商的产品同他所不能认为制造商的产品同他所说的标准不相符说的标准不相符决策决策决策决策: : 结论结论结论结论: : -1.7291-1.7291t t0 0拒绝域拒绝域.05.05总体比例的检验总体比例的检验(Z 检验检验)一个总体比例检验1.假定条件–有两类结果–总体服从二项分布–可用正态分布来近似2.比例检验的 Z 统计量 0 0为假设的总体比例为假设的总体比例为假设的总体比例为假设的总体比例一个总体比例的检验 (例题分析)•【【例例】】一项统计结果声称,某市老年人口(年龄在65岁以上)的比重为14.7%,该市老年人口研究会为了检验该项统计是否可靠,随机抽选了400名居民,发现其中有57人年龄在65岁以上。
调查结果是否支持该市老年人口比重为14.7%的看法?( = 0.05)双侧检验双侧检验一个总体比例的检验 (例题分析)•H0: = 14.7%•H1: 14.7%• = 0.05•n = 400•临界值临界值(s):检验统计量检验统计量检验统计量检验统计量: :在在 = 0.05= 0.05的水平上不拒绝的水平上不拒绝H H0 0该市老年人口比重为该市老年人口比重为14.7%14.7%决策决策决策决策: :结论结论结论结论: :Z Z0 01.961.96-1.96-1.96.025.025拒绝拒绝 H H0 0拒绝拒绝 H H0 0.025.025总体方差的检验总体方差的检验( 2 检验检验)方差的卡方 (2) 检验1.检验一个总体的方差或标准差2.假设总体近似服从正态分布3.检验统计量样本方差样本方差样本方差样本方差假设的总体方差假设的总体方差假设的总体方差假设的总体方差方差的卡方 (2) 检验(例题分析)•【【例例】】某厂商生产出一种新型的饮料装瓶机器,按设计要求,该机器装一瓶一升(1000cm3)的饮料误差上下不超过1cm3。
如果达到设计要求,表明机器的稳定性非常好现从该机器装完的产品中随机抽取25瓶,分别进行测定(用样本减1000cm3),得到如下结果检验该机器的性能是否达到设计要求 ( =0.05)0.3-0.4 -0.71.4-0.6-0.3 -1.50.6-0.91.3-1.30.71-0.50-0.60.7-1.5 -0.2 -1.9-0.51-0.2 -0.61.1绿色绿色绿色绿色健康饮品健康饮品健康饮品健康饮品绿色绿色绿色绿色健康饮品健康饮品健康饮品健康饮品双侧检验双侧检验方差的卡方 (2) 检验(例题分析)•H0: 2 = 1•H1: 2 1• = 0.05•df = 25 - 1 = 24•临界值临界值(s):统计量统计量统计量统计量: : 在在 = 0.05= 0.05的水平上不拒绝的水平上不拒绝H H0 0不能认为该机器的性能未达到不能认为该机器的性能未达到设计要求设计要求 2 220 0 039.3639.3639.3612.4012.4012.40 /2 =.05/2 =.05/2 =.05决策决策决策决策: :结论结论结论结论: :8.3 两个总体参数的检验8.3.1 检验统计量的确定检验统计量的确定8.3.2 两个总体均值之差的检验两个总体均值之差的检验8.3.3 两个总体比例之差的检验两个总体比例之差的检验8.3.4 两个总体方差比的检验两个总体方差比的检验8.3.5 检验中的匹配样本检验中的匹配样本两个正态总体参数的检验两个总体的检验两个总体的检验Z 检验检验(大样本大样本)t 检验检验(小样本小样本)t 检验检验(小样本小样本)Z 检验检验F 检验检验独立样本独立样本独立样本配对样本配对样本配对样本均值均值比例比例方差方差独立样本总体均值之差的检验独立样本总体均值之差的检验两个总体均值之差的检验 (12、22 已知)•1.假定条件–两个样本是独立的随机样本–两个总体都是正态分布–若不是正态分布, 可以用正态分布来近似(n130和 n230)2.检验统计量为两个总体均值之差的检验 (假设的形式)假设假设研究的问题研究的问题没有差异没有差异有差异有差异均值均值1 1 均值均值2 2均值均值1 1 < 均值均值2 2均值均值1 1 均值均值2 2均值均值1 1 > 均值均值2 2H0 1 – 2 = 0 1 – 2 0 1 – 2 0H1 1 – 2 0 1 – 2 < 0 1 – 2 > 0两个总体均值之差的检验 (例题分析)• 双侧检验!双侧检验!【【【【例例例例】】】】有有两两种种方方法法可可用用于于制制造造某某种种以以抗抗拉拉强强度度为为重重要要特特征征的的产产品品。
根根据据以以往往的的资资料料得得知知,,第第一一种种方方法法生生产产出出的的产产品品其其抗抗拉拉强强度度的的标标准准差差为为8 8公公斤斤,,第第二二种种方方法法的的标标准准差差为为1010公公斤斤从从两两种种方方法法生生产产的的产产品品中中各各抽抽取取一一个个随随机机样样本本,,样样本本量量分分别别为为n n1 1=32=32,,n n2 2=40=40,,测测得得 x x1 1= = 5050公公斤斤,, x x2 2= = 4444公公斤斤问问这这两两种种方方法法生生产产的的产产品品平平均均抗抗拉拉强强度度是是否有显著差别?否有显著差别? ( ( = 0.05) = 0.05)两个总体均值之差的检验 (例题分析)•H0: 1 1- 2 2 = 0•H1: 1 1- 2 2 0• = 0.05•n1 = 32,,n2 = 40•临界值临界值(s):检验统计量检验统计量检验统计量检验统计量: :决策决策决策决策: :结论结论结论结论: : 在在 = 0.05= 0.05的水平上拒绝的水平上拒绝H H0 0有证据表明两种方法生产的产有证据表明两种方法生产的产品其抗拉强度有显著差异品其抗拉强度有显著差异Z Z0 01.961.96-1.96-1.96.025.025拒绝拒绝 H H0 0拒绝拒绝 H H0 0.025.025两个总体均值之差的检验 (12、22 未知但相等,小样本)1.检验具有相等方差的两个总体的均值2.假定条件–两个样本是独立的随机样本–两个总体都是正态分布–两个总体方差未知但相等1=3.检验统计量其中:其中:其中:两个总体均值之差的检验 (12、22 未知且不等,小样本)1.检验具有不等方差的两个总体的均值2.假定条件–两个样本是独立的随机样本–两个总体都是正态分布–两个总体方差未知且不相等13.检验统计量两个总体均值之差的检验 (例题分析)单侧检验单侧检验 【【例例】】 “ “多多吃吃谷谷物物,,将将有有助助于于减减肥肥。
”为为了了验验证证这这个个假假设设,,随随机机抽抽取取了了3535人人,,询询问问他他们们早早餐餐和和午午餐餐的的通通常常食食谱谱,,根根据据他他们们的的食食谱谱,,将将其其分分为为二二类类,,一一类类为为经经常常的的谷谷类类食食用用者者( (总总体体1 1) ),,一一类类为为非非经经常常谷谷类类食食用用者者( (总总体体2 2) )然然后后测测度度每每人人午午餐餐的的大大卡卡摄摄取取量量经经过过一一段段时时间间的的实实验验,,得得到到如如下下结结果果::检检验该假设验该假设 ( ( = 0.05) = 0.05)两个总体均值之差的检验 (例题分析—用统计量进行检验)•H0: 1 1- 2 2 0•H1: 1 1- 2 2 < 0• = 0.05•n1 = 15,,n2 = 20•临界值临界值(s):检验统计量检验统计量检验统计量检验统计量: :决策决策决策决策: :结论结论结论结论: : 在在 = 0.05= 0.05的水平上拒绝的水平上拒绝H H0 0没有证据表明多吃谷物将有助没有证据表明多吃谷物将有助于减肥于减肥-1.694-1.694t t0 0拒绝域拒绝域.05.05两个总体均值之差的检验 (例题分析—用Excel进行检验)•第1步:选择“工具”下拉菜单,并选择“数据分析”选项•第2步:选择“t检验,双样本异方差假设检验,双样本异方差假设”•第3步:当出现对话框后• 在“变量1的区域”方框内键入数据区域• 在“变量2的区域”方框内键入数据区域• 在“假设平均差”的方框内键入0• 在“α(A)”框内键入0.05• 在“输出选项”中选择输出区域• 选择“确定”两个匹配两个匹配(或配对或配对)样本的均值检验样本的均值检验两个总体均值之差的检验(匹配样本的 t 检验)•1. 检验两个总体的均值–配对或匹配–重复测量 (前/后)•3. 假定条件–两个总体都服从正态分布–如果不服从正态分布,可用正态分布来近似 (n1 30 , n2 30 )匹配样本的 t 检验 (假设的形式)假设假设研究的问题研究的问题没有差异没有差异有差异有差异总体总体1 1 总体总体2 2总体总体1 1 < 总体总体2 2总体总体1 1 总体总体2 2总体总体1 1 > 总体总体2 2H0 D = 0 D 0 D 0H1 D 0 D< 0 D > 0注:注:D Di i = = X X1 1i i - - X X2 2i i ,对第,对第 i i 对观察值对观察值匹配样本的 t 检验 (数据形式) 观察序号观察序号样本样本1 1样本样本2 2差值差值1x 11x 21D1 = x 11 - x 212x 12x 22D1 = x 12 - x 22M MM MM MM Mix 1ix 2iD1 = x 1i - x 2iM MM MM MM Mnx 1nx 2nD1 = x 1n- x 2n匹配样本的 t 检验(检验统计量)样本差值均值样本差值均值样本差值均值样本差值均值样本差值标准差样本差值标准差样本差值标准差样本差值标准差自由度自由度dfdf ==n nD D - 1- 1统计量统计量统计量统计量D D0 0:假设的差值:假设的差值•【【例例】】一个以减肥为主要目标的健美俱乐部声称,参加其训练班至少可以使减肥者平均体重减重8.5kg以上。
为了验证该宣称是否可信,调查人员随机抽取了10名参加者,得到他们的体重记录如下表:匹配样本的 t 检验 (例题分析)在在 = 0.05= 0.05的显著性水平下,调查结果是否支持该的显著性水平下,调查结果是否支持该俱乐部的声称?俱乐部的声称?训练前训练前94.5101110103.59788.596.5101104116.5训练后训练后8589.5101.5968680.58793.593102单侧检验单侧检验样本差值计算表样本差值计算表训练前训练前训练后训练后差值差值Di94.5101110103.59788.596.5101104116.58589.5101.5968680.58793.5931029.511.58.57.51189.57.51114.5合计合计—98.5配对样本的 t 检验(例题分析)配对样本的 t 检验 (例题分析)差值均值差值均值差值均值差值均值差值标准差差值标准差差值标准差差值标准差•H0: 1 – 2 8.5•H1: 1 – 2 < 8.5• = 0.05•df = 10 - 1 = 9•临界值临界值(s):检验统计量检验统计量检验统计量检验统计量: :决策决策决策决策: :结论结论结论结论: : 在在 = 0.05= 0.05的水平上不拒绝的水平上不拒绝H H0 0不能认为该俱乐部的宣称不可信不能认为该俱乐部的宣称不可信配对样本的 t 检验 (例题分析)-1.833-1.833t t0 0拒绝域拒绝域.05.05配对样本的 t 检验 (例题分析—用Excel进行检验)•第第1步:步:选择“工具” •第第2步:步:选择“数据分析”选项•第第3步步::在分析工具中选择“t检检验验::平平均均值值的的成成对对二样本分析二样本分析”•第第4步:步:当出现对话框后• 在“变量1的区域”方框内键入数据区域• 在“变量2的区域”方框内键入数据区域 • 在“假设平均差”方框内键入8.5• 显著性水平保持默认值两个总体比例之差的检验两个总体比例之差的检验•1.假定条件–两个总体是独立的–两个总体都服从二项分布–可以用正态分布来近似2.检验统计量两个总体比例之差的Z检验两个总体比例之差的检验(假设的形式)假设假设研究的问题研究的问题没有差异没有差异有差异有差异比例比例1 1 ≥≥比例比例2 2比例比例1 1 < 比例比例2 2总体总体1 1 ≤≤比例比例2 2总体总体1 1 > 比例比例2 2H0P1–P2 = 0P1–P2 0P1–P2 0H1P1–P2 0P1–P2<0P1–P2 >0两个总体比例之差的Z检验 (例题分析)单侧检验单侧检验 【【【【例例例例】】】】对对两两个个大大型型企企业业青青年年工工人人参参加加技技术术培培训训的的情情况况进进行行调调查查,,调调查查结结果果如如下下::甲甲厂厂::调调查查6060人人,,1818人人参参加加技技术术培培训训。
乙乙厂厂调调查查4040人人,,1414人人参参加加技技术术培培训训能能否否根根据据以以上上调调查查结结果果认认为为乙乙厂厂工工人人参参加加技技术术培培训训的的人人数数比比例例高高于甲厂?于甲厂?( ( = 0.05 = 0.05) )两个总体比例之差的Z检验 (例题分析)•H0: 1 1- 2 2 0•H1: 1 1- 2 2 < 0• = 0.05•n1 = 60,,n2 = 40•临界值临界值(s):检验统计量检验统计量检验统计量检验统计量: :决策决策决策决策: :结论结论结论结论: : 在在 = 0.05= 0.05的水平上不拒绝的水平上不拒绝H H0 0没没有有证证据据表表明明乙乙厂厂工工人人参参加加技技术培训的人数比例高于甲厂术培训的人数比例高于甲厂-1.645-1.645Z Z0 0拒绝域拒绝域 两个总体方差比的检验两个总体方差比的检验两个总体方差比的检验(F 检验)1.假定条件–两个总体都服从正态分布,且方差相等–两个独立的随机样本2.假定形式–H0:12 = 22 或 H0:12 22 (或 ) H1:12 22 H1:12 <22 (或 >)3.检验统计量–F = S12 /S22~F(n1 – 1 , n2 – 1)两个总体方差的 F 检验(临界值)0不能拒绝不能拒绝H0F拒绝拒绝H0 /2 /2拒绝拒绝 H0两个总体方差的 F 检验 (例题分析)H H0 0: : 1 1 1 12 22 2= = 2 2 2 22 2 2 2 H H1 1: : 1 1 1 12 22 2 2 2 2 22 2 2 2 = 0.05 = 0.05n n1 1 = 15 = 15,,,,n n2 2 = 20= 20临界值临界值临界值临界值(s):(s):检验统计量检验统计量检验统计量检验统计量: :决策决策决策决策: :结论结论结论结论: : 在在 = 0.05= 0.05的水平上不拒绝的水平上不拒绝H H0 0不不能能认认为为这这两两个个总总体体的的方方差差有有显著差异显著差异 0FF F0.0975 0.0975 =0.352=0.352.025.025拒绝拒绝 H H0 0拒绝拒绝 H H0 0.025.025F F0.025 0.025 =2.62=2.628.4 假设检验中的其他问题8.4.1 用置信区间进行检验用置信区间进行检验8.4.2 单侧检验中假设的建立单侧检验中假设的建立用置信区间进行检验用置信区间进行检验用置信区间进行检验(双侧检验)1.求出双侧检验均值的置信区间 2 2 2 2已知时:已知时:已知时: 2 2 2 2未知时:未知时:未知时:2.若总体的假设值 0在置信区间外,拒绝H0 用置信区间进行检验(单侧检验)1.左侧检验:求出单边置信下限2. 若总体的假设值若总体的假设值 0 0小于单边置信下限,拒绝小于单边置信下限,拒绝H H0 03.右侧检验:求出单边置信上限4. 若总体的假设值若总体的假设值 0 0大于单边置信上限,拒绝大于单边置信上限,拒绝H H0 0用置信区间进行检验 (例题分析)• 【【例例】】一种袋装食品每包的标准重量应为1000克。
现从生产的一批产品中随机抽取16袋,测得其平均重量为991克已知这种产品重量服从标准差为50克的正态分布试确定这批产品的包装重量是否合格?( = 0.05)双侧检验!双侧检验!香脆香脆香脆蛋卷蛋卷蛋卷用置信区间进行检验 (例题分析)•H0: = 1000•H1: 1000• = 0.05•n = 16•临界值临界值(s):置信区间为置信区间为置信区间为置信区间为决策决策决策决策: :结论结论结论结论: : 假设的假设的 00=1000=1000在置信区在置信区间内,不拒绝间内,不拒绝H H0 0不能认为这批产品的包装重量不能认为这批产品的包装重量不合格不合格Z Z0 01.961.96-1.96-1.96. .025025. .拒绝拒绝 H H0 0拒绝拒绝 H H0 0.025.025本章小节1. 假设检验的概念和类型假设检验的概念和类型 2. 假设检验的过程假设检验的过程3.基于一个样本的假设检验问题基于一个样本的假设检验问题4. 基于两个样本的假设检验问题基于两个样本的假设检验问题5. 用置信区间进行检验用置信区间进行检验6. 利用利用p - 值进行检验值进行检验。
