
第五讲假设检验问题.ppt
35页1,第五讲 假设检验问题,,2,从一个例子看假设检验的思路,假设我们有意估计一个社区的平均收入假设收入总体是正态N(, 25),且抽取了一个随机样本,其中有n = 25个观测值,得到 = 17 现在,一位经济专家A先生宣称说,根据他的知识,平均收入 = 16你对此作何反应?,,我们可以按照以下方式推理在观察 = 17之前, 的抽样分布为N(, 1)这是因为 .) 观察到的 (= 17) 与A先生宣称的 仅有1个标准误差 ,可被视作这一分布的一个典型观察因而,在A先生的说法与证据之间没有多少不一致假如另一位专家B先生宣称说 = 15,你会作何反应呢? 根据B先生的说法,所观察到的 (= 17)开始显得有点极端,因为它现在偏离 有两个标准误差了假如第三位专家C先生宣称说 = 14又如何呢? 当然,假如 =14,那么观察到的 (= 17)的确非常极端,我们要么拒绝其说法,要么研究数据的准确性对值的假设(宣称)值与观测到的值之间的差异大小的度量就是观察到更加极端的 的概率(机率)即: 这一概率称作观察值 的p-值 因而一个 较小的p-值意味着假设没有得到数据的支持 较大的p-值意味着假设与数据一致,,7,假设检验的基本概念,H0: = 0 称为原假设 H1: 0称为备择假设 选择的态度:拒绝?不拒绝? (To be or not to be,……) 更多的例子,简单假设和复合假设。
按照标准误差单位来度量偏离有多远 首先,当 为已知时,这一距离由下式给出 这称作z统计量按照原假设,即H0: = 0为真时,在得到样本平均值之前,随机变量 z 的分布为单位正态N(0,1)使用p-值检验来衡量观测值z 与 0之间的差异这里的p-值是得到比观测值更为极端的z统计量的概率9,,一般的统计实践中: 假如p-值 0.05, 则拒绝H0 , 并报告结果在统计上是显著的(在0.05的水平) 如果p-值 0.05,则结果在统计上不显著(在0.05的水平),10,,原假设= 15由于观测到 =17,观测到的 z = 17-15=2. (这是因为 .) 因而,p-值是概率 所以拒绝原假设11,,另一方面,对于本例而言,p-值0.05等价于 因此上式称为拒绝域,意思是如果样本均值的观测值如果落在这个区域里就要拒绝原假设12,你会犯什么错误?,13,,第一类错误:当H0 为真时拒绝H0 第二类错误:当H0 为假时不拒绝H0 显著水平:犯第一类错误的最大概率 前面的例子,犯第一类错误的最大概率为0.05 如果希望犯第一类错误的最大概率为0.01, 则拒绝域变为,14,假设检验的步骤,确定适应的原假设和备择假设; 选择检验统计量; 指定显著水平; 根据显著水平和统计量的抽样分布来确定统计量的临界值,从而确定拒绝域; 根据样本计算统计量的值并与临界值比较看是否落入拒绝域; 或计算p-值,并比较p-值与 得出结论。
15,方差未知时总体均值的双边检验,,16,一个例子,所有联合食品公司的顾客一次购买金额的平均值是35美圆? H0: =35. H1: 35 给定显著水平=0.05 拒绝域为 现有一样本,n=100,,17,是否对Hilltop咖啡投诉?,联邦贸易委员会(FTC)意欲对大瓶Hilltop牌咖啡进行检查,以确定是否符合其标签上注明的“容量至少是3磅”的说法,并由此决定是否因为包装重量的不足而对其提出投诉 H0: 3 H1:3. 显著水平=0.05,,18,大样本下的解决方案,如果2已知,则拒绝域为 如果2未知,则拒绝域为,19,,假定由36听罐头所组成的一个样本的样本均值为 磅,样本标准差 s=0.18 ,你能拒绝原假设吗?,20,小样本下的解决方案,如果2未知,则,21,一组虚拟的数据,我们设FTC抽取了20瓶Hilltop咖啡作为随机样本,得到其质量分别为(磅): 2.82 3.01 3.11 2.71 2.93 2.68 3.02 3.01 2.93 2.56 2.78 3.01 3.09 2.94 2.82 2.81 3.05 3.01 2.85 2.79 其样本均值为2.8965,样本标准为0.148440135, 你可以拒绝原假设吗?,,拒绝域为:,结论:拒绝原假设。
显著性水平 a 和拒绝域,,,,,,,H0: m 3 H1: m 3,,,,0,0,0,H0: m 3 H1: m 3,H0: m = 3 H1: m 3,,a,a,a/2,,,,,,,,临界值,,拒绝域,,,24,置信区间和双边检验,总体均值的95%置信区间: 双边检验的拒绝域: 启示: 通过置信区间进行双边检验 H0: = 0 如果0不在总体均值的95%置信区间内,则拒绝H0未知均值,关于方差2 的检验 H0: 2 = H1: 2 ,26,,,27,自动饮料机的例子,某种自动饮料机的饮料灌装量的方差是一个重要的技术指标,方差太大,意味着可能经常出现过度灌装或者灌装不足,这会引起饮料机的拥有者或者顾客的不满在对某一特定的机器灌装量的测试中,由18杯饮料组成的随机样本得到样本方差是0.40 问题: 如果一个可以接受的方案是方差不超过0.25,根据测试的结果你是否认为该机器不合格?,28,该机器是否合格?,检验假设:H0: 20.25, H1: 20.25; 拒绝域为,29,总体比率的检验,一个例子:Pine Greek高尔夫球场 的性别比率问题。
400个运动者中 100个女性,能否认为女性比率比过去的20%增加了? H0: p0.20, H1: p0.20; 拒绝域的形状: 利用大样本下样本比率的抽样分布得到拒绝域为:,,当=0.05时,拒绝域为 由样本知 ,所以拒绝原假设即女性比率比过去增加了31,总体比率的双边检验,,32,更多的例子,Ford Taurus宣称在高速路上行驶的油耗为30英里/加仑一个保护消费者利益的小组对汽车进行检验从的50次高速路行驶组成的样本中,得到样本平均为29.5英里/加仑,样本标准差为1.8英里/加仑取显著性水平0.01,得出你的结论33,34,,一个快餐店决定计划实施一次特殊供应,使顾客能购买到专门印有著名卡通人物的杯装饮料如果有超过15%的消费者购买这种饮料,则认为可以推行这种特殊供应在某些地方已经进行的初步试验表明,500名消费者有88名购买了这种杯装饮料是否应推行这种特殊杯装饮料?当显著性水平为0.01时,得出你的建议。
