好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

第五章假设检验.ppt

109页
  • 卖家[上传人]:汽***
  • 文档编号:584747584
  • 上传时间:2024-08-31
  • 文档格式:PPT
  • 文档大小:951.50KB
  • / 109 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 第第 六六 章章假假 设设 检检 验验 假设检验就是事先对总体参假设检验就是事先对总体参数或总体分布形式作出一个假设,数或总体分布形式作出一个假设,然后利用样本信息来判断假设是然后利用样本信息来判断假设是否合理,即判断样本信息与假设否合理,即判断样本信息与假设是否有显著差异,从而决定应接是否有显著差异,从而决定应接受或否定假设受或否定假设假设检验(显著性检验):假设检验(显著性检验): 假设检验包括参数假设检验假设检验包括参数假设检验和非参数假设检验和非参数假设检验 1、参数假设检验:、参数假设检验: 2、非参数假设检验:、非参数假设检验: 第一节第一节 假设检验假设检验 的一般问题的一般问题 一、假设检验的基本思想一、假设检验的基本思想是带有概率性质的反证法是带有概率性质的反证法 1、假设检验所采用的逻、假设检验所采用的逻辑推理方法是反证法辑推理方法是反证法 2、假设检验的反证法是、假设检验的反证法是带有概率性质的反证法并非严带有概率性质的反证法并非严格的逻辑证明。

      格的逻辑证明 二、假设检验的步骤二、假设检验的步骤1、提出原假设和备择假设、提出原假设和备择假设原假设原假设 ::研究者想收集证据予以反研究者想收集证据予以反对的假设对的假设备择假设备择假设 :研究者想收集证据予研究者想收集证据予以支持的假设以支持的假设 1.原假设和备择假设是一个完备事件组,而且相互对立n在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立2.先确定备择假设,再确定原假设 3.等号“=”总是放在原假设上 4.因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)提出假设提出假设(结论与建议结论与建议) 1)提出假设的原则(1)“不轻易拒绝原假设”(3)原假设总是与等号连在一起双侧)(2)把所希望证明的假设放在备择假设上单侧) 【【例例】】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整试陈述用来检验生产过程是否正常的原假设和被择假设解解解解解解::::::研研研究究究者者者想想想收收收集集集证证证据据据予予予以以以证证证明明明的的的假假假设设设应应应该该该是是是“ “ “生生生产产产过过过程程程不不不正正正常常常” ” ”。

      建立的原假设和备择假设为建立的原假设和备择假设为建立的原假设和备择假设为 H HH0 0 0 ::::::          10cm 10cm 10cm H HH1 1 1 ::::::          10cm 10cm 10cm 【【例例】】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实试陈述用于检验的原假设与备择假设解解解解解解::::::研研研究究究者者者抽抽抽检检检的的的意意意图图图是是是倾倾倾向向向于于于证证证实实实这这这种种种洗洗洗涤涤涤剂剂剂的的的平平平均均均净净净含含含量量量并并并不不不符符符合合合说说说明明明书书书中中中的的的陈陈陈述述述 建建建立立立的的的原假设和备择假设为原假设和备择假设为原假设和备择假设为 H H H0 0 0 ::::::               500 500 500 H H H1 1 1 ::::::    < 500< 500< 500500g500g •【【例例】】一家研究机构估计,某城市中家庭拥有汽车的比率超过30%。

      为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验试陈述用于检验的原假设与备择假设解:解:解:解:解:解:研究者想收集证据予以支持的假研究者想收集证据予以支持的假研究者想收集证据予以支持的假设是设是设是“ “ “该城市中家庭拥有汽车的比率该城市中家庭拥有汽车的比率该城市中家庭拥有汽车的比率超过超过超过30%”30%”30%”建立的原假设和备择假设建立的原假设和备择假设建立的原假设和备择假设为为为 H H H0 0 0 ::::::       30% 30% 30% H H H1 1 1 ::::::       30%30%30% 假设的三种形式:假设的三种形式: 1、双侧检验:、双侧检验: 左侧检验左侧检验 右侧检验右侧检验 双侧检验与单侧检验 (假设的形式)假假设双双侧检验单侧检验单侧检验左左侧检验右右侧检验原假设原假设H0 : :   =  0 0H0 : :      0 0H0 : :      0 0备择假设备择假设H1 : :   ≠ 0 0H1 : : <  0 0H1 : :   >  0 0 2、选择适当的统计量,并确定、选择适当的统计量,并确定其分布形式其分布形式 3、选择显著性水平、选择显著性水平 ,确定临,确定临界值界值 显著性水平显著性水平 表示表示 为真时拒绝为真时拒绝 的概率,即拒绝原假设的风险。

      的概率,即拒绝原假设的风险 总总是与是与 相对应)相对应) 4、作出统计结论、作出统计结论(比较统计量与比较统计量与临界值的大小)临界值的大小) 5、作出经营管理决策结论、作出经营管理决策结论 三、假设检验的两类错误三、假设检验的两类错误(一)第一类错误(拒真、弃真错误)(一)第一类错误(拒真、弃真错误) 当原假设当原假设 为真,但由于样本的随为真,但由于样本的随机性使样本统计量落入了拒绝区域,机性使样本统计量落入了拒绝区域,这时所作的判断是拒绝原假设这类这时所作的判断是拒绝原假设这类错误称为第一类错误错误称为第一类错误 - 错误)错误)(卖方风险)(卖方风险) 原假设原假设 为不真,但由于样本为不真,但由于样本的随机性使样本统计量落入了接受的随机性使样本统计量落入了接受区域,这时所作的判断是接受原假区域,这时所作的判断是接受原假设这类错误称为第二类错误这类错误称为第二类错误 )(买方风险))(买方风险)(二)第二类错误(二)第二类错误 接受拒绝正确正确 两类错误的概率两类错误的概率 的关系的关系 1、二者互为消长。

      二者互为消长 2、在检验中,对、在检验中,对 的选的选择取决于犯两类错误所要付出的择取决于犯两类错误所要付出的代价通常的做法是先确定代价通常的做法是先确定 3、若要同时减少、若要同时减少 ,或,或给定给定α而使而使β减少,就必须增大样减少,就必须增大样本容量本容量n 4、、 β的大小不仅与临界值有关,的大小不仅与临界值有关,而且还与原假设的参数值而且还与原假设的参数值 与总体参与总体参数的真实值数的真实值 之间的差异大小有关之间的差异大小有关此差异越大,此差异越大, β就越小 5、统计学中把、统计学中把(1-β) 称为检验称为检验功效1-β) 较高,意味着检验做较高,意味着检验做得较好给定得较好给定α的情况下,使的情况下,使β最小最小或或 (1-β) 最大的检验叫做最佳检验最大的检验叫做最佳检验 第二节第二节总体均值、比例和方差的总体均值、比例和方差的假设检验假设检验 (一)正态总体、方差已知 •【【例例】】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。

      取显著性水平=0.05 ,检验该天生产的饮料容量是否符合标准要求?双侧检验双侧检验绿色绿色绿色绿色健康饮品健康饮品绿色绿色绿色绿色健康饮品健康饮品255255255255255255 •H0 ::  = 255•H1 ::    255•  = 0.05•n = 40•临界值临界值检验统计量检验统计量检验统计量检验统计量: :z z0 01.961.96-1.96-1.960.0250.025拒绝拒绝 H H0 0拒绝拒绝 H H0 00.0250.025决策决策决策决策: :结论结论结论结论: : 不拒绝不拒绝H H0 0样样本本提提供供的的证证据据表表明明::该该天天生生产的饮料符合标准要求产的饮料符合标准要求 例题例题1:: 根据过去大量资料,某根据过去大量资料,某厂生产的产品的使用寿命服从正态分厂生产的产品的使用寿命服从正态分布布 现从最近生产的一现从最近生产的一批产品中随机抽取批产品中随机抽取16件,测得样本平件,测得样本平均寿命为均寿命为1080小时试在小时试在0.05的显的显著性水平下判断这批产品的使用寿命著性水平下判断这批产品的使用寿命是否有显著提高是否有显著提高? 习题习题1: 某工厂对废水进行处理,某工厂对废水进行处理,要求处理后的水中某种有毒物质的浓要求处理后的水中某种有毒物质的浓度不超过度不超过19毫克毫克/立升。

      现抽取立升现抽取n=10的样本,得到平均浓度为的样本,得到平均浓度为17.1毫克毫克/立升,假设有毒物质的含量服从正态立升,假设有毒物质的含量服从正态分布,且已知总体方差为分布,且已知总体方差为8.5(毫克毫克/立升立升) ,问在,问在 显著性水平下,显著性水平下,处理后的水是否合格处理后的水是否合格? Z - 检验二、大样本 •【【例例】】一种机床加工的零件尺寸绝对平均误差为1.35mm生产厂家现采用一种新的机床进行加工以期进一步降低误差为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验利用这些样品数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低? (=0.005) 左侧检验左侧检验50个零件尺寸的误差数据个零件尺寸的误差数据 (mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86 •H0 ::     1.35•H1 ::   < 1.35•  = 0.005•n = 50•临界值临界值检验统计量检验统计量检验统计量检验统计量: : 拒绝拒绝H H0 0新新机机床床加加工工的的零零件件尺尺寸寸的的平平均均误误差与旧机床相比有显著降低差与旧机床相比有显著降低决策决策决策决策: :结论结论结论结论: :-2.58-2.58z z0 0拒绝拒绝H H0 00.0050.005 例题例题2: 一个生产宇航飞行器的工一个生产宇航飞行器的工厂需要经常购买一种耐高温的零件,厂需要经常购买一种耐高温的零件,要求抗热的平均温度是要求抗热的平均温度是 ,在,在过去,供货商提供的产品都符合要求,过去,供货商提供的产品都符合要求,并从大量的数据获知零件抗热的标准并从大量的数据获知零件抗热的标准差为差为 ,在最近的一批进货中随,在最近的一批进货中随机测试了机测试了100个零件,其平均的抗热个零件,其平均的抗热为为 能否认为这批产品不合格能否认为这批产品不合格?工厂希望对实际产品符合要求而错误工厂希望对实际产品符合要求而错误地加以拒绝的风险为地加以拒绝的风险为0.05。

      习题习题2: 某种导线要求其平均拉力某种导线要求其平均拉力强度为强度为1200公斤,一批产品在出厂时公斤,一批产品在出厂时抽取了抽取了100个作样本,测试结果平均个作样本,测试结果平均拉力强度为拉力强度为1150公斤,标准差为公斤,标准差为230公斤,若以公斤,若以 能否认为这批产品能否认为这批产品的平均拉力强度低于的平均拉力强度低于1200公斤?公斤? 习题习题3: 一个食品加工者关心一个食品加工者关心500克的切片菠萝罐头是否装得太克的切片菠萝罐头是否装得太满质量部门随机抽取了一个容量满质量部门随机抽取了一个容量为为50的随机样本,发现平均重量是的随机样本,发现平均重量是510克,样本标准差是克,样本标准差是8克试根据克试根据5%的显著性水平的显著性水平 检验切片菠萝罐检验切片菠萝罐头是否装得太满?头是否装得太满? 三、正态总体、方差未知、小样本t-检验 •【【例例】】一种汽车配件的平均长度要求为12cm,高于或低于该标准均被认为是不合格的汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。

      现对一个配件提供商提供的10个样品进行了检验假定该供货商生产的配件长度服从正态分布,在0.05的显著性水平下,检验该供货商提供的配件是否符合要求? 10个零件尺寸的长度个零件尺寸的长度 (cm)12.210.812.011.811.912.411.312.212.012.3 •H0 ::   = 12•H1 ::     12•  = 0.05•df = 10 - 1 = 9•临界值临界值检验统计量检验统计量检验统计量检验统计量: : 不拒绝不拒绝H H0 0该供货商提供的零件符合要求该供货商提供的零件符合要求 决策:决策:决策:决策:结论:结论:结论:结论:t t0 02.2622.262-2.262-2.2620.0250.025拒绝拒绝 H H0 0拒绝拒绝 H H0 00.0250.025 例题例题3: 某厂采用自动包装机分装某厂采用自动包装机分装产品,假定每包产品的重量服从正态产品,假定每包产品的重量服从正态分布,每包标准重量为分布,每包标准重量为1000克某日随机抽查随机抽查9包,测得样本平均重量为包,测得样本平均重量为986克,样本标准差为克,样本标准差为24克。

      试问在克试问在0.05的检验水平上,的检验水平上, 能否认为这天自能否认为这天自动包装机工作正常动包装机工作正常? 习题习题4:一个:一个 轮胎制造厂声称它轮胎制造厂声称它的轮胎在正常行驶的条件下平均行驶的轮胎在正常行驶的条件下平均行驶里程至少在里程至少在40000公里以上,通常已公里以上,通常已知轮胎在正常行驶的条件下,其行驶知轮胎在正常行驶的条件下,其行驶里程数服从正态分布某一推销商要里程数服从正态分布某一推销商要随机抽取随机抽取15个轮胎作试验,经过测试个轮胎作试验,经过测试得到平均行驶里程为得到平均行驶里程为42000公里,标公里,标准差为准差为5000公里,若显著性水平公里,若显著性水平 ,, 能否从这些样本数据使该轮胎制造能否从这些样本数据使该轮胎制造厂的声称得到证实厂的声称得到证实 习题习题5:某乡统计员报告,其乡:某乡统计员报告,其乡平均每个农户的家庭年收入为平均每个农户的家庭年收入为5000元,为核实其说法,县统计局从该元,为核实其说法,县统计局从该乡随机抽取乡随机抽取25户,得到平均年收入户,得到平均年收入为为4650元,标准差为元,标准差为150元,假定元,假定农户的家庭年收入服从正态分布。

      农户的家庭年收入服从正态分布试在试在5%的显著性水平的显著性水平 下检验乡统下检验乡统计员报告是否正确计员报告是否正确 习题习题6: 某厂生产的一种金属线,某厂生产的一种金属线,其抗拉强度的均值为其抗拉强度的均值为10620千克据说经过工艺改进后其抗拉强度有所提说经过工艺改进后其抗拉强度有所提高为检验,从新生产的产品中随机高为检验,从新生产的产品中随机抽取了抽取了10根,测得平均抗拉强度为根,测得平均抗拉强度为10631千克,标准差为千克,标准差为81千克,设抗千克,设抗拉强度服从正态分布,问:在拉强度服从正态分布,问:在 的显著性水平的显著性水平 下,可否认为抗拉强度下,可否认为抗拉强度比过去提高了?比过去提高了? 三、总体比例的假设检验 对总体比例的假设检验通常是对总体比例的假设检验通常是在大样本的条件下进行的,根据正在大样本的条件下进行的,根据正态分布来确定临界值,即采用态分布来确定临界值,即采用Z-检检验验法 •【【例例】】一种以休闲和娱乐为主题的杂志,声称其读者群中有80%为女性为验证这一说法是否属实,某研究部门抽取了由200人组成的一个随机样本,发现有146个女性经常阅读该杂志。

      分别取显著性水平  =0.05和 =0.01 ,检验该杂志读者群中女性的比率是否为80%?它们的值各是多少?双侧检验双侧检验 •H0 ::  = 80%•H1 ::    80%•  = 0.05•n = 200•临界值临界值(c):检验统计量检验统计量检验统计量检验统计量: :拒绝拒绝H H0 0 ( (P P = 0.013328 <= 0.013328 <     = 0.05) = 0.05)该杂志的说法并不属实该杂志的说法并不属实 决策决策决策决策: :结论结论结论结论: :z z0 01.961.96-1.96-1.960.0250.025拒绝拒绝 H H0 0拒绝拒绝 H H0 00.0250.025 例题例题4: 某研究者估计本市某研究者估计本市居民家庭的电脑拥有率为居民家庭的电脑拥有率为80%现随机抽查了现随机抽查了200个家庭,其个家庭,其中中168个家庭拥有电脑试问个家庭拥有电脑试问该研究者的估计是否可信(该研究者的估计是否可信( )?)? 习题习题7: 某机构声称某机构声称5年来各年来各种新发行债券的承销价高于面值种新发行债券的承销价高于面值的比例没有超过的比例没有超过50%。

      为检验此为检验此说法,随机抽选了说法,随机抽选了60只新发行债只新发行债券,其中有券,其中有24只的承销价高于面只的承销价高于面值,试以值,试以 的显著性水平的显著性水平 进进行检验 习题习题8:某西红柿酱生产厂向供应:某西红柿酱生产厂向供应商购买一批西红柿,规定若优质西红商购买一批西红柿,规定若优质西红柿的比例在柿的比例在40%以上按一般市场价格以上按一般市场价格收购,若达不到此标准,应低于市场收购,若达不到此标准,应低于市场价格收购,现随机抽取了价格收购,现随机抽取了100个西红个西红柿作检验,只有柿作检验,只有34个优质西红柿,样个优质西红柿,样本比例本比例 因而欲按低于市场价因而欲按低于市场价格收购,但供应商认为样本比例格收购,但供应商认为样本比例 不到不到40%是随机原因引起的,试以是随机原因引起的,试以 的显著性水平的显著性水平 进行检验进行检验 习题习题9:某公司收购一塑料厂生产的:某公司收购一塑料厂生产的防水手套,为了保证质量,允许次品率为防水手套,为了保证质量,允许次品率为10%,双方协议如下:每次收购时,抽样,双方协议如下:每次收购时,抽样检验检验100副手套,规定犯第一类错误的概副手套,规定犯第一类错误的概率为率为5%,当次品率超过临界值时,就要,当次品率超过临界值时,就要拒收。

      按此协议:拒收按此协议: 1、假设检验中如何建立原假设和备择、假设检验中如何建立原假设和备择假设假设 2、次品比例拒收的临界值是多少、次品比例拒收的临界值是多少? 3、若有、若有6批产品,它们的次品比批产品,它们的次品比例分别为例分别为12%,,25%,,8%,,16%,,24%和和21%,哪些批应该拒收?,哪些批应该拒收? 4、在这样的检验中,什么情况、在这样的检验中,什么情况属于犯第二类错误?属于犯第二类错误? 5、若检验的规则改为检验、若检验的规则改为检验10副副手套,发现次品在两副或两副以上时手套,发现次品在两副或两副以上时拒收,这时犯第一类错误的概率是多拒收,这时犯第一类错误的概率是多少少? 3、、12%<14% 8%<14%接收接收 25%>14% 16%>14%24%>14% 21%>14%拒收拒收 4、当、当 10%,而接收时,属于,而接收时,属于犯第二类错误犯第二类错误 5、设、设10副手套中次品数为副手套中次品数为X,则,则犯第一类错误的概率是:当犯第一类错误的概率是:当P=0.1时时: 四、正态总体方差的假设检验假设的三种形式: 检验统计量及其分布:检验统计量及其分布: 例题:例题:P120~6.5 习题习题:某电工器材厂生产一种某电工器材厂生产一种保险丝,保险丝的熔化时间服从保险丝,保险丝的熔化时间服从正态分布,按规定,熔化时间的正态分布,按规定,熔化时间的方差不得超过方差不得超过400。

      今从一批产品今从一批产品中随机抽取中随机抽取25个样品,测得熔化个样品,测得熔化时间的方差为时间的方差为410问在显著性水问在显著性水平平 0.05条件下,能认为这批产品条件下,能认为这批产品的方差显著偏大吗的方差显著偏大吗? 第三节第三节 假设检验中的其它问题假设检验中的其它问题一、区间估计与假设检验的关系一、区间估计与假设检验的关系 1、抽样估计与假设检验都、抽样估计与假设检验都是统计推断的重要内容两者可是统计推断的重要内容两者可以相互转换区间估计的置信以相互转换区间估计的置信区间对应于假设检验中的接受区区间对应于假设检验中的接受区域)域) 2、区间估计是以估计值为、区间估计是以估计值为中心的双侧置信区间;假设检验中心的双侧置信区间;假设检验有双侧检验,也有单侧检验有双侧检验,也有单侧检验 3、区间估计立足于大概率,假设检验立足于小概率 (二)假设检验中的(二)假设检验中的P值值 不同样本得出的检验统计量的值不同样本得出的检验统计量的值不同,即使都落在相同的区域,所下不同,即使都落在相同的区域,所下的结论相同,但检验的把握程度实际的结论相同,但检验的把握程度实际上是不同的。

      上是不同的 通常把通常把“在现有样本的条件下,在现有样本的条件下,拒绝原假设的最小显著性水平拒绝原假设的最小显著性水平”称为假设检验中的称为假设检验中的P值 已知已知Z,求,求 的过程 补:两个总体均值或比例之差的假设检验(一)两个总体为正态总体,方差已知或大样本 一个新建的超市在选择位置时需一个新建的超市在选择位置时需考虑许多因素,因素之一是有关周围考虑许多因素,因素之一是有关周围居民购买力,现有居民购买力,现有A,,B两地可供选择,两地可供选择,A地的建筑费用较地的建筑费用较B地低,如果两地居地低,如果两地居民的平均收入相同,就在民的平均收入相同,就在A地建筑,地建筑,但若但若B地居民的平均收入高于地居民的平均收入高于A地则选地则选在在B 地建筑现从两地居民户中各抽地建筑现从两地居民户中各抽取了取了100户居民调查,计算其收入水户居民调查,计算其收入水平 A地年平均收入地年平均收入28650元,从其它元,从其它方面获知总体标准差方面获知总体标准差4746元,元,B地年地年平均收入平均收入29980元,从其它方面获知元,从其它方面获知总体标准差总体标准差5365元。

      用元用 的的显著性水平推断显著性水平推断B地居民的收入水平地居民的收入水平是否显著高于是否显著高于A地?地? 。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.