好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

统计学--假设检验课件.ppt

99页
  • 卖家[上传人]:壹****1
  • 文档编号:591102371
  • 上传时间:2024-09-16
  • 文档格式:PPT
  • 文档大小:937KB
  • / 99 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 统计学统计学第7章 假设检验 ……正如一个法庭宣告某一判决为“无罪(not guilty)”而不为“清白(innocent)”,统计检验的结论也应为“不拒绝”而不为“接受” ——Jan Kmenta——Jan Kmenta统计名言统计名言 案例案例•辛普森杀妻案 •辛普森案 (英语:O. J. Simpson murder caseO. J. Simpson murder case,又称加利福尼亚人民诉辛普森案,英语:People v.SimpsonPeople v.Simpson)是美国加利福尼亚州最高法院对前美式橄榄球明星、演员O•J•O•J•辛普森进行的刑事诉讼,在该案中,辛普森被指控于19941994年犯下两宗谋杀罪,受害人为其前妻妮克尔• •布朗• •辛普森及其好友罗纳德• •高曼该案被称为是美国历史上最受公众关注的刑事审判案件。

      •案发时间,1994年6月12日深夜•案发后凌晨,辛普森门外有血迹•现场滴落的血痕中有辛普森的血,辛普森家中血手套和辛普森的脏衣服都有被害人的血 法庭战争检方的““铁证如山””与““梦幻律师团”•在检方看来在检方看来,本案可谓是,本案可谓是““铁证如山铁证如山””,本案中无论是证据数,本案中无论是证据数量,还是证据的可信程度,在检方看来,都达到了很高的标准量,还是证据的可信程度,在检方看来,都达到了很高的标准 控辩双方几个关键的地方• 控方:检方在审判的最初几周出示证据,证明辛普森曾有对妮可尔的家庭暴力史•辩方:时遭受丈夫家庭暴力中,遭受丈夫伤害的概率为1%1% •控方:鞋码与辛普森的相似,辛普森手上有划痕•辩方:世界上与辛普森鞋码一样的人数不胜数,在左手有伤痕的人也不尽其数,所以这样的证据对案件的判断是没有任何价值的 •控方:在犯罪现场发现的血液,DNADNA鉴定发现与辛普森是完全一致的,而DNADNA鉴定两个人一致的可能性只有万分之•辩方:在洛杉矶300300万人口中,就有300300个人DANDAN一致,辛普森是洛杉矶人口的1 1人,所以,辛普森是杀人凶手的概率只有0.03%0.03%。

      如果认为新浦森有罪的话,那么误判的概率将高达99.97%.99.97%.•最终无罪释放 •控方:平时遭受丈夫家庭暴力中,非正常死亡的,其凶手为丈夫的概率为80%80%•控方:可能会有很多与辛普森鞋码一样的人,但也会有很多左手有划痕的人,但辛普森是一个嫌疑犯, 不能把他放在所有的人当中去进行归类,于是只能放在嫌疑犯中,在嫌疑犯中,跟辛普森鞋码吻合的人的概率非常之小 法庭宣判过程•法官假定辛普森无罪————控方搜集证据证明他有罪,只有当证据充足的时候才能宣判有罪,否则要接受法官的假定 辛浦森(Simpson's Paradox)悖论案例1: 是否存在种族歧视被告种族受害者种族死刑判决是否白人白人19132 黑人09黑人白人1152 黑人697160160160166166166 363636290 290 290 326326326 总的看总的看, 白人有白人有19/160=12% 的被告被判处死刑的被告被判处死刑, 与与之对应之对应, 黑人只有黑人只有17/166=10% 的被告被判死刑的被告被判死刑, 白人死白人死刑率要高一些刑率要高一些. 但如果考虑受害者的种族但如果考虑受害者的种族, 结论就相反了结论就相反了. 当受害者是白人时当受害者是白人时, 有有11/63=17.5% 的黑人被告被判死的黑人被告被判死刑刑, 而只有而只有 19/151=12.6% 的白人被告被判死刑的白人被告被判死刑. 当受害当受害者是黑人时者是黑人时, 白人被告没一个人白人被告没一个人( 0%)被判死刑被判死刑, 而黑人而黑人被告确有被告确有 6/103=5.8% 的被判死刑的被判死刑. •控方:DNA鉴定•辩方:把辛普森至于300万人群当中,但新浦是是嫌疑犯,所以应把他放在嫌疑犯这个人群中,那么样本与他一致的也就他一个人 综上,只有辛普森一个人符合三个条件 第 7 7 章 假设检验7 7.1.1 假设检验的基本问题 7 7.2.2 一个总体参数的检验 学习目标 1.1.理解假设检验的基本思想和基本步骤 ; 2. 2.理解假设检验的两类错误及其关系; 3. 3.熟练掌握一个总体平均数、总体成数各种假设检验方法; 4. 4.利用P P - - 值进行假设检验。

      l用ExcelExcel进行检验 假设检验知识结构总体参数检总体参数检验验一个总体一个总体一个总体一个总体两个总体两个总体两个总体两个总体均值均值比例比例方差方差均值差均值差比例差比例差方差比方差比独立样本独立样本匹配样本匹配样本大样本大样本F F检验检验Z Z检验检验大样本大样本小样本小样本Z Z检验检验 1 12 2 2 22 2已知已知 1 12 2 2 22 2未知未知Z Z检验检验t t检验检验大样本大样本小样本小样本Z Z检验检验 2 2已知已知Z Z检验检验 2 2未知未知t t检验检验Z Z检验检验卡方检验卡方检验 7.1 假设检验的基本原理假设检验的基本原理 7.1.1 怎样提出假设?怎样提出假设? 7.1.2 怎样做出决策?怎样做出决策? 7.1.3 怎样表述决策结果?怎样表述决策结果?第 7 章 假设检验 7.1.1 怎样提出假设?7.1 假设检验的基本原理假设检验的基本原理 1.1.什么是假设?•假设:定义为一个调研者或管理者对被调查总体的某些特征所做的一种假定或猜想是对是对总体参数的一种假设总体参数的一种假设。

      §常见的是对总体均值或比例和方差的检验;§在分析之前,被检验的参数将被假定取一确定值我认为到KFC消费的人平均花费2.5美元! 2、、市场调研中常见的假设检验问题市场调研中常见的假设检验问题§一项跟踪调查的结果表明,顾客对产品的了解程度比一项跟踪调查的结果表明,顾客对产品的了解程度比6个月个月前所做的类似调查中的显示要低结果是否明显降低?是前所做的类似调查中的显示要低结果是否明显降低?是否低到需要改变广告策略的程度?否低到需要改变广告策略的程度?§ 一位产品经理认为其产品购买者的平均年龄为一位产品经理认为其产品购买者的平均年龄为35岁为检验其假设,他进行了一项调查,调查表明购买者平均年龄验其假设,他进行了一项调查,调查表明购买者平均年龄为为38.5岁调查结果与其观点的差别是够足以说明此经理里岁调查结果与其观点的差别是够足以说明此经理里的观点是不正确的的观点是不正确的? 3、问题在哪里? 某广告商宣称其代理的A产品的合格率达到99%,质检人员为了验证,随机抽取了一件产品,发现是一件次品质检人员会是什么反应呢? 什么是假设检验? ? ( (hypothesis testhypothesis test) )1.1.先对总体的参数( (或分布形式) )提出某种假设,然后利用样本信息判断假设是否成立的统计方法2.2.有参数检验和非参数检验3.3.逻辑上运用反证法,统计上依据小概率原理–小概率是在一次试验中,一个几乎不可能发生的事件发生的概率–在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设 原假设(null hypothesis)(null hypothesis)1.1.又称““0 0假设””,研究者想收集证据予以反对的假设,用H H0 0表示2.2.所表达的含义总是指参数没有变化或变量之间没有关系 3.3.最初被假设是成立的,之后根据样本数据确定是否有足够的证据拒绝它 4.4.总是有符号  , ,   或  –H H0 0 :   = = 某一数值–H H0 0 :     某一数值–H H0 0 :    某一数值l例如, , H H0 0 :     10cm10cm 1.1.也称““研究假设””, ,研究者想收集证据予以支持的假设,用H H1 1或H Ha a表示2.2.所表达的含义是总体参数发生了变化或变量之间有某种关系3.3.备择假设通常用于表达研究者自己倾向于支持的看法,然后就是想办法收集证据拒绝原假设,以支持备择假设 4.4.总是有符号  , ,   或  –H H1 1 :   某一数值–H H1 1 :   某一数值–H H1 1 :  < <某一数值备择假设备择假设(alternative hypothesis) •【例】一种零件的生产标准是直径应为10cm10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。

      如果零件的平均直径大于或小于10cm10cm,则表明生产过程不正常,必须进行调整试陈述用来检验生产过程是否正常的原假设和被择假设提出假设提出假设(例题分析例题分析)解解解解::::研研研研究究究究者者者者想想想想收收收收集集集集证证证证据据据据予予予予以以以以证证证证明明明明的的的的假假假假设设设设应应应应该该该该是是是是“ “生生生生产产产产过程不正常过程不正常过程不正常过程不正常” ”建立的原假设和备择假设为建立的原假设和备择假设为建立的原假设和备择假设为建立的原假设和备择假设为 H H0 0 ::::         10cm 10cm H H1 1 ::::         10cm 10cm •【例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500500克从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实试陈述用于检验的原假设与备择假设提出假设提出假设(例题分析例题分析)解解解解::::研研研研究究究究者者者者抽抽抽抽检检检检的的的的意意意意图图图图是是是是倾倾倾倾向向向向于于于于证证证证实实实实这这这这种种种种洗洗洗洗涤涤涤涤剂剂剂剂的的的的平平平平均均均均净净净净含含含含量量量量并并并并不不不不符符符符合合合合说说说说明明明明书书书书中中中中的的的的陈陈陈陈述述述述 。

      建建建建立立立立的的的的原原原原假假假假设设设设和和和和备备备备择择择择假设为假设为假设为假设为 H H0 0 ::::            500 500 H H1 1 ::::     < 500< 500 •【例】一家研究机构估计,某城市中家庭拥有汽车的比例超过30%30%为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验试陈述用于检验的原假设与备择假设提出假设提出假设(例题分析例题分析)解:研究者想收集证据予以支持的假设是解:研究者想收集证据予以支持的假设是解:研究者想收集证据予以支持的假设是解:研究者想收集证据予以支持的假设是“ “该该该该城市中家庭拥有汽车的比例超过城市中家庭拥有汽车的比例超过城市中家庭拥有汽车的比例超过城市中家庭拥有汽车的比例超过30%30%” ”建立的原假设和备择假设为原假设和备择假设为原假设和备择假设为原假设和备择假设为 H H0 0 ::::         30% 30% H H1 1 ::::         30%30% 提出假设 总结•H H0 0: : 通常是将研究者不愿相信的、不认可的、想拒绝的结论•H H0 0 :   = = 某一数值–H H0 0 :     某一数值–H H0 0 :    某一数值H H1 1: :与原假设是对立的,通常是研究者想要支持的、愿意相信的结果–H H1 1 :   某一数值–H H1 1 :   某一数值–H H1 1 :  < <某一数值1.1.先确定备择假设,再确定原假设–原假设和备择假设必有一个成立,而且只有一个成立2.2. 等号只能出现在原假设里3.3.因研究目的不同,对同一问题可能提出不同的假设( (也可能得出不同的结论) ) 1.1.备备择择假假设设没没有有特特定定的的方方向向性性,,并并含含有有符符号号““ ””的的假假设设检检验验,,称为双侧检验或双尾检验称为双侧检验或双尾检验(two-tailed test) (two-tailed test) 2.2.备备择择假假设设具具有有特特定定的的方方向向性性,,并并含含有有符符号号““> >””或或““< <””的的假假设检验,称为单侧检验或单尾检验设检验,称为单侧检验或单尾检验(one-tailed test)(one-tailed test)–备择假设的方向为备择假设的方向为““< <””,称为,称为左侧检验左侧检验 –备择假设的方向为备择假设的方向为““> >””,称为,称为右侧检验右侧检验 双侧检验与单侧检验双侧检验与单侧检验 双侧检验与单侧检验 ( (假设的形式) )假假设双双侧检验单侧检验左左侧检验右右侧检验原假设H H0 0: :  = = 0 0H H0 0: :    0 0H H0 0: :    0 0备择假设H H1 1: :  ≠≠ 0 0H H1 1: : < < 0 0H H1 1: :  > > 0 0以总体均值的检验为例以总体均值的检验为例以总体均值的检验为例以总体均值的检验为例 7.1.2 怎样做出决策?7.1 假设检验的基本原理假设检验的基本原理 假设检验的步骤•1.提出原假设H0和备择假设H1•2.构造适当的检验统计量•3.给定显著性水平  0.01, 0.05, 0.100.01, 0.05, 0.10•4.计算检验统计量的值•5.做出判断 假设检验的基本思想......... 因此我们拒绝假因此我们拒绝假因此我们拒绝假因此我们拒绝假设设设设     = 50= 50... ...... 如果这是总体的如果这是总体的如果这是总体的如果这是总体的假设均值假设均值假设均值假设均值样本均值样本均值    = 50= 50抽样分布抽样分布抽样分布抽样分布H H H0 00这个值不像我们应这个值不像我们应这个值不像我们应这个值不像我们应该得到的样本均值该得到的样本均值该得到的样本均值该得到的样本均值 ......202020 两类错误与显著性水平(了解)1.1.研究者总是希望能做出正确的决策,但由于决策是建立在样本信息的基础之上,而样本又是随机的,因而就有可能犯错误2.2.原假设和备择假设不能同时成立,决策的结果要么拒绝H H0 0,要么不拒绝H H0 0。

      决策时总是希望当原假设正确时没有拒绝它,当原假设不正确时拒绝它,但实际上很难保证不犯错误 3.3.第ⅠⅠ类错误( ( 错误) )–原假设为正确时拒绝原假设–第ⅠⅠ类错误的概率记为 ,被称为显著性水平•2.2. 第ⅡⅡ类错误( ( 错误) )–原假设为错误时未拒绝原假设–第ⅡⅡ类错误的概率记为  (Beta)(Beta)   显著性水平  ( (significant levelsignificant level) )1.1.事先确定的用于拒绝原假设H H0 0时所必须的证据2.2.能够容忍的犯第ⅠⅠ类错误的最大概率( (上限值) )•2.2.原假设为真时,拒绝原假设的概率– 抽样分布的拒绝域•3.3.表示为   (alpha)(alpha)– 常用的   值有0.01, 0.05, 0.100.01, 0.05, 0.10•4.4.由研究者事先确定   错误和   错误的关系  你不能同时减少两你不能同时减少两类错误类错误!   和和和和   的关系就像翘翘的关系就像翘翘的关系就像翘翘的关系就像翘翘板,板,板,板,   小小小小   就大,就大,就大,就大,      大大大大   就小就小就小就小 依据什么做出决策?1.1.若若假假设设为为H H0 0=500=500,, H H1 1<500<500。

      样样本本均均值值为为495495,,拒拒绝绝H H0 0吗?样本均值为吗?样本均值为502502,拒绝,拒绝H H0 0吗?吗?2.2.做出拒绝或不拒绝原假设的依据是什么?做出拒绝或不拒绝原假设的依据是什么?3.3.传传统统上上,,做做出出决决策策所所依依据据的的是是样样本本统统计计量量,,现现代代检检验验中中人人们们直直接接使使用用由由统统计计量量算算出出的的犯犯第第ⅠⅠ类类错错误误的的概概率率,,即所谓的即所谓的P P值值 1.1.根根据据样样本本观观测测结结果果计计算算出出对对原原假假设设和和备备择择假假设设做做出出决决策策某某个个样样本统计量本统计量2.2.对样本估计量的标准化结果对样本估计量的标准化结果–原假设原假设H H0 0为真为真–点估计量的抽样分布点估计量的抽样分布 检验统计量检验统计量(test statistic)3.3. 标准化的检验统计量标准化的检验统计量 用统计量决策( (双侧检验 ) )H H1 1: :  ≠≠ 0 0,I I统计量I > I > 临界值,拒绝H H0 0抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布H HH000临界值临界值临界值临界值临界值临界值   /2 /2      /2 /2 /2 拒绝拒绝拒绝H HH000拒绝拒绝拒绝H HH0001 - 1 - 1 -      置信水平置信水平置信水平置信水平置信水平置信水平Region of RejectionRegion of RejectionRegion of RejectionRegion of NonrejectionRegion of NonrejectionRegion of NonrejectionRegion of RejectionRegion of RejectionRegion of Rejection 用统计量决策(左侧检验 )H H1 1: : < < 0 0,统计量 < - < -临界值,拒绝H H0 0抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布H HH000临界值临界值临界值     拒绝拒绝拒绝H HH0001 - 1 - 1 -      置信水平置信水平置信水平置信水平置信水平置信水平Region of RejectionRegion of RejectionRegion of RejectionRegion of NonrejectionRegion of NonrejectionRegion of Nonrejection 用统计量决策(右侧检验 )H H1 1: :  > > 0 0,统计量 > > 临界值,拒绝H H0 0抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布H HH000临界值临界值临界值 拒绝拒绝拒绝H HH0001 - 1 - 1 -      置信水平置信水平置信水平置信水平置信水平置信水平Region of NonrejectionRegion of NonrejectionRegion of NonrejectionRegion of RejectionRegion of RejectionRegion of Rejection      统计量决策规则统计量决策规则1.1.给定显著性水平 ,查表得出相应的临界值z 或z /2 /2, t 或t /2 /22.2.将检验统计量的值与  水平的临界值进行比较3.3.作出决策–双侧检验:H H1 1: :  ≠≠ 0 0,I I统计量I > I > 临界值,拒绝H H0 0, 3 3> >1.961.96,拒绝,拒绝–左侧检验:H H1 1: : < < 0 0,统计量 < - < -临界值,拒绝H H0 0, -3<--3<-1.961.96,拒绝,拒绝–右侧检验:H H1 1: :  > > 0 0, ,统计量 > > 临界值,拒绝H H0 0, , 3 3> >1.961.96,拒绝,拒绝当单侧检验时,只要统计量与z 或 t 大小比较方向与备择假设符合一致时,拒绝拒绝不过,总而言之,无论是哪一种检验形式,只要I I统计量I > I > 临界值,拒绝H H0 0 用P P 值决策 软件操作中的sig.sig.即为P P值 (P-value)1.1.如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率,也就是我们拒绝原假设面临的风险•P P值告诉我们:如如果果原原假假设设是是正正确确的的话话,,我我们们得得到到得得到到目目前前这这个个样样本本数数据据的的可可能能性性有有多多大大,,如果这个可能性很小,就应该拒绝原假设如果这个可能性很小,就应该拒绝原假设 2.2.被称为观察到的( (或实测的) )显著性水平3.3.决策规则:若p p值< < , , 拒绝 H H0 0,即即是是说说,,拒拒绝绝原原假假设设犯犯弃弃真真错错误误的的风风险险比比事事先先假假定定的的风风险险 还还小小,,所以拒绝原假设也无妨。

      所以拒绝原假设也无妨 双侧检验的P 值      / / 2 2       / / 2 2 Z Z拒绝拒绝拒绝拒绝H H0 0拒绝拒绝拒绝拒绝H H0 00 0 0临界值临界值临界值计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量临界值临界值临界值1/2 1/2 1/2 P P P 值值值1/2 1/2 1/2 P P P 值值值 左侧检验的P 值   Z Z拒绝拒绝拒绝拒绝H H0 00 0 0临界值临界值临界值计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量1/2 1/2 1/2 P P P 值值值 右侧检验的P 值   Z Z拒绝拒绝拒绝拒绝H H0 00 0 0计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量临界值临界值临界值1/2 1/2 1/2 P P P 值值值 1.用P值进行检验比根据统计量检验提供更多的信息2.统计量检验是我们事先给出的一个显著性水平,以此为标准进行决策,无法知道实际的显著性水平究竟是多少–比比如如,,根根据据统统计计量量进进行行检检验验时时,,只只要要统统计计量量的的值值落落在在拒拒绝绝域域,,我我们们拒拒绝绝原原假假设设得得出出的的结结论论都都是是一一样样的的,,即即结结果果显显著著。

      但但实实际际上上,,统统计计量量落落在在拒拒绝绝域域不不同同的的地地方方,,实实际际的的显显著著性性是是不不同同的的比比如如,,统统计计量量落落在在临临界界值值附附近近与与落落在在远远离离临临界界值值的的地地方方,,实实际际的的显显著著性性就就有有较较大大差差异异而而P P值值给给出出的的是是实际算出的显著水平,它告诉我们实际的显著性水平是多少实际算出的显著水平,它告诉我们实际的显著性水平是多少P 值决策与统计量的比较值决策与统计量的比较 拒绝拒绝拒绝拒绝H H0 0P 值决策与统计量的比较拒绝拒绝拒绝拒绝拒绝拒绝H HH0 00的两个统计量的不同显著性的两个统计量的不同显著性的两个统计量的不同显著性的两个统计量的不同显著性的两个统计量的不同显著性的两个统计量的不同显著性   Z Z拒绝拒绝拒绝拒绝H H0 00 0 0统计量统计量统计量统计量统计量统计量1 11 P PP1 11 值值值统计量统计量统计量统计量统计量统计量2 22 P PP2 22 值值值拒绝拒绝拒绝拒绝H H0 0临界值临界值临界值临界值临界值临界值 7 7.1.3 .1.3 怎样表述决策结果?7.1 假设检验的基本原理假设检验的基本原理 假设检验不能证明原假设正确1.假设检验的目的主要是收集证据拒绝原假设,而支持你所倾向的备择假设2.假设检验只提供不利于原假设的证据。

      因此,当拒绝原假设时,表明样本提供的证据证明它是错误的,当没有拒绝原假设时,我们也没法证明它是正确的,因为假设检验的程序没有提供它正确的证据–这与法庭上对被告的定罪类似:先假定被告是无罪的,直到你有足够的证据证明他是有罪的,否则法庭就不能认定被告有罪当证据不足时,法庭的裁决是“被告无罪”,但这里也没有证明被告就是清白的 假设检验不能证明原假设正确1.假设检验得出的结论都是根据原假设进行阐述的–我们要么拒绝原假设,要么不拒绝原假设我们要么拒绝原假设,要么不拒绝原假设2.当不能拒绝原假设时,我们也从来不说“接受原假设”,因为没有证明原假设是真的–采用采用““接受接受””原假设的说法,则意味着你证明了原假设是正确的原假设的说法,则意味着你证明了原假设是正确的3.没有足够的证据拒绝原假设并不等于你已经“证明”了原假设是真的,它仅仅意为着目前还没有足够的证据拒绝原假设,只表示手头上这个样本提供的证据还不足以拒绝原假设–比如,在例6.2中,如果拒绝原假设,表明样本提供的证据证明该品牌洗涤剂的净含量与说明书所标识的不相符如果不拒绝原假设,只能说这个样本提供的证据还不足证明净含量不是500克或500克以上,并不等于证明了净含量就超过了500克4.“不拒绝”的表述方式实际上意味着没有得出明确的结论 假设检验不能证明原假设正确1.“接受”的说法有时会产生误导–这种说法似乎暗示着原假设已经被证明是正确的了–实事上,H0的真实值我们永远也无法知道,不知道真实值是什么,又怎么能证明它是什么?–H0只是对总体真实值的一个假定值,由样本提供的信息也就自然无法证明它是否正确2.采用“不拒绝”的表述方法更合理一些,因为这种表述意味着样本提供的证据不够强大,因而没有足够的理由拒绝,这不等于已经证明原假设正确 假设检验不能证明原假设正确•【例】比如原假设为H0:=10,从该总体中抽出一个随机样本,得到x=9.8,在=0.05的水平上,样本提供的证据没有推翻这一假设,我们说“接受”原假设,这意为着样本提供的证据已经证明=10是正确的。

      如果我们将原假设改为H0:=10.5,同样,在=0.05的水平上,样本提供的证据也没有推翻这一假设,我们又说“接受”原假设但这两个原假设究竟哪一个是“真实的”呢?其人弗能应也 假设检验不能证明原假设正确1.假设检验中通常是先确定显著性水平,这就等于控制了第Ι类错误的概率,但犯第Ⅱ类错误的概率却是不确定的2.在拒绝H0时,犯第Ⅰ类错误的概率不超过给定的显著性水平,当样本结果显示没有充分理由拒绝原假设时,也难以确切知道第Ⅱ类错误发生的概率3.采用“不拒绝”而不采用“接受”的表述方式,在多数场合下便避免了错误发生的风险–因为“接受”所得结论可靠性将由第Ⅱ类错误的概率来测量,而的控制又相对复杂,有时甚至根本无法知道的值,除非你能确切给出 ,否则就不宜表述成“接受”原假设 假设检验不能证明原假设正确• 在实际检验中,针对一个具体的问题,将检验结果表述为“不拒绝”原假设,这似乎让人感到无所是从–比如,你想购买一批产品,检验的结果没有拒绝原假设,即达到合同规定的标准要求,你是否购买这批产品呢?这时,你可以对检验的结果采取某种默认态度,退一步说,你可以将检验结果表述为““可以接受””原假设,你但这并不等于说你““确实接受””它 统计上显著不一定有实际意义1.1.当拒绝原假设时,我们称样本结果是统计上显著的(statistically (statistically Significant)Significant)2.当不拒绝原假设时,我们称样本结果是统计上不显著的3.在“显著”和“不显著”之间没有清除的界限,只是在P值越来越小时,我们就有越来越强的证据,检验的结果也就越来越显著 1.“显著的”(Significant)一词的意义在这里并不是““重要的””,而是指““非偶然的””2.一项检验在统计上是““显著的””,意思是指:这样的(样本)结果不是偶然得到的,或者说,不是靠机遇能够得到的3.如果得到这样的样本概率(P)很小,则拒绝原假设–在这么小的概率下竟然得到了这样的一个样本,表明这样的样本经常出现,所以,样本结果是显著的统计上显著不一定有实际意义 统计上显著不一定有实际意义1.在进行决策时,我们只能说P值越小,拒绝原假设的证据就越强,检验的结果也就越显著2.但P值很小而拒绝原假设时,并不一定意味着检验的结果就有实际意义–因为假设检验中所说的“显著”仅仅是“统计意义上的显著”–一个在统计上显著的结论在实际中却不见得就很重要,也不意味着就有实际意义3.因为值与样本的大小密切相关,样本量越大,检验统计量的P值也就越大,P值就越小,就越有可能拒绝原假设 统计上显著不一定有实际意义1.如果你主观上要想拒绝原假设那就一定能拒绝它–这类似于我们通常所说的“欲加之罪,何患无词”–只要你无限制扩大样本量,几乎总能拒绝原假设2.当样本量很大时,解释假设检验的结果需要小心–在大样本情况下,总能把与假设值的任何细微差别都能查出来,即使这种差别几乎没有任何实际意义3.在实际检验中,不要刻意追求“统计上的”显著性,也不要把统计上的显著性与实际意义上的显著性混同起来–一个在统计上显著的结论在实际中却不见得很重要,也不意为着就有实际意义 7 7.2.1 .2.1 总体均值的检验 ( (大样本) )7.2 一个总体参数的检验一个总体参数的检验 总体均值的检验 (大样本)•1.假定条件–大样本(n30)2.使用z检验统计量– 2 已知:– 2 未知: 总体均值的检验( 2 已知),P164第1题相似(例题分析—大样本)•【例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml255ml,标准差为5ml5ml。

      为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了4040罐进行检验,测得每罐平均容量为255.8ml255.8ml取显著性水平 =0.05 =0.05 ,检验该天生产的饮料容量是否符合标准要求?双侧检验双侧检验 假设检验的步骤•1.1.提出原假设H H0 0和备择假设H H1 1•2.2.给定显著性水平  0.01, 0.05, 0.100.01, 0.05, 0.10, ,查表求临界值•3.3.构造适当的检验统计量•4.4.计算检验统计量的值并于临界值进行比较•5.5.做出判断| |统计两|>|>临界值,拒绝原假设,说明在统计上是显著的 总体均值的检验( (  2 2 已知) )( (例题分析-大样本) )•H0 :  = 255= 255•H1 :    255255•  = = 0.050.05•n = = 4040•临界值( (c c):):检验统计量检验统计量检验统计量检验统计量: :决策决策决策决策: :结论结论结论结论: :不拒绝原假设不拒绝原假设不拒绝原假设不拒绝原假设 用用Excel中的中的【【NORMSDIST】】函数得到函数得到的双尾检验的双尾检验P=0.312945不拒绝不拒绝H0没没有有证证据据表表明明该该天天生生产产的的饮饮料料不不符符合合标准要求标准要求 z z0 01.961.96-1.96-1.960.0050.005拒绝拒绝 H0拒绝拒绝 H00.0050.005 总体均值的检验(z(z检验) ) ( (P P 值的计算与应用) )•第1 1步:进入ExcelExcel表格界面,直接点击【fx】•第2 2步:在函数分类中点击【统计】,并在函数名 • 菜单下选择【NORMSDISTNORMSDIST】,然后【确定】•第3 3步:将 z z 的绝对值1.011.01录入,得到的函数值为• 0.8437523450.843752345 • P P值=2(1-=2(1-0.8437523450.843752345)=)=0.3124950.312495 • P P值远远大于 ,故不拒绝H H0 0 总体均值的检验( 2 未知) (例题分析—大样本)•【例】一种机床加工的零件尺寸绝对平均误差为1.35mm1.35mm。

      生产厂家现采用一种新的机床进行加工以期进一步降低误差为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取5050个进行检验利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机 床 相 比 是 否 有 显 著 降 低 ? ( ( =0.01) =0.01) •样本均值为1.31521.3152左侧检验左侧检验5050个零件尺寸的误差数据 (mm)1.261.261.191.191.311.310.970.971.811.811.131.130.960.961.061.061.001.000.940.940.980.981.101.101.121.121.031.031.161.161.121.121.121.120.950.951.021.021.131.131.231.230.740.741.501.500.500.500.590.590.990.991.451.451.241.241.011.012.032.031.981.981.971.970.910.911.221.221.061.061.111.111.541.541.081.081.101.101.641.641.701.702.372.371.381.381.601.601.261.261.171.171.121.121.231.230.820.820.860.86 总体均值的检验( (例题分析——大样本) )•H0 :   1.351.35•H1 :  <1.35<1.35•  = 0.01 = 0.01•n = = 5050•临界值( (c c):):检验统计量检验统计量: -2.6061<-1.96,-2.6061<-1.96,于是于是 拒绝拒绝H H0 0新新机机床床加加工工的的零零件件尺尺寸寸的的平平均均误误差差与与旧旧机机床相比有显著降低床相比有显著降低决策决策决策决策: :结论结论结论结论: :-2.33-2.33z z0 0拒绝拒绝H H0 00.010.01 总体均值的检验 ( (P P 值的计算与应用——大样本) )•第1 1步:进入ExcelExcel表格界面,直接点击【f( (x) )】•第2 2步:在函数分类中点击【统计】,并在函数名的菜单下选• 择【ZTESTZTEST】,然后【确定】•第3 3步:在所出现的对话框【ArrayArray】】框中,输入原始数据所• 在区域 ;在【X】】后输入参数的某一假定值( (这里为• 1.351.35) );在【SigmaSigma】】后输入已知的总体标准差( (若总• 体标准差未知则可忽略不填,系统将自动使用样本 • 标准差代替) ) •第4 4步:用1 1减去得到的函数值0.9954210230.995421023 即为P P值• P P值= =1-0.995421023=1-0.995421023=0.0045790.004579 • P P值< < =0.01=0.01,拒绝H H0 0 用用用用用用ExcelExcelExcel计算计算计算计算计算计算P P P值值值值值值 总体均值的检验 (P 值的图示)计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量=2.6061=2.6061=2.6061P PP= ==0.0045790.0045790.004579    Z Z拒绝拒绝拒绝拒绝H H0 00 0 0临界值临界值临界值P P P 值值值 总体均值的检验( 2 未知)(例题分析)•【例】某一小麦品种的平均产量为52005200kg/kg/hmhm2 2 。

      一家研究机构对小麦品种进行了改良以期提高产量为检验改良后的新品种产量是否有显著提高,随机抽取了3636个地块进行试种,得到的样本平均产量为52755275kg/kg/hmhm2 2,标准差为120120/ /hmhm2 2 试检验改良后的新品种产量是否有显著提高? ( ( =0.05)=0.05) 右侧检验右侧检验右侧检验 总体均值的检验( 2 未知)(例题分析)•H0 :   52005200•H1 :  >5200>5200•  = 0.05 = 0.05•n = 36= 36•临界值( (c c):):检验统计量检验统计量检验统计量检验统计量: : 拒绝拒绝H H0 0因为因为3.75>3.75>1.65,1.65,或者或者( (P P = = 0.000088 <0.000088 <     = 0.05) = 0.05)改良后的新品种产量有显著提高改良后的新品种产量有显著提高 决策决策决策决策: :结论结论结论结论: :z z z0 0 0拒绝拒绝拒绝H HH0 000.050.050.051.6451.6451.645 总体均值的检验(z检验) (P 值的图示)抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布P P P = = = 0.0000880.0000880.000088 0 0 01.6451.6451.645     0.050.050.05拒绝拒绝拒绝H HH0 001 - 1 - 1 -      计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量=3.75=3.75=3.75P P P 值值值 总体均值的检验 (小样本)•1.假定条件–总体服从正态分布–小样本(n   30)2.检验统计量– 2 已知:– 2 未知: [ [例7-2]7-2]某市历年来对7 7岁男孩的统计资料表明,他们的身高服从均值为1.321.32米、标准差为0.120.12米的正态分布。

      现从各个学校随机抽取2525个7 7岁男学生,测得他们平均身高1.361.36米,若已知今年全市7 7岁男孩身高的标准差仍为0.120.12米,问与历年7 7岁男孩的身高相比是否有显著差异( (取 =0.05)0.05)解:从题意可知, =1.361.36米, =1. 321. 32米, =0.120.12米 (1) (1)建立假设:H H0 0: =1.321.32, H H1 1: 1.32 1.32 (2) (2)确定统计量: 方差已知方差已知 (3)Z(3)Z的分布:Z Z~N(0,1)N(0,1)(4)(4)对给定的 =0.050.05确定临界值因为是双侧备择假设所以查表时要注意因概率表是按双侧排列的,所以应查1-0.051-0.05=0.950.95的值,查得临界值 =1.961.965)(5)检验准则Z|<1.96|Z|<1.96,接受H H0 0,反之,拒绝H H0 0。

      6)(6)决策:因Z Z=1.671.67<1.961.96;落在了接受域,因此认为今年7 7岁男孩平均身高与历年7 7岁男孩平均身高无显著差异,即不能拒绝零假设 总体均值的检验 (例题分析—小样本)•【例】一种汽车配件的平均长度要求为1212cmcm,高于或低于该标准均被认为是不合格的汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进现对一个配件提供商提供的1010个样本进行了检验假定该供货商生产的配件长度服从正态分布,在0.050.05的显著性水平下,检验该供货商提供的配件是否符合要求? 1 10 0个零件尺寸的长度 (cm)12.212.210.810.812.012.011.811.811.911.912.412.411.311.312.212.212.012.012.312.3 总体均值的检验 (例题分析—小样本)•H0 :  =12=12•H1 :   1212•  = 0.05= 0.05•df df = 10 = 10 - 1= 9- 1= 9•临界值( (c c):):检验统计量检验统计量: 不拒绝不拒绝H H0 0没没有有证证据据表表明明该该供供货货商商提提供供的的零零件件不不符合要求符合要求 决策:决策:决策:决策:结论:结论:结论:结论:t t0 02.2622.262-2.262-2.2620.0250.025拒绝拒绝 H H0 0拒绝拒绝 H H0 00.0250.0250.025 总体均值的检验 (P 值的计算与应用-t 检验)•第1 1步:进入ExcelExcel表格界面,直接点击【fx】•第2 2步:在函数分类中点击【统计】,并在函数名的• 菜单下选择【TDISTTDIST】,然后【确定】•第3 3步:在出现对话框的【X】栏中输入计算出的t的绝对• 值0.7035,在【Deg-freedomDeg-freedom】(自由度)栏中输• 入本例的自由度9,在【TailsTails】栏中输入2(表明• 是双侧检验,如果是单测检验则在该栏输入1) •第4 4步:P值=0.499537958 0.499537958 • P值>=0.05,故不拒绝H0 一个总体均值的检验( (作出判断) )  是否已知是否已知小小小小小小样本量样本量n大大大大大大  是否已知是否已知否否否否 t 检验检验否否否否z 检验检验是是是是z 检验检验 是是是是z 检验检验 7 7.2..2.1 1 总体比例的检验7.3 一个总体参数的检验一个总体参数的检验 总体比例检验1.假定条件–总体服从二项分布–可用正态分布来近似(大样本)2.检验的 z 统计量    0 0为假设的总体比例为假设的总体比例为假设的总体比例为假设的总体比例 总体比例的检验 (例题分析)•【例】一种以休闲和娱乐为主题的杂志,声称其读者群中有80%80%为女性。

      为验证这一说法是否属实,某研究部门抽取了由200200人组成的一个随机样本,发现有146146个女性经常阅读该杂志分别取显著性水平  =0.05=0.05和 =0.01=0.01 ,检验该杂志读者群中女性的比例是否为80%?它们的P值各是多少? 总体比例的检验 (例题分析)•H0 :  = 80%= 80%•H1 :    80%80%•  = 0.05= 0.05•n = 200= 200•临界值( (c c):):检验统计量检验统计量检验统计量检验统计量: :拒绝拒绝H H0 0 ( (P P = = 0.013328 <0.013328 <     = 0.05) = 0.05)该杂志的说法并不属实该杂志的说法并不属实 决策决策决策决策: :结论结论结论结论: :z z0 01.961.96-1.96-1.960.0250.025拒绝拒绝 H H0 0拒绝拒绝 H H0 00.0250.025 总体比例的检验 (例题分析)•H0 :  = 80%= 80%•H1 :    80%80%•  = 0.01 = 0.01•n = 200= 200•临界值(c)(c): :检验统计量检验统计量检验统计量检验统计量: :不拒绝不拒绝H H0 0 ( (P P = = 0.013328 > 0.013328 >     = 0.01) = 0.01)没没有有证证据据表表明明“ “该该杂杂志志声声称称读读者者群群中中有有80%80%为女性为女性” ”的看法不正确的看法不正确 决策决策决策决策: :结论结论结论结论: :z z0 02.582.58-2.58-2.580.0050.005拒绝拒绝 H H0 0拒绝拒绝 H H0 00.0050.005 [ [例7-7]7-7]某企业的产品畅销国内市场。

      据以往调查,购买该产品的顾客有5050%是3030岁以上的男子该企业负责人关心这个比例是否发生了变化,而无论是增加还是减少于是,该企业委托了一家咨询机构进行调查,这家咨询机构从众多的购买者中随机抽选了400400名进行调查,结果有210210名为3030岁以上的男子该厂负责人希望在显著性水平0.050.05下检验““5050%的顾客是3030岁以上的男子””这个假设解:(1 1)建立假设由题意可知,这是双侧检验,故建立假设 H H0 0: =5050%.H1H1: 5050% (2 2)计算统计量由于样本容量 =400400>3030, =400×50400×50%=200200, =200200,皆大于5 5,所以可以使用正态分布进行检验3 3)Z Z~N(0,1)N(0,1)(4 4)对应于0.050.05的显著性水平,双侧检验临界值为1.961.965 5)若Z Z值不大于1.961.96,则接受原假设,否则,拒绝之6 6)本例中,Z=1Z=1,处于接受域,故接受““5050%的顾客是3030岁以上的男子””这个假设。

      7 7. .4 4. .1 1 总体方差的检验7.4 一个总体参数的检验一个总体参数的检验(选学)(选学) 总体方差的检验 ( 2检验) 1.检验一个总体的方差或标准差2.假设总体近似服从正态分布3.使用 2分布4.检验统计量假设的总体方差假设的总体方差假设的总体方差假设的总体方差自学自学 总体方差的检验(例题分析)•【例】啤酒生产企业采用自动生产线灌装啤酒,每瓶的装填量为640640ml,但由于受某些不可控因素的影响,每瓶的装填量会有差异此时,不仅每瓶的平均装填量很重要,装填量的方差同样很重要如果方差很大,会出现装填量太多或太少的情况,这样要么生产企业不划算,要么消费者不满意假定生产标准规定每瓶装填量的标准差不应超过4 4ml企业质检部门抽取了1010瓶啤酒进行检验,得到的样本标准差为s s=3.8=3.8ml试以0.050.05的显著性水平检验装填量的标准差是否符合要求? 总体方差的检验(例题分析)•H H0 0 :  2 2   4 42 2•H H1 1 :  2 2   4 42 2•  = 0.10 = 0.10•df df = 10 - 1 = 9= 10 - 1 = 9•临界值( (s s):):统计量统计量统计量统计量: :不拒绝H0 (p=0.52185)没有证据表明没有证据表明装填量的标准差不符合要求装填量的标准差不符合要求    2016.9190  =0.05决决策策策策: :结论结论: Excel中的统计函数nZTEST—ZTEST—计算Z Z检验的P P值nTDIST—TDIST—计算t t分布的概率nTINV—TINV—计算t t分布的临界值nTTEST—TTEST—计算t t分布检验的P P值nFDIST—FDIST—计算F F分布的概率nFINV—FINV—计算F F分布的逆函数( (临界值) )nFTEST—FTEST—计算F F检验( (两个总体方差比的检验) )单尾概率 假设检验知识结构总体参数检总体参数检验验一个总体一个总体一个总体一个总体两个总体两个总体两个总体两个总体均值均值比例比例方差方差均值差均值差比例差比例差方差比方差比独立样本独立样本匹配样本匹配样本大样本大样本F F检验检验Z Z检验检验大样本大样本小样本小样本Z Z检验检验 1 12 2 2 22 2已知已知 1 12 2 2 22 2未知未知Z Z检验检验t t检验检验大样本大样本小样本小样本Z Z检验检验 2 2已知已知Z Z检验检验 2 2未知未知t t检验检验Z Z检验检验卡方检验卡方检验 本章小结l假设检验的基本原理 l一个总体参数的检验l用ExcelExcel进行检验l利用P P 值进行检验 1 1、假设检验是预先对总体参数的取值做出假定,然后用样本数据验证,做出是接受还是拒绝原来假设的结论的一种方法。

      2 2、假设检验的基本概念有:小概率原理、原假设和备择假设、检验统计量、接受域和拒绝域、显著性水平、双侧检验与单侧检验、取伪错误与弃真错误等 3 3、假设检验的一般步骤包括:①①建立原假设和备择假设;②②构造检验统计量;③③给出显著性水平,确定检验统计量的临界值和拒绝域;④④根据样本数据,计算检验统计量的数值;⑤⑤判断并做出决策 4 4、总体均值的假设检验是应用最为广泛的假设检验之一,其检验的基本原理同样适用于其他类型的假设检验由于已知条件不同,所构造的检验统计量也不同,因此必须搞清统计量的形式及其服从的分布 5 5、P P 值检验是统计检验的另一种形式它是通过直接计算检验统计量在样本数据下的概率来检验原假设是否成立 结结 束束 。

      点击阅读更多内容
      相关文档
      高等学校学生手册.doc 2025年区教育系统招聘编外教师储备人才事业单位考试押题.docx 2025年秋季青岛版三年级数学上册认识轴对称现象教学课件.pptx 2025年秋季青岛版三年级数学上册用乘法估算解决问题教学课件.pptx 2025年秋季青岛版三年级数学上册两、三位数乘一位数的笔算(不进位)教学课件.pptx 2025年秋季青岛版三年级数学上册1200张纸有多厚教学设计范文.docx 2025年秋季青岛版三年级数学上册多位数除以一位数教学课件.pptx 2025年秋季青岛版三年级数学上册认识平移、旋转现象教学课件.pptx 2025年秋季青岛版三年级数学上册多位数乘一位数教学设计范本.docx 2025年秋季青岛版三年级数学上册认识平移与旋转教学设计范文.docx 2025年秋季青岛版三年级数学上册乘数中间有0或末尾有0的乘法教学课件.pptx 2025年秋季青岛版三年级数学上册两位数乘一位数的笔算(进位)教学课件.pptx 2025年秋季青岛版三年级数学上册《两、三位数乘一位数的笔算(不进位)》教学设计与意图.docx 2025年秋季青岛版三年级数学上册我学会了吗教学课件.pptx 2025年连云港市妇幼保健院招聘专业技术人员考试笔试试题.docx 2025年深圳市大鹏新区发展和财政局招聘考试笔试试卷.docx 2025年绵阳市梓潼县财政投资评审中心招聘考试试题.docx 2025年来宾市妇幼保健院招聘考试笔试试题.docx 2025年无极县教育系统招聘教师考试笔试试卷.docx 2025年灵山县第三中学调配教师考试笔试试题.docx
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.