好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

第8章节假设检验幻灯片.pps

154页
  • 卖家[上传人]:E****
  • 文档编号:90175817
  • 上传时间:2019-06-09
  • 文档格式:PPS
  • 文档大小:4.79MB
  • / 154 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • ……正如一个法庭宣告某一判决为“无罪 (not guilty)”而不为“清白(innocent)”, 统计检验的结论也应为“不拒绝”而不为 “接受” Jan Kmenta,第 8 章 假设检验,统计应用 药物筛选中的假设检验,制药公司开发研制新的药物时,药物筛选成为需面临的一个极其重要的决策问题 统计学是对药物筛选技术做出了巨大贡献的学科之一药物筛选过程中有两种可能的行为 “拒绝”开发的新药,这意味着所检验的药物无效或只有微弱的效果此时采取的行动就是将该药物废弃 暂时”接受”开发的新药,此时需要采取的行动是对该药物进行进一步的细致试验 根据两种可能出现的研究结果,人们提出了如下相应的假设形式 H0:新药对治疗某种特定疾病无效(或效果微弱) H1:新药对治疗某种特定疾病有效,第 8 章 假设检验,8.1 假设检验的基本问题 8.2 一个总体参数的检验 8.3 两个总体参数的检验,假设检验在统计方法中的地位,学习目标,假设检验的基本思想和原理 假设检验的步骤 一个总体参数的检验 两个总体参数的检验 P值的计算与应用 用Excel进行检验,,8.1 假设检验的基本问题,8.1.1 假设的陈述 8.1.2 两类错误与显著性水平 8.1.3 统计量与拒绝域 8.1.4 利用P值进行决策 8.1.5 统计显著性与实际显著性,假设的陈述,什么是假设? (hypothesis), 对总体参数的具体数值所作的陈述 总体参数包括总体均值、比例、方差等 分析之前必须陈述,我认为这种新药的疗效比原有的药物更有效!,,什么是假设检验? (hypothesis test),先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程 有参数检验和非参数检验 逻辑上运用反证法,统计上依据小概率原理,,假设检验的基本思想,,,,,,,,,,,. 因此我们拒绝假设  = 50,样本均值,m,= 50,抽样分布,H0,假设检验的过程,原假设与备择假设,原假设 (null hypothesis),研究者想收集证据予以反对的假设 又称“0假设” 总是有符号 ,  或 4. 表示为 H0 H0 :  = 某一数值 指定为符号 =, 或  例如, H0 :   10cm,null,为什么叫 0 假设?,之所以用零来修饰原假设,其原因是原假设的内容总是表示没有差异或没有改变,或变量间没有关系等等 零假设总是一个与总体参数有关的问题,所以总是用希腊字母表示。

      关于样本统计量如样本均值或样本均值之差的零假设是没有意义的,因为样本统计量是已知的,当然能说出它们等于几或是否相等,,研究者想收集证据予以支持的假设 也称“研究假设” 总是有符号 , 或  表示为 H1 H1 : 某一数值,或 某一数值 例如, H1 : 10cm,或 10cm,备择假设 (alternative hypothesis),【例】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整试陈述用来检验生产过程是否正常的原假设和备择假设,提出假设 (例题分析),解:研究者想收集证据予以证明的假设应该是“生产过程不正常”建立的原假设和备择假设为 H0 :   10cm H1 :   10cm,【例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500g从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实试陈述用于检验的原假设与备择假设,提出假设 (例题分析),解:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述 。

      建立的原假设和备择假设为 H0 :   500 H1 :  500,【例】一家研究机构估计,某城市中家庭拥有汽车的比例超过30%为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验试陈述用于检验的原假设与备择假设,提出假设 (例题分析),解:研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比例超过30%”建立的原假设和备择假设为 H0 :   30% H1 :   30%,原假设和备择假设是一个完备事件组,而且相互对立 在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立 先确定备择假设,再确定原假设 等号“=”总是放在原假设上 因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论),提出假设 (结论与建议),双侧检验与单侧检验,备择假设没有特定的方向性,并含有符号“”的假设检验,称为双侧检验或双尾检验(two-tailed test) 备择假设具有特定的方向性,并含有符号“”或“”,称为右侧检验,双侧检验与单侧检验,,双侧检验与单侧检验 (假设的形式),以总体均值的检验为例,两类错误与显著性水平,假设检验中的两类错误,1. 第Ⅰ类错误(弃真错误) 原假设为正确时拒绝原假设 第Ⅰ类错误的概率记为 被称为显著性水平 2. 第Ⅱ类错误(取伪错误) 原假设为错误时未拒绝原假设 第Ⅱ类错误的概率记为(Beta),,,,H0: 无罪,假设检验中的两类错误 (决策结果),假设检验就好像一场审判过程,统计检验过程,, 错误和  错误的关系,,,,,,你要同时减少两类错误的惟一办法是增加样本容量!,,和 的关系就像翘翘板,小 就大, 大 就小,两类错误的控制,一般来说,对于一个给定的样本,如果犯第Ι类错误的代价比犯第Ⅱ类错误的代价相对较高,则将犯第Ⅰ类错误的概率定得低些较为合理;反之,如果犯第Ι类错误的代价比犯第Ⅱ类错误的代价相对较低,则将犯第Ⅰ类错误的概率定得高些 一般来说,发生哪一类错误的后果更为严重,就应该首要控制哪类错误发生的概率。

      但由于犯第Ι类错误的概率是可以由研究者控制的,因此在假设检验中,人们往往先控制第Ι类错误的发生概率,影响  错误的因素,1. 总体参数的真值 随着假设的总体参数的减少而增大 2. 显著性水平  当  减少时增大 3. 总体标准差  当  增大时增大 4. 样本容量 n 当 n 减少时增大,检验能力 (power of test),拒绝一个错误的原假设的能力 根据  的定义, 是指没有拒绝一个错误的原假设的概率这也就是说,1- 则是指拒绝一个错误的原假设的概率,这个概率被称为检验能力,也被称为检验的势或检验的功效(power) 可解释为正确地拒绝一个错误的原假设的概率,显著性水平 (significant level),1. 是一个概率值 2. 原假设为真时,拒绝原假设的概率 抽样分布的拒绝域 3. 表示为 (alpha) 常用的 值有0.01, 0.05, 0.10 4. 由研究者事先确定,我们可以在事先确定用于拒绝原假设H0的证据必须强到何种程度这等于说我们要求多小的P值而这个P值就叫显著性水平,用表示 显著性水平表示总体中某一类数据出现的经常程度 假如我们选择=0.05,样本数据能拒绝原假设的证据要强到:当H0正确时,这种样本结果发生的频率不超过5%;如果我们选择=0.01,就是要求拒绝H0的证据要更强,这种样本结果发生的频率只有1% 如果P值小于或等于 ,我们称该组数据不利于原假设的证据有的显著性水平,显著性水平 (significant level),significant(显著的)一词的意义在这里并不是“重要的”,而是指“非偶然的” 在假设检验中,如果样本提供的证据拒绝原假设,我们说检验的结果是显著的,如果不拒绝原假设,我们则说结果是不显著的 一项检验在统计上是“显著的”,意思是指:这样的(样本)结果不是偶然得到的,或者说,不是靠机遇能够得到的 拒绝原假设,表示这样的样本结果并不是偶然得到的;不拒绝原假设(拒绝原假设的证据不充分) ,则表示这样的样本结果只是偶然得到的,统计显著性 (significant),假设检验中的小概率原理, 什么小概率? 1. 在一次试验中,一个几乎不可能发生的事件发生的概率 2. 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设 3. 小概率由研究者事先确定,统计量与拒绝域,根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量 对样本估计量的标准化结果 原假设H0为真 点估计量的抽样分布,检验统计量 (test statistic),标准化的检验统计量,显著性水平和拒绝域 (双侧检验 ),,显著性水平和拒绝域 (双侧检验 ),显著性水平和拒绝域 (双侧检验 ),显著性水平和拒绝域 (双侧检验 ),显著性水平和拒绝域 (单侧检验 ),,显著性水平和拒绝域 (左侧检验 ),显著性水平和拒绝域 (左侧检验 ),显著性水平和拒绝域 (右侧检验 ),显著性水平和拒绝域 (右侧检验 ),决策规则,给定显著性水平,查表得出相应的临界值z或z/2, t或t/2 将检验统计量的值与 水平的临界值进行比较 作出决策 双侧检验:I统计量I 临界值,拒绝H0 左侧检验:统计量 临界值,拒绝H0,利用 P 值 进行决策,什么是P 值? (P-value),如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率 P值告诉我们:如果原假设是正确的话,我们得到得到目前这个样本数据的可能性有多大,如果这个可能性很小,就应该拒绝原假设 被称为观察到的(或实测的)显著性水平 决策规则:若p值, 拒绝 H0,,双侧检验的P 值,,左侧检验的P 值,,右侧检验的P 值,原假设的可信度有多高?如果H0所代表的假设是人们多年来一直相信的,就需要很强的证据(小的P值)才能说服他们 拒绝的结论是什么?如果拒绝H0而肯定H1 ,就需要有很强的证据显示要支持H1。

      比如,H1代表要花很多钱把产品包装改换成另一种包装,你就要有很强的证据显示新包装一定会增加销售量(因为拒绝H0要花很高的成本),多大的P 值合适?,显著性检验的目的是要描述样本所提供不利于原假设的证据有多强P值就在做这件事但是,要证明原假设不正确,P值要多小,才能令人信服呢?这要根据两种情况来确定,有了P值,我们并不需要用5%或1%这类传统的显著性水平P值提供了更多的信息,它让我们可以选择任意水平来评估结果是否具有统计上的显著性,从而可根据我们的需要来决定是否要拒绝原假设 只要你认为这么大的P值就算是显著了,你就可以在这样的P值水平上拒绝原假设 传统的显著性水平,如1%、5%、10%等等,已经被人们普遍接受为“拒绝原假设足够证据”的标准,我们大概可以说:10%代表有“一些证据”不利于原假设;5%代表有“适度证据”不利于原假设;1%代表有“很强证据”不利于原假设,固定显著性水平是否有意义,用P值进行检验比根据统计量检验提供更多的信息 统计量检验是我们事先给出的一个显著性水平,以此为标准进行决策,无法知道实际的显著性水平究竟是多少 比如,根据统计量进行检验时,只要统计量的值落在拒绝域,我们拒绝原假设得出的结论都是一样的,即结果显著。

      但实际上,统计量落在拒绝域不同的地方,实际的显著性是不同的比如,统计量落在临界值附近与落在远离临界值的地方,实际的显著性就有较大差异而P值给出的是实际算出的显著水平,它告诉我们实际的显著性水平是多少,P 值决策与统计量的比较,,拒绝H0,P 值决策与统计量的比较,拒绝H0的两个统计量的不同显著性,,,,,,,,,Z,拒绝H0,0,统计量1,P1 值,,,,统计量2,P2 值,,,拒绝H0,临界值,,,,与其人为地把显著性水平固定按某一水平上,不如干脆选取检验统计量的P值 与其大致知道犯第Ⅰ错误的概率,不如干脆知道一个确切的犯第Ⅰ类错误的概率(P值) 与其为选取“适当的”的而苦恼,不如干脆把真正的 (P值)算出来,P 值决策与统计量的比较 (结论),统计。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.