好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

假设检验的概念及.ppt

40页
  • 卖家[上传人]:ni****g
  • 文档编号:577380633
  • 上传时间:2024-08-21
  • 文档格式:PPT
  • 文档大小:582.05KB
  • / 40 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 第八章 假设检验的概念及t检验 总体总体样本样本抽取部分观察单位抽取部分观察单位 统计量统计量统计量统计量 参参参参 数数数数 统计推断统计推断统计推断统计推断 statistical inferencestatistical inference如:样本均数如:样本均数        样本标准差样本标准差S        样本率样本率 P如:总体均数如:总体均数        总体标准差总体标准差        总体率总体率内容:内容:1.参数估计参数估计(estimation of parameters)2.     包括:点估包括:点估计与区间估计计与区间估计3.2. 假设检验假设检验((test of hypothesis) 实例实例   通过以往大规模调查,已知某地一般新生通过以往大规模调查,已知某地一般新生儿的头围均数为儿的头围均数为34.50cm为研究某矿区为研究某矿区新生儿的发育状况,现从该地某矿区随机新生儿的发育状况,现从该地某矿区随机抽取新生儿抽取新生儿55人,测得其头围均数为人,测得其头围均数为33.89cm,,问该矿区新生儿的头围总体均问该矿区新生儿的头围总体均数与一般新生儿头围总体均数是否不同?数与一般新生儿头围总体均数是否不同? 假设检验的步骤及有关概念假设检验的步骤及有关概念总体间差异:总体间差异: 1. 1. 个体差异,抽样误差所致;个体差异,抽样误差所致; 2. 2. 总体间固有差异总体间固有差异 判断差别属于哪一种情况的统计学检验,就是判断差别属于哪一种情况的统计学检验,就是假设检验假设检验。

      小概率思想小概率思想: : P P<0.05<0.05((或或P P<0.01<0.01))是小概率事件是小概率事件在一次试验中基本上不会发生在一次试验中基本上不会发生 P P≤≤αα(0.05) (0.05) 样样本差别有统计学意义;本差别有统计学意义;P P > >αα(0.05) (0.05) 样本差别无统样本差别无统计学意义计学意义假设检验(test of hypothesistest of hypothesis):,事先对总体的特征作出某种假设,通过分析样本数据,判断该样本信息是否支持这种假设,最后作出拒绝或不拒绝这种假设的取舍抉择此方法称作假设检验 1 1、建立假设与确定检验水准(、建立假设与确定检验水准(αα)) H H0 0: μ: μ1 1==μμ2 2 无效假设(无效假设(null hypothesisnull hypothesis)) H H1 1: μ: μ1 1≠μ≠μ2 2 备择假设(备择假设(alternative hypothesisalternative hypothesis)) 检验水准(检验水准(level of a testlevel of a test):):α=0.05(α=0.05(双侧双侧) ) 2 2、选定方法和计算统计量:、选定方法和计算统计量: 根据统计推断目的、设计、资料组数、样本含量、等根据统计推断目的、设计、资料组数、样本含量、等选择方法。

      如两组小样本比较用选择方法如两组小样本比较用t t检验、大样本比较检验、大样本比较u u检验、方差齐性检验用检验、方差齐性检验用F F检验3 3、确定、确定P P值,作出判断值,作出判断 P P≤α(0.05) ≤α(0.05) 样本差别有统计学意义;样本差别有统计学意义; P P >α(0.05) >α(0.05) 样本差别无统计学意义样本差别无统计学意义P值:值:指在指在H0成立的假设前提下,出现当前检验统计成立的假设前提下,出现当前检验统计量以及更极端情况的概率量以及更极端情况的概率 假设检验的步骤假设检验的步骤 1.差异来源差异来源    该矿区新生儿总体均数与一般新生儿头围总体均该矿区新生儿总体均数与一般新生儿头围总体均数相同数相同    该矿区新生儿总体均数与一般新生儿头围总体均该矿区新生儿总体均数与一般新生儿头围总体均数不同数不同   H0::μ= μ 0==34.50   ,,  H1::μ≠ μ0==34.50    单凭一份样本不可能证明哪一个正确,可考虑样单凭一份样本不可能证明哪一个正确,可考虑样本资料和哪一个假设有较大的矛盾来决定拒绝哪本资料和哪一个假设有较大的矛盾来决定拒绝哪一个假设。

      一般考察样本资料是否与一个假设一般考察样本资料是否与H0有较大的有较大的矛盾矛盾分析思路 2. H0成立时会怎样?成立时会怎样?   所得所得u值因样本而异,值因样本而异,但其绝对值多数情况下落在但其绝对值多数情况下落在0 0附近u的的分布规律可由分布规律可由u界值表查出界值表查出3.当前状况如何,发生的可能性(当前状况如何,发生的可能性(P值)有值)有多大?多大?n=55, =33.89, n=55, =33.89, μμ0 0 =34.50 =34.50 得得u=-2.273u=-2.273 拒绝域拒绝域            接受域接受域             拒绝域拒绝域      P值值系指在系指在H0成立的假设前提下,出现当成立的假设前提下,出现当前检验统计量以及更极端情况的概率前检验统计量以及更极端情况的概率   查查u界值表,当前界值表,当前u值以外的双侧尾部面积值以外的双侧尾部面积    介于介于0.05和和0.02之间之间4.决策决策   决策者需要事先规定一个可以忽略的决策者需要事先规定一个可以忽略的小概率值小概率值α如取如取0.05,那么上述,那么上述P值可认值可认为很小。

      即为很小即H0成立时,几乎不可能出现当成立时,几乎不可能出现当前的状况前的状况    于是,面临两种抉择,一是认为于是,面临两种抉择,一是认为H0是成立的,是成立的,而当前的极端情况又恰好偶然发生了;二是而当前的极端情况又恰好偶然发生了;二是怀疑怀疑H0的正确性,从而接受的正确性,从而接受H1通常选择后通常选择后者本例,可认为该矿区新生儿总体均数与者本例,可认为该矿区新生儿总体均数与一般新生儿头围总体均数不同一般新生儿头围总体均数不同 例例8-2::1995年,某地年,某地20岁应征男青年平岁应征男青年平均身高为均身高为168.5cm2003年在当地年在当地20岁岁应征男青年中随机抽取应征男青年中随机抽取85人,平均身高人,平均身高为为171.2cm,,标准差为标准差为5.3cm,,问这两年问这两年身高是否不同身高是否不同解:解:总体方差一般未知,当样本含量足够总体方差一般未知,当样本含量足够大时,用大时,用S作为作为σσ 的估计值的估计值    1 1 建立假设,确定检验水准建立假设,确定检验水准    H0::μμ ==168.5,,    H1::μμ≠≠ 168.5 168.5 α α ==0.050.05 2 2 计算统计量计算统计量u u3 确定P值,下结论 查查u界值表,界值表, 4.70 >u 0.001/2=3.2905,得得P <0.001,按照按照αα ==0.05水准,拒绝水准,拒绝H0,,接接受受H1,,可认为可认为2003年年20岁应征男青年身岁应征男青年身高有变化,比高有变化,比1995年增高了。

      年增高了 例例8-3::为比较某药治疗流行性为比较某药治疗流行性 出血热疗效,出血热疗效,将将72名患者随机分为试验和对照组,结果分名患者随机分为试验和对照组,结果分别为别为n1=32,       =2.9,S1=1.9;n2=40,         =5.2,S2=2.7,问试验组和对照组的平均退热问试验组和对照组的平均退热天数有无差别天数有无差别解:可用两组大样本资料的解:可用两组大样本资料的u检验检验      H0::μμ1 1=μ=μ2 2 ,,H1::μμ1 1 ≠≠ μμ2 2      α α ==0.050.05二 两均数比较的u检验 u=-4.23  查查u界值表,界值表,4.23 >u 0.001/2=3.2905,得得P <0.001,按照按照αα ==0.05水准,拒绝水准,拒绝H0,,接接受受H1,,可认为试验组和对照组退热天数的可认为试验组和对照组退热天数的总体均数不等,疗效不同试验组比对照总体均数不等,疗效不同试验组比对照组平均退热天数短组平均退热天数短μμ1 1-μ-μ2 2 的的95%可信区间为%可信区间为-3.3——-1.3天天 Ⅰ型错误和型错误和Ⅱ型错误型错误 由样本推断的结果由样本推断的结果 真实结果真实结果 拒绝拒绝H H0 0 不拒绝不拒绝H H0 0 H H0 0成立成立 Ⅰ Ⅰ型错误型错误 a a 推断正确推断正确(1(1--a a ) ) H H0 0不成立不成立 推断正确(推断正确(1 1--b b)) Ⅱ Ⅱ型错误型错误b b ((1 1--b b))即即把握度把握度((power of a test):power of a test):两总体两总体确有差别,被检出有差别的能力确有差别,被检出有差别的能力((1 1--a a))即即可信度可信度((confidence level):confidence level):重复重复抽样时,样本区间包含总体参数(抽样时,样本区间包含总体参数(m m))的百分数的百分数 对于一般的假设检验,对于一般的假设检验, a a定定为为0.050.05((或或0.010.01)),,b b的的大大小小取取决决于于H H1 1。

      通通常常情情况况下下,,比比较较总总体体间间有有无无差差异异并并不不知知道道,,即即H H1 1不不明明确确,, b b值值的的大大小小无无法法确确定定,,也也就就是是说说,,对对于于一一般般的的假假设设检检验验,,我我们们并并不不知知道道犯犯ⅡⅡ型型错错误误的的概概率率b b有多大有多大通常情况下通常情况下Ⅱ型错误未知型错误未知 a ab b减少(增加)减少(增加)I型错误型错误,将会,将会增加(减少)增加(减少)II型错误型错误增大增大n 同时降低同时降低a a 与与 b b a a 与与 b b 间的关系间的关系 假设检验注意事项假设检验注意事项((1 1)可比性)可比性( (随机性抽样、分组,资料具有均衡性和随机性抽样、分组,资料具有均衡性和可比性可比性) )((2 2)正确选用假设检验方法)正确选用假设检验方法((3 3))““差别差别””的实际意义的实际意义( (正确理解差别有统计学意正确理解差别有统计学意义的涵义义的涵义有统计学意义指:样本来自不同的总体,而并非指差别很大,不能说明差别的大小.当专业上当专业上和统计学上都有和统计学上都有“显著性意义显著性意义”时,才有实用价值。

      时,才有实用价值) 假设检验注意事项假设检验注意事项(4(4)判断结论时不能绝对化)判断结论时不能绝对化( (原因是存在着两类错误原因是存在着两类错误 写出精确写出精确P P值:若对同一研究内容,值:若对同一研究内容,A A研究的结果研究的结果P=0.002,BP=0.002,B研究的结果研究的结果P=0.04,P=0.04,虽结果均为拒绝虽结果均为拒绝H0,H0,但但A A结果结果更为可信更为可信. .((5 5)单侧检验与双侧检验)单侧检验与双侧检验((6 6)报告结果应写出统计量值、具体)报告结果应写出统计量值、具体P P值(单侧时应注明);值(单侧时应注明);9595%%CICI既能说明差别的大小,也具有检验的作用,建议使既能说明差别的大小,也具有检验的作用,建议使用用 (可信区间与假设检验均为统计推断方法,可信区间可信区间与假设检验均为统计推断方法,可信区间可以检验差值大小,假设检验可精确表示相关事件的概率可以检验差值大小,假设检验可精确表示相关事件的概率统计结果同时报告检验统计量、统计结果同时报告检验统计量、P P值和可信区间更值得提值和可信区间更值得提倡) ) 第十章第十章 t t检验(检验(t t test test))t t检验,亦称检验,亦称studentstudent t t检验(检验(StudentStudent’s s t t testtest),),主要用于样本含量较小(主要用于样本含量较小(例如n<30n<30),),总体标准差总体标准差σσ未知的正态分布资料。

      未知的正态分布资料 一、样本均数与总体均数的比较一、样本均数与总体均数的比较二、配对资料的比较二、配对资料的比较三、两三、两样本均数的比较样本均数的比较四、两方差齐性检验四、两方差齐性检验 一、样本均数与总体均数的比较一、样本均数与总体均数的比较 推断样本所代表的未知总体均数推断样本所代表的未知总体均数µ与与已知总体均数已知总体均数µ0 0有无差别有无差别 已知总体均数已知总体均数µ0 0一般为理论值、标准一般为理论值、标准值或经大量观察所得的稳定值值或经大量观察所得的稳定值 统计量统计量t t的计算公式:的计算公式: 实实 例例 附表附表2 2 t t界值表界值表 二、配对资料的比较二、配对资料的比较 两种情况两种情况::1.1.随机配对设计随机配对设计( (randomized randomized paired design)paired design)是将受试对象按某些混杂因素(如性是将受试对象按某些混杂因素(如性别、年龄、窝别等)别、年龄、窝别等)配成对子配成对子,每对中的两个个体随,每对中的两个个体随机分配给两种处理(如处理组与对照组);机分配给两种处理(如处理组与对照组);2.2.或者或者同同一受试对象一受试对象作两次不同的处理作两次不同的处理( (自身对照自身对照) )。

      优点优点:配对设计:配对设计减少了个体差异减少了个体差异 特点:特点:资料成对,每对数据不可拆分资料成对,每对数据不可拆分 表表3-4 3-4 两法两法测定测定1212份尿铅份尿铅含量含量的结果的结果 表表3-3 两法测定两法测定12份尿铅含量的结果份尿铅含量的结果 三、两样本均数的比较三、两样本均数的比较 完全随机设计完全随机设计( (completely random design) completely random design) ::把受试把受试对象完全随机分为两组,分别给予不同处理,然后比较独对象完全随机分为两组,分别给予不同处理,然后比较独立的两组样本均数各组对象数不必严格相同立的两组样本均数各组对象数不必严格相同 目的目的: :比较两总体均数是否相同比较两总体均数是否相同 条件:假定资料来自正态总体,条件:假定资料来自正态总体,σσ1 12 2= =σσ2 22 2计算公式:计算公式:其中,均数差的标准误其中,均数差的标准误 实实 例例 2. 方差齐性检验方差齐性检验Y==log (X+a) Y== Y Y== Y= 方差齐性检验方差齐性检验 t检验的类型检验的类型样本均数与总体均数比较的t检验 (单组设计) (one sample t test) 配对设计定量资料的t检验 (paired t-test) 成组设计定量资料的t检验 (two sample t test)小小 结结 三个概念 1 独立性 :指一批实验数据彼此之间是互相独立的。

      例如测得不同学生的身高、不同学生的考试成绩2 正态性:是指每个影响因素各水平组的定量资料来自于正态或近似正态分布的总体3 方差齐性:指每个影响因素各水平组的总体方差应当相等 一一 单组设计的特点及应满足的前提条件单组设计的特点及应满足的前提条件1 设计特点:对一组同质的受试对象不按任何其它因素分组,直接观测或给予一种特定处理后观测这些受试对象某种或多种指标的取值2 已知总体均数总体均数µ0 0一般为理论值、标准值或经大量观察所得的稳定值3 前提条件:样本数据满足正态或近似正态分布4 统计量的计算: 二 配对设计的特点及应满足的前提条件1 设计特点:设计特点:A 随机配对设计随机配对设计( (randomized paired randomized paired design)design)是将受试对象按某些混杂因素(如性别、是将受试对象按某些混杂因素(如性别、年龄、窝别等)配成对子,每对中的两个个体随机年龄、窝别等)配成对子,每对中的两个个体随机分配给两种处理(如处理组与对照组分配给两种处理(如处理组与对照组););B.B.或者同或者同一受试对象作两次不同的处理一受试对象作两次不同的处理( (自身对照自身对照) )。

      优点:优点:配对设计减少了个体差异配对设计减少了个体差异 资料成对,每对数据资料成对,每对数据不可拆分不可拆分2 前提条件:成对数据间的差值满足正态或近似正态分布3 统计量的计算: 三 成组设计的特点及资料应满足的前提条件1 设计特点:设计特点:完全随机设计完全随机设计( (completely random completely random design) design) ::把受试对象完全随机分为两组,分别给把受试对象完全随机分为两组,分别给予不同处理,然后比较两组样本均数两组数据是予不同处理,然后比较两组样本均数两组数据是独立的,两组对象数不必严格相同独立的,两组对象数不必严格相同2 前提条件:两组数据间是互相独立的、两组数据分别服从正态或近似正态分布、两组资料所对应的总体方差相等3 统计量的计算: 五、资料不满足正态与方差齐时进行检验之对策1 对数变换:常用于数据呈正偏态分布,较小数据多,较大数据少2 平方根变换:常用于服从Poisson分布的资料,算术均数=方差3 倒数变换:常用在数据呈极严重的正偏态分布,变换后可使特大数据变小,资料近似正态对策对策 五、资料不满足正态与方差齐时进行检验之对策4平方根反正弦 常用于百分率数据(如白血病患者的淋巴细胞转化率,脑电图波的变化率等)5当数据有负数时,作对数或平方根变换可对原始数据相加一个常数使其变为正数。

      6 6近似近似t检验检验(separate variance estimation t-test)  t‘检验检验7 7非参数检验非参数检验------秩和检验秩和检验对策对策 两两均均数数比比较较样本与总体样本与总体 单样本单样本t检验检验配对配对配对配对t检验检验方差齐性方差齐性 变量变化变量变化两两样样本本 t`检验检验两样本两样本t检验检验非配对非配对 不齐不齐齐齐差值呈正态差值呈正态秩和检验秩和检验指标呈正态指标呈正态分析思分析思 路路 讨论题1    要要比比较较一一组组肺肺结结核核病病人人治治疗疗前前后后的的淋淋巴巴细细胞胞与与白白细细胞胞总总数数的百分比,以评价治疗效果,可用(的百分比,以评价治疗效果,可用(    ))A   2检验检验     B  t检验检验 C  配对配对 2检验检验       D  配对配对t检验检验  2        对两样本均数进行假设检验时,对两样本均数进行假设检验时,P值越小,说明(值越小,说明(  ))   A  两总体均数有差别的可能性越大两总体均数有差别的可能性越大   B  两总体均数有差别的可能性越小两总体均数有差别的可能性越小   C  两总体均数相差越大两总体均数相差越大 D  两总体均数越小两总体均数越小3 3 两两组组数数据据中中的的每每个个变变量量值值减减同同一一常常数数后后做做两两个个均均数数差差别别的的t t 检验(检验( )) A tA t值不变值不变 B tB t值变小值变小 C tC t值变大值变大 D tD t值不能确定值不能确定 。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.