
医学统计学课件:第五讲 假设检验基础.ppt
36页第六章 假设检验1假设检验(hypothesis test) 在数理统计上亦称显著性检验是对所估计的总体首先提出一个假设,然后通过样本数据去推断是否拒绝这一假设 科研数据处理的重要工具; 某事发生了: 是由于碰巧?还是由于必然的原因?统计学家运用显著性检验来处理这类问题 举例:上课迟到,买鸡蛋2假设检验的原因 由于个体差异的存在,即使从同一总体中严格的随机抽样,X1、X2、X3、X4、,不同 因此,X1、X2 不同有两种(而且只有两种)可能:(1)分别所代表的总体均数相同,由于抽样误差造成了样本均数的差别差别无统计学意义 2)分别所代表的总体均数不同差别有统计学意义3 假设检验的基本原理 已知健康成年男子的脉搏均数为72次/分某医生在某山区随机调查25名健康男子,求得脉搏均数为74.2次/分,标准差6.5次/分能否认为该山区的成年男子的脉搏均数高于一般成年男子的脉搏均数? 样本均数和总体均数的差异有两种可能: 抽样误差所致, 有本质差异n=254 利用反证法思想,假设是由于第一个原因,计算产生 的概率(P) 若P较小,是小于或等于小概率事件的概率,即在一次抽样中一般不能发生,现在发生了,则有理由拒绝原假设 ,接受与之对立的假设。
若P不是很小,暂时接受原假设 5假设检验的一般步骤建立假设、确定检验水准1两种假设: (1)检验假设:又称无效假设、零假设、原假设,是从反证法思想提出的 (2)备择假设:拒绝H0时而被接受的假设,与H0对立有三种情况: 双侧检验 单侧检验 单侧检验2单、双侧的选择:由专业知识来确定3检验水准:,又称显著性水准,是小概率事件的概率通常取0.056选定检验方法,计算检验统计量 根据资料类型和推断目的选用不同的检验方法不同的检验方法有相应不同的检验统计量及计算公式 所有检验统计量都是在H0 成立的条件下计算出来的,反映了抽样误差的大小,并且服从已知的分布 例: 成立条件下 , 则 用s代替,检验统计量为 7-2.0641.692 2.0640 =240.0250.025t0.05,24=2.064 P =P ( |t| 2.064 )=0.05 P=P(|t|1.692)0.058确定P值,作出推断结论 1P的含义:从规定的总体随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率根据检验统计量值,查相应的界值表,确定P值 2得出结论:若 ,按检验水准拒绝H0 ,接受H1 ,有统计学意义;若 ,按检验水准不拒绝,无统计学意义。
9假设检验特点1.类似于数学中的反证法 先建立假设(假设上课不迟到,鸡蛋是新鲜的),然后通过计算证明,得出小概率事件发生,则该假设不成立2.数学推断是确定性的,而统计学推断是以概率给出的,因此结论是相对的,得到任何结论都存在发生错误的可能10u ( Z )检验 均数的 u 检验 应用条件:样本含量n较大,或总体标准差已知 1.单样本u检验2.两大样本的u检验 11例题61 根据1983年大量调查结果,已知某地成年男子的脉搏均数为72次/分,某医生2003年在该地随机调查了75名成年男子,求其脉搏均数为74.2次/分,标准差为6.5次/分,能否据此认为该地成年男子的脉搏不同于1983年?1213例题62 为研究孕妇补锌对胎儿生长发育的影响,将96名孕妇随机分为试验组和对照组,一组在孕期不同时间按要求补锌,另一组为对照,观察两组孕妇所生新生儿体重有无不同,两组的例数、均数、标准差分别为:1415率的u检验应用条件:当n较大,p和1-p均不太小时,即np及n(1-p)均大于5时 1.样本率与总体率的比较2.两样本率的比较16例题6-3 全国调查结果显示,学龄前儿童营养性贫血患病率为23.5%,某医院为了解当地学龄前儿童营养性贫血患病情况,对当地1396例学龄前儿童进行了抽样调查,查出营养性贫血患儿363例,患病率26.0%。
问该地学龄前儿童营养性贫血患病率是否不同于全国平均水平?1718例题6-4 为了解某地在校男大学生肥胖与超重的情况,用随机的方法分别调查了该地一所文科大学和一所工科大学的部分在校男生,其中文科大学调查了765人,检出超重53人,超重率为6.9%,工科大学调查了882人,检出超重22人,超重率为2.5%,试比较两所大学男生的超重检出率有无差别1920假设检验两类错误 弃真错误,即类错误(),和存伪错误,即类错误( ) 大,则小,反之小大21两类错误示意图22假设检验中需注意的几个问题1.建立假设 “假设”是对总体特征的表述 H0与H1的表述随资料性质、分析目的和检验方法而定23 2.不同变量或资料应选用不同的检验 3.资料的代表性与可比性 所谓代表性是指该样本从相应总体中经随机抽样获得,能够代表总体的特征; 所谓可比性是指各对比组间除了要比较的主要因素外,其它影响结果的因素应尽可能相同或相近 为了保证资料的可比性,必须要有严密的实验设计,保证样本随机抽取于同质总体,这是假设检验得以正确应用的前提 244.结论不能绝对化 报告结果应说明P 值 5.统计结论必须与专业结论有机的结合 在做专业结论时,应在综合考虑两均数大小的实际意义、P值大小和设计科学性的基础上进行统计结论的专业解释。
256.检验水准的确定 犯型错误后果严重时,要减小 如一种新药治疗高血压,该药物副作用小,成本低经检验若拒绝 ,则该药有效,可推广使用,这时为减小犯型错误的概率,降低 如新检测方法与旧方法比较,不拒绝 ,可用新检测方法代替旧方法,这时应慎重,减少犯型错误的概率,提高 267.单双侧的选择:结合专业知识确定 应该用双侧,用了单侧,易拒绝,易得出有差别的结论;应该用单侧,用了双侧,降低了检验效能 27-2.0642.0640 =240.0250.02528假设检验的统计意义 1. P值的正确理解 2. 检验结果的正确理解 . 统计结论的表述 . 假设检验与可信区间的区别与联系 29假设检验的实际意义 P说明如果总体均数相等,得到本次实验(观察结果(如两样本均数的差值)不大可能出现,因而拒绝此H0,并不是说发现的差异一定有实际意义从本章u检验的所有计算公式中可以看出,假设检验的结论与样本大小有关当样本量足够大时,标准误趋于,无论两样本均数或两样本率相差多少,都能得足以拒绝H0的u值和P值 反之,当样本很小时,即使样本均数差别较大也会得出较小的检验统计量值和较大的P值而作出差别无统计意义的结论。
因此,P值大小只能说明统计学意义的“显著”,不一定有实际意义 30影响检验效能的4个因素 检验效能用概率1-表示,其中为假设检验不拒绝H0时犯类错误的概率检验效能的意义是,当两总体确有差别,按检验水准假设检验能发现其差别(拒绝H0)的能力 .总体参数的差异越大,检验效能越大 .个体差异(标准差)越小,检验效能越大 3. 样本量越大,检验效能越大 .检验水准(类错误的概率)定得越宽,检验效能越大 31多次重复检验问题 多个观察指标的多次重复检验问题 一个观察指标多次测量的重复检验问题 32小结 1.假设检验的过程是:建立假设;选择检验方法,计算检验统计量;确定P值,得出结论 2.假设检验的基本思想是:小概率事件在一次抽样中不太可能出现 3.假设检验方法很多,每种方法均有相应的适用条件综合考虑研究目的、设计类型、变量类型、样本含量等要素,才能选择合适的检验方法33u检验资料检验假设应用条件计算公式大样本均数和总体均数比较n30两独立大样本均数比较n1与n2均大于30样本率与总体率的比较np及n(1-p)均大于5两独立样本率比较两组np及n(1-p)均大于534习题1.两个样本均数比较,经t检验,差别有统计学意义时,P值越小,说明( ) A.两样本差别越大 B.两总体均数差别越大C.越有理由认为两总体均数不同 D.越有理由认为两样本均数不同 E.拒绝H1犯错误的概率越小2.两样本均数比较时,以下检验水准中第二类错误最小的是( ) A.=0.05 B. =0.01 C. =0.15 D.=0.20 E. =0.30 3.( )时,应做单侧检验 A.已知A药不会优于B药 B.已知A药优于B药 C.已知A药劣于B药 D.不知A药好还是B药好 E.以上答案都不对354.某年级全体男女同学的平均血压作对比,要不要进行假设检验?5.为什么假设检验的结论不能绝对化?36。












