
医学统计学(8).ppt
133页单击此处编辑母版标题样式,,单击此处编辑母版文本样式,,第二级,,第三级,,第四级,,第五级,,,,*,医学统计学(,08,),——,基于秩次的非参数检验,非参数检验,又称为任意分布检验,,,这类方法并不依赖总体分布的具体形式,应用时可以不考虑研究变量为何种分布以及分布是否已知,进行的不是参数之间的检验,故称非参数检验基本特点:,与分布无关,,,基本方法:,,χ,2,,检验,,基于秩(等级,,rank),的方法,,基于特定参照点(如中位数)的方法,,,……,,非参数检验的优点:,①,适用范围广,,②,受限条件少参数检验对总体分布等有特别限定,而非参数检验的假定条件少,也不受总体分布的限制,更适合一般的情况③,具有稳健性参数检验是建立在严格的假设条件基础之上的,一旦不符合假设条件,其推断的正确性将受到怀疑;而非参数检验都是带有最弱的假定,所受的限制很少,稳健性好①对符合用参数检验的资料,如用非参数检验,会丢失部分信息②虽然非参数检验计算简便,但有些问题的计算仍显繁冗非参数检验的缺点:,已知总体分布类型,,对未知参数进行统计推断,依赖于特定分布类型,比较的是,参数,,,参数检验,,(,parametric test,),,非参数检验,,(,nonparametric test,),对总体的分布类型不作严格要求,不受分布类型的影响,比较的是,总体分布位置,,优点,:方法简便、易学易用,易于推广使用、应用范围广;可用于参数检验难以处理的资料,(,如等级资料,或含数值,“,>50mg,”,等,),缺点,:方法比较粗糙,对于符合参数检验条件者,采用非参数检验会损失部分信息,其,检验效能较低,;样本含量较大时,两者结论常相同,应用非参数检验的情况,1.,不满足正态和方差齐性条件的小样本资料;,,2.,总体分布类型不明的小样本资料;,,3.,一端或两端是不确定数值(如<,0.002,、>,65,等)的资料(必选);,,4.,单向(双向)有序列联表资料;,,5.,各种资料的初步分析。
方法的起点--排队与秩次,统计描述中排秩思想的成功应用,,,百分位数、中位数,,,排队的优点,,,广泛适用于多种分布,,,排队的结果,,,将原始数据的比较转化为,秩次,的比较,秩次,(rank),——,将数值变量值从小到大,或等级变量值从弱到强所排列的序号例,1,,11,只大鼠存活天数:,,存活天数,4,,,10,,,7,,,50,,,3,,,15,,,2,,,9,,,13,,,>60,,,>60,,,,,,例,2,,9,名 肺炎病人的治疗结果:,,疗效,治愈 治愈 死亡 无效 治愈 有效 治愈 有效 无效,秩次,,3 6 4 9 2 8 1 5 7 10 11,,10.5 10.5,平均秩次,,2.5 2.5 9 7.5 2.5 5.5 2.5 5.5 7.5,秩次,,1 2 9 7 3 5 4 6 8,,SPSS,中的菜单位置,基于秩次的非参数检验,,两个独立样本比较的非参数检验,,多个独立样本比较的非参数检验,,配对样本比较的非参数检验,,随机区组设计多个样本比较的非参数检验,两独立样本,(A),受试对象,随机分组,样本,1,样本,2,A,完全随机,分组得到两独立样本,甲药,乙药,两独立样本,(B),样本,1,总体,1,样本,2,总体,2,B,从两总体中随机抽样得到两独立样本,,随机抽样,两独立样本,(C),总体,样本,样本,2,样本,1,按某属性分类,,C,按某一两分类的属性分组得到两独立样本,1.建立检验假设,确定检验水准(,α),,H,0,:,两总体分布相同,H,1,:,两总体分布不同,α=0.05,。
2.编秩,按数值由小到大排列,若有相同数据,,,取平均秩分析步骤:,,基本思想,两样本来自同一总体,任一组秩和不应太大或太小,假定:两组样本的总体分布形状相同,,T,与平均秩和应相差不大,3.计算秩和,确定检验统计量秩和,T,值,当,n,1,>10,或(,n,2,-n,1,)>10,时,则可采用正态近似法求,u,(,Z,)值来确定,P,值,其公式如下:,4.确定,P,值和作出推断结论,,,当,n,1,<=10,或(,n,2,-n,1,)<=10,时,查表,P,值,,若相同秩次较多,应作校正计算,,,,,,【,例,1】,某实验室观察缺氧条件下大鼠与小鼠的生存,以生存日数作为观察指标试检验两组生存日数有无差别,?,序号,1,2,3,4,5,6,7,8,9,10,11,12,大鼠,10,12,15,15,16,17,18,20,23,90,,以上,,,小鼠,2,3,4,5,6,7,8,9,10,11,12,13,,,,,T=170>146,P<0.05,T,在界值范围内,P>α T,在界值范围外,P<α T,与界值相等,P=α,SPSS,软件操作,第一步:建立变量第二步:输入原始数据,第三步:非参数检验(,1,),,第三步:非参数检验(,2,),,第四步:结果解读(,1,),结果解读:,例数、均数、标准差、中位数、四分位间距等。
标准差较大,第四步:结果解读(,2,),结果解读:,Z=3.630,P=0.000,【,例,2】,20,名正常人和,32,名铅作业工人尿铅定性检查结果如表问铅作业工人尿铅是否高于正常人,?,结果,-,+,++,+++,++++,正常人,18,2,0,0,0,铅作业工人,8,10,7,3,4,,U,检验:,,Zc=U,,与,1.96,,,2.58,比较,SPSS,软件操作,第一步:建立变量第二步:输入原始数据,第三步:加权个案,第四步:非参数检验,,第五步:结果解读,结果解读:,Z=4.503,P=0.000,,两个独立样本比较的非参数检验,,多个独立样本比较的非参数检验,,配对样本比较的非参数检验,,随机区组设计多个样本比较的非参数检验,基于秩次的非参数检验,完全随机设计多个样本比较的秩和检验由,Kraskal,和,Wallis,在,Wilcoxon,秩和检验基础上扩展而来,又称,K-W,检验,或,H,检验,1.建立检验假设,确定检验水准(,α),H,0,:k,个总体分布相同;,H,1,:k,个总体分布不同或不全相同;,α,=0.052.混合编秩,将各组数据混合,由小到大编秩遇有原始数据相同时,若相同数据在同一组内,则仍按顺序编秩;若相同数据在不同组,则取它们的平均秩次。
分析步骤:,3.求秩和并计算检验统计量,H,将各组秩次分别相加,求出各组的秩和,R,i,检验统计量值,H,可按下式计算: 式中,,R,i,为各组的秩和,,n,i,为各组样本含量,,N,为总样本含量分析步骤:,当各组相同秩次较多时,可对,H,值进行校正,按下式求值分析步骤:,t,j,相同秩次的数量,4.确定,P,值和作出推断结论,,当组数,K=3,,每组样本含量,n,i,≤5,时,可查附表(,H,界值表)得到,P,值 若,k>3,或,n,i,>5,时,,H,值的分布近似于自由度为,k-1,的,χ,2,分布,此时可查,χ,2,界值表得到,P,值 最后按,P,值作出推断结论分析步骤:,【,例,3】,比较小白鼠接种三种不同菌型伤寒杆菌,9D,、,11C,和,DSC,1,后存活日数,结果见表问小白鼠接种三种不同菌型伤寒杆菌的存活日数有无差别?,序号,1,2,3,4,5,6,7,8,9,10,11,9D,2,2,2,3,4,4,4,5,7,7,,11C,5,5,6,6,6,7,8,10,12,,,DSC1,3,5,6,6,6,7,7,9,10,11,11,P=1-CDF.CHISQ(9.97,2),SPSS,软件操作,第一步:建立变量。
第二步:输入原始数据,第三步:非参数检验,,第四步:结果解读,结果解读:,x,2,=9.940,P=0.007,【,例,4】,四种疾病患者痰液内嗜酸性白细胞的检查结果见表问四种疾病患者痰液内的嗜酸性白细胞有无差别?,白细胞,-,+,++,+++,支气扩张,0,2,9,6,肺水肿,3,5,5,2,肺癌,5,7,3,2,病毒性呼吸道感染,3,5,3,0,P=1-CDF.CHISQ(15.52,3),SPSS,软件操作,第一步:建立变量第二步:,,输入原始数据,第三步:加权个案,第四步:非参数检验,,第五步:结果解读,结果解读:,x,2,=15.506,P=0.001,【,例,5】,某临床药理基地观察,5,组接受不同治疗的妇科病人,结果见表问,5,组疗效有无差别,?,疗效,对照组,中药,A,组,中药,B,组,中药,C,组,西药组,合计,I,21,19,0,0,0,40,II,4,4,41,3,0,52,III,0,0,6,11,31,48,IV,0,2,3,15,42,62,V,0,0,0,21,77,98,P=1-CDF.CHISQ(195.50,4),SPSS,软件操作,第一步:建立变量。
第二步:输入原始数据,第三步:加权个案,第四步:非参数检验,,第五步:结果解读,结果解读:,x,2,=195.504,P=0.000,,两个独立样本比较的非参数检验,,多个独立样本比较的非参数检验,,配对样本比较的非参数检验,,随机区组设计多个样本比较的非参数检验,基于秩次的非参数检验,配对设计,(A),甲药,乙药,A,受试对象按,某些特征,配对,两对象随机接受两种处理,,,,,配对设计,(B),,,,,,,方法甲,方法乙,,,,,,,B,一份样品,一分为二,随机接受两种处理,,,,,治疗前,治疗后,,,,,,,,,,,,,,,,,,,,,治,,疗,配对设计,(C),C,受试对象处理前后比较,配对设计差值比较的符号秩和检验由,Wilcoxon,1945,年提出,又称,Wilcoxon,符号秩和检验,,,常用于检验差值的总体中位数是否等于零1)建立检验假设,确定检验水准,H,o,:,差值总体,中位数,M,d,=0 H,1,:,差值总体,中位数,M,d,≠0,,α=0.05,分析步骤:,(,2,)编秩:,,求差值,,编秩方法:依差值的绝对值从小到大编秩编秩时注意两点:,遇差值为0者,舍去不计,,n,相应减少,,,差值的绝对值相等,,,符号不同者应取平均秩次,,编秩后,按差值的正负给秩次冠上符号。
3,)求差值为,正或负,的秩和,差值为正的秩和以,T,+,表示 差值为负的秩和以,T,-,表示T,+,+T,-,=n(n+1)/2 T=min,(,T,+,,,T,-,),(,4,)确定,P,值和作出推断结论:,当,n≤50,时,查,T,界值表,T,在界值范围内,P>α T,在界值范围外,P<α T,与界值相等,P=α,分析步骤:,,当,n>50,,可采用正态近似法,计算,u,值正 态 近 似 法,若相同秩次较多,应作校正计算Z,或,式中,,t,j,为第,j(j=1,2,,…,),个相同差值的个数正 态 近 似 法,【,例,6】,对,10,名患者分别用甲法与乙法,测得血汞值问两种方法的结果有无差别,?,,n=10-1=9,T=min(26.5,18.5)=18.5,,n=9,,p>0.05,,SPSS,软件操作,第一步:建立变量第二步:输入原始数据,第三步:非参数检验(,1,),第三步:非参数检验(,2,),第四步:结果解读(,1,),结果解读:,例数、均数、标准差、中位数、四分位间距等标准差较大,第四步:结果解读(,2,),结果解读:,Z=0.474,P=0.635,【,例,7】,对,12,份血清分别用原方法(检测时间,20,分钟)和新方法(检测时间,10,分钟)测谷,-,丙转氨酶,结果见表。
问两法所得结果有无差别?,序号,1,2,3,4,5,6,7,8,9,10,11,12,原法,60,142,195,80,242,220,190,25,198,38,236,95,新法,76,152,243,82,240,220,205,38,243,44,190,100,,,T=MIN(54.5,11.5)=11.5,,n=11,,P>0.05,SPSS,软件操作,第一步:建立变量第二步:输入原始数据,第三步:非参数检验(,1,),第三步:非参数检验(,2,),第四步:结果解读(,1,),结果解读:,例数、均数、标准差、中位数、四分位间距等标准差较大,第四步:,,结果解读(,2,),结果解读:,Z=1.913,P=0.056,,两个独立样本比较的非参数检验,,多个独立样本比较的非参数检验,,配对样本比较的非参数检验,,随机区组设计多个样本比较的非参数检验,基于秩次的非参数检验,随机区组设计资料比较,如果观察结果不满足方差分析条件,可用,Friedman,检验(,Friedman test,)1.,建立检验假设和确定检验水准,,2.,编秩:,,先在每一配伍组内将数据从小到大编秩,如有相同数据,取平均秩次;,,再求各处理组秩和,Ri,,,i,=1,,,2,,,...,,,g,。
分析步骤,3.,计算检验统计量,M,值,,(,1,)查表法,(n≤15,,,g≤15),:,,M=,Σ,(,R,j,-R,),2,(,R=,Σ,,R,j,/g,),,==》M,界值表,,基于,χ,2,分布近似法得到,χ,2,值查有关的,χ,2,界值表,,(,2,),χ,2,分布近似法,分析步骤:,,自由度为(,g-1,),,当各区组间出现相同秩次时,需进行校正,校正公式为,,,b,为区组个数,,,k,为处理组个数,4.确定,P,值和作出推断结论,【,例,8】8,名受试对象在相同实验条件下分别接受,4,种不同频率声音的刺激,他们的反应率(,%,)资料见表问,4,种频率声音刺激的反应率是否有差别?,,SPSS,软件操作,第一步:建立变量第二步:输入原始数据,第三步:非参数检验(,1,),第三步:非参数检验(,2,),第四步:结果解读(,1,),结果解读:,例数、均数、标准差、中位数、四分位间距等第四步:,,结果解读(,2,),结果解读:,x,2,=15.152,P=0.002,一个讨论案例,【,例,9】,某中医医院采用中西医结合方法治疗,228,例不同病情的脑卒中患者,疗效情况如下表,SPSS,软件操作,第一步:建立变量。
第二步:输入原始数据,第三步:加权个案,1,、不同病情的脑卒中患者,疗效有无差别?,第三步:秩和检验,,第四步:,,结果解读,结果解读:,x,2,=24.319,P=0.000,2,、脑卒中患者病情与疗效有无相关?,第三步:等级相关分析,,,第四步:结果解读,结果解读:,r,s,=0.311,P=0.000,,3,、脑卒中患者病情与疗效变化趋势如何?,第三步:线性趋势检验(,1,),第三步:线性趋势检验(,2,),输出,4,种卡方检验结果:,1,、,pearson,卡方,2,、卡方值的校正值,3,、似然比卡方,,一般用于对数线性模型4,、,fisher,的精确检验,,线性趋势检验,第四步:,,结果解读,结果解读:,x,2,=21.797,P=0.000,线性趋势检验,计量资料,——,线性回归,,等级有序资料,——,线性趋势检验,,基本原则:将,x,2,值进行分解,将总变异分为线性回归分量和偏离线性回归分量总变异,线性回归分量,,Ridit,分析是一种关于等级资料进行对比组与标准组比较的假设检验方法,其基本思想是先确定一个,标准组,作为特定总体,求得各等级的,Ridit,值,标准组平均,Ridit,值理论上可以证明等于,0.5,,其他各组与标准组比较,看其可信区间是否与,0.5,重叠,来判断组间的统计学显著性,最后得出专业解释。
Ridit,分析,Ridit,分析适用范围:,,,1.,两组或两组以上等级资料的比较和分析,,,2.,两端数据不确切的计量资料分组转换成计数资料的分析,如血清滴度等特点:,简便、直观、适用性广Ridit,分析关键步骤:,,一、确定标准组:,,,1.,利用已知的标准分布(传统方法)作为标准组2.,以例数最多的一组作为标准组3.,各组的例数都差不多时,可把各组观察结果合并起来作为标准组二、计算标准组的,Ridit,值:,,三、利用对照组计算各组的平均,R,值,,四、统计检验,:,u,检验,Ridit,分析(实例):,,三种方剂对某妇科病患者治疗效果比较,1.,标准组平均,R,值 :,,= 248.00/496 =0.5,,对比组平均,R,值,,糖衣组,R=,,= 0.4819,,,黄体酮组,R = 0.6287,,,复方组,R = 0.4881,,如果等级是由劣到优的顺序排列,则平均,Ridit,值越大越好,否则越小越好但我们不能单纯以各组平均,Ridit,值的大小来判断各组的差异,因为,Ridit,值是一个点估计,没有考虑抽样误差,而样本正好等于总体指标的可能性很小,因此应该结合可信区间或统计检验方法综合判断。
注意:,统计界限:,u0.05,,差异无统计意义,,,u≥1.96,P≤0.05,,差异有统计意义,,,u≥2.58,P≤0.01,,差异有统计意义,,u,1,2,=3.84, u,1,3,=0.18, u,2,3,=2.99,多个样本资料的两两比较,如同方差分析一样,当多个样本比较的秩和检验,拒绝,H,0,,认为多组处理效应不同或不全相同时,常需进一步作两两比较的秩和检验,以推断哪些组之间不同,或哪些组之间相同如何确定,P,值?,,,——,u,界值表,,,检验水准,α,=0.05,?,,由于,K,个样本两两比较增大了第一类错误,为保证,α,=0.05,,需要对检验水准进行调整,即:,,α,’=,α,/,比较的次数,,多组间两两比较:,α,’=,α,/[k,(,k-1,),/2],,多个实验组与对照组比较,α,’=,α,/,(,k-1,),谢 谢!,。












