医学统计学:第8章 非参数统计法.ppt
26页1第八章第八章 非参数统计方法非参数统计方法nonparametric testnonparametric test2一、基本一、基本概念(一)非参数统计(一)非参数统计 不依赖于总体分布形式,不须考虑被研究对象为何不依赖于总体分布形式,不须考虑被研究对象为何种分布及分布是否已知,不是参数间的比较,而是种分布及分布是否已知,不是参数间的比较,而是用于分布之间的比较用于分布之间的比较二)参数统计(二)参数统计 依赖于总体分布形式,总体分布是已知,而且有规依赖于总体分布形式,总体分布是已知,而且有规律可循,是总体参数间的比较律可循,是总体参数间的比较3( (三三) ) 两类统计方法的优缺点:两类统计方法的优缺点:参数统计参数统计检验效率较高,但使用条件较严格检验效率较高,但使用条件较严格非参数统计非参数统计由于对资料无特殊要求,因此适用由于对资料无特殊要求,因此适用范围广,资料收集和分析比较简便但统计效率范围广,资料收集和分析比较简便但统计效率较低(较低( 较大)较大)n n选择:选择: 首先考虑参数检验,当条件不符,才选择非参数首先考虑参数检验,当条件不符,才选择非参数统计方法统计方法4( (四四) ) 非参数统计适用情况非参数统计适用情况(1 1)偏态分布资料)偏态分布资料 (2 2)总体分布不明资料)总体分布不明资料 (3 3)方差不齐资料)方差不齐资料(4 4)数据一端或两端有未确定值)数据一端或两端有未确定值 (5 5)等级资料)等级资料 定量变量 5二、秩和检验(二、秩和检验(rank sum testrank sum test) 是非参数检验中效率较高,而且比较系统是非参数检验中效率较高,而且比较系统完整的一种。
完整的一种两组资料比较两组资料比较 配对设计配对设计WWilcoxox signed rank test 成组设计成组设计Wilcoxon Mann-Whitney test多组资料比较多组资料比较 完全随机设计完全随机设计Kruskal-Wallis H test 随机区组设计随机区组设计Friedman M test 6(一)配对资料比较(一)配对资料比较符号秩和检验符号秩和检验 为什么要用为什么要用非参数检验非参数检验?T T- - =58 T =58 T+ +=8=8SPSS78基本步骤基本步骤: :(1 1)建立检验假设)建立检验假设, ,确定检验水准确定检验水准: : H H0 0: :差值的总体中位数为差值的总体中位数为0 0; 即即M Md d=0 =0 H H1 1: :差值的总体中位数不为差值的总体中位数不为0 0即M Md d0 =0.050 =0.05(2 2)求检验统计量)求检验统计量T T : : 求差值求差值: : 编秩编秩: :按差值的绝对值从小到大编秩按差值的绝对值从小到大编秩 差值为差值为 0 0,舍去不记,舍去不记,n n相应减少;相应减少; 差值绝对值相同,取平均秩次。
差值绝对值相同,取平均秩次 求秩和并确定检验统计量求秩和并确定检验统计量: : T T+ +、 T T- - , 两者均可作为检两者均可作为检验统计量验统计量3 3)确定确定P,P,作出统计推断结论作出统计推断结论9结果判断结果判断:(1 1)查表法:)查表法:当当n n5050时时,查,查T T界值表界值表(符号秩和检验(符号秩和检验用)(用)(P.716P.716),得:,得: T T0.05,110.05,11= 10= 105656,(,( T T0.01, 110.01, 11 = 5 = 56161) 若若T T+ +或或T T- -:落在范围内,则:落在范围内,则P0.05;P0.05; 落在范围外落在范围外, , 则则P0.05P50时, 可近似认为T分布逼近正态分布 u 检验的公式为:如果相同秩次较多,则需要进行校正,校正公式为:11Wilcoxon Signed Ranks Test12 秩和分布的特点秩和分布的特点 (1 1)离散型的对称分布;)离散型的对称分布; (2 2)N N一定时,秩和分布也一定;如一定时,秩和分布也一定;如n=3n=3时,秩和分布如时,秩和分布如 下图。
下图3 3)靠近中央的频数较多;)靠近中央的频数较多; (4 4)当)当N N足够大时,秩和分布逼近正态分布足够大时,秩和分布逼近正态分布: :13查表得查表得: T: T0.05, 110.05, 11 = 1056 = 1056, T T0.01, 110.01, 11 = 561 = 561 P 0.01 P 10, n2 - n1 10) u检验公式为:相同秩次较多时,需要校正:正态近似法:正态近似法:16例例 某医师为研究血铁蛋白与肺炎的关系,随机抽查了肺炎患某医师为研究血铁蛋白与肺炎的关系,随机抽查了肺炎患者和正常人若干名,并测得血铁蛋白值(者和正常人若干名,并测得血铁蛋白值(ug/Lug/L)如下表因难以确定数据分布情况,故决定用秩和检验因难以确定数据分布情况,故决定用秩和检验患者组:均数为患者组:均数为301301,标准差为,标准差为199199正常组:均数为正常组:均数为101101,标准差为,标准差为 8585( (一一) ) 原始数据两组比较原始数据两组比较: : 17T=183.5, n1 =10, n2 - n1 =6 ,查表得:0.01P0.02SPSS1819( (二二) ) 等级资料或频数表资料两组比较等级资料或频数表资料两组比较问铅作业工人尿棕色素是否高于正常人? u=4.493, P 3 或 ni 5, 此时H分布近似服从自由度为 k-1的X2分布。
3)若相同秩次较多,需对H值校正:22例 11.3 为研究吸烟与尿中硫氰酸盐含量的关系,某医生收集了下述数据,问不同吸烟量者尿中的硫氰酸盐有无差别?(一)原始资料多组比较(一)原始资料多组比较23 本例k=4, =4 1=3, X20.01(3)=11.34, H11.34,所以 P 0.01可认为不同吸烟量者尿中的硫氰酸盐有差别SPSS24例 某医师为研究早产、足月产及过期产者在产后一个月内泌乳量的差别,收集了如下资料,问三种产妇乳量有无差别?(二)等级资料或频数表资料的多组比较(二)等级资料或频数表资料的多组比较SPSS25五五. . 随机区组设计多组资料比较随机区组设计多组资料比较 Friedman M test 例 欲用学生的综合评分来评价四种教学方式的不同,按照年龄、性别、年级、社会经济地位、学习动机相同和智力水平、学习情况相近作为配伍条件,将4名学生分为一组,共8组,每区组的4名学生随机分到四种不同的教学实验组,经过相同的一段时间后,测得学习成绩的综合评分,试比较四种教学方式对学生学习成绩的综合评分影响有无不同?26H0:四种教学方法学生综合评分的总体分布相同H1:四种教学方法学生综合评分的总体分布不同或不全相同 =0.05SPSS27。





