好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

分类变量资料的统计分析秩和检验.ppt

33页
  • 卖家[上传人]:第***
  • 文档编号:600657567
  • 上传时间:2025-04-11
  • 文档格式:PPT
  • 文档大小:480.27KB
  • / 33 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,统计资料的类型,数值变量,:,定量资料,分类变量,:,定性资料,有序分类,:,变量之间有程度的差,别,且排列有序,.,(,等级资料,),无序分类,:,(计数资料),二项分类,多项分类,变量的转换,:,定量 定性,连续型计量资料,离散型计量资料,分类变量资料的统计分析,第一节 统计描述,一,.,描述指标,(,相对数,),1.,率,(rate),:,说明一定时间内某事件发生的频率或强度,单位,:%,1/,万,1/10,万,2.,构成比,(constituent ratio),:说明事物内部构成,或各部分所占百分比,,单位,%,3.,相对比,(relative ratio),:,说明两个指标的比例关系,常用率比,例,11-1,某研究者,2000,年对某校的初中生进行了近视患病情况调查,试计算各年级近视患病率和构成比及三年级和一年级患病率的相对比,.,年级 检查人数 患病人数,患病率 构成比 相对比,一年级,442 67,二年级,428 68,三年级,405 74,合计,1275 209 16.39 100.0,15.16 32.06,15.89 32.53,18.27 35.41 1.2,二,.,应用相对数时注意事项,1.,分母,不宜太小,2.,率和构成比的区别,3.,样本含量不等的,几个率的平均值,不等于 几个率的算数平均值,4.,对率或构成比进行比较时,应注意,资料的可比性,5.,率的标准化,6.,两样本率进行比较时应进行,假设检验,三,.,率的标准化,1.,基本思想,:,为消除内部构成不同对指标的影响,采用统一的内部构成计算标准化率,使得出的标准化率具有可比性,.,2.,计算方法,:,直接法,:,已知各年龄组的实际发病率,用标准人口数或,标准人口构成进行计算,间接法,:,标准化死亡比,(SMR),实际死亡数与预,期死亡数的比,3.,率的标准化应注意的问题,第二节 计数资料统计推断,一,.,率的抽样误差和标准误,样本率和总体率或样本率之间存在的差异,称抽样误差,.,率的抽样误差用率的标准误表示,.,(,p or Sp,).,(p=,阳性率,1-p=,阴性率,),二,.,总体率的区间估计,查表法,:,当,n 50,样本率,p,接近于,0,或,1,时,该资料服从二项分布,用查表法估计总体率可信区间,p,u,Sp,1.,正态近似法,:,np,和,n(1-p)5,条件,:,n,足够大,样本率,p,或,1-p,均不太小时,即,例,11-2,为了解某地乙肝表面抗原携带情况,某研究者在该地人群中随机检测了该地,200,人,乙肝表面抗原阳性,7,人,乙肝表面抗原携带率为,3.5%,试计算标准误并估计,95%,和,99%,可信区间,.,95%,可信区间,:3.5%,1.96,Sp,99%,可信区间,:3.5%,2.58,Sp,n=200 X=7,P=3.5%,例,11-3,某医生用,A,B,两种药物治疗急性下呼吸道感染,.A,药治疗,74,例,有效,68,例,;B,药治疗,63,例,有效,52,例,.,问两种药物的有效率是否有差别,?,处理 有效 无效 合计 有效率,(%),A,药,68 6 74 91.89,B,药,52 11 63 82.54,合计,120 17 137 87.59,H,0,:,1,=,2,H,1,:,1,2,=0.05,三,.,两个率比较的,u,检验,当,np,和,n(1-p)5,时,样本率的分布近似正态分布,u,检验,(,一,),检验步骤,:,1.,建立假设,确定检验水准,H,0,:,1,2,H,1,:,1,2,=0.05,2.,选择检验方法,计算,u,值,3.,确定,P,值,判断结果,(,二,),资料设计类型,样本率与总体率的比较,计算公式,:,2.,两个样本率的比较,计算公式,:,例,11-3,某医生用,A,B,两种药物治疗急性下呼吸道感染,.A,药治疗,74,例,有效,68,例,;B,药治疗,63,例,有效,52,例,.,问两种药物的有效率是否有差别,?,处理 有效 无效 合计 有效率,(%),A,药,68(64.82)6 (9.18)74 91.89,B,药,52(55.18)11(7.82)63 82.54,合计,120 17 137 87.59,H,0,:,1,=,2,H,1,:,1,2,=0.05,第三节,X,2,检验,(chi-square test),基本思想,检验实际频数与理论频数的吻合程度,实际频数与理论频数越相近,X,2,值越小,;,反之,实际数与理论数相差越大,X,2,值越大,.,计算公式,:,理论频数的计算,:T,RC,=n,R,n,C,/n,df=(,行数,-1)(,列数,-1),例,11-3,某医生用,A,B,两种药物治疗急性下呼吸道感染,.A,药治疗,74,例,有效,68,例,;B,药治疗,63,例,有效,52,例,.,问两种药物的有效率是否有差别,?,处理 有效 无效 合计 有效率,(%),A,药,68(64.82)6 (9.18)74 91.89,B,药,52(55.18)11(7.82)63 82.54,合计,120 17 137 87.59,二,.,2,检验的基本步骤,建立检验假设,确定检验水准,H,0,:,1=,2,H,1,:,1,2,=0.05,2.,计算,2,值,资料设计类型不同,计算公式不同,3.,确定,P,值,判断结果,根据查,2,界值表,确定,P,值,三,.,四格表资料的,2,检验,1.,四格表资料的,2,检验的,专用公式,df=(R-1)(C-1)=1,四格表资料的,2,检验的校正,-,Yates,连续校正,校正公式,:,校正的目的,:,英国统计学家,(Yates),认为,2,分布是一种连续性分布,而四格表中的资料属离散性分布,得到的,2,统计量的抽样分布也是离散的,.,因此,为改善,2,统计量分布的连续性,建议进行校正,.,连续性校正应遵循的条件,:,1.,T,5,且,N,40,时,用非校正的公式,2.,1,T,5,且,N,40,时,用连续性校正公 式,3.,T,1,或,N,40:,当,b+c40,时,用校正公式,.(McNemar,检验,),例,随机选择,239,例胃、十二指肠疾病患者和,187,名健康输血员,其血型分布见下表,问胃、十二指肠疾病患者和健康输血员血型分布有无差别?,胃十二指肠疾病患者与健康输血员的血型分布,分 组,A B AB O,合 计,胃十二指肠疾病,健康输血员,66 20 106 239,52 54 19 62 187,合 计,99 120 39 168 426,检验步骤:,1.,建立检验假设,确定检验水准,2.,计算,2,值,3.,确定概率,P,值,判断结果,4.,行,列表资料的,2,检验,(R,C,表资料,),基本公式,:,A,每个格子的实际频数,n,R,A,所对应的行合计,n,C,A,所对应的列合计,例,表 甲、乙两城市空气质量状况比较,组 空气质量类别,别 优 良 轻度污染 中度污染 重度污染,合计,甲,193 67 28 7 5,300,乙,154 94 28 18 6,300,合计,347 161 56 25 11 600,检验步骤:,1.,建立检验假设,确定检验水准,2.,计算,2,值,3.,确定概率,P,值,判断结果,行,列表资料,2,检验应注意事项,1.,行,列表资料,2,检验公式的应用条件,:,不能有,1/5,以上,的格子的,理论数,5,或者,不能有,1,个格子,的,理论数,1,2.,如果资料不能满足上述条件,则可以通过,(1),在可能的情况下再增加样本量,;,(2),专业上允许的情况下,合并相邻的行或列,;,(3),删去理论数太小的行和列,3.,假设检验结果有差别,只能认为总的率或构成比有差别,小结,分类变量资料的统计描述,指标,:,率、构成比、相对比,分类变量资料的统计推断,总体参数估计:,P,u,*,Sp,率的假设检验:,样本率与总体率的比较,-,u,检验,两个大样本率的比较,-,u,检验,两个小样本率的比较,-,2,检验,配对设计资料的两个率比较,-,2,检验,多个样本率的比较,-R,C,表的,2,检验,假设检验的基本步骤完全相同,统计资料处理的基本思路,资料的整理:统计图,统计表,统计资料的描述(描述指标),统计学推断,总体参数的估计(可信区间),假设检验,统计资料类型的判断,例,1.,某研究者欲比较甲乙两药治疗高血压的效果,进行了随机对照试验,.,甲乙药组各选择了,50,名病人,甲药组血压平均下降了,2.67mmHg,标准差是,0.27mmHg,乙药组平均下降了,3.20mmHg,标准差是,0.33mmHg.,问两药降压效果是否不同,?,例,2.,为调查,2,型糖尿病发病易感因素,某研究者进行了一项以医院为基础的病例对照研究,.,结果发现,在,200,名糖尿病病例中,100,人有糖尿病遗传家族史,;,而,200,名对照者中只有,50,人有糖尿病家族史,.,问糖尿病家族史是否在两组中分布不同,?,例,3.,为比较,A,B,C,D,四种药物治疗小细胞肺癌的效果,将,160,人随机分配进入四个治疗组,.,每组,40,人,.,治疗结果见下表,试比较四种药物治疗效果有无差别,?,处理组 有效 无效 合计,A,药,15 25 40,B,药,10 30 40,C,药,13 27 40,D,药,8 32 40,合计,46 114 160,例,4.,为研究铅作业与工人尿铅含量的关系,随机抽查了,3,种作业工人的尿铅结果,见下表,.,问,3,种作业工人的尿铅含量是否不同,?,铅作业组 调离铅作业组 非铅作业组,0.01 0.11 0.09,0.16 0.23 0.02,0.24 0.18 0.05,0.18 0.14 0.02,0.28 0.20 0.01,0.14 0.12 0.10,参数统计,(parametric statistics),以特定的总体分布作为前提,对总体参数进行,估计和假设检验,非参数统计,(nonparametric statistics),不是对总体参数进行估计和检验,而是检验总,体分布的位置的统计方法,它不依赖总体分布的具体形式,参数统计和非参数统计的区别,:,1.,总体分布,2.,检验效能,第七章 秩和检验,秩和检验,(,rank sum test,):,秩,:,秩序,顺序,.,把资料从小到大排序,再求顺序的和,秩和。

      以秩和作为统计量进行假设检验,称秩和检验,.,资料设计类型不同有不同的检验方法,配对设计(符号秩和检验),成组设计 (两个样本比较),多组设计 (多个样本比较),。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.