好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

分类资料的假设检验.ppt

80页
  • 卖家[上传人]:壹****1
  • 文档编号:591393301
  • 上传时间:2024-09-17
  • 文档格式:PPT
  • 文档大小:1.23MB
  • / 80 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 分类资料的假设检验分类资料的假设检验公共卫生学院卫生统计学教研室公共卫生学院卫生统计学教研室杨永利杨永利 66911482 第一节第一节 率的率的u u检验检验 一、样本率与总体率比较的一、样本率与总体率比较的u u检验检验 二、两个样本率比较的二、两个样本率比较的u u检验检验第二节第二节 四格表资料的卡方检验四格表资料的卡方检验第三节第三节 行行××列(列(R R××C C)表资料的)表资料的χχ2 2检验检验第四节第四节 列联表资料的列联表资料的χχ2 2检验检验 分类资料的假设检验分类资料的假设检验 第一节第一节  率的率的u u检验检验 一、样本率与总体率比较的一、样本率与总体率比较的u u检验检验 二、两个样本率比较的二、两个样本率比较的u u检验检验 由于率的抽样误差(由于率的抽样误差(σp)的存在,对的存在,对分类变量资料进行比较时,同样需分类变量资料进行比较时,同样需用假设检验对样本指标与总体指标用假设检验对样本指标与总体指标或样本指标间的差别,进行统计学或样本指标间的差别,进行统计学推断。

      推断 一、样本率与总体率比较的一、样本率与总体率比较的u检验检验 目的目的::推断样本所代表的总体率π与已知的总体率π0是否相等适用条件适用条件:样本含量n较大(如n>50)且 s计算公式为计算公式为:: 式中,p为样本率,π0为已知的总体率,σp为由总体率π0计算的标准误,1/2n为校正数 s例例6.4 某病根据以往治疗经验,其某病根据以往治疗经验,其病死率为病死率为20%某医师采用新药治某医师采用新药治疗疗100个病人,死亡个病人,死亡13人问用新药人问用新药治疗后,该病病人的病死率有否降治疗后,该病病人的病死率有否降低?低? 抽样误差所致已知总体未知总体药物的影响or 今,故,按α水准拒绝H0故可以认为该新药可降低该病的病死率 右侧检验(显著性水平与拒绝域 ) H HH0 00值值值1.6451.6451.6450.050.050.050.050.050.05样本统计量样本统计量样本统计量接受域接受域接受域1 – 1 – 1 – 0.050.050.050.050.050.05置信水平置信水平置信水平置信水平拒绝域拒绝域拒绝域 二、两样本率比较的二、两样本率比较的u检验检验 目的目的: 是推断2个样本所分别代表的总体率 是否相等。

      适用条件适用条件:当两个样本满足正态近似条件且样本含量较大时,可用u检验 式中X1和n1分别代表较大阳性率p1的阳性数及样本含量,X2和n2分别代表较小阳性率p2的阳性数及样本含量,pc为合并阳性率计算公式计算公式: 例 某医师研究妊娠晚期患病毒性肝炎对早产的影响发现186例病人中,有80例早产,早产率为43%;144例无肝炎孕妇,早产者36例,早产率为25%问病毒性肝炎对早产是否有影响? 抽样误差所致未知总体未知总体病毒性肝炎的影响or H0: π1=π2H1: π1≠π2本题 n1=186,X1=80, P1=0.43; n2=144,X2=36, P2 Pc=(X1+X2)/(n1+n2今,故,按α水准拒绝H0,接受H1可以认为肝炎孕妇的早产率高于无肝炎者 双侧检验(显著性水平与拒绝域 ) H HH000值值值+1.96+1.96+1.96-1.96-1.96-1.960.050.050.050.05/2/2 0.050.050.050.050.050.05/2 /2 /2 样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域接受域接受域接受域1 –0.051 –0.051 –0.05置信水平置信水平置信水平置信水平置信水平置信水平 率的率的u检验能解决以下问题吗?检验能解决以下问题吗? 率的反应为生与死、阳性与阴性、发生与不率的反应为生与死、阳性与阴性、发生与不发生等二分类变量,如果二分类变量为非正反关发生等二分类变量,如果二分类变量为非正反关系(如治疗系(如治疗A A、治疗、治疗B B);反应为多分类,如何进);反应为多分类,如何进行假设检验?行假设检验? 率的率的u u检验要求:检验要求:n n足够大,且足够大,且nπnπ≥5≥5和和 n n((1-1-ππ))≥5≥5。

      如果条件不满足,如何进行假设如果条件不满足,如何进行假设检验?检验? 第二节第二节  四格表资料的卡方检验四格表资料的卡方检验       χ2检验(Chi-square test)是英国人K . Pearson(1857-1936)于1900年提出的一种具有广泛用途的统计方法,可用于 P P=的临界值=的临界值一、一、χ2分布分布((chi-square distribution)) Χ2分布的特点1 Χ2分布是非对称的分布2. ΧΧ2 2分布分布的图形与其自由度有关的图形与其自由度有关 三、四格表资料的三、四格表资料的χ2检验检验(一)什么是四格表资料(一)什么是四格表资料 例6.16 在某山区小学随机抽取男生80人,其中肺吸虫感染23人;随机抽取女生85人,其中肺吸虫感染13人问该山区小学男生和女生的肺吸虫感染率有无差别? abcd23571372 (二)(二)四格表资料的四格表资料的χ2检验检验的基本步骤的基本步骤H0: π1=π2H1: π1≠π2α=n=165>40,最小理论值为T11>5 表表10 Χ10 Χ2 2界值表(部分)界值表(部分) υ=1,查附表10,χ2界值表得:P<。

      按α=水准拒绝H0,接受H1,可认为该山区小学男生和女生的肺吸虫感染率不等,男生高于女生 s对例用四格表专用公式计算 式中a,b,c,d分别为四格表的四个实际数,总例数n= a+b+c+d 根据专用公式求χ2值结果与基本公式相同 s(2)1

      溃疡病人的治愈率高于老年胃溃疡病人     配对数据配对数据:对按一定条件配成对的n对研究对象分别使用两种不同的处理方法,或者对n个研究对象在两个时间点上使用两种不同的处理方法所得到的观察数据 B+ - A + a b - c d 配对四格表 Id A B 1 + + 2 + - …… j - + …… n - - 原始数据例如,两个医生分别检查n个病人,检验的结果如下:问题:两个医生的检验结果一致吗?问题:两个医生的检验结果一致吗? s练习题 用两种方法检查已确诊的乳腺癌患者120名甲法的检出率为60%,乙法的检出率为50%,甲、乙两法一致的检出率为35%试将上述资料整理成四格表,并比较两种方法何者为优? 第三节第三节    行列表资料的行列表资料的χχ2 2检验检验 (二)多个样本构成比的比较 将两个或多个样本构成比作比较的目的是推断各样本所代表的总体构成比是否相同。

      这类资料的基本数据有R行、C列,组成R×C表 例6.6 两个医院合作进行脑梗死疗效试验中,各医院受试病例的脑梗死部位见表,问这两家医院病例的梗死部位构成是否相同 表表10 Χ10 Χ2 2界值表(部分)界值表(部分) R×C表χ2检验的应用注意事项 1. 对R×C表,不易有1/5以上格子的理论频数小于5或有一个格子的理论频数小于1出现某些格子中理论频数过小时怎么办? (1)增大样本含量(最好!) (2)删去该格所在的行或列(丢失信息!) (3)根据专业知识将该格所在行或列与别的行或列合并丢失信息!甚至出假象) 2.2.多多组组比比较较时时,,若若效效应应有有强强弱弱的的等等级级,,如如+ +,,++++,,++++++,,最最好好采采用用后后面面的的非非参参数数检检验验方方法法χχ2 2检检验验只只能能反反映映其其构构成成比比有有无无差差异异,,不不能能比比较较效效应应的的平平均均水平 表表8 Χ8 Χ2 2界值表(部分)界值表(部分)    υ=(=(3—1)()(2—1)=)=2,查附表,查附表8,χ2界值表得界值表得: P<<。

      按按α=水准拒绝=水准拒绝H0,接受,接受H1,故可认为,故可认为三种不同剂量镇痛药镇三种不同剂量镇痛药镇痛效果有差别痛效果有差别c cReject20a a a a 剂量剂量 有效有效 无效无效 合计合计 1.0 3 12 151.0 3 12 15 2.5 11 9 20 2.5 11 9 20 合计合计 14 21 35 14 21 35 •对于成组分类数据的 2×2 表: a n ≥ 40且所有T ≥5 b n ≥ 40但有 1 < T<5 c n < 40或有T<1 •对于配对分类数据的 2×2 表 a) b+c ≥ 40 b) b+c < 40 四格表资料的方法选择四格表资料的方法选择 s行列表资料的行列表资料的χχ2 2检验检验 s[ [选择题选择题] ]1 1 用用正正态态近近似似法法进进行行总总体体率率的的区区间间估估计计时时,,应满足应满足 A. n A. n足够大足够大 B. p B. p或(或(1-p1-p)不太小)不太小 C. np C. np或或n(1-p)n(1-p)均大于均大于5 5 D. D. 以上均要求以上均要求 2 2 由由两两样样本本率率的的差差别别推推断断两两总总体体率率的的差差别别,,若若,,则则sA.A. 两样本率相差很大两样本率相差很大 sB.B. 两总体率相差很大两总体率相差很大 C. C. 两样本率和两总体率差别有统计意义两样本率和两总体率差别有统计意义 D. D. 两总体率相差有统计意义两总体率相差有统计意义 3 3 四四格格表表资资料料中中的的实实际际数数与与理理论论数数分分别别用用A A与与T T表表示示,,其其基基本本公公式式与与专专用用公公式式求求的的条条件为件为 A. A≥5 A. A≥5 B. T≥5 B. T≥5 C. A≥5 C. A≥5 且且 T≥5 T≥5    D. A≥≥5 且且n≥≥40       E. T≥≥5 且且n≥≥40 4 4 三个样本率比较得到三个样本率比较得到 ,可以为,可以为 A. A.三个总体率不同或不全相同三个总体率不同或不全相同 C. C.三个样本率都不相同三个样本率都不相同 案例讨论案例讨论 某地对区级医院2001-2002年医疗质量进行总体评价与比较,按分层抽样方法抽取两年内某病患者1250例,患者年龄构成与病情两年间差别没有统计学意义,观察三项指标分别为疗效、住院日、费用。

      规定很好、好、一般、差的标准见表7-16,病人医疗质量各等级频数分布见表7-17 原检验方法不正确该例结果变量为疗原检验方法不正确该例结果变量为疗效、住院日、费用等,属于等级资料,等效、住院日、费用等,属于等级资料,等级资料平均效应的比较不能用卡方检验,级资料平均效应的比较不能用卡方检验,因为卡方检验只能说明因为卡方检验只能说明2001年和年和2002年的年的频数分布有无差别,不能说明平均效应有频数分布有无差别,不能说明平均效应有无不同 应该采用秩和检验应该采用秩和检验。

      点击阅读更多内容
      相关文档
      【全国硕士研究生入学统一考试政治】2020年考研政治真题.docx 【全国硕士研究生入学统一考试政治】2015年考研政治真题.docx 【全国硕士研究生入学统一考试政治】2010年考研政治真题.docx 【全国硕士研究生入学统一考试政治】1996年政治考研真题(理科)及参考答案.doc 【全国硕士研究生入学统一考试政治】2001年政治考研真题(理科)及参考答案.doc 【全国硕士研究生入学统一考试政治】2016年考研政治真题.docx 【全国硕士研究生入学统一考试政治】2000年政治考研真题(文科)及参考答案.doc 【全国硕士研究生入学统一考试政治】1997年政治考研真题(理科)及参考答案.doc 【全国硕士研究生入学统一考试政治】2007年考研政治真题.doc 【全国硕士研究生入学统一考试政治】1997年政治考研真题(文科)及参考答案.doc 【全国硕士研究生入学统一考试政治】2004年考研政治真题.doc 【全国硕士研究生入学统一考试政治】2003年考研政治真题.doc 【全国硕士研究生入学统一考试政治】2019年考研政治真题.docx 【全国硕士研究生入学统一考试政治】2009年考研政治真题.docx 【全国硕士研究生入学统一考试政治】2001年政治考研真题(文科)及参考答案.doc 【全国硕士研究生入学统一考试政治】2021年考研政治真题.doc 【全国硕士研究生入学统一考试政治】2014年考研政治真题.docx 【全国硕士研究生入学统一考试政治】2018年考研政治真题.docx 【全国硕士研究生入学统一考试政治】2008年考研政治真题.doc 【全国硕士研究生入学统一考试政治】2011年考研政治真题.docx
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.