电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

卡方检验正式

86页
  • 卖家[上传人]:sh****d
  • 文档编号:115523255
  • 上传时间:2019-11-13
  • 文档格式:PPT
  • 文档大小:1.50MB
  • / 86 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、1,2检验 Chi-squared test,第7章,蒋红卫 Email: JHWCCC21CN.COM,2,讲课内容:,1. 概述基本思想 2. 22表卡方检验 3. 配对四格表卡方检验 4. Fisher确切概率检验 5. RC表卡方检验 6. 多个样本率的多重比较 7. 有序分组资料的线性趋势检验,3,概念回顾,在总体率为的二项分布总体中做n1和n2抽样,样本率p1和p2与的差别,称为率抽样误差。 在总体率为1和2的不同总体中抽样,得p1和p2,在n5,可通过率的u检验推断是否1=2。 二项分布的两个样本率的检验同样可用2检验。,4,目的: 推断两个总体率或构成比之间有无差别 多个总体率或构成比之间有无差别 多个样本率的多重比较 两个分类变量之间有无关联性 频数分布拟合优度的检验。 检验统计量:2 应用:计数资料,5,基本概念,例1 某院比较异梨醇(试验组)和氢氯塞嗪(对照组)降低颅内压的疗效,将200名患者随机分为两组,试验组104例中有效的99例,对照组96例中有效的78例,问两种药物对降低颅内压疗效有无差别?,6,表 200名颅内高压患者治疗情况,如何整理此类资料? 如何分

      2、析此类资料?,7,四格表(fourfold table)资料的基本形式,实际频数(actual frequency)是指各分类实际发生或未发生计数值,记为A。,单元格,8,理论频数(theoretical frequency)是指按某H0假设计算各分类理论上的发生或未发生计数值,记为T。,式中,TRC 为第R 行C 列的理论频数 nR 为相应的行合计 nC 为相应的列合计,9,残差 设A代表某个类别的观察频数,T代表基于H0计算出的期望频数,A与T之差(A-T)被称为残差 残差可以表示某一个类别观察值和理论值的偏离程度,但残差有正有负,相加后会彼此抵消,总和仍然为0。为此可以将残差平方后求和,以表示样本总的偏离无效假设的程度 类似于方差的计算思想,,10,Pearson 2检验的基本公式,残差大小是一个相对的概念,相对于期望频数为10时,20的残差非常大;可相对于期望频数为1000时20就很小了。因此又将残差平方除以期望频数再求和,以标准化观察频数与期望频数的差别。 卡方统计量,1900年由英国统计学家K. Pearson首次提出。,Karl Pearson (1857 1936),1

      3、1,从卡方的计算公式可见,当观察频数与期望频数完全一致时,卡方值为0; 观察频数与期望频数越接近,两者之间的差异越小,卡方值越小; 反之,观察频数与期望频数差别越大,两者之间的差异越大,卡方值越大。 当然,卡方值的大小也和自由度有关 检验的自由度取决于可以自由取值的格子数目,而不是样本含量n。 理论上,在n40时下式值与2分布近似,在理论数5,近似程度较好。,12,连续型分布:正态分布(Normal distribution),学生氏t分布(Students t-distribution),F分布(F distribution) 另一个同样重要的分布2卡方分布(Chi-squared distribution)。 此分布在1875年,首先由F. Helmet所提出,而且是由正态分布演变而来的,即标准正态分布Z值之平方而得,2分布,13,设Xi为来自正态总体的连续性变量。,称为自由度df=n的卡方值。,显然,卡方分布具有可加性。,14,3.84,7.81,12.59,P0.05的临界值,2分布的概率密度函数曲线,15,当=1时,16,第二节 22表卡方检验,17,两组样本率比较的设计分类

      4、: 1.两组(独立) 样本率的比较 组间数据是相互独立,非配对设计。 22表卡方检验 2.配对设计两组样本率的比较 组间数据是相关的,配对设计。 配对四格表卡方检验,18,两组(不配对)样本率的比较,1)四格表形式 2)四格表不配对资料检验的专用公式,二者结果等价,各组样本例数是固定的,19,例1(续),20,H0:1=2 即试验组与对照组降低颅内压的总体有效率相等 H1:12 =0.05。,以=1查附表8的2界值表得P0.005。按=0.05检验水准拒绝H0,接受H1,可以认为两组降低颅内压总体有效率不等,即可认为异梨醇口服液降低颅内压的有效率高于氢氯噻嗪+地塞米松的有效率。,21,值得指出,成组设计四格表资料的2检验与前面学习过的两样本率比较的双侧u检验是等价的。 若对同一资料作两种检验,两个统计量的关系为2= u2。其对应的界值也为平方关系。 两者的应用条件也是基本一致的,连续性校正也基本互相对应。,22,卡方检验假设的等价性,两组颅内压治疗有效率相同 两组有效率的比较 实际数据的频数分布和理论假设相同 理论分布与实际分布的检验 使用不同的药物并不会影响颅内压的治疗(两个分类变量

      5、间无关联) 两变量的相关分析,23,四格表2值的校正,英国统计学家Yates认为,2分布是一种连续型分布,而四格表资料是分类资料,属离散型分布,由此计算的2值的抽样分布也应当是不连续的,当样本量较小时,两者间的差异不可忽略,应进行连续性校正(在每个单元格的残差中都减去0.5) 若n 40 ,此时有 1 T 5时,需计算Yates连续性校正2值 T 1,或n40时,应改用Fisher确切概率法直接计算概率,24,(1) 校正公式的条件: 1T5,同时N40,用校正公式计算 (2) 连续校正(continuity correction)公式:,(3) 当T1,或N40,用Fisher确切概率法,四格表2 检验的校正公式 (两组不配对资料),25,例2 某医师欲比较胞磷胆碱与神经节苷酯治疗脑血管疾病的疗效,将78例脑血管疾病患者随机分为两组,结果见表7-2。问两种药物治疗脑血管疾病的有效率是否相等?,H0:1=2 即两种药物治疗脑血管疾病的总体有效率相等 H1:12 =0.05。,26,表 两种药物治疗脑血管疾病有效率的比较,27,本例n=78,但T224.67,故用四格表资料2检验的校正公

      6、式,不校正2=4.35,p0.05,以=1查附表8的2界值表得P0.05。按=0.05检验水准,不拒绝H0,无统计学意义,尚不能认为两种药物治疗脑血管疾病的有效率不等。,28,卡方检验的连续性校正问题,正方观点: 卡方统计量抽样分布的连续性和平滑性得到改善,可以降低I类错误的概率; 校正结果更接近于Fisher确切概率法; 校正是有条件的。 反方观点: 经连续性校正后,P值有过分保守之嫌; 连续性校正卡方检验的P值与Fisher确切概率法的P值没有可比性,这是因为Fisher确切概率法建立在四格表双边固定的假定下,而实际资料则是单边固定的四格表。,29,就应用而言,无论是否经过连续性校正,若两种检验的结果一致,无须在此问题上纠缠。但是,当两种检验结果相互矛盾时,如例2,就需要谨慎解释结果了。 为客观起见,建议将两种结论同时报告出来,以便他人判断。当然,如果两种结论一致,如均为有或无统计学意义,则只报道非连续性检验的结果即可。,30,第二节 配对设计两个样本率的2检验 ( McNemer检验 ),配对设计:通常为同源配对。对同一观察对象分别用两种方法处理,观察其阳性与阴性结果。 基本用途

      7、:常用于比较两种检验方法或两种培养基的阳性率是否有差别。 数据形式:配对四格表形式。,31,例3 某实验室采用两种方法对58名可疑红斑狼疮患者的血清抗体进行测定,问:两方法测定结果阳性检出率是否有差别? 测定结果为:阳性、阴性(共116标本,58对) 方法(X) 乳胶凝集法 免疫荧光法 对子例数 11 33 2 12,结果,32,上述配对设计实验中,就每个对子而言,两种处理的结果不外乎有四种可能:,两种检测方法皆为阳性数(a); 两种检测方法皆为阴性数(d); 免疫荧光法为阳性,乳胶凝集法为 阴性数(b); 乳胶凝集法为阳性,免疫荧光法为 阴性数(c)。,其中,a, d 为两法观察结果一致的两种情况, b, c为两法观察结果不一致的两种情况。,33,表 两种方法的检测结果,34,方法原理,按照配对设计的思路进行分析,则首先应当求出各对的差值,然后考察样本中差值的分布是否按照H0假设的情况对称分布。 按此分析思路,最终可整理出如前所列的配对四格表。 主对角线上两种检验方法的结论相同,对问题的解答不会有任何贡献 斜对角线上两种检验方法的结论不相同,显示了检验方法间的差异,35,配对2检验统

      8、计量为,36,H0:b=c =(12+2)/2=7(两法总体阳性率相等) H1:b c (两方法总体阳性率不等) =0.05 本例b+c=12+2=1440,用校正公式 本例2=5.793.84,P0.05。在=0.05水准,拒绝H0,接受H1,有统计学意义。认为两方法的检测率不同,乳胶凝集法的阳性检测率22.41%低于免疫检测率39.66%。,37,注意事项,McNemar检验只会利用非主对角线单元格上的信息,即它只关心两者不一致的评价情况,用于比较两个评价者间存在怎样的倾向。因此,对于一致性较好的大样本数据,McNemar检验可能会失去实用价值。 例如对1万个案例进行一致性评价,9995个都是完全一致的,在主对角线上,另有5个分布在左下的三角区,显然,此时一致性相当的好。但如果使用McNemar检验,此时反而会得出两种评价有差异的结论来。,105,38,第三节,四格表资料的Fisher确切概率法,105,39,条件: 理论依据:超几何分布 (非2检验 的范畴),105,40,例4 某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果,将33例HBsAg阳性孕妇随机分为预防注射组和

      9、非预防组,结果见表7-4。问两组新生儿的HBV总体感染率有无差别?,105,41,表7-4 两组新生儿HBV感染率的比较,42,基本思想,在四格表周边合计数固定不变的条件下,计算表内4个实际频数变动时的各种组合之概率Pi;再按检验假设用单侧或双侧的累计概率P,依据所取的检验水准做出推断。,43,1各组合概率Pi的计算 在四格表周边合计数不变的条件下,表内4个实际频数 a,b,c,d 变动的组合数共有“周边合计中最小数+1”个。如例7-4,表内4个实际频数变动的组合数共有9+1=10个,依次为:,44,各组合的概率Pi服从超几何分布,其和为1。,计算公式为,45,2累计概率的计算 ( 单、双侧检验不同),46,47,48,检验步骤,49,50,表5 例4的 Fisher确切概率法计算表,51,例5 某单位研究胆囊腺癌、腺瘤的P53基因表达,对同期手术切除的胆囊腺癌、腺瘤标本各10份,用免疫组化法检测P53基因,资料见表7-6。问胆囊腺癌和胆囊腺瘤的P53基因表达阳性率有无差别?,52,表6 胆囊腺癌与胆囊腺瘤P53基因表达阳性率的比较,53,本例 a+b+c+d=10,由表7-7可看出,四格表内各种组合以i=4和i=5的组合为中心呈对称分布。,表7 例5的Fisher确切概率法计算表,*为现有样本,54,(1)计算现有样本的D*和P*及各组合下四格表的Di。 本例D*=50,P*=0.02708978。 (2)计算满足Di50条件的各组合下四格表的概率Pi。 (3)计算同时满足Di50和PiP*条件的四格表的累 计概率。本例为P7和P8, (4)计算双侧累计概率P。 P0.05,按=0.05检验水准不拒绝H0,尚不能认为胆囊腺癌与胆囊腺瘤的P53基因表达阳性率不等。,55,56,一点补充,确切概率法的原理具有通用性,对于四格表以外的情况也适用,如行乘列表、配对、配伍表格均可 对于较大的行乘列表,确切概率法的计算量将很大,有可能超出硬

      《卡方检验正式》由会员sh****d分享,可在线阅读,更多相关《卡方检验正式》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2 2022年小学体育教师学期工作总结 2022年家长会心得体会集合15篇
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.