电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本
换一换
首页 金锄头文库 > 资源分类 > PPT文档下载
分享到微信 分享到微博 分享到QQ空间

卡方检验正式

  • 资源ID:115523255       资源大小:1.50MB        全文页数:86页
  • 资源格式: PPT        下载积分:30金贝
快捷下载 游客一键下载
账号登录下载
微信登录下载
三方登录下载: 微信开放平台登录   支付宝登录   QQ登录  
二维码
微信扫一扫登录
下载资源需要30金贝
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
如填写123,账号就是123,密码也是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

 
账号:
密码:
验证码:   换一换
  忘记密码?
    
1、金锄头文库是“C2C”交易模式,即卖家上传的文档直接由买家下载,本站只是中间服务平台,本站所有文档下载所得的收益全部归上传人(卖家)所有,作为网络服务商,若您的权利被侵害请及时联系右侧客服;
2、如你看到网页展示的文档有jinchutou.com水印,是因预览和防盗链等技术需要对部份页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有jinchutou.com水印标识,下载后原文更清晰;
3、所有的PPT和DOC文档都被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;下载前须认真查看,确认无误后再购买;
4、文档大部份都是可以预览的,金锄头文库作为内容存储提供商,无法对各卖家所售文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;
5、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据;
6、如果您还有什么不清楚的或需要我们协助,可以点击右侧栏的客服。
下载须知 | 常见问题汇总

卡方检验正式

1,2检验 Chi-squared test,第7章,蒋红卫 Email: JHWCCC21CN.COM,2,讲课内容:,1. 概述基本思想 2. 2×2表卡方检验 3. 配对四格表卡方检验 4. Fisher确切概率检验 5. R×C表卡方检验 6. 多个样本率的多重比较 7. 有序分组资料的线性趋势检验,3,概念回顾,在总体率为的二项分布总体中做n1和n2抽样,样本率p1和p2与的差别,称为率抽样误差。 在总体率为1和2的不同总体中抽样,得p1和p2,在n5,可通过率的u检验推断是否1=2。 二项分布的两个样本率的检验同样可用2检验。,4,目的: 推断两个总体率或构成比之间有无差别 多个总体率或构成比之间有无差别 多个样本率的多重比较 两个分类变量之间有无关联性 频数分布拟合优度的检验。 检验统计量:2 应用:计数资料,5,基本概念,例1 某院比较异梨醇(试验组)和氢氯塞嗪(对照组)降低颅内压的疗效,将200名患者随机分为两组,试验组104例中有效的99例,对照组96例中有效的78例,问两种药物对降低颅内压疗效有无差别?,6,表 200名颅内高压患者治疗情况,如何整理此类资料? 如何分析此类资料?,7,四格表(fourfold table)资料的基本形式,实际频数(actual frequency)是指各分类实际发生或未发生计数值,记为A。,单元格,8,理论频数(theoretical frequency)是指按某H0假设计算各分类理论上的发生或未发生计数值,记为T。,式中,TRC 为第R 行C 列的理论频数 nR 为相应的行合计 nC 为相应的列合计,9,残差 设A代表某个类别的观察频数,T代表基于H0计算出的期望频数,A与T之差(A-T)被称为残差 残差可以表示某一个类别观察值和理论值的偏离程度,但残差有正有负,相加后会彼此抵消,总和仍然为0。为此可以将残差平方后求和,以表示样本总的偏离无效假设的程度 类似于方差的计算思想,,10,Pearson 2检验的基本公式,残差大小是一个相对的概念,相对于期望频数为10时,20的残差非常大;可相对于期望频数为1000时20就很小了。因此又将残差平方除以期望频数再求和,以标准化观察频数与期望频数的差别。 卡方统计量,1900年由英国统计学家K. Pearson首次提出。,Karl Pearson (1857 1936),11,从卡方的计算公式可见,当观察频数与期望频数完全一致时,卡方值为0; 观察频数与期望频数越接近,两者之间的差异越小,卡方值越小; 反之,观察频数与期望频数差别越大,两者之间的差异越大,卡方值越大。 当然,卡方值的大小也和自由度有关 检验的自由度取决于可以自由取值的格子数目,而不是样本含量n。 理论上,在n40时下式值与2分布近似,在理论数5,近似程度较好。,12,连续型分布:正态分布(Normal distribution),学生氏t分布(Students t-distribution),F分布(F distribution) 另一个同样重要的分布2卡方分布(Chi-squared distribution)。 此分布在1875年,首先由F. Helmet所提出,而且是由正态分布演变而来的,即标准正态分布Z值之平方而得,2分布,13,设Xi为来自正态总体的连续性变量。,称为自由度df=n的卡方值。,显然,卡方分布具有可加性。,14,3.84,7.81,12.59,P0.05的临界值,2分布的概率密度函数曲线,15,当=1时,16,第二节 2×2表卡方检验,17,两组样本率比较的设计分类: 1.两组(独立) 样本率的比较 组间数据是相互独立,非配对设计。 2×2表卡方检验 2.配对设计两组样本率的比较 组间数据是相关的,配对设计。 配对四格表卡方检验,18,两组(不配对)样本率的比较,1)四格表形式 2)四格表不配对资料检验的专用公式,二者结果等价,各组样本例数是固定的,19,例1(续),20,H0:1=2 即试验组与对照组降低颅内压的总体有效率相等 H1:12 =0.05。,以=1查附表8的2界值表得P0.005。按=0.05检验水准拒绝H0,接受H1,可以认为两组降低颅内压总体有效率不等,即可认为异梨醇口服液降低颅内压的有效率高于氢氯噻嗪+地塞米松的有效率。,21,值得指出,成组设计四格表资料的2检验与前面学习过的两样本率比较的双侧u检验是等价的。 若对同一资料作两种检验,两个统计量的关系为2= u2。其对应的界值也为平方关系。 两者的应用条件也是基本一致的,连续性校正也基本互相对应。,22,卡方检验假设的等价性,两组颅内压治疗有效率相同 两组有效率的比较 实际数据的频数分布和理论假设相同 理论分布与实际分布的检验 使用不同的药物并不会影响颅内压的治疗(两个分类变量间无关联) 两变量的相关分析,23,四格表2值的校正,英国统计学家Yates认为,2分布是一种连续型分布,而四格表资料是分类资料,属离散型分布,由此计算的2值的抽样分布也应当是不连续的,当样本量较小时,两者间的差异不可忽略,应进行连续性校正(在每个单元格的残差中都减去0.5) 若n 40 ,此时有 1 T 5时,需计算Yates连续性校正2值 T 1,或n40时,应改用Fisher确切概率法直接计算概率,24,(1) 校正公式的条件: 1T5,同时N40,用校正公式计算 (2) 连续校正(continuity correction)公式:,(3) 当T1,或N40,用Fisher确切概率法,四格表2 检验的校正公式 (两组不配对资料),25,例2 某医师欲比较胞磷胆碱与神经节苷酯治疗脑血管疾病的疗效,将78例脑血管疾病患者随机分为两组,结果见表7-2。问两种药物治疗脑血管疾病的有效率是否相等?,H0:1=2 即两种药物治疗脑血管疾病的总体有效率相等 H1:12 =0.05。,26,表 两种药物治疗脑血管疾病有效率的比较,27,本例n=78,但T224.67,故用四格表资料2检验的校正公式,不校正2=4.35,p0.05,以=1查附表8的2界值表得P0.05。按=0.05检验水准,不拒绝H0,无统计学意义,尚不能认为两种药物治疗脑血管疾病的有效率不等。,28,卡方检验的连续性校正问题,正方观点: 卡方统计量抽样分布的连续性和平滑性得到改善,可以降低I类错误的概率; 校正结果更接近于Fisher确切概率法; 校正是有条件的。 反方观点: 经连续性校正后,P值有过分保守之嫌; 连续性校正卡方检验的P值与Fisher确切概率法的P值没有可比性,这是因为Fisher确切概率法建立在四格表双边固定的假定下,而实际资料则是单边固定的四格表。,29,就应用而言,无论是否经过连续性校正,若两种检验的结果一致,无须在此问题上纠缠。但是,当两种检验结果相互矛盾时,如例2,就需要谨慎解释结果了。 为客观起见,建议将两种结论同时报告出来,以便他人判断。当然,如果两种结论一致,如均为有或无统计学意义,则只报道非连续性检验的结果即可。,30,第二节 配对设计两个样本率的2检验 ( McNemer检验 ),配对设计:通常为同源配对。对同一观察对象分别用两种方法处理,观察其阳性与阴性结果。 基本用途:常用于比较两种检验方法或两种培养基的阳性率是否有差别。 数据形式:配对四格表形式。,31,例3 某实验室采用两种方法对58名可疑红斑狼疮患者的血清抗体进行测定,问:两方法测定结果阳性检出率是否有差别? 测定结果为:阳性、阴性(共116标本,58对) 方法(X) 乳胶凝集法 免疫荧光法 对子例数 11 33 2 12,结果,32,上述配对设计实验中,就每个对子而言,两种处理的结果不外乎有四种可能:,两种检测方法皆为阳性数(a); 两种检测方法皆为阴性数(d); 免疫荧光法为阳性,乳胶凝集法为 阴性数(b); 乳胶凝集法为阳性,免疫荧光法为 阴性数(c)。,其中,a, d 为两法观察结果一致的两种情况, b, c为两法观察结果不一致的两种情况。,33,表 两种方法的检测结果,34,方法原理,按照配对设计的思路进行分析,则首先应当求出各对的差值,然后考察样本中差值的分布是否按照H0假设的情况对称分布。 按此分析思路,最终可整理出如前所列的配对四格表。 主对角线上两种检验方法的结论相同,对问题的解答不会有任何贡献 斜对角线上两种检验方法的结论不相同,显示了检验方法间的差异,35,配对2检验统计量为,36,H0:b=c =(12+2)/2=7(两法总体阳性率相等) H1:b c (两方法总体阳性率不等) =0.05 本例b+c=12+2=1440,用校正公式 本例2=5.793.84,P0.05。在=0.05水准,拒绝H0,接受H1,有统计学意义。认为两方法的检测率不同,乳胶凝集法的阳性检测率22.41%低于免疫检测率39.66%。,37,注意事项,McNemar检验只会利用非主对角线单元格上的信息,即它只关心两者不一致的评价情况,用于比较两个评价者间存在怎样的倾向。因此,对于一致性较好的大样本数据,McNemar检验可能会失去实用价值。 例如对1万个案例进行一致性评价,9995个都是完全一致的,在主对角线上,另有5个分布在左下的三角区,显然,此时一致性相当的好。但如果使用McNemar检验,此时反而会得出两种评价有差异的结论来。,105,38,第三节,四格表资料的Fisher确切概率法,105,39,条件: 理论依据:超几何分布 (非2检验 的范畴),105,40,例4 某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果,将33例HBsAg阳性孕妇随机分为预防注射组和非预防组,结果见表7-4。问两组新生儿的HBV总体感染率有无差别?,105,41,表7-4 两组新生儿HBV感染率的比较,42,基本思想,在四格表周边合计数固定不变的条件下,计算表内4个实际频数变动时的各种组合之概率Pi;再按检验假设用单侧或双侧的累计概率P,依据所取的检验水准做出推断。,43,1各组合概率Pi的计算 在四格表周边合计数不变的条件下,表内4个实际频数 a,b,c,d 变动的组合数共有“周边合计中最小数+1”个。如例7-4,表内4个实际频数变动的组合数共有9+1=10个,依次为:,44,各组合的概率Pi服从超几何分布,其和为1。,计算公式为,45,2累计概率的计算 ( 单、双侧检验不同),46,47,48,检验步骤,49,50,表5 例4的 Fisher确切概率法计算表,51,例5 某单位研究胆囊腺癌、腺瘤的P53基因表达,对同期手术切除的胆囊腺癌、腺瘤标本各10份,用免疫组化法检测P53基因,资料见表7-6。问胆囊腺癌和胆囊腺瘤的P53基因表达阳性率有无差别?,52,表6 胆囊腺癌与胆囊腺瘤P53基因表达阳性率的比较,53,本例 a+b+c+d=10,由表7-7可看出,四格表内各种组合以i=4和i=5的组合为中心呈对称分布。,表7 例5的Fisher确切概率法计算表,*为现有样本,54,(1)计算现有样本的D*和P*及各组合下四格表的Di。 本例D*=50,P*=0.02708978。 (2)计算满足Di50条件的各组合下四格表的概率Pi。 (3)计算同时满足Di50和PiP*条件的四格表的累 计概率。本例为P7和P8, (4)计算双侧累计概率P。 P0.05,按=0.05检验水准不拒绝H0,尚不能认为胆囊腺癌与胆囊腺瘤的P53基因表达阳性率不等。,55,56,一点补充,确切概率法的原理具有通用性,对于四格表以外的情况也适用,如行乘列表、配对、配伍表格均可 对于较大的行乘列表,确切概率法的计算量将很大,有可能超出硬

注意事项

本文(卡方检验正式)为本站会员(sh****d)主动上传,金锄头文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即阅读金锄头文库的“版权提示”【网址:https://www.jinchutou.com/h-59.html】,按提示上传提交保证函及证明材料,经审查核实后我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.