
医学统计学第3版卡方检验.ppt
71页ΧΧ2 2 检检 验验1主要内容主要内容n n1 1、卡方分布、卡方分布n n2 2、拟合优度检验基本思想和步骤、拟合优度检验基本思想和步骤n n3 3、两独立、两独立2×2列联表资料卡方检验表资料卡方检验n n 两配对两配对2×2列联表资料卡方检验表资料卡方检验n n R×C列联表资料卡方检验表资料卡方检验n n 234567 目的:目的: 推断两个总体率或构成比之间有无差别推断两个总体率或构成比之间有无差别 多个总体率或构成比之间有无差别多个总体率或构成比之间有无差别 多个样本率的多重比较多个样本率的多重比较 两个分类变量之间有无关联性两个分类变量之间有无关联性 频数分布拟合优度的检验频数分布拟合优度的检验 检验统计量检验统计量:: 应用应用:定性资料:定性资料8第一节 2分布和拟合优度检验 一、一、一、一、 2 2分布分布分布分布 2 2分布是一种连续型随机变量的概率分布。
分布是一种连续型随机变量的概率分布分布是一种连续型随机变量的概率分布分布是一种连续型随机变量的概率分布如果如果如果如果Z Z服从标准正态分布,那么服从标准正态分布,那么服从标准正态分布,那么服从标准正态分布,那么Z Z2 2服从自由度为服从自由度为服从自由度为服从自由度为1 1的的的的 2 2分布分布分布分布, , 其概率密度在(其概率密度在(其概率密度在(其概率密度在(0 0,+,+,+,+∞ ∞)区间上表)区间上表)区间上表)区间上表现为现为现为现为L L型,如图型,如图型,如图型,如图7-17-1对应于自由度对应于自由度对应于自由度对应于自由度=1=1的曲线,取的曲线,取的曲线,取的曲线,取较小值的可能性较大,取较大值的可能性较小较小值的可能性较大,取较大值的可能性较小较小值的可能性较大,取较大值的可能性较小较小值的可能性较大,取较大值的可能性较小 93.847.8112.59P P==0.050.05的临界值的临界值χ2分布(chi-square distribution)10((1)自由度一定时,)自由度一定时,P值越小,值越小, x2值值越大n nv=1时,时, P=0.05,, x2 =3.84 P=0.01,, x2 =6.63((2))当当P 值值一一定定时时,,自自由由度度越越大大,, x2越大。
越大n nP=0.05时,时, v=1,, x2 =3.84 v=2,, x2 =5.99 112分布n n图图7-1, 2分布的形状依赖于自由度分布的形状依赖于自由度ν的大小,的大小,当自由度当自由度ν>>2时,随着时,随着ν的增加,曲线逐渐的增加,曲线逐渐趋于对称,当自由度趋于对称,当自由度ν趋于趋于∞时,时, 2分布逼分布逼近正态分布各种自由度的近正态分布各种自由度的 2分布右侧尾分布右侧尾部面积为部面积为α时的临界值记为时的临界值记为 列于附表列于附表8 12二、拟合优度检验 拟合优度检验是根据样本的频率分布检拟合优度检验是根据样本的频率分布检验其总体分布是否等于某给定的理论分布验其总体分布是否等于某给定的理论分布 拟合优度检验步骤:拟合优度检验步骤:1.建立检验假设.建立检验假设H0 0::总体分布等于给定的理论分布总体分布等于给定的理论分布H1 1::总体分布不等于给定的理论分布总体分布不等于给定的理论分布 13拟合优度检验2.计算检验统计量.计算检验统计量 实际观察到的频数用实际观察到的频数用实际观察到的频数用实际观察到的频数用A A表示,根据表示,根据表示,根据表示,根据H0H0确定的确定的确定的确定的理论频数用理论频数用理论频数用理论频数用T T表示,则大样本时统计量,自由度表示,则大样本时统计量,自由度表示,则大样本时统计量,自由度表示,则大样本时统计量,自由度=K-1-=K-1-((((利用的参数个数)利用的参数个数)利用的参数个数)利用的参数个数)14拟合优度检验 以上两个公式以上两个公式以上两个公式以上两个公式 2 2检验的基本公式,所有其它检验的基本公式,所有其它检验的基本公式,所有其它检验的基本公式,所有其它形式的形式的形式的形式的 2 2检验公式都来源于此。
检验公式都来源于此检验公式都来源于此检验公式都来源于此 2 2值反映了样本值反映了样本值反映了样本值反映了样本实际频数分布与理论总体分布的符合程度实际频数分布与理论总体分布的符合程度实际频数分布与理论总体分布的符合程度实际频数分布与理论总体分布的符合程度如果如果如果如果原假设成立,原假设成立,原假设成立,原假设成立, 2 2值不会太大;反之,值不会太大;反之,值不会太大;反之,值不会太大;反之,A A若与若与若与若与T T差差差差距大,距大,距大,距大, 2 2值也大;当值也大;当值也大;当值也大;当 2 2值超出一定范围时,就有值超出一定范围时,就有值超出一定范围时,就有值超出一定范围时,就有理由认为原假设不成立理由认为原假设不成立理由认为原假设不成立理由认为原假设不成立 3 3.确定相应的概率.确定相应的概率.确定相应的概率.确定相应的概率P P,,,,作出推断结论作出推断结论作出推断结论作出推断结论 15拟合优度检验例例例例7-1 7-1 对表对表对表对表7-17-1所示数据作正态分布拟合优度检验所示数据作正态分布拟合优度检验。
所示数据作正态分布拟合优度检验所示数据作正态分布拟合优度检验136136例体模骨密度测量值的均数例体模骨密度测量值的均数例体模骨密度测量值的均数例体模骨密度测量值的均数=1.260;=1.260;标准差标准差标准差标准差=0.010=0.010n n检验的假设检验的假设检验的假设检验的假设: :HH0 0::::总体分布等于均数为总体分布等于均数为总体分布等于均数为总体分布等于均数为1.2601.260,标准差为,标准差为,标准差为,标准差为0.0100.010的正的正的正的正态分布态分布态分布态分布HH1 1::::总体分布不等于该正态分布总体分布不等于该正态分布总体分布不等于该正态分布总体分布不等于该正态分布 16表表7-1 136例体模骨密度例体模骨密度测量量值频数分布表及数分布表及拟合合优度度检验统计量的量的计算算组组段段段段((((1 1))))实际频实际频数数数数A A((((2 2))))ΦΦΦΦ((((X X1 1 1 1))))((((3 3))))ΦΦΦΦ((((X X2 2 2 2))))((((4 4))))P P((((X X))))((((5 5))))T T= =n n× ×P P((((X X))))((((6 6))))((((A—TA—T))))2 2/ /T T((((7 7))))1.2281.228――2 20.000690.000690.004660.004660.003970.00397 0.5405 0.54053.941433.941431.2341.234――2 20.004660.004660.022750.022750.018090.01809 2.4601 2.46010.086050.086051.2401.240――7 70.022750.022750.080760.080760.058010.05801 7.8889 7.88890.100160.100161.2461.246――17170.080760.080760.211860.211860.131100.1311017.829417.82940.038590.038591.2521.252――25250.211860.211860.420740.420740.208880.2088828.408328.40830.408920.408921.2581.258――37370.420740.420740.655420.655420.234680.2346831.916731.91670.809610.809611.2641.264――25250.655420.655420.841340.841340.185920.1859225.285525.28550.003220.003221.2701.270――16160.841340.841340.945200.945200.103860.1038614.124414.12440.249060.249061.2761.276――4 40.945200.945200.986100.986100.040900.04090 5.5618 5.56180.438580.438581.2821.282――1 10.986100.986100.997440.997440.011350.01135 1.5434 1.54340.191300.19130合合合合计计——————————6.266926.2669217拟合优度检验n n计算统计量计算统计量计算统计量计算统计量: :n n推断结论推断结论推断结论推断结论: :自由度自由度自由度自由度=10-1-2=7,=10-1-2=7,查附表查附表查附表查附表8, 8,得到得到得到得到P>0.50,P>0.50,可以认为该样本服从正态分布。
可以认为该样本服从正态分布可以认为该样本服从正态分布可以认为该样本服从正态分布 计算T I 时的参数有2个(均数和标准差)18Karl Pearsonn nKarl PearsonKarl Pearson卡尔卡尔··皮尔森皮尔森 (1857-1936)(1857-1936):英国生物学家:英国生物学家和统计学家,旧数理学派和描述统计学派的代表人物,现和统计学家,旧数理学派和描述统计学派的代表人物,现代统计科学的创立者,被公认为统计学之父代统计科学的创立者,被公认为统计学之父n n他是个社会主义者出于对马克思的敬仰,他在二十三岁他是个社会主义者出于对马克思的敬仰,他在二十三岁那年,把名字从英文的习惯写法Carl改为与马克思相那年,把名字从英文的习惯写法Carl改为与马克思相同的Karl同的Karln nK. Pearson 22K. Pearson 22岁毕业于剑桥大学数学系;曾参与激进的岁毕业于剑桥大学数学系;曾参与激进的政治活动出版几本文学作品,并且作了三年的律师实习政治活动出版几本文学作品,并且作了三年的律师实习2727岁进入伦敦大学学院岁进入伦敦大学学院 (University College, London)(University College, London),,教授数学与力学,从此待在该校一直到教授数学与力学,从此待在该校一直到19331933年。
年 19Karl Pearsonn nK. PearsonK. Pearson是活跃在是活跃在1919世纪末叶和世纪末叶和2020世纪初叶的世纪初叶的罕见的百科全书式的学者他是应用数学家、生罕见的百科全书式的学者他是应用数学家、生物统计学家和优生学家,也是天文学、弹性和工物统计学家和优生学家,也是天文学、弹性和工程问题专家,又是名副其实的科学哲学家、历史程问题专家,又是名副其实的科学哲学家、历史学家、民俗学家、宗教学家、人类学家、语言学学家、民俗学家、宗教学家、人类学家、语言学家、伦理学家,还是律师、教育改革者、社会主家、伦理学家,还是律师、教育改革者、社会主义者、人道主义者、妇女解放的鼓吹者,同时还义者、人道主义者、妇女解放的鼓吹者,同时还是受欢迎的教师、编辑、文学作品和人物传记的是受欢迎的教师、编辑、文学作品和人物传记的作者 20Karl Pearsonn nK. Pearson K. Pearson 最重要的学术成就,是为现代统计学最重要的学术成就,是为现代统计学打下基础许多熟悉的统计名词如标准差,成分打下基础许多熟悉的统计名词如标准差,成分分析,卡方检验都是他提出的。
分析,卡方检验都是他提出的 n nK. PearsonK. Pearson、、Galton Galton 与与 Weldon Weldon 为了推广统计在为了推广统计在生物上的应用,于生物上的应用,于19011901年创立统计的元老期刊年创立统计的元老期刊《《BiometrikaBiometrika》》,, 由由 K. Pearson K. Pearson 主编至死,但主编至死,但是是 K. Pearson K. Pearson 的主观强,经常对他本人认为有的主观强,经常对他本人认为有““争议争议””的文章,的文章, 删改或退稿,并因此与英国二删改或退稿,并因此与英国二十世纪最有才华的统计学家十世纪最有才华的统计学家 Fisher Fisher 结下梁子结下梁子 21K. PearsonK. Pearson在在统计学方面的主要贡献:统计学方面的主要贡献:1.1.推导出推导出 分布,提出分布,提出 检验(检验(19001900年)2.2.发展了回归和相关理论发展了回归和相关理论 22处理组处理组处理组处理组发生数发生数发生数发生数未发生数未发生数未发生数未发生数合计合计合计合计甲甲甲甲a ab ba+ba+b乙乙乙乙c cd dc+dc+d合计合计合计合计a+ca+cb+db+dn n四格表资料的基本形式四格表资料的基本形式第二节 独立样本2×2列联列联表资料的 2检验23成立成立两组人群的总体阳性率相同两组人群的总体阳性率相同理论频数的计算及含义理论频数的计算及含义x2 统计量的含义统计量的含义对应对应P 值值(16.6)(26.4)(55.4)(87.6) 各种情形下,理论频数与实际频数偏离的总和即为各种情形下,理论频数与实际频数偏离的总和即为χ2值值(chi-square value)(chi-square value),,它服从自由度为它服从自由度为νν的的χ2分布。
分布二、二、 χ2 2 检验的基本思想检验的基本思想24一、二分类情形一、二分类情形——2×2列联表表 例例例例7-2 7-2 某医师研究用兰芩口服液与银黄口服液治疗某医师研究用兰芩口服液与银黄口服液治疗某医师研究用兰芩口服液与银黄口服液治疗某医师研究用兰芩口服液与银黄口服液治疗慢性咽炎疗效有无差别,将病情相似的慢性咽炎疗效有无差别,将病情相似的慢性咽炎疗效有无差别,将病情相似的慢性咽炎疗效有无差别,将病情相似的8080名患者名患者名患者名患者随机分成两组,分别用两种药物治疗,结果见表随机分成两组,分别用两种药物治疗,结果见表随机分成两组,分别用两种药物治疗,结果见表随机分成两组,分别用两种药物治疗,结果见表7-27-2 25表表7-27-2 慢性咽炎两种药物疗效资料 慢性咽炎两种药物疗效资料药药物物物物疗疗效效效效合合合合计计有效有效有效有效无效无效无效无效兰兰芩口服液芩口服液芩口服液芩口服液41 (36.56)41 (36.56) 4 (8.44) 4 (8.44)4545(固定(固定(固定(固定值值))))银银黄口服液黄口服液黄口服液黄口服液24 (28.44)24 (28.44)11 (6.56)11 (6.56)3535(固定(固定(固定(固定值值))))合合合合计计 65 65 15 15 80 8026n n问题问题::üü这两个频数分布的总体分布是否相等?这两个频数分布的总体分布是否相等?üü或者这两份样本是否来自同一个总体。
因或者这两份样本是否来自同一个总体因为这里是二分类变量,问两个总体分布是为这里是二分类变量,问两个总体分布是否相等就相当于问两个有效概率是否相等否相等就相当于问两个有效概率是否相等 27((1)建立检验假设)建立检验假设H0::π1= π2 两药的有效概率相同两药的有效概率相同H1:: π1≠π2 两药有效概率不同两药有效概率不同 检验水准检验水准 =0.05 ((2)计算检验统计量)计算检验统计量28自由度 自由度 自由度 自由度 =(2-1)(2-1)=1=(2-1)(2-1)=1((((3 3)确定)确定)确定)确定p p值值值值查附表查附表查附表查附表8 8,,,, =1=1对应的临界值对应的临界值对应的临界值对应的临界值 , , P P<0.025<0.0254 4))))结论结论结论结论: :拒绝拒绝拒绝拒绝HH0 0,,,,两样本频率的差别具有统计学两样本频率的差别具有统计学两样本频率的差别具有统计学两样本频率的差别具有统计学意义可以认为,兰芩口服液和银黄口服液的总意义可以认为,兰芩口服液和银黄口服液的总意义可以认为,兰芩口服液和银黄口服液的总意义。
可以认为,兰芩口服液和银黄口服液的总体有效概率不同,前者(体有效概率不同,前者(体有效概率不同,前者(体有效概率不同,前者(91.1%91.1%)高于后者)高于后者)高于后者)高于后者((((68.6%68.6%)29对于四格表资料,四格表专用公式对于四格表资料,四格表专用公式对于四格表资料,四格表专用公式对于四格表资料,四格表专用公式 30n n当当n≥40时,如果有某个格子出现时,如果有某个格子出现1≤T<5,,一一般需用校正公式般需用校正公式如果样本例数不是很大,计算时应先估计表中最小的T值,也就是行合计最小值及列合计最小行合计最小值及列合计最小值所对应的那一格的值所对应的那一格的T T值值,以确定是否需采用校正公式 31Basic thinking of chi-square testn n 值除取决于值除取决于A A与与T T的吻合程度,还与格子数有关的吻合程度,还与格子数有关格子数越多,格子数越多, 值会越大值会越大n nIf If H H0 0 is true, chi-square statistic will tend to be is true, chi-square statistic will tend to be small.small.n nIf If H H0 0 is not true, chi-square statistic will tend to be is not true, chi-square statistic will tend to be large.large.n nIf , then reject If , then reject H H0 0。
n nOtherwise, no reason to reject Otherwise, no reason to reject H H0 0 32例例例例7-3 7-3 将病情相似的淋巴系肿瘤患者随机分成两组,将病情相似的淋巴系肿瘤患者随机分成两组,将病情相似的淋巴系肿瘤患者随机分成两组,将病情相似的淋巴系肿瘤患者随机分成两组,分别做单纯化疗与复合化疗,两组的缓解率见表分别做单纯化疗与复合化疗,两组的缓解率见表分别做单纯化疗与复合化疗,两组的缓解率见表分别做单纯化疗与复合化疗,两组的缓解率见表7-47-4,问两疗法的总体缓解率是否不同?,问两疗法的总体缓解率是否不同?,问两疗法的总体缓解率是否不同?,问两疗法的总体缓解率是否不同?((((1 1)建立检验假设)建立检验假设)建立检验假设)建立检验假设H0H0::::π π1 1= π= π2, 2, 两法总体缓解概率相同两法总体缓解概率相同两法总体缓解概率相同两法总体缓解概率相同 H1H1:::: π π1≠1≠π π2 2,,,,两法总体缓解概率不同两法总体缓解概率不同两法总体缓解概率不同两法总体缓解概率不同 检验水准检验水准检验水准检验水准 =0.05 =0.05 33表7-4 两种疗法缓解率的比较 组别组别属性属性属性属性合合合合计计缓缓解率解率解率解率((((%%))))缓缓解解解解未未未未缓缓解解解解单纯单纯化化化化疗疗2 ( 4.8)2 ( 4.8)10 ( 7.2)10 ( 7.2)1212(固定(固定(固定(固定值值))))16.716.7复合化复合化复合化复合化疗疗14 (11.2)14 (11.2)14 (16.8)14 (16.8)2828(固定(固定(固定(固定值值))))50.050.0合合合合计计16162424404040.040.0342)计算检验统计量)计算检验统计量 =(2-1)(2-1)=1 3)确定确定P值值:P>0.1,,高于检验水准高于检验水准 ,不能拒,不能拒绝绝H0 0,,差别无统计学意义,尚不能认为两差别无统计学意义,尚不能认为两种治疗方案的总体缓解概率不同。
种治疗方案的总体缓解概率不同 35n n特别注意特别注意: 当四格表出现当四格表出现T<1或或n<40时,校正时,校正 2值也值也不恰当,这时必须用四格表的确切概率计不恰当,这时必须用四格表的确切概率计算法(见本章第算法(见本章第6节) 36四格表资料四格表资料 检验公式选择条件:检验公式选择条件: ,专用公式; ,校正公式; ,直接计算概率 连续性校正仅用于连续性校正仅用于 的四格表资料,当的四格表资料,当 时,一般不作校正时,一般不作校正 37二、多分类的情形——2×C列联表 定性变量具有多分类时定性变量具有多分类时定性变量具有多分类时定性变量具有多分类时, , 两个频数分布的数据两个频数分布的数据两个频数分布的数据两个频数分布的数据可表示为一个可表示为一个可表示为一个可表示为一个2×C2×C列联表 例例例例7-4 7-4 北京市北京市北京市北京市19861986年城市和农村年城市和农村年城市和农村年城市和农村2020至至至至4040岁已婚妇岁已婚妇岁已婚妇岁已婚妇女避孕方法情况如表女避孕方法情况如表女避孕方法情况如表女避孕方法情况如表7-57-5所示,试分析北京城市和所示,试分析北京城市和所示,试分析北京城市和所示,试分析北京城市和农村采用不同避孕方法的总体分布是否有差别。
农村采用不同避孕方法的总体分布是否有差别农村采用不同避孕方法的总体分布是否有差别农村采用不同避孕方法的总体分布是否有差别 38表表7-5 7-5 北京城市和农村已婚妇女避孕方法情况北京城市和农村已婚妇女避孕方法情况 地区地区地区地区避孕方法避孕方法避孕方法避孕方法合合合合计计节节育器育器育器育器服避孕服避孕服避孕服避孕药药避孕套避孕套避孕套避孕套节节育器育器育器育器其他其他其他其他城市城市城市城市15315333331651651531534040431431农农村村村村320320757543433203201818518518合合合合计计473473108108208208473473585894994939((1)建立检验假设)建立检验假设H0 0::北京城市和农村已婚妇女避孕方法的总北京城市和农村已婚妇女避孕方法的总体概率分布相同体概率分布相同H1 1::北京城市和农村已婚妇女避孕方法的总北京城市和农村已婚妇女避孕方法的总体概率分布不同体概率分布不同检验水准检验水准 =0.0540((2)计算检验统计量)计算检验统计量H0 0成立时,两组概率分布相同,均近似地等成立时,两组概率分布相同,均近似地等于合并计算的频率分布。
于合并计算的频率分布41 =(2-1)(4-1)=3,=(2-1)(4-1)=3,查附表查附表查附表查附表8 8P P<0.001<0.001,,,,按按按按 =0.05=0.05水准拒绝水准拒绝水准拒绝水准拒绝HH0 0可以认为可以认为可以认为可以认为, , 北京城北京城北京城北京城市和农村已婚妇女避孕方法的总体概率分布不同市和农村已婚妇女避孕方法的总体概率分布不同市和农村已婚妇女避孕方法的总体概率分布不同市和农村已婚妇女避孕方法的总体概率分布不同据调查数据,城市使用男用避孕套的频率高于农据调查数据,城市使用男用避孕套的频率高于农据调查数据,城市使用男用避孕套的频率高于农据调查数据,城市使用男用避孕套的频率高于农村;宫内节育器是城市和农村的主要避孕方式,村;宫内节育器是城市和农村的主要避孕方式,村;宫内节育器是城市和农村的主要避孕方式,村;宫内节育器是城市和农村的主要避孕方式,但农村使用宫内节育器的频率比城市高但农村使用宫内节育器的频率比城市高但农村使用宫内节育器的频率比城市高但农村使用宫内节育器的频率比城市高42第三节 独立样本R×C列联表资料的2检验43设有一个定性变量,具有设有一个定性变量,具有CC个可能的个可能的“取值取值”;现有;现有R组独立样本的频数分布,其数据组独立样本的频数分布,其数据以表以表7-7的形式表示。
这样的数据形式称为的形式表示这样的数据形式称为R×C列联表4445 例例7-5 为研究某镇痛药的不同剂量镇为研究某镇痛药的不同剂量镇痛效果是否有差别,研究人员在自愿的痛效果是否有差别,研究人员在自愿的原则下,将条件相似的原则下,将条件相似的53名产妇随机分名产妇随机分成三组成三组, 分别按三种不同剂量服用该药,分别按三种不同剂量服用该药,镇痛效果如表镇痛效果如表7-846表表7-8 某药不同剂量的镇痛效果 某药不同剂量的镇痛效果剂剂量量量量镇镇痛效果痛效果痛效果痛效果合合合合计计有效率有效率有效率有效率(%)(%)有效有效有效有效无效无效无效无效1.0mg1.0mg 3 (7.36) 3 (7.36) 12 ( 7.64) 12 ( 7.64) 1515(固定(固定(固定(固定值值))))20.0020.002.5mg2.5mg11 (9.81)11 (9.81) 9 (10.19)9 (10.19) 2020(固定(固定(固定(固定值值))))55.0055.005.0mg5.0mg12 (8.83)12 (8.83) 6 ( 9.17)6 ( 9.17)1818(固定(固定(固定(固定值值))))66.6766.67合合合合计计26262727535349.0649.0647((1)建立检验假设)建立检验假设H0 0::三种剂量镇痛有效的概率相同。
三种剂量镇痛有效的概率相同H1 1::不同剂量镇痛有效的概率不全相同不同剂量镇痛有效的概率不全相同检验水准取为检验水准取为 =0.05按公式按公式(7-13)计算计算 2统计量统计量48自由度自由度 =(3-1)(2-1)=2,查附表查附表8,, P<<0.025,按,按0.05水准,水准,拒绝拒绝H0,,差别有统计学意义差别有统计学意义可以认为三种剂量镇痛有效的总体概率有差别为三种剂量镇痛有效的总体概率有差别 对于比较多组独立样本的对于比较多组独立样本的 2检验检验, 拒绝拒绝H0只能只能说各组总体概率不全相同,即多组中至少有两组说各组总体概率不全相同,即多组中至少有两组的有效概率是不同的,但并不是多组有效概率彼的有效概率是不同的,但并不是多组有效概率彼此之间均不相同若要明确哪两组间不同,还需此之间均不相同若要明确哪两组间不同,还需进一步作多组间的两两比较进一步作多组间的两两比较 49不同剂量有效概率间的两两比较结果见表不同剂量有效概率间的两两比较结果见表不同剂量有效概率间的两两比较结果见表不同剂量有效概率间的两两比较结果见表7-9 7-9 对对比比比比组组四格表四格表四格表四格表 2 2值值P P值值检验检验水准修正水准修正水准修正水准修正值值检验结检验结果果果果1.0mg vs. 1.0mg vs. 2.5mg2.5mg4.384.380.0360.0360.01670.0167——1.0mg vs. 1.0mg vs. 5.0mg5.0mg7.197.190.0070.0070.01670.0167* *2.5mg vs. 2.5mg vs. 5.0mg5.0mg0.540.540.4630.4630.01670.0167——50行×列联表资料 检验的注意事项511..行列表中的行列表中的各格各格T≥1,,并且并且1≤T<<5的格子数不宜超过的格子数不宜超过1/5格子总数,否则可格子总数,否则可能产生偏性。
处理方法有三种:能产生偏性处理方法有三种:Ø 增大样本含量以达到增大理论频数的目的,属首选方法,只是有些研究无法增大样本含量,如同一批号试剂已用完等52Ø根据专业知识,删去理论频数太小的行或列,或将理论频数太小的行或列与性质相近的邻行或邻列合并这样做会损失信息及损害样本的随机性注意注意:不同年龄组可以合并,但不同血型就不能合并Ø改用双向无序R×C表的Fisher确切概率法(可用SAS软件实现)535455第四节 配对设计资料的2检验56配对四格表和一般四格表比较57一、二分类情形——2×2列联列联表例例7-6 设有 设有28份咽喉涂抹标本,把每份标本份咽喉涂抹标本,把每份标本一分为二,依同样的条件分别接种于甲、一分为二,依同样的条件分别接种于甲、乙两种白喉杆菌培养基上,观察白喉杆菌乙两种白喉杆菌培养基上,观察白喉杆菌的生长情况,结果如表的生长情况,结果如表7-10,问两种培养基,问两种培养基上白喉杆菌的生长概率有无差别?上白喉杆菌的生长概率有无差别? 采用采用McNemar 检验检验58表表7-10 两种培养基白喉杆菌生长情况两种培养基白喉杆菌生长情况甲培养基甲培养基甲培养基甲培养基乙培养基乙培养基乙培养基乙培养基阳性阳性阳性阳性阴性阴性阴性阴性合合合合计计阳性阳性阳性阳性222218184040阴性阴性阴性阴性2 214141616合合合合计计24243232 5656(固定(固定(固定(固定值值))))注:“阳性”表示生长,“阴性”表示不生长 5960H0 0::两种培养基上白喉杆菌生长的阳性概率两种培养基上白喉杆菌生长的阳性概率相等相等H1 1::两种培养基上白喉杆菌生长的阳性概率两种培养基上白喉杆菌生长的阳性概率不相等不相等检验水准检验水准 =0.05。
若若H0 0成立,白喉杆菌生长状况不一致的两个成立,白喉杆菌生长状况不一致的两个格子理论频数都应该是格子理论频数都应该是(b+c)/2 61计算公式计算公式:: b+c>=40时,时,当当b+c<40时,需做连续性校正:时,需做连续性校正:62由由 2检验基本公式(检验基本公式(7-1)有)有化简后不难得到化简后不难得到, 2统计量的计算公式为统计量的计算公式为63因因因因b+c<40,b+c<40,P P<<<<0.050.05,按,按,按,按α=0.05α=0.05水准拒绝水准拒绝水准拒绝水准拒绝HH0 0,,,,差别有统计学意义,差别有统计学意义,差别有统计学意义,差别有统计学意义,可以认为可以认为可以认为可以认为, , 两种培养基上白喉杆菌生长的阳性概两种培养基上白喉杆菌生长的阳性概两种培养基上白喉杆菌生长的阳性概两种培养基上白喉杆菌生长的阳性概率不相等鉴于甲培养基阳性频率为率不相等鉴于甲培养基阳性频率为率不相等鉴于甲培养基阳性频率为率不相等鉴于甲培养基阳性频率为40/56=71.4%40/56=71.4%,乙培养基为,乙培养基为,乙培养基为,乙培养基为24/56=42.9%24/56=42.9%,可以认为,可以认为,可以认为,可以认为, , 甲培养基甲培养基甲培养基甲培养基阳性概率高于乙培养基。
阳性概率高于乙培养基阳性概率高于乙培养基阳性概率高于乙培养基64注意: 本本法法一一般般用用于于样样本本含含量量不不太太大大的的资资料料因因为为它它仅仅考考虑虑了了两两法法结结果果不不一一致致的的两两种种情情况况(b, c),,而而未未考考虑虑样样本本含含量量n和和两两法法结结果果一一致致的的两两种种情情况况(a, d)所所以以,,当当n很很大大且且a与与d的的数数值值很很大大((即即两两法法的的一一致致率率较较高高)),,b与与c的的数数值值相相对对较较小小时时,,即即便便是是检检验验结结果果有有统统计计学学意意义义,,其其实实际际意义往往也不大意义往往也不大65第五节 2检验要注意的问题661.关于1.关于 2检验的条件检验的条件 使用使用 2检验在任何情况下都要注意理论检验在任何情况下都要注意理论频数频数 T不能太小一般要求各格的理论频数不能太小一般要求各格的理论频数均应大于均应大于1,且,且T<5的格子数不宜多于格子的格子数不宜多于格子总数总数R×C的的1/5 2. 关于似然比关于似然比 2统计量统计量 作作 2检验,既可以计算检验,既可以计算Pearson 2统计统计量,也可以计算似然比量,也可以计算似然比 2((Likelihood ratio chi-square))统计量,统计量, 67四格表的确切概率法 理论数小于理论数小于1或或n < 40或作或作 2检验后所得概率检验后所得概率P 接近检验水准接近检验水准 ,, 68小小 结结三、四格表资料连续性校正的条件为三、四格表资料连续性校正的条件为:: ①①1<<T<<5,而,而n>>40时,须计算校正值。
时,须计算校正值 ②②T≤1或或n≤40时,需用确切概率计算法时,需用确切概率计算法了解)(了解)一一、、χ2检检验验是是一一种种具具有有广广泛泛用用途途的的假假设设检检验验方方法法,,可可用用于于两两个个或或多多个个样样本本率率((或或构构成成比比))间间的的比比较较、、计计数数资料的关联度分析、拟合优度检验等等资料的关联度分析、拟合优度检验等等二、二、χ2检验检验的理论公式为:的理论公式为:69四、配对资料的四、配对资料的χ2检验,计算公式为:检验,计算公式为:五、五、R×C表资料表资料χ2检验的注意事项检验的注意事项70重重 点点 重点重点2 2 2 2表资料的表资料的 2 2检验检验 一般公式一般公式::校正公式:校正公式:若若两两者结果不同,以者结果不同,以校校正公式正公式为准 要要求求记记住住0.050.05和和0.010.01水水平平的的界界值值,,3.843.84和和6.636.63。












