
统计学卡方检验.ppt
52页单击此处编辑母版标题样式,,单击此处编辑母版文本样式,,第二级,,第三级,,第四级,,第五级,,,*,第七章,,2检验,,,,,2检验用途,单个频数分布的拟合优度检验,,完全随机设计两组频数分布,,2检验,,多组频数分布的,,2检验,,配对设计下两组频数分布,,2检验,,**四格表的确切概率法,,,2分布和拟合优度检验,,,2分布,,,,2,分布是一种连续型随机变量的概率分布如果,Z,服从标准正态分布,那么,Z,2,服从自由度为1的,,2分布, 其概率密度在(0,+∞)区间上表现,为L型,,如图7-1对应于自由度=1的曲线,取较小值的可能性较大,取较大值的可能性较小v=1,v=4,v=6,v=9,,,2分布和拟合优度检验,图7-1,,,2分布的形状依赖于自由度,ν,的大小,当自由度,ν,>2时,随着,ν,的增加,曲线逐渐趋于对称,当自由度,ν,趋于∞时,,,2分布逼近正态分布各种自由度的,,2分布右侧尾部面积为α时的临界值记为,,列于附表8,2分布和拟合优度检验,拟合优度检验,,拟合优度检验是根据样本的频率分布检验其总体分布是否等于某给定的理论分布拟合优度检验步骤:,,1.建立检验假设,,H0,:总体分布等于给定的理论分布,,H1,:总体分布不等于给定的理论分布,,,,2分布和拟合优度检验,2.计算检验统计量,,,实际观察到的频数用,A,表示,根据,H0,确定的理论频数用,T,表示,则大样本时统计量,自由度=K-1-(利用的参数个数),,,2分布和拟合优度检验,,以上两个公式,,2检验的基本公式,所有其它形式的,,2检验公式都来源于此。
,2值反映了样本实际频数分布与理论总体分布的符合程度如果原假设成立,,,2值不会太大;反之,A若与T差距大,,,2值也大;当,,2值超出一定范围时,就有理由认为原假设不成立3.确定相应的概率P,作出推断结论,,,2分布和拟合优度检验,例7-1 对表7-1所示数据作正态分布拟合优度检验136例体模骨密度测量值的均数=1.260;标准差=0.010,,检验的假设:,,H,0:总体分布等于均数为1.260,标准差为0.010的正态分布,,H,1:总体分布不等于该正态分布,,,表7-1,136,例体模骨密度测量值频数分布表及拟合优度检验统计量的计算,,组段,,(1),实际频数,A,,(2),Φ,(,X,1,),,(3),Φ,(,X,2,),,(4),P,(,X,),,(5),T,=,n,×,P,(,X,),,(6),(,A—T,),2,/,T,,(7),1.228―,2,0.00069,0.00466,0.00397,0.5405,3.94143,1.234―,2,0.00466,0.02275,0.01809,2.4601,0.08605,1.240―,7,0.02275,0.08076,0.05801,7.8889,0.10016,1.246―,17,0.08076,0.21186,0.13110,17.8294,0.03859,1.252―,25,0.21186,0.42074,0.20888,28.4083,0.40892,1.258―,37,0.42074,0.65542,0.23468,31.9167,0.80961,1.264―,25,0.65542,0.84134,0.18592,25.2855,0.00322,1.270―,16,0.84134,0.94520,0.10386,14.1244,0.24906,1.276―,4,0.94520,0.98610,0.04090,5.5618,0.43858,1.282―,1,0.98610,0.99744,0.01135,1.5434,0.19130,合计,—,—,—,—,—,6.26692,,,2分布和拟合优度检验,,表7-1 中第3列、第4列正态分布函数值可通过对作标准正态变换后查正态分布表或利用相应的SAS程序得到,第5列为第4列与第3列的差值,第6列理论频数,T,等于总例数136与各组段概率的乘积,第7列各数之和即检验统计量,,2值。
,2分布和拟合优度检验,计算统计量:,,,,,推断结论:自由度=10-1-2=7,查附表8,得到,,P>0.50,可以认为该样本服从正态分布计算T,I,时的参数有2个(均数和标准差),,完全随机设计两组频数分布,,2检验,二分类情形——2×2,列联,表,,,例7-2 某医师研究用兰芩口服液与银黄口服液治疗慢性咽炎疗效有无差别,将病情相似的80名患者随机分成两组,分别用两种药物治疗,结果见表7-2表7-2 慢性咽炎两种药物疗效资料,药物,疗效,,合计,,有效,无效,,兰芩口服液,41 (36.56),4 (8.44),45(固定值),银黄口服液,24 (28.44),11 (6.56),35(固定值),合计,65,15,80,,完全随机设计两组频数分布,,2检验,问题:这两个频数分布的总体分布是否相等?或者这两份样本是否来自同一个总体因为这里是二分类变量,问两个总体分布是否相等就相当于问两个有效概率是否相等完全随机设计两组频数分布,,2检验,(1)建立检验假设,,H0,:π,1,= π,2,两药的有效概率相同,,H1,: π,1≠,π,2,两药有效概率不同,,检验水准,,=0.05,,(2)计算检验统计量,,完全随机设计两组频数分布,,2检验,,,,自由度,,=(2-1)(2-1)=1,,(3)确定,p,值,,查附表8,,,=1对应的临界值 ,,P,<0.025。
4)结论:拒绝,H0,,两样本频率的差别具有统计学意义可以认为,兰芩口服液和银黄口服液的总体有效概率不同,前者(91.1%)高于后者(68.6%)完全随机设计两组频数分布,,2检验,对于四格表资料,四格表专用公式,,,,,,完全随机设计两组频数分布,,2检验,当,n≥,40时,如果有某个格子出现1≤,T,<5,一般需用校正公式,,完全随机设计两组频数分布,,2检验,例7-3 将病情相似的淋巴系肿瘤患者随机分成两组,分别做单纯化疗与复合化疗,两组的缓解率见表7-4,问两疗法的总体缓解率是否不同?,,(1)建立检验假设,,H0,:π,1,= π,2,,,两法总体缓解概率相同,,H1,: π,1≠,π,2,两法总体缓解概率不同,,检验水准,,=0.05,,完全随机设计两组频数分布,,2检验,组别,属性,,合计,缓解率(%),,缓解,未缓解,,,单纯化疗,2 ( 4.8),10 ( 7.2),12(固定值),16.7,复合化疗,14 (11.2),14 (16.8),28(固定值),50.0,合计,16,24,40,40.0,,完全随机设计两组频数分布,,2检验,2)计算检验统计量,,,,,,=(2-1)(2-1)=1,,3)确定P值:,P,>0.1,高于检验水准,,,不能拒绝,H,0,差别无统计学意义,尚不能认为两种治疗方案的总体缓解概率不同。
完全随机设计两组频数分布,,2检验,特别注意:,,,当四格表出现,T,<1或,n,<40时,校正,,2值也不恰当,这时必须用四格表的确切概率计算法(见本章第6节)完全随机设计两组频数分布,,2检验,多分类的情形——2×C列联表,,,定性变量具有多分类时, 两个频数分布的数据可表示为一个2×C列联表例7-4 北京市1986年城市和农村20至40岁已婚妇女避孕方法情况如表7-5所示(据王绍贤等调查资料),试分析北京城市和农村采用不同避孕方法的总体分布是否有差别表7-5 北京城市和农村已婚妇女避孕方法情况,,地区,避孕方法,,,,,合计,,节育器,服避孕药,避孕套,节育器,其他,,城市,153,33,165,153,40,431,农村,320,75,43,320,18,518,合计,473,108,208,473,58,949,,完全随机设计两组频数分布,,2检验,(1)建立检验假设,,H0:北京城市和农村已婚妇女避孕方法的总体概率分布相同,,H1:北京城市和农村已婚妇女避孕方法的总体概率分布不同,,检验水准,,=0.05完全随机设计两组频数分布,,2检验,(2)计算检验统计量,,H0,成立时,两组概率分布相同,均近似地等于合并计算的频率分布。
完全随机设计两组频数分布,,2检验,,,,,=(2-1)(4-1)=3,查附表8,,P,<0.001,按,,=0.05水准拒绝,H,0可以认为, 北京城市和农村已婚妇女避孕方法的总体概率分布不同据调查数据,城市使用男用避孕套的频率高于农村;宫内节育器是城市和农村的主要避孕方式,但农村使用宫内节育器的频率比城市高完全随机设计多组频数分布,,2检验,,设有一个定性变量,具有,C,个可能的“取值”;现有,R,组独立样本的频数分布,其数据以表7-7的形式表示这样的数据形式称为,R,×,C,列联表完全随机设计多组频数分布,,2检验,,例7-5 为研究某镇痛药的不同剂量镇痛效果是否有差别,研究人员在自愿的原则下,将条件相似的53名产妇随机分成三组, 分别按三种不同剂量服用该药,镇痛效果如表7-8表7-8 某药不同剂量的镇痛效果,剂量,镇痛效果,,合计,有效率(%),,有效,无效,,,1.0mg,3 (7.36),12 ( 7.64),15(固定值),20.00,2.5mg,11 (9.81),9 (10.19),20(固定值),55.00,5.0mg,12 (8.83),6 ( 9.17),18(固定值),66.67,合计,26,27,53,49.06,,完全随机设计多组频数分布,,2检验,(1)建立检验假设,,H0,:三种剂量镇痛有效的概率相同。
H1,:不同剂量镇痛有效的概率不全相同检验水准取为,,=0.05,,按公式(7-13)计算,,2统计量,,完全随机设计多组频数分布,,2检验,自由度,,=(3-1)(2-1)=2,查附表8,,P<0.02,5,按0.05水准,拒绝,H,0,差别有统计学意义可以认为三种剂量镇痛有效的总体概率有差别对于比较多组独立样本的,,2检验, 拒绝,H,0只能说各组总体概率不全相同,即多组中至少有两组的有效概率是不同的,但并不是多组有效概率彼此之间均不相同若要明确哪两组间不同,还需进一步作多组间的两两比较,,,,完全随机设计多组频数分布,,2检验,不同剂量有效概率间的两两比较结果见表7-9,对比组,四格表,,2,值,P,值,检验水准修正值,检验结果,1.0mg vs. 2.5mg,4.38,0.036,0.0083,—,1.0mg vs. 5.0mg,7.19,0.007,0.0083,*,2.5mg vs. 5.0mg,0.54,0.463,0.0083,—,,配对设计下两组频数分布的,,2检验,,二分类情形——2×2,列联,表,,,例7-6 设有28份咽喉涂抹标本,把每份标本一分为二,依同样的条件分别接种于甲、乙两种白喉杆菌培养基上,观察白喉杆菌的生长情况,结果如表7-10,问两种培养基上白喉杆菌的生长概率有无差别?,,采用McNemar 检验,,表7-10 两种培养基白喉杆菌生长情况,,,甲培养基,乙培养基,,,,阳性,阴性,合计,阳性,22,18,40,阴性,2,14,16,合计,24,32,56(固定值),注:“阳性”表示生长,“阴性”表示不生长,,,,,配对设计下两组频数分布的,,2检验,H0,:两种培养基上白喉杆菌生长的阳性概率相等,,H1,:两种培养基上白喉杆菌生长的阳性概率不相等,,检验水准,,=0.05。
若,H0,成立,白喉杆菌生长状况不一致的两个格子理论频数都应该是(,b,+,c,)/2配对设计下两组频数分布的,,2检验,由,,2检验基本公式(7-1)有,,,,,化简后不难得到,,,2统计量的计算公式为,,配对设计下两组频数分布的,,2检验,因b+c<40,,,,,P<,0.05,按α=0.05水准拒绝,H,0,差别有统计学意义,可以认为, 两种培养基上白喉杆菌生长的阳性概率不相等鉴于甲培养基阳性频率为40/56=71.4%,乙培养基为24/56=42.9%,可以认为, 甲培养基阳性概率高于乙培养基配对设计下两组频数分布的,,2检验,多分类的情形——,R,×,R,列联表,,例7-7 对150名冠心病患者用两种方法检查室壁收缩运动的情况,检测结果见表7-12 试比较两种方法测定结果的概率分布有无差别配对设计下两组频数分布的,,2检验,甲法测定结果,乙法测定结果,,,合 计,,正常,减弱,异常,,正常,60,3,2,65,减弱,0,42,9,51,异常,8,9,17,34,合计,68,54,28,150(固定值),,配对设计下两组频数分布的,,2检验,H0,:两种测定方法的概率分布相同,,H1,:两种测定方法的概率分布不相同,,,,,,=1.60,P>0.05 故尚不能认为甲法测定结果的概率分布与乙法测定结果的概率分布不同。
,2检验要注意的问题,,1.关于,,2检验的条件,,使用,,2检验在任何情况下都要注意理论频数,T,不能太小一般要求各格的理论频数均应大于1,且,T,<5的格子数不宜多于格子总数,R,×,C,的1/5,,2. 关于似然比,,2统计量,,作,,2检验,既可以计算Pearson,,2统计量,也可以计算似然比,,2(Likelihood ratio chi-square)统计量,,,四格表的确切概率法,,基本思想是:,,在四格表边缘合计固定不变的条件下,利用公式(7-18)直接计算表内四个格子数据的各种组合的概率,然后计算单侧或双侧累计概率,并与检验水准,,比较,作出是否拒绝,H0,的结论应用条件:,理论数小于1或,n,< 40或作,,2检验后所得概率,P,接近检验水准,,,,,,四格表的确切概率法,a、b、c、d,为四格表中的四个频数,,n,为总例数例7-8 将23名精神抑郁症患者随机分到两组,分别用两种药物治疗,结果见表7-14,问两种药物的治疗效果是否不同表7-14 两种药物治疗精神抑郁症的效果,,分组,治疗效果,,合计,有效率%,,有效,无效,,,甲药,7(a),5(b),12,58.3,乙药,3(c),8(d),11,28.6,合计,10,13,23,43.5,,四格表的确切概率法,本例,n <,40,只能选用四格表的确切概率法。
其假设检验的步骤如下:,,建立检验假设,,H,0 :,,1 =,,2 两种药物治疗效果相等,,,H,1 :,,1,,,,2 两种药物治疗效果不等,,,,= 0.05,,,四格表的确切概率法,2、计算概率,见表7-15,,3、确定,P,值和作出推断,,双侧检验的,P,值是指表7-15 中,,p,1,– p,2,,,,0.310的各种组合的四格表确切概率相加所得到的累计概率,,本例的研究目的是甲乙两种药物的治疗效果何者为优,所以用双侧检验将表7-15 中,,p1 – p2,,,,0.310的8个四格表的,P,值相加,得累计概率,P,= 0.214 按,,= 0.05水准不能拒绝原假设,两组药物疗效的差别无统计学意义,尚不能认为两药治疗精神抑郁症的效果不同四格表序号,有效,无效,p,1,p,2,p,1,– p,2,P,1,7,,3,5,,8,0.583,0.273,0.310,0.114224,2,8,,2,9,,4,0.667,0.182,0.485,0.023797,3,9,,1,3,,10,0.750,0.091,0.659,0.002115,4,10,,0,2,,11,0.833,0.000,0.833,0.000058,5,6,,4,6,,7,0.500,0.364,0.136,-,6,5,,5,7,,6,0.417,0.455,-0.038,-,7,4,,6,8,,5,0.333,0.545,-0.212,-,8,3,,7,9,,4,0.250,0.676,-0.426,0.063458,9,2,,8,10,,3,0.167,0.727,-0.560,0.009519,10,1,,9,11,,2,0.083,0.818,-0.735,0.000577,11,0,,10,12,,1,0.000,0.909,-0.909,0.000001,,。












