好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

四格表的确切概率法.ppt

30页
  • 卖家[上传人]:pu****.1
  • 文档编号:577624837
  • 上传时间:2024-08-22
  • 文档格式:PPT
  • 文档大小:2.02MB
  • / 30 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 卫生统计学(第五版)卫生统计学与数学学教研室 检验水准调整:检验水准调整: 第四节第四节 配对设计下两组频数分布的卡方检验配对设计下两组频数分布的卡方检验一、二分类情形--2×2列联表 计数资料的配对设计常用于两种检验方法,计数资料的配对设计常用于两种检验方法,培养方法、诊断方法的比较其特点是对样本中培养方法、诊断方法的比较其特点是对样本中各观察单位分别用两种方法处理,然后观察两种各观察单位分别用两种方法处理,然后观察两种处理方法的某两分类变量的计数结果处理方法的某两分类变量的计数结果 甲培养基甲培养基乙培养基乙培养基 合计合计 阳性阳性 阴性阴性阳性阳性阴性阴性 22 (a) 2 (c) 18 (b) 14 (d) 40 16合计合计 24 32 56(固定值)(固定值)表7-10 两种培养基白喉杆菌生长情况 例例7-6 7-6 设有设有5656份咽喉涂抹标本,把每一份标本份咽喉涂抹标本,把每一份标本一分为二,依同样的条件分别接种于甲、乙两种白一分为二,依同样的条件分别接种于甲、乙两种白喉杆菌培养基上,观察白喉杆菌的生长情况,结果喉杆菌培养基上,观察白喉杆菌的生长情况,结果如表如表7-107-10,问两种培养基上白喉杆菌的生长概率有,问两种培养基上白喉杆菌的生长概率有无差别?无差别? 本例是以每份标本一分为二,分别同时接种于两本例是以每份标本一分为二,分别同时接种于两种培养基上,属于配对设计;两份样本实质上是一样种培养基上,属于配对设计;两份样本实质上是一样的,不是互相独立的,观察白喉杆菌生长与否,指标的,不是互相独立的,观察白喉杆菌生长与否,指标为二分类的定性变量;目的是通过样本资料来推断两为二分类的定性变量;目的是通过样本资料来推断两方法的阳性概率有无差别。

      方法的阳性概率有无差别 观察结果甲培养基的阳性率等于观察结果甲培养基的阳性率等于40/5640/56,乙培养,乙培养基的阳性率等于基的阳性率等于24/5624/56,比较总体阳性概率不能用前,比较总体阳性概率不能用前面第二节的办法,原因是前面的办法针对的是面第二节的办法,原因是前面的办法针对的是““两组两组独立样本独立样本””,而现在我们遇到的实质上是一组样本,,而现在我们遇到的实质上是一组样本,即使分成了两份,也是即使分成了两份,也是““两份互不独立的样本两份互不独立的样本””需要需要另想方法另想方法 变量变量1变量变量2 合计合计 阳性阳性 阴性阴性阳性阳性阴性阴性 a c b d n1 n2合计合计 m1 m2 n(固定值)固定值)表7-11 两个变量阳性率比较的一般形式和符号 这类问题的原始数据可以表示为表这类问题的原始数据可以表示为表7-117-11所示的四所示的四格表形式表格表形式表7-117-11和表和表7-37-3的区别仅在设计上,前面是的区别仅在设计上,前面是两个独立样本,两个独立样本,行合计是事先固定的行合计是事先固定的;而这里的;而这里的““两两份样本份样本””互不独立,样本量都是互不独立,样本量都是n n,固定的,,固定的,而行合计而行合计与列合计却是事先不确定的与列合计却是事先不确定的。

      由表7-11不难看出, 变量变量1 1的阳性率的阳性率 变量变量2 2的阳性率的阳性率 变量变量1 1的阳性率的阳性率——变量变量2 2的阳性率的阳性率 可见,两个变量阳性率的比较只和可见,两个变量阳性率的比较只和b b、、c c有关,而有关,而与与a a、、d d无关 回到表回到表7-107-10,两种培养基白喉杆菌生长状况一,两种培养基白喉杆菌生长状况一致的两个格子频数分别为致的两个格子频数分别为 其中,其中,a,da,d,为两法观察结果一致的两种情况,为两法观察结果一致的两种情况,b,cb,c为为两法观察结果不一致的两种情况当两种处理方法两法观察结果不一致的两种情况当两种处理方法无差别时,对总体有无差别时,对总体有B=CB=C由于在抽样研究中,抽样由于在抽样研究中,抽样误差是不可避免的,样本中的误差是不可避免的,样本中的b b和和c c往往不相等往往不相等为为此,需进行假设检验此,需进行假设检验 该法一般用于样本含量不太大的资料该法一般用于样本含量不太大的资料 这两个频数的大小显示不出两种培养基上白喉这两个频数的大小显示不出两种培养基上白喉杆菌生长状况的差别。

      比较两种培养基的阳性概率杆菌生长状况的差别比较两种培养基的阳性概率是否有差别,需要考察白喉杆菌生长状况不一致的是否有差别,需要考察白喉杆菌生长状况不一致的两个格子,我们只对其中的频数两个格子,我们只对其中的频数 两种培养基上白喉杆菌生长的阳性概率相等两种培养基上白喉杆菌生长的阳性概率相等 两种培养基上白喉杆菌生长的阳性概率不相等两种培养基上白喉杆菌生长的阳性概率不相等 检验检验水准水准 若若 成立,成立, 白喉杆菌生长状况不一致的两个格白喉杆菌生长状况不一致的两个格子理论频数都应该是子理论频数都应该是 由检验由检验 基本公式(基本公式(7-17-1)有)有化简后不难得到,化简后不难得到, 统计量的计算公式为统计量的计算公式为((7-127-12)) 若若 公式(公式(7-147-14)校正公式为)校正公式为((7-137-13)) 对于例对于例7-67-6数据,因为数据,因为 按式(按式(7-157-15)计算)计算由由 临界值表,临界值表, 按按 水准拒绝水准拒绝 ,, 差别有统计学意义,差别有统计学意义, 可以认为,两种培养基上白喉杆菌生长的阳性可以认为,两种培养基上白喉杆菌生长的阳性概率不相等。

      鉴于甲培养基阳性频率为概率不相等鉴于甲培养基阳性频率为40/56==71.4%40/56==71.4%,乙培养基为,乙培养基为24/56=42.9%24/56=42.9%,可以认为,,可以认为,甲培养基阳性概率高于乙培养基甲培养基阳性概率高于乙培养基 我们将两个变量不一致的总例数我们将两个变量不一致的总例数( (b+cb+c) )视视为固定值,在此条件下进行推断无需考虑两为固定值,在此条件下进行推断无需考虑两变量一致的总例数变量一致的总例数a a和和d d的大小这类方法在的大小这类方法在统计学中称为条件推断方法当然,也有文统计学中称为条件推断方法当然,也有文献报道对此类问题进行非条件推断的方法,献报道对此类问题进行非条件推断的方法,这时这时a a和和d d的信息都能用上,但十分复杂,超的信息都能用上,但十分复杂,超出了本书的范围出了本书的范围以上检验称为以上检验称为 检验检验 二、多分类的情形--R×R列联表 例7-7 对150名冠心病患者用两种方法检查室壁收缩运动的情况,检测结果见表7-12试比较两种方法测定结果的概率分布有无差别。

      甲法测定结果甲法测定结果乙法测定结果乙法测定结果 合计合计 正常正常 减弱减弱 异常异常正常正常减弱减弱异常异常 60 0 83 242 99 17 65 51 34合计合计 6854 28 150(固定值)固定值)表7-12 两种方法检查室壁收缩运动情况 类似于例类似于例7-67-6,这里是配对设计,只是定性变量,这里是配对设计,只是定性变量有有3 3种可能的种可能的““取值取值””;甲方法的测定结果;甲方法的测定结果是一组频数分布;乙方法的测定结果是一组频数分布;乙方法的测定结果 是另是另一组频数分布一组频数分布 需要检验的是需要检验的是 两种测定方法的检查结果的概率分布相同两种测定方法的检查结果的概率分布相同 两种测定方法的检查结果的概率分布不相同两种测定方法的检查结果的概率分布不相同 检验检验水准水准 变量变量1变量变量2合计合计 1 2 … R12…R A11 A12 … A1c A21 A22 … A2c … … … … AR1 AR2 … ARR n1(固定值)(固定值) n2(固定值)(固定值) …nR(固定值)(固定值)合计合计 m1 m2 … mR n(固定值)(固定值)表7-13 配对设计下多分类资料的R×R列联表 配对设计下多分类资料一般可表示为表配对设计下多分类资料一般可表示为表7-137-13的形的形式。

      表式表7-137-13是表是表7-117-11的推广,这里的定性变量的推广,这里的定性变量1 1和变和变量量2 2都有都有R R个可能的个可能的““取值取值””,,R R〉〉2 2 现在的问题是:现在的问题是: 基于一份配对的多分类样本,我们得到了两组基于一份配对的多分类样本,我们得到了两组频数分布频数分布,, 要了解它们的总体要了解它们的总体概率分布是否相同,即概率分布是否相同,即两变量的概率分布相同两变量的概率分布相同 两变量的概率分布不相同两变量的概率分布不相同 检验检验水准水准 我们采用的检验统计量为我们采用的检验统计量为((7-147-14)) 其中其中k k为类别数,为类别数, 分别为第分别为第i i行合计和第行合计和第i i列合计 成立时(成立时(7-147-14)式中统计量服从自由度为)式中统计量服从自由度为k-1k-1的的 分布 当当k=2k=2时,(时,(7-147-14)式便回到()式便回到(7-127-12)式,这说明本)式,这说明本节的方法节的方法 是检验的推广。

      是检验的推广 例例7-77-7,, 故尚不能认为甲法测定结果的概率分布与乙法故尚不能认为甲法测定结果的概率分布与乙法测定结果的概率分布不同测定结果的概率分布不同 =1.60 搜集搜集n n对同胞,每一对中必须有一位是某疾病的对同胞,每一对中必须有一位是某疾病的患者,另一位未患该疾病;变量患者,另一位未患该疾病;变量1 1为该病患者在某位为该病患者在某位点的等位基因类别,变量点的等位基因类别,变量2 2为未患者在该点的等位基为未患者在该点的等位基因类别要检验的是:同胞对中患病者与未患病者因类别要检验的是:同胞对中患病者与未患病者在该位点上等位基因的概率分布是否相同如果两在该位点上等位基因的概率分布是否相同如果两个概率分布不同,则该基因位点可能与该疾病有关个概率分布不同,则该基因位点可能与该疾病有关 将上述方法用于多等位基因传递不平衡检验将上述方法用于多等位基因传递不平衡检验 第五节  检验要注意的问题•1. 1. 理论数不宜太小,一般不宜有理论数不宜太小,一般不宜有1/51/5以上格子的以上格子的理论频数小于理论频数小于5 5,或有一个理论频数小于,或有一个理论频数小于1 1。

      对理对理论数太小有三种处理方法:论数太小有三种处理方法:•①①最好增加样本含量以增大理论频数;最好增加样本含量以增大理论频数;根本的方根本的方法•②②删去理论频数太小的行和列;删去理论频数太小的行和列;此法不好此法不好•③③将理论频数较小的行或列与邻行或邻列合并以将理论频数较小的行或列与邻行或邻列合并以增大理论频数但后两法可能会损失信息,增大理论频数但后两法可能会损失信息, •2.2.当多个样本率(或构成比)比较的检验,结论当多个样本率(或构成比)比较的检验,结论为拒绝检验假设,只能认为各总体率(或总体构为拒绝检验假设,只能认为各总体率(或总体构成比)之间不全相等,但不能认为彼此间都不相成比)之间不全相等,但不能认为彼此间都不相等若要比较彼此间的差别,可用行等若要比较彼此间的差别,可用行××列表的列表的分分割法•3.3.对对于于行行××列列表表单单向向等等级级资资料料((单单向向有有序序资资料料))组组间间的的比比较较,,宜宜用用第第八八章章秩秩和和检检验验,,如如作作卡卡方方检检验验法法只只说说明明各各处处理理组组的的效效应应在在构构成成比比上上有有无无差差异异,,而不能说明组间整体效应的差异。

      而不能说明组间整体效应的差异 假设检验基础假设检验基础一、二分类情形--2一、二分类情形--2××2列联表2列联表一、二分类情形--2一、二分类情形--2××2列联表2列联表 end第六节* 四格表的确切概率法•前已述及,四格表若有理论频数T小于1,或n<40时,尤其是用其他检验方法所得概率接近检验水准时,宜用四格表的确切概率法(exact probabilities in 2×2 table),即四格表概率的直接计算法•本法的基本思想是:在四格表周边合计不变的情况下,获得某个四格表的概率为 : end 例例7-14 7-14 抽查两批食品的卫生状况,作大肠杆菌检抽查两批食品的卫生状况,作大肠杆菌检查,检查结果见表查,检查结果见表6-106-10问两批食品的卫生状况有问两批食品的卫生状况有无差别?无差别?•表表7-14 甲乙两批食品大肠杆菌检查结果甲乙两批食品大肠杆菌检查结果 组 别阳性数 阴性数合计阳性率(%)甲批 26(28.8) 7(4.2) 3341.67乙批 36(33.2) 2(4.8) 3810.00合 计 62 97127.27 end计算计算 P P 值值 •表7-14中甲批食品阳性率P1=0.4167,乙批食品阳性率P2=0.1000,两者之差| p1-p2 |=0.3167。

      在周边合计数不变的条件下,可能还有其它组合的四格表,其阳性率之差≥0.3167,所有这些比当前四格表更极端的情况都应考虑进去,因为这些极端情况在H0条件下都有可能发生 endv 表表7-117-11中中| | p p1 1--p p2 2 |≥0.3167|≥0.3167的四格表为序的四格表为序号(号(0 0)、()、(1 1)、()、(5 5)、()、(6 6)的情形,按公式)的情形,按公式求得序号(求得序号(1 1)的概率为)的概率为 end表表7-11 7-11 确切概率计算表(四格表周边合计数不变)确切概率计算表(四格表周边合计数不变) endv余仿此余仿此, ,P P(0)(0)=0.0124, =0.0124, P P(5)(5)=0.0405, =0.0405, P P(6)(6)=0.0028, =0.0028, 因此所求概率为:因此所求概率为: v 推断结论推断结论 按按=0.05=0.05的水准,不拒绝的水准,不拒绝H H0 0,,差异无差异无统计学意义还不能认为两批食品卫生状况有差统计学意义还不能认为两批食品卫生状况有差别。

      别P =PP =P(0)(0)+P+P(1)(1)+P+P(5)(5)+P+P(6)(6)=0.0124+0.1061 =0.0124+0.1061 +0.0405+0.0028=0.1618 +0.0405+0.0028=0.1618 。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.