
定性资料的统计分析.ppt
31页Gene 2006医学统计学定性资料的统计分析statistical analysis for qualitative data主要内容n二项分布简介n总体率的可信区间估计nPoisson分布简介n总体事件数的可信区间估计n样本率与总体率的比较n两样本率比较的u检验n四格表资料的2检验 n行列表资料的2检验n确切概率法n两事件数的比较n卡方检验应用的注意事项 第九节 确切概率法一、四格表的确切概率法 n对于普通四格表资料,当n<40或出现至少有一个T<1时,因2检验近似程度较差,易导致分析的偏性,2检验不再适用,应当用四格表的确切概率法n四格表的确切概率法本身不属于2检验范畴,只是作为四格表2检验应用上的补充 例、某医院观察了29例脑瘤患者,资料如下表试分析大脑两半球恶性肿瘤所占比例有无差异 每个格子的|A-T|均等于 四格表确切概率的基本思想 n在四格表的周边合计不变的条件下,用下面的计算公式直接计算四格表内四个数据的各种组合的概率n双侧检验:分别计算各种组合中两侧所有|A-T|值大于等于现有样本|A-T|值的四格表的Pi值,相加后即得双侧检验的P值。
n单侧检验:按研究目的只需计算一侧所有|A-T|值大于等于现有样本|A-T|值的四格表的Pi值,相加后即为单侧检验的P值本例中,列出周边合计(16,13,20,9)不变的情况下 a、b、c、d的各种组合,共10种按a的数值从小到大排列: 本例|A-T|等于 二、配对四格表的确切概率法 n在配对四格表资料中,当b+c≤20时,因配对四格表2检验近似程度较差,易导致分析的偏性此时,同样需要用确切概率法来计算n方法与四格表确切概率法有区别,利用二项分布原理例、用两种检验方法对某食品作沙门氏菌检验,结果如下表,试用配对四格表的确切概率法比较两种方法的阳性结果是否有差别 分析思路n则在B+C=31不变的前提下,b和c的所有可能取值为(0,31),(1,30),(2,29),(3,28),……,(28,3),(29,2),(30,1),(31,0),共32种组合此时,b和c服从n=31,=的二项分布(对称分布)n“获得现有资料及差别更大的资料” 包括: (26,5),(27,4),(28,3),(29,2),(30,1),(31,0) ,及(0,31),(1,30),(2,29),(3,28),(4,27),(5,26) 共12种组合。
n按二项分布原理即可求出这12种组合的概率 n设X=bn实际运算中,先计算P(0) 第十节 两事件数的比较n一般认为单位时间、空间或人群间某独立事件的发生服从Poisson分布n当样本事件数大于50,Poisson分布近似正态分布n两事件数比较的目的:推断两个样本各自所代表的总体计数有无差别n两事件数的比较可利用正态近似原理,采用u检验检验统计量u值的计算公式 n1、两样本观察单位相同的无重复试验,计算u值的公式:n2、两样本观察单位相同的有重复试验,且两样本重复观察次数相等时,利用Poisson分布的可加性原理,将各小单位发生数X相加成相同的大单位∑X后再计算u值: n3、样本观察单位不同,或在有重复试验中,重复次数不同时,应先将观察单位化成相同的小单位,先求出以小单位为观察单位的平均计数后再计算u值:nn1、n2分别为两样本的观察单位数当n1=n2时,该公式与式2完全等价 n例1、分别用甲、乙两种培养基对同一水样作细菌培养,每份水样均取1ml,各培养8次,得细菌个数如下:甲培养基分别为7,5,6,7,4,5,3,6;乙培养基分别为9,8,8,10,7,7,7,9试比较两种培养基的效果有无差别? 根据题意,本例为观察单位相同(均为1ml水样)的有重复试验,且重复次数相同(n1 = n2 =8)。
故以式2求u值n例2、某车间在改革生产工艺前,测取三次粉尘浓度,每升空气中分别有38、39、36颗粉尘;改革生产工艺后,测取两次,分别有25、18颗粉尘问工艺改革前后粉尘颗粒有无差别? 依题意,本例为观察单位相同(均为1升空气)的有重复试验,但重复次数不同以式3求u值 第十一节 卡方检验应用的注意事项n一、绝对数的问题 计算2值时,必须用绝对数,而不能用相对数,因为2值的大小与频数大小有关 n二、两个率的比较时,不同2检验公式的适用条件: q1、当n≥40,且T≥5时,用基本公式计算2值; q2、当n≥40,且1≤T<5时,则用2检验的连续性校正公式;q3、当n<40,或有T<1时,不能用2检验,应当用四格表的确切概率法q两样本率比较时,如为双侧检验,则u检验和四格表2检验是等价的若为单侧检验,则用u检验较为方便三、配对2检验公式的应用条件 n1、当b+c≥40时,用配对2检验的基本公式计算2值;n2、当20<b+c≤40时,用连续性校正公式来计算2值n3、而当b+c≤20时,用配对四格表确切概率法计算 四、多个率或构成比比较时,2检验的适用条件:n此时行×列表中不宜有1/5以上格子的理论频数小于5,或不宜有一个理论频数小于1。
n长期来,对理论频数太小有三种处理办法:q1、最好增加样本例数以增大理论频数;q2、删去上述理论频数太小的行或列;q3、将太小理论频数所在行或列的实际频数与性质相近的邻行或邻列的频数合并,使重新计算的理论频数增大n一般认为,后两种方法可能会损失信息,也会损害样本的随机性,故不作为常规方法 五、多重比较的问题n当多个样本率(或构成比)比较的假设检验结论为拒绝检验假设,只能认为各总体率(或总体构成比)之间总的说来有差别,但不能说明它们彼此间都有差别,或某两者间有差别n若要进一步明确差别之所在,可进行多重比较 六、资料独立性的问题n率或构成比的2检验,都假设各比较组间是独立的,组与组之间是无序的n如果组间是有序的例如,比较三种病情(轻、中、重)的病人之治愈率,2检验只能得出三组间有无差别,得不到相关性的结论(如:病情越严重治愈率越低)n此时,将其中的任何两列不同治愈率的数值进行调换, 2值不会发生变化 n这类资料的分析可以用秩和检验、Spearman相关分析等方法来进行 双向有序分类资料(列联表) 不同期次矽肺患者的肺门密度级别分布矽肺期次肺门密度合计++++++I43188 14245II 1 96 72169III 6 17 55 78合计50301141492Thanks!。












