spss中怎样进行fisher精确概率法统计.doc
20页spss中怎样进行fisher精确概率法统计最短距离法是把两个类之间的距离定义为一个类中的所有案例与另一类中的所有案例之间的距离最小者.缺点是它有链接聚合的趋势,因为类与类之间的距离为所有距离中最短者,两类合并以后,它与其他类之间的距离缩小了,这样容易形成一个较大的类.所以此方法效果并不好,实际中不太用. 2.最长距离法是把类与类之间的距离定义为两类中离得最远的两个案例之间的距离.最长距离法克服了最短距离法链接聚合的缺点,两类合并后与其他类的距离是原来两个类中的距离最大者,加大了合并后的类与其他类的距离. 3.平均联结法,最短最长距离法都只用两个案例之间的距离来确定两类之间的距离,没有充分利用所有案例的信息,平均联结法把两类之间的距离定义为两类中所有案例之间距离的平均值,不再依赖于特殊点之间的距离,有把方差小的类聚到一起的趋势,效果较好,应用较广泛. 4.重心法,把两类之间的距离定义为两类重心之间的距离,每一类的重心是该类中所有案例在各个变量的均值所代表的点.与上面三种不同的是,每合并一次都要重新计算重心.重心法也较少受到特殊点的影响.重心法要求用欧氏距离,其主要缺点是在聚类过程中,不能保证合并的类之间的距离呈单调增加的趋势,也即本次合并的两类之间的距离可能小于上一次合并的两类之间的距离. 5.离差平方和法,也称沃尔德法.思想是同一类内案例的离差平方和应该较小,不同类之间案例的离差平方和应该较大.求解过程是首先使每个案例自成一类,每一步使离差平方和增加最小的两类合并为一类,直到所有的案例都归为一类为止.采用欧氏距离,它倾向于把案例数少的类聚到一起,发现规模和形状大致相同的类.此方法效果较好,使用较广.个独立样本率比较的χ2检验属四格表资料χ2检验。
这类资料在医学研究中较为多见 例如比较两种方法治疗某种疾病的有效率是否相同?治疗结果如下: 有效 无效 有效率(%) 试验组 12 1 92.31 对照组 3 8 27.27 可以在SPSS中进行统计分析,具体操作详见附件中的.EXE文件在读取统计结果时,应当注意χ2检验的适用条件,正确选择Pearson卡方检验、Yates校正卡方检验、Fisher精确概率法(本法不属于χ2检验)第三节四格表资料的Fisher确切概率法前面提及,当四格表资料中出现,或,或用公式(8-1)与公式(8-4)计算出值后所得的概率时,需改用四格表资料的Fisher确切概率(Fisher probabilities in 2×2 table)该法是由R.A.Fisher(1934年)提出的,其理论依据是超几何分布(hypergeometric distribution),并非检验的范畴但由于在实际应用中常用它作为四格表资料假设检验的补充,故把此法列入本章下面以例8-1介绍其基本思想与检验步骤。
例8-1 某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果,将33例HBsAg阳性孕妇随机分为预防注射组和非预防组,结果见表8-3问两组新生儿的HBV总体感染率有无差别?表8-3两组新生儿HBV感染率的比较组别阳性阴性合计感染率(%)预防注射组4182218.18非预防组561145.45合计9243327.27一、基本思想在四格表周边合计数固定不变的条件下,计算表内4个实际频数变动时的各种组合之概率;再按检验假设用单侧或双侧的累计概率,依据所取的检验水准做出推断1.各组合概率的计算在四格表周边合计数不变的条件下,表内4个实际频数,,,变动的组合数共有“周边合计中最小数+1”个如例7-4,表内4个实际频数变动的组合数共有个,依次为:(1)(2)(3)(4)(5)0221212203194189283746556ad-bc= -198ad-bc= -165ad-bc= -132ad-bc =-99ad-bc= -66(6)(7)(8)(9)(10)517616715814913473829110011ad-bc= -33ad-bc=0ad-bc=33ad-bc=66ad-bc= 99各组合的概率服从超几何分布,其和为1。
可按公式(8-9)计算(8-9)式中,,,,等符号的意义同表7-1;!为阶乘符号2.累计概率的计算单、双侧检验不同设现有样本四格表中的交叉积差,其概率为,其余情况下的组合四格表的交叉积差记为,概率记为1)单侧检验若现有样本四格表中,须计算满足和条件的各种组合下四格表的累计概率若,则计算满足和条件的各种组合下四格表的累计概率2)双侧检验计算满足和条件的各种组合下四格表的累计概率若遇到或时,四格表内各种组合的序列呈对称分布,此时按单侧检验规定条件只计算单侧累计概率,然后乘以2即得双侧累计概率二、检验步骤本例,宜用四格表资料的Fisher确切概率法直接计算累计概率检验步骤为:(1):,即两组新生儿HBV的总体感染率相等:,即两组新生儿HBV的总体感染率不等(2)计算现有样本四格表的和及各组合下四格表的,见表8-43)计算满足条件的各组合下四格表的概率4)计算同时满足和条件的四格表的累计概率本例、、、、和满足条件,累计概率为表8-4例8-1的 Fisher确切概率法计算表四格表组合102292-1980.00000143212183-1650.00009412322074-1320.00197656431965-990.018447855*41856-66*0.08762728*651747-337616380871529339814110660.0912039010913011990.01289752* 为现有样本。
按检验水准不拒绝H0,尚不能认为预防注射与非预防的新生儿HBV的总体感染率不等include





