
道客巴巴计数资料的统计推断.ppt
27页第八讲 计数资料的统计推断1统计推断统计推断用样本信息推论总体特征的过程用样本信息推论总体特征的过程包括:包括:参数估计参数估计: 运用统计学原理,用从样本计算出来的统计指运用统计学原理,用从样本计算出来的统计指标量,对总体统计指标量进行估计标量,对总体统计指标量进行估计假设检验:假设检验:又称显著性检验,是指由样本间存在的差别对又称显著性检验,是指由样本间存在的差别对样本所代表的总体间是否存在着差别做出判断样本所代表的总体间是否存在着差别做出判断2主要内容一、率(或构成比)的抽样误差和标准误二、总体率(或构成比)的估计:点估计、区间估计三、总体率(或构成比)的假设检验 1.率(或构成比)的 检验 2. x2检验检验 四、假设检验的注意事项五、非参数检验 1.参数统计和非参数统计优缺点 2.秩和检验3一、率(或构成比)的抽样误差和标准误z均数的标准差和标准误均数的标准差和标准误(复习复习)z抽样误差产生的原因、概念z标准误的计算公式z与样本量的关系:成反比z例题:56页 某市为了解已婚育龄妇女子宫颈癌的患病情况,进行了抽样调查,随机抽取2000人,患者80例。
试求此患病率的标准误4二、总体率(或构成比)的估计z点估计:将样本率直接作为总体率的估计值.z区间估计(对照总体均数的区间估计) 公式: P±Uα.SP 条件: nP>5, n(1-P)>5 例题: 意义:5三、总体率(或构成比)的三、总体率(或构成比)的假假设检验检验z当两个样本率不同时,有两种可能:z1. P1 , P2所代表的总体率相同,由于抽样误差的存在,造成的不同,这种差别在统计上叫差别无统计学意义差别无统计学意义z2. P1 , P2所代表的总体率不同,即两个样本来不同的总体,其差别有统计学意义其差别有统计学意义z现在就是要用统计学的方法进行判断到底属于那种情况61.总体率(或构成比)的u检验z目的:z公式: 其中符号的含义z适用条件: 已知π0 nP>5, n(1-P)>5例题P5872. x2检验z是一种假设检验的方法,当样本量不大,或几个率进行比较时可用x2检验 某医生想观察一种新药对流感的预防效果,进行了如下的研究,问此药是否有效?8x2分布规律z自由度一定时,P值越小, x2值越大z当P 值一定时,自由 度越大, x2越大。
=1时, P=0.05, x2 =3.84 P=0.01, x2 =6.63 P=0.05时, =1, x2 =3.84 =2, x2 =5.99z当自由度取1时, u2= x29x2检验的基本公式zx2 =(A-T)2/TzA:表示实际频数,即实际观察到的例数zT:理论频数,即如果假设检验成立,应该观察到的例数z :求和符号z自由度:=(R-1)x(C-1) R行数, C列数 注意:是格子数,而不是例数10基本原理zx2 =(A-T)2/Tz如果假设检验成立,A与T不应该相差太大理论上可以证明 (A-T)2/T服从x2分布,计算出x2值后,查表判断这么大的x2是否为小概率事件,以判断建设检验是否成立11(1)四格表资料的x2检验z什么是四格表资料?凡是两个率或构成比资料都可以看做四格表资料12四格表的一般形式理论频数与自由度的计算:A是实际频数,T是根据假设检验来确定的,当H0成立时,计算出的格子中的数每个格子中的理论频数计算公式为:TRC=NRxNC/N, NR所在的行合计,NC所在的列合计,代入公式中求x2值。
求上例的4个T值)四格表资料的专用公式:13四格表资料的专用公式zx2 =(ad-bc)2 xN/(a+b)(c+d)(a+c)(b+d) 该公式从基本公式推导而来,结果相同计算较为简单z适用条件:N>40且T 5当不满足时用校正公式x2 =(|A-T|-0.5)2/T或x2 =(|ad-bc|-n/2)2 xN(a+b)(c+d)(a+c)(b+d)见62页14例题z上例:问此药是否有效z第一步:建立假设 H0 : 1=2 =20% H1 : 1 ‡ 2z第二步:确定显著性水平 =0.05z第三步:计算统计量: n =200>40,每格的T值大于5,可选用公式??(计算过程)z第四步:确定P值z第五步:判断结果15(2)配对计数资料的x2检验z什么是配对资料?P64甲乙两种培养基的生长情况16例:问两种培养基的效果是否不同z第一步:建立假设 H0 : B=C=b+c/2 H1 : B‡C z第二步:确定显著性水平 =0.05z第三步:计算统计量:z b+c>40时,基本公式:x2 =(A-T)2/T, 专用公式: x2 =( b-c)2/ b+c b+c40时,校正公式: x2 =(|A-T|-0.5)2/T x2 =( lb-cl-1)2/ b+c自由度:=(2-1) x (2-1)=1z第四步:确定P值z第五步:判断结果17(3)行x列表的x2检验 四格表是指只有2行2列,当行数或列数超过2时,统称为行x列表。
行x列表的x2检验是对多个样本率(或构成比)的检验 基本公式:x2 =(A-T)2/T 专用公式:x2 =n x ( A2 /nR x nC -1) 自由度:=(R-1)x(C-1) 适用条件:表中不宜有1/5以上格子的理论频数小于5,或有一个格子的理论频数小于118四、注意事项z1、计量资料的注意事项同样适用(见下张幻灯片)z2、公式的适用条件n 、Tz3、多组率经x2检验有显著性时,只能说明不全相同,但不能确定哪两个不同需要进一步证明时,用行x列表的x2分割法1920练习z书上作业67页21五、参数统计和非参数统计 参数:总体的统计指标称为参数( 、、) 统计量:样本的统计指标叫统计量(X、s、p)参数统计:我们介绍的统计推断方法,通常要求样本来自正态总体,或方差齐等,在这些假设的基础上,对总体参数进行估计和检验,称为参数统计非参数统计:有许多资料不符合参数统计的要求,不能用参数统计的方法进行检验,而需要一种不依赖于总体分布类型,也不对总体参数进行统计推断的假设检验,称为非参数检验22秩和检验 非参数检验的方法很多,秩和检验是较常用的,检验效率较高的一种。
其基本原理是编秩求和编秩求和23成组资料比较的秩和检验z秩和检验的方法很多以此例说明秩和检验的基本原理 研究不同饲料与雌鼠体重增加的关系,问高低蛋白饲料与体重增加有无关系? 24高蛋白 低蛋白体重增加秩次体重增加秩次13417 70 11461811811104 7101 611912 85 312414107 8.51611913216107 8.5 94 4 83113 210不同饲料的两组雌鼠在不同饲料的两组雌鼠在8周内所增体重(周内所增体重(g))25参数统计和非参数统计优缺点z参数统计优点: 对资料的分析利用充分 统计分析的效率高缺点: 对资料的要求高 适用范围有限z非参数统计优点:对资料的没有特殊要求 不受分布的影响(偏态、分布不明的资料) 不受方差齐性的限制 不受变量类型的影响 不受样本量的影响缺点: 检验效率低(易犯Ⅱ型错误) 对信息的利用不充分26小小 结结一、率(或构成比)的抽样误差和标准误二、总体率(或构成比)的估计:点估计、区间估计三、总体率(或构成比)的假设检验 1.率(或构成比)的 检验 2. x2检验检验 四、假设检验的注意事项五、非参数检验 1.参数统计和非参数统计优缺点 2.秩和检验27。












