好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

卫生学第十一章 分类变量资料的统计分析.ppt

123页
  • 卖家[上传人]:M****1
  • 文档编号:590059965
  • 上传时间:2024-09-12
  • 文档格式:PPT
  • 文档大小:3.69MB
  • / 123 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 第十一章第十一章 分类变量资料的统计分析分类变量资料的统计分析 第一节第一节 分类变量资料的统计描述分类变量资料的统计描述 学习要点:学习要点:l1.掌握相对数的概念和计算方法;掌握相对数的概念和计算方法;l2.掌握应用时的注意事项;掌握应用时的注意事项;l3.熟悉率的标准化的基本思想熟悉率的标准化的基本思想l4.掌握率的标准化的意义和计算方法(直接法)掌握率的标准化的意义和计算方法(直接法)l5.熟悉率的标准化(间接法)的计算熟悉率的标准化(间接法)的计算 第一节第一节 分类变量资料的统计描述分类变量资料的统计描述 常用相对数:率、构成比、相对比常用相对数:率、构成比、相对比 常用的相对数常用的相对数l率:说明某现象发生的频率或强度率:说明某现象发生的频率或强度l构成比:说明某一事物内部各组成部构成比:说明某一事物内部各组成部分所占的比重分所占的比重l相对比:说明一个指标是另一个指标相对比:说明一个指标是另一个指标的几倍或百分之几的几倍或百分之几 (一)率(一)率l定义:率又称频率指标是指在一定观察时间定义:率又称频率指标是指在一定观察时间内,某现象实际发生数与可能发生某现象的总内,某现象实际发生数与可能发生某现象的总数之比,用以说明某现象发生的频率或强度。

      数之比,用以说明某现象发生的频率或强度实际发生某现象的观察数实际发生某现象的观察数率率= ×K 可能发生某现象的观察单位总数可能发生某现象的观察单位总数又称频率指标或强度指标又称频率指标或强度指标 例:某学者对肿瘤诊断的新指标细胞内端粒酶活性表达情例:某学者对肿瘤诊断的新指标细胞内端粒酶活性表达情况进行研究,资料如下表,试计算端粒酶在不同肺癌病理况进行研究,资料如下表,试计算端粒酶在不同肺癌病理组织中活性表达的阳性率组织中活性表达的阳性率腺癌中端粒酶表达的阳性率腺癌中端粒酶表达的阳性率=72/84×100%=85.7%鳞癌中端粒酶表达的阳性率鳞癌中端粒酶表达的阳性率=68/82×100%=82.9%肺癌组织分类肺癌组织分类例数例数阳性例数阳性例数腺腺 癌癌8472鳞鳞 癌癌8268端粒酶在肺癌病理组织中的活性表达端粒酶在肺癌病理组织中的活性表达 实际运用中遇到的特殊情况实际运用中遇到的特殊情况l分母是难以确定的数:分母是难以确定的数: 例:年发病率例:年发病率–年中人口数目年中人口数目–年平均人口数年平均人口数l分子是难以确定的数:分子是难以确定的数: 例:慢性疾病或肿瘤的发病率例:慢性疾病或肿瘤的发病率往往以确诊日期作为发病日期往往以确诊日期作为发病日期 医学中常用的率医学中常用的率l发病率:发病率:表示一定时期内,在可能发生某表示一定时期内,在可能发生某病的一定人群中新发生某病的强度。

      病的一定人群中新发生某病的强度 l患病率:患病率:又称为现患率,指某时点上受检又称为现患率,指某时点上受检人数中现患某种疾病的频率,患病率分为人数中现患某种疾病的频率,患病率分为时点患病率和期间患病率时点患病率和期间患病率 l治愈率:治愈率:表示受治病人中治愈的频率表示受治病人中治愈的频率 医学中常用的率医学中常用的率l有效率:有效率:表示受治病人中治疗有效的频率表示受治病人中治疗有效的频率l生存率:生存率:指病人能活到某一时点的概率指病人能活到某一时点的概率l死亡率:死亡率:某疾病的死亡人数与观察人数之比某疾病的死亡人数与观察人数之比l病死率:病死率:某疾病的死亡人数与该病的患病人某疾病的死亡人数与该病的患病人数之比 练习:练习:请问下面哪个指标能最好反映疾病对人群的威胁程度请问下面哪个指标能最好反映疾病对人群的威胁程度??l发病率发病率l病死率病死率l患病率患病率l死亡率死亡率l现患率现患率 (二)构成比(二)构成比l定义:构成比又称构成指标,表示事物内部某一定义:构成比又称构成指标,表示事物内部某一部分的观察数与事物内部各部分的观察单位数总部分的观察数与事物内部各部分的观察单位数总和之比,常以百分数表示。

      用以说明事物内部各和之比,常以百分数表示用以说明事物内部各部分所占的比重或分布部分所占的比重或分布 构成比构成比= ×100%事物内部某一部分的观察单位数事物内部某一部分的观察单位数事物内部各部分的观察单位数总和事物内部各部分的观察单位数总和 构成比的特征构成比的特征v各部分构成比的合计等于各部分构成比的合计等于100%或或1v事物内部某部分的构成比发生变化,其他部分的构事物内部某部分的构成比发生变化,其他部分的构成比也相应地发生变化成比也相应地发生变化某医院某年门诊病人构成情况某医院某年门诊病人构成情况       某医院某医院20102010年与年与20112011年各科病床情况年各科病床情况        科别科别 20102010年年 20112011年年                病床数病床数 构成比构成比 病床数病床数 构成比构成比        内科内科    200     50.0        300       60.0        外科外科    100     25.0        100       20.0         儿科儿科    100     25.0        100       20.0         合计合计    400     100.0      500      100.0  例:例:某研究者于某研究者于20102010年对某校的初中生进行了近视患病情况的年对某校的初中生进行了近视患病情况的调查,结果见下表,试计算各年级初中生近视患病率及患调查,结果见下表,试计算各年级初中生近视患病率及患病者中各年级的构成比。

      病者中各年级的构成比 年年级检查人数人数患病人数患病人数患病率(患病率(%))构成比(构成比(%))一年一年级44267二年二年级42868三年三年级40574合合  计12752092010年某初中近视的患病率及构成比年某初中近视的患病率及构成比 例:例:某研究者于某研究者于20102010年对某校的初中生进行了近视患病情况的年对某校的初中生进行了近视患病情况的调查,结果见下表,试计算各年级初中生近视患病率及患调查,结果见下表,试计算各年级初中生近视患病率及患病者中各年级的构成比病者中各年级的构成比 年年级检查人数人数患病人数患病人数患病率(患病率(%))构成比(构成比(%))一年一年级4426715.16  32.06二年二年级4286815.8932.53三年三年级4057418.2735.41合合  计127520916.39  100.002010年某初中近视的患病率及构成比年某初中近视的患病率及构成比 (三)相对比(三)相对比l定义:相对比是两个有关指标之比,说明一个指定义:相对比是两个有关指标之比,说明一个指标是另一个指标的几倍或百分之几标是另一个指标的几倍或百分之几。

      相对比相对比= (或(或×100%))甲甲 指指 标标乙乙 指指 标标       两个指标可以是性质相同的,(如两病区病床两个指标可以是性质相同的,(如两病区病床数之比);也可以是性质不同数之比);也可以是性质不同 的(如小鼠肝重与体的(如小鼠肝重与体重之比);两个指标可以是绝对数,也可以是相对重之比);两个指标可以是绝对数,也可以是相对数或平均数数或平均数 例:某地区人口数为例:某地区人口数为2400人,该地区所有医疗部门病床床人,该地区所有医疗部门病床床位数为位数为760张,试求该地区人均占有病床数?张,试求该地区人均占有病床数?人均占有病床数人均占有病床数=760/2400=0.317 二、应用相对数时的注意事项二、应用相对数时的注意事项l计算相对数时,观察单位数应足够多计算相对数时,观察单位数应足够多l分析时构成比和率不能混淆分析时构成比和率不能混淆l观察单位不等的几个率的平均率不等于这几个率观察单位不等的几个率的平均率不等于这几个率的算术平均值的算术平均值l相对数的相互比较应注意可比性相对数的相互比较应注意可比性l率的比较要进行标准化率的比较要进行标准化l样本率或构成比的比较应做假设检验样本率或构成比的比较应做假设检验 1 1、计算相对数时,分母不宜过少、计算相对数时,分母不宜过少例如:某医生用组织埋藏法治疗了例如:某医生用组织埋藏法治疗了2 2例视网膜炎患例视网膜炎患 者,者,1 1例有效,即报道有效率为例有效,即报道有效率为50%50%。

      这显这显 然是不可靠的,不能正确反映事实真相,然是不可靠的,不能正确反映事实真相, 这时最好用绝对数表示这时最好用绝对数表示 2、分析时不能以构成比代替率年年级检查人数人数患病人数患病人数患病率(患病率(%))构成比(构成比(%))一年一年级4426715.16  32.06二年二年级4286815.8932.53三年三年级4057418.2735.41合合  计127520916.39  100.002000年某初中近视的患病率及构成比年某初中近视的患病率及构成比强度性强度性指标指标构成性构成性指标指标 以比代率以比代率 3、平均率的计算、平均率的计算l观察单位不等的几个率的平均率,不能简单的相观察单位不等的几个率的平均率,不能简单的相加后求平均值而得到,应该把所有实际发生某现加后求平均值而得到,应该把所有实际发生某现象的观察数相加后,除以可能发生该现象的所有象的观察数相加后,除以可能发生该现象的所有观察单位总数观察单位总数             某医院各科的病死率某医院各科的病死率   科别科别 患者数患者数 死亡数死亡数 病死率病死率((%))    外外 科科   1500         180          12.0   内内 科科     500           20            4.0    传染科传染科   400           24            6.0   合计合计      2400         224           7.3   ((12.0+4.0+6.0))/3×100%=7.3%  平均率平均率=224/2400×100%=9.3% 4、对率和构成比进行比较时,应注意可比性、对率和构成比进行比较时,应注意可比性l除了研究因素外,其余的影响因素应除了研究因素外,其余的影响因素应尽可能相同或相近。

      尽可能相同或相近l例如比较两地区慢性支气管炎的患例如比较两地区慢性支气管炎的患病率是应主要考虑什么因素?病率是应主要考虑什么因素? 因慢性支气管炎好发于老年人,因慢性支气管炎好发于老年人,所以年龄可能为主要的混杂因素所以年龄可能为主要的混杂因素 5、率的标准化、率的标准化 消除混杂因素,使其内部构消除混杂因素,使其内部构成保持一致,便于比较成保持一致,便于比较 6 6、两样本率比较时应进行假设检验、两样本率比较时应进行假设检验l遵循随机抽样:遵循随机抽样:l假设检验:假设检验:–抽样抽样–本质本质 三、率的标准化三、率的标准化l标准化法的意义和基本思想标准化法的意义和基本思想– –意义意义意义意义:消除混杂因素的影响:消除混杂因素的影响– –基本思想基本思想基本思想基本思想:采用统一的标准构成(例年龄、:采用统一的标准构成(例年龄、性别、民族、病情等构成),以消除人口构性别、民族、病情等构成),以消除人口构成不同对研究因素的影响将所比较的两组成不同对研究因素的影响将所比较的两组或多组资料的构成按统一的或多组资料的构成按统一的“标准标准”调整后,调整后,计算标化率,使其具有可比性。

      计算标化率,使其具有可比性 年龄组年龄组(岁)(岁)甲甲 县县乙乙 县县人口数人口数人口人口构成构成死亡死亡人数人数死亡率死亡率人口数人口数人口人口构成构成死亡死亡人数人数死亡率死亡率 0~17568790.65200017258190.65800030~2449420.0909124.92892980.1103258.640~2516780.09349136.22504800.095512549.950 ~2069470.0768307148.31912040.0729344179.960~1438930.0534460319.71143550.0436371324.470~902700.0335292323.5516700.0197170329.0合计合计26946271.0000116243.1226228261.000010.539.46甲乙两县各年龄组人口数及食管癌死亡率(甲乙两县各年龄组人口数及食管癌死亡率(1/10万)万)率的标准化率的标准化率的标准化率的标准化 率的标准化率的标准化率的标准化率的标准化某市甲乙两院各科出院和治愈人数(某市甲乙两院各科出院和治愈人数(2007年)年)科室科室甲甲 院院乙乙 院院出院人数出院人数治愈人数治愈人数治愈率治愈率(%)出院人数出院人数治愈人数治愈人数治愈率治愈率(%)内内 科科68721130.712186931.65妇妇 科科45639887.2848641284.77小儿科小儿科23921991.6325222890.48外外 科科20519895.5969866795.56合合 计计1587102664.651654137683.19 (一)方法选择(一)方法选择l直接法直接法–已知被标化组的年龄别率,以及已知标准组已知被标化组的年龄别率,以及已知标准组的年龄别人口数或年龄别人口构成比时;的年龄别人口数或年龄别人口构成比时; l间接法间接法–已知被标化组的年龄别人口数与发病(死亡)已知被标化组的年龄别人口数与发病(死亡)总数,但年龄别率未知,以及已知标准组年总数,但年龄别率未知,以及已知标准组年龄别发病(死亡)率与总发病(死亡)率时;龄别发病(死亡)率与总发病(死亡)率时; 资料齐全时,首选直接法资料齐全时,首选直接法 (二)标准选择(二)标准选择l选择一个具有代表性的、内部构成相对稳定的选择一个具有代表性的、内部构成相对稳定的较大人群;较大人群;l将相互比较的人群合并后,作为共同的标准;将相互比较的人群合并后,作为共同的标准;l从要比较的两组中任选一组的内部构成作为标从要比较的两组中任选一组的内部构成作为标准准。

      (三)标准化率的计算(三)标准化率的计算l符号识别符号识别 直接法直接法l已知标准组各科室出院人数时:已知标准组各科室出院人数时: p’=(∑Nipi)/N 甲院标准化治愈率甲院标准化治愈率p’=2413.19/3241=74.46%乙院标准化治愈率乙院标准化治愈率p’=2392.13/3241=73.81% 直接法直接法直接法直接法l已知标准组各科室出院人数构成比:已知标准组各科室出院人数构成比: p’=∑(Ni/N)pip’=(∑Nipi)/N 间接法间接法 p’=P. r/∑nipi ;;SMR= r/∑nipi (标准化死亡(标准化死亡/治愈比)治愈比)SMR甲甲=1026/1046.7069=0.9802;;SMR乙乙=1376/1431.7478=0.9611P’甲甲=P× SMR甲甲=0.7058 ×0.9802=69.18%P’乙乙=P× SMR乙乙=0.7058 ×0.9611=67.83% 标准化死亡比(标准化死亡比(SMR))lSMR>1:表示被标化人群的死亡率高于标准组;:表示被标化人群的死亡率高于标准组;lSMR<1:表示被标化人群的死亡率低于标准组;:表示被标化人群的死亡率低于标准组; 标准的选择标准的选择l选择一个具有代表性的、内部构成相对稳定的选择一个具有代表性的、内部构成相对稳定的较大人群;较大人群;l将相互比较的人群合并后,作为共同的标准;将相互比较的人群合并后,作为共同的标准;l从要比较的两组中任选一组的内部构成作为标从要比较的两组中任选一组的内部构成作为标准准。

      练练 习习某市甲乙两院各科出院和治愈人数某市甲乙两院各科出院和治愈人数科室科室甲甲 院院乙乙 院院出院人数出院人数治愈人数治愈人数治愈率治愈率(%)出院人数出院人数治愈人数治愈人数治愈率治愈率(%)内内 科科68721130.712186931.65妇妇 科科45639887.2848641284.77小儿科小儿科23921991.6325222890.48外外 科科20519895.5969866795.56合合 计计1587102664.651654137683.19 l已知标准组各科室出院人数已知标准组各科室出院人数-------直接法直接法l p’=(∑Nipi)/N 甲院标准化治愈率甲院标准化治愈率p’=2413.19/3241=74.46%乙院标准化治愈率乙院标准化治愈率p’=2392.13/3241=73.81% 选择甲院为标准人群选择甲院为标准人群科室科室甲甲 院院乙乙 院院出院人数出院人数治愈人数治愈人数治愈率治愈率(%)出院人数出院人数原治愈率原治愈率(%)预期治愈人数预期治愈人数内内 科科68721130.7121831.65217.44妇妇 科科45639887.2848684.77386.55小儿科小儿科23921991.6325290.48216.25外外 科科20519895.5969895.56195.90合合 计计1587102664.65165483.191016.14选择甲院为标准人群对乙院进行标准化选择甲院为标准人群对乙院进行标准化乙院标准化率:乙院标准化率:p’=1016.14/1587=64.03% 科室科室甲甲     院院乙乙    院院出院人出院人数数治愈人治愈人数数治愈率治愈率(%)预期治预期治愈人数愈人数出院人出院人数数治愈人治愈人数数治愈率治愈率(%)内内  科科68721130.7166.952186931.65妇妇  科科45639887.28424.1848641284.77小儿科小儿科23921991.63230.9125222890.48外外  科科20519895.59667.2269866795.56合合  计计1587102664.651389.251654137683.19选择乙院为标准人群选择乙院为标准人群甲院标准化率:甲院标准化率:p’=1389.25/1654=83.99%选择选择乙乙院为标准人群对院为标准人群对甲甲院进行标准化院进行标准化 不同标准选择结果对比不同标准选择结果对比标准选择标准选择甲医院甲医院乙医院乙医院合并两医院合并两医院74.4673.81已甲医院已甲医院64.6564.03已乙医院已乙医院83.9983.19 (四)率的标准化注意要点(四)率的标准化注意要点l标准化的目的在于消除混杂因素对结果的影响,使标准总标准化的目的在于消除混杂因素对结果的影响,使标准总率具有可比性;通常,直接法因其计算简便更为常用,但率具有可比性;通常,直接法因其计算简便更为常用,但若原资料中有些年龄组人口过少,易使年龄别死亡率波动若原资料中有些年龄组人口过少,易使年龄别死亡率波动较大时宜用间接法;较大时宜用间接法;l当比较几个标准化率时,应采用同一个标准人口。

      由于选当比较几个标准化率时,应采用同一个标准人口由于选定的标准人口不同,算得的标准化率也不同,但是比较时定的标准人口不同,算得的标准化率也不同,但是比较时的结论不变的结论不变l各年龄组率间出现明显交叉时,宜比较年龄组死亡率,而各年龄组率间出现明显交叉时,宜比较年龄组死亡率,而不用标准化法;不用标准化法;l两样本标准化率的比较应作假设检验两样本标准化率的比较应作假设检验 小小 结结l分类资料的统计描述,先要编制分类资料的分类资料的统计描述,先要编制分类资料的频数表,得到绝对数指标,再计算相应相对频数表,得到绝对数指标,再计算相应相对数;数;l相对数的计算法不同,说明的问题也不同,相对数的计算法不同,说明的问题也不同,应用时需注意:分母一般不宜过小,不以构应用时需注意:分母一般不宜过小,不以构成比代替率,可比性,样本指标需遵循随机成比代替率,可比性,样本指标需遵循随机抽样,比较时应做假设检验抽样,比较时应做假设检验l标准化法目的在于消除混杂因素对结果的影标准化法目的在于消除混杂因素对结果的影响 两地总死亡率比较两地总死亡率比较结合专业知识考虑有无混杂因素(如年龄)结合专业知识考虑有无混杂因素(如年龄)年龄与死亡率有无关系年龄与死亡率有无关系两地人口年龄构成是否相同两地人口年龄构成是否相同无无有有不同不同同同两地各年龄组死亡率两地各年龄组死亡率pi(无明显交叉)(无明显交叉)标准组各年龄组人数标准组各年龄组人数Ni或或构成比构成比Ni/N被标化组各年龄人数被标化组各年龄人数ni及及死亡总数死亡总数r标准组各年龄组死亡率标准组各年龄组死亡率Pi及总死亡率及总死亡率P直接法:直接法:标化率标化率p’=(∑Nipi)/N= ∑(Ni/N)pi间接法:间接法: SMR= r/∑nipi标化率标化率p’=P . SMR已知条件已知条件 第二节第二节 分类变量资料统计推断分类变量资料统计推断公共卫生学院公共卫生学院公共卫生学院公共卫生学院        王文军王文军王文军王文军wwjun1973@wwjun1973@:59389706:59389706 学习要点:学习要点:l1.了解二项分布了解二项分布l2.掌握率的抽样误差与区间估计掌握率的抽样误差与区间估计l3.熟悉率的熟悉率的Z检验适用条件和方法检验适用条件和方法 例例1  设生男孩的概率为设生男孩的概率为p,生女孩的概率为生女孩的概率为q=1-p,,令令X表示随机抽查出生的表示随机抽查出生的4 4个婴儿个婴儿中中““男孩男孩””的个数的个数. .一、一、二项分布二项分布我们来求我们来求X的概率分布的概率分布. . X的概率函数是:的概率函数是:男男 女女X表示随机抽查的表示随机抽查的4 4个婴儿中男孩的个数,个婴儿中男孩的个数,生男孩的概率为生男孩的概率为 p.X=0X =1X =2X =3X =4X可取值可取值0,1,2,3,4. 例例2  将将一枚均匀骰子抛掷一枚均匀骰子抛掷3次,次,令令X 表示表示3 3次中出现次中出现““4 4””点的次数点的次数X的概率函数是:的概率函数是:不难求得,不难求得, 掷骰子:掷骰子:““掷出掷出4 4点点””,,““未掷出未掷出4 4点点””        一般地,一般地,设在一次试验中我们只考虑两个设在一次试验中我们只考虑两个互逆的结果:互逆的结果:A或或      ,,  或者形象地把两个互逆或者形象地把两个互逆结果叫做结果叫做“成功成功”和和“失败失败”. . 新生儿:新生儿:““是男孩是男孩””,,““是女孩是女孩”” 抽验产品:抽验产品:““是正品是正品””,,““是次品是次品”” 这样的这样的n次独立重复试验称作次独立重复试验称作n重贝努里重贝努里试验,简称贝努里试验或贝努里概型、二项试验,简称贝努里试验或贝努里概型、二项分布。

      分布 再设我们重复地进行再设我们重复地进行n次独立试验次独立试验 ( ( “重重复复”是指这次试验中各次试验条件相同是指这次试验中各次试验条件相同 ) ),, 每次试验成功的概率都是每次试验成功的概率都是p,失败的概率,失败的概率都是都是q=1-=1-p. . 二项分布的应用条件有三:二项分布的应用条件有三:l各观察单位各观察单位 只具有互相对立只具有互相对立 的一种结果,如阳性的一种结果,如阳性或阴性,或阴性, 生存或死亡等,生存或死亡等, 属于二项分类资料;属于二项分类资料;l已知发生已知发生某一结果某一结果 (如死亡如死亡) 的概率为的概率为p,其对立结,其对立结果的概率则为果的概率则为1-P=q,,实际中要求实际中要求p 是从大量观察是从大量观察中获得的比较稳定的数值;中获得的比较稳定的数值;ln个观察单位的个观察单位的观察结果互相独立观察结果互相独立,即每个观察单,即每个观察单位的观察结果不会影响到其它观察单位的观察结果位的观察结果不会影响到其它观察单位的观察结果 率的抽样分布率的抽样分布l从从某某个个二二项项分分类类总总体体中中随随机机抽抽取取含含量量一一定定的的样样本本,,其其样样本本率率的的分分布布概概率率是是有有规规律律的的,,这这种种规规律律为为服服从从二二项项分分布布,,即即样样本本中中阳阳性性数数或或样样本本阳阳性性率率的的分分布布概概率率等等于于二二项项式式展展开开后后各各项项。

      若若总总体体阳阳性性率率为为π、、样样本本含含量量为为n,,阳阳性性数数为为X,,则则样样本本中中出出现现X个个阳阳性性事事件的概率可由下式求得件的概率可由下式求得  已已知知::①①π =0.5,,n =10;;②②π =0.3,,n =5;;③③π =0.3,,n =10;;④④π =0.3,,n =15可可根根据据公公式式求求各各阳阳性性数数事事件件的的概概率率并并作作概概率分布图率分布图 图图11-1 11-1 率的抽样分布图率的抽样分布图 决定图形的两个参数:决定图形的两个参数:n,,  率的抽样分布特征率的抽样分布特征1.为离散型分布;为离散型分布;2.2.当当π π =1-=1-ππ时,呈对称分布;时,呈对称分布;3.3.当当n n增大时,逐渐逼近正态分布增大时,逐渐逼近正态分布 一般认为,当一般认为,当nπnπ和和n n(1-(1-ππ)≥5)≥5时时, , 可近似可近似看作正态分布看作正态分布 l二、率的抽样误差与标准误二、率的抽样误差与标准误( (理论值理论值理论值理论值) )( (估计值估计值估计值估计值) ) 例:例: 在某镇按人口的在某镇按人口的1/201/20随机抽取随机抽取329329人,作血人,作血清登革热血凝抑制抗体反应检验,得到阳性率为清登革热血凝抑制抗体反应检验,得到阳性率为8.81 %8.81 %,试求此阳性率的抽样误差。

      试求此阳性率的抽样误差l本例,已知:本例,已知:n=329, p=0.0881, 代入公式可得:代入公式可得: 二、参数估计二、参数估计l点估计:点估计: p π l区间估计区间估计–正态近似法:当样本含量正态近似法:当样本含量n足够大足够大,样本率,样本率p或或1-p均不太小时均不太小时[如如np和和n(1-p)均大于均大于5],样本率的分布近似正态分布,总体率,样本率的分布近似正态分布,总体率可信区间在(可信区间在(1-a)可信度下,估计为:)可信度下,估计为: P±ZαSp 例:总体率例:总体率95%的可信区间:的可信区间: P±1.96Sp 总体率总体率99%的可信区间:的可信区间: P±2.58Sp–查表法:当查表法:当n较小,如较小,如n≤50,特别是,特别是p接近与接近与0或或1时(小概率时(小概率事件),按二项分布原则估计总体率的可信区间使用百分率事件),按二项分布原则估计总体率的可信区间使用百分率可信区间表。

      可信区间表 P((X))=Cnx(1- π)n-x πx 例:在某镇按人口的例:在某镇按人口的1/201/20随机抽取随机抽取329329人,作血清登革热血凝人,作血清登革热血凝抑制抗体反应检验,得到阳性率为抑制抗体反应检验,得到阳性率为8.81 %8.81 %,求得阳性率的抽,求得阳性率的抽样误差为样误差为0.01560.0156,试求抗体阳性率的,试求抗体阳性率的95%95%及及99%99%的可信区间?的可信区间?已知:已知:n=329,,p=0.0881,, sp=0.0156 n.p=329×0.0881=28.98>>5,符合正态近似法的条件,符合正态近似法的条件95%可信区间:可信区间: p±1.96 sp = 0.0881 ±1.96 ×0.0156=0.0575~0.1187 即:即:5.75%~11.87%99%可信区间:可信区间: p±2.58 sp = 0.0881 ±2.58 ×0.0156=0.0479~0.1283 即:即:4.79%~12.83% 例:某校校医用仪器矫治例:某校校医用仪器矫治25名学生的近视眼,其中名学生的近视眼,其中3人人近期有效,求该方法近期有效率的近期有效,求该方法近期有效率的95%的可信区间。

      的可信区间 n=25<50,采用查表法:,采用查表法: 在在n=25横行,和横行,和x=3的纵列交叉处上行的的纵列交叉处上行的数值为数值为3~~31,即该法近期有效率的,即该法近期有效率的95%可信区可信区间为:间为:3% ~~31% 注意:表中注意:表中X值只列出值只列出X≤n/2部分,当部分,当x>n/2时,应以时,应以n-X值查表,然后用值查表,然后用100减去查得的数减去查得的数值,即为可信区间值,即为可信区间 百分率的可信区间百分率的可信区间上行:上行:95%可信区间可信区间 下行:下行:99%可信区间可信区间nx01234567810-980-10020-840-931-990-100100-310-410-450-543-561-657-654-7412-748-8119-8113-87250-140-190-200-261-260-323-311-375-363-427-415-479-457-5112-499-5615-5411-60 例:某县抽查了例:某县抽查了10名献血员的名献血员的HBsAg携带情况,阴性携带情况,阴性者者8人,求该县献血员人,求该县献血员HBsAg阴性率的阴性率的95%的可信区间。

      的可信区间 本例本例n=10,,X=8,,X>n/2,故以,故以X=10-8=2查表,得到查表,得到3~~56,再用:,再用: 100-3=97 100-56=44 即该县献血员即该县献血员HBsAg阴性率的阴性率的95%的可信的可信区间为区间为44%~~97% 三、总体率的三、总体率的Z检验检验l条件:当样本含量条件:当样本含量n足够大,样本率足够大,样本率p或或1-p均不均不太小时,即太小时,即np和和n(1-p)均大于均大于5,样本率的分布,样本率的分布近似于正态分布近似于正态分布假设检验假设检验 1-α 总体率的总体率的总体率的总体率的Z Z检验检验检验检验l样本率与总体率的比较样本率与总体率的比较l两个样本率的比较两个样本率的比较ZZ 总体率的总体率的总体率的总体率的Z Z检验检验检验检验————步骤步骤步骤步骤步骤:步骤:l建立检验假设建立检验假设H0和备择假设和备择假设H1l确定检验水准确定检验水准l选定检验方法和计算检验统计量选定检验方法和计算检验统计量l确定确定P值和作出推断结论值和作出推断结论 总体率的总体率的总体率的总体率的Z Z检验检验检验检验例:例:故可认为该油田职工家属高血压患病率与一般人不同故可认为该油田职工家属高血压患病率与一般人不同故可认为该油田职工家属高血压患病率与一般人不同故可认为该油田职工家属高血压患病率与一般人不同ZZZ 练练 习(习(1))l经长期临床观察经长期临床观察, 发现胃溃疡患者发生胃出血症状发现胃溃疡患者发生胃出血症状的占的占20%。

      现某医院观察了现某医院观察了304例例65岁以上的老年岁以上的老年胃溃疡患者,有胃溃疡患者,有96例发生胃出血症状问老年胃例发生胃出血症状问老年胃溃疡患者是否较一般患者更易发生胃出血?溃疡患者是否较一般患者更易发生胃出血?65岁以上老年胃溃疡患者胃出血率为岁以上老年胃溃疡患者胃出血率为:P=96/304=31.58%,,样本样本p和和1-p均不接近于零,且均不接近于零,且np与与n(1-p)均大于均大于5,样本率的分布近似于正态分布样本率的分布近似于正态分布 ((1)建立检验假设,确定检验水准)建立检验假设,确定检验水准   H0::  =  0,即老年胃溃疡患者胃出血发生率与一般患者,即老年胃溃疡患者胃出血发生率与一般患者相同相同   H1::  >  0,即老年胃溃疡患者胃出血发生率高于一般患者,即老年胃溃疡患者胃出血发生率高于一般患者       = 0.05   ((2)) 计算检验统计量计算检验统计量        ((3)) 确定确定P值值 ,  做出推断结论查表得做出推断结论查表得, P<0.01, 按按   = 0.05水水准拒绝准拒绝H0, 接受接受H1, 认为老年胃溃疡患者较一般患者更易发生认为老年胃溃疡患者较一般患者更易发生胃出血胃出血。

       Z 某研究者在某地区随机抽取某研究者在某地区随机抽取1010岁儿童岁儿童100100人,人,2020岁青年岁青年120120人,检查发现人,检查发现1010岁儿童中有岁儿童中有7070人患人患龋齿,龋齿,2020岁青年中有岁青年中有6060人患龋齿,问该地区人患龋齿,问该地区1010岁岁儿童与儿童与2020岁青年患龋齿率是否相等?岁青年患龋齿率是否相等?练练  习习((2)) ((1 1)建立检验假设,确定检验水准)建立检验假设,确定检验水准              H0:: 1 = =  2,即两组人群龋患率相同,即两组人群龋患率相同             H1::   1   2,即两组人群龋患率不同,即两组人群龋患率不同   = 0.05= 0.05 (2) (2) 计算检验统计量计算检验统计量 本例本例, , p1=70/100=0.70, p2=60/120=0.50   pc =(70+60))/((100+120)=0.5909 (3) (3) 确定确定P值值, , 做出推断结论。

      做出推断结论 查表得查表得P P<0.01<0.01,按,按  = 0.05= 0.05水准拒绝水准拒绝H H0 0,, 接受接受H H1 1,认为该地,认为该地1010岁儿童与岁儿童与2020岁岁青年龋患率不同青年龋患率不同Z 第三节第三节 χ2  检验检验公共卫生学院公共卫生学院公共卫生学院公共卫生学院        王文军王文军王文军王文军wwjun1973@wwjun1973@:59389706:59389706 学习要点:学习要点:l1.熟悉卡方检验的基本思想熟悉卡方检验的基本思想l2.掌握四格表资料卡方检验的适用条件和方法掌握四格表资料卡方检验的适用条件和方法l3.掌握配对的卡方检验的适用条件和方法掌握配对的卡方检验的适用条件和方法l4.熟悉行熟悉行X列表资料检验的适用条件和方法列表资料检验的适用条件和方法 第三节:第三节: χ2  检验检验l定义:定义: 当需要进行两个或两个以上样本率比较,并试图从当需要进行两个或两个以上样本率比较,并试图从样本率的差别来推断其所代表的总体率是否也存在差别样本率的差别来推断其所代表的总体率是否也存在差别时,为保证推断的科学性,必须做样本率的显著性检验,时,为保证推断的科学性,必须做样本率的显著性检验,这种检验的方法叫做这种检验的方法叫做χ2  检验。

      检验lχ2  检验的基本思想检验的基本思想 假设两组资料率的差异来自抽样误差,用假设两组资料率的差异来自抽样误差,用χ2  值反映值反映实际频率和理论频数吻合的程度实际频率和理论频数吻合的程度 χ χ2 2 检验的基本思想 检验的基本思想 检验的基本思想 检验的基本思想处理方法处理方法生生 存存死死 亡亡合合 计计生存率(生存率(%))甲疗法甲疗法52 (46.09)34 (39.91)8660.47乙疗法乙疗法45 (50.91)50 (44.09)9547.37合计合计978418153.59甲乙两种疗法治疗前列腺癌的甲乙两种疗法治疗前列腺癌的3年生存率比较年生存率比较χ2 =∑————T((A--T))2TRC=————nR× nCn((A:实际频数;实际频数;T:理论频数):理论频数)ν=(行数-(行数-1))×(列数(列数 --1))注意:计算自由度时使用的是格子数,而不是例数注意:计算自由度时使用的是格子数,而不是例数 χ χ2 2 检验的基本思想 检验的基本思想 检验的基本思想 检验的基本思想χ2 值、值、P值和统计结论值和统计结论χ2 值值P值值 统计结论统计结论<< χ2 0.05(ν)>>0.05不拒绝不拒绝H0,差异无统计学意义,差异无统计学意义≥ χ2 0.05(ν)≤0.05拒绝拒绝H0,接受,接受H1,差异有统计学意义,差异有统计学意义χ2 界值表(界值表(P323)) χ2 界值表(界值表(P323))lχ2 0.05((1))=lχ2 0.01((1)) =lχ2 0.05((7)) =lχ2 0.01((14)) =3.846.6314.0729.14 二、四格表资料的二、四格表资料的χ χ2 2检验检验1818497合计合计9550 (44.09)45 (50.91)乙疗法乙疗法8634 (39.91)52 (46.09)甲疗法甲疗法合合 计计死死 亡亡生生 存存处理处理甲乙两种疗法治疗前列腺癌的甲乙两种疗法治疗前列腺癌的3年生存率比较年生存率比较 l四格表资料四格表资料χ χ2 2检验的基本步骤检验的基本步骤①①建立假设:建立假设: H0::π1=π2,, H1 ::π1≠π2,,α=0.05②②计算理论数和计算理论数和χ2统计量统计量③③确定确定P值:值: ν=(行数-(行数-1))×(列数(列数 --1))=((2-1))×((2-1))=1,, 根据自由度查界值表根据自由度查界值表χ2 0.05(1)=3.84,本例,本例χ2 =3.11<<3.84,,P值>值>0.05④④结论结论 按按α=0.05水准,不能拒绝水准,不能拒绝H0,故不能认为两种疗法治疗前列腺癌的,故不能认为两种疗法治疗前列腺癌的3年年生存率有所不同。

      生存率有所不同χ2 =∑————=T((A--T))21818497合计合计9550 (44.09)45 (50.91)乙疗法乙疗法8634 (39.91)52 (46.09)甲疗法甲疗法合合 计计死死 亡亡生生 存存处理处理甲乙两种疗法治疗前列腺癌的甲乙两种疗法治疗前列腺癌的3年生存率比较年生存率比较 处理方法处理方法生生 存存死死 亡亡合合 计计生存率(生存率(%))甲疗法甲疗法52 (46.09)34 (39.91)8660.47乙疗法乙疗法45 (50.91)50 (44.09)9547.37合计合计978418153.59甲乙两种疗法治疗前列腺癌的甲乙两种疗法治疗前列腺癌的3年生存率比较年生存率比较Z χ χ2 2检验与两样本率的检验与两样本率的z检验的联系检验的联系l如果资料符合要求,两种检验结果是一致的:如果资料符合要求,两种检验结果是一致的: Χ2=Z2lχ2 0.05((1))=3.84l((Z 0.05))2=((1.96)) 2 =3.84 四格表资料专用公式四格表资料专用公式四格表资料专用公式四格表资料专用公式 四格表资料四格表资料χ2检验的条件检验的条件l所有格子的理论频数都大于等于所有格子的理论频数都大于等于5 5((T≥5T≥5),),而且总的样本数大于等于而且总的样本数大于等于4040,(,(n ≥ 40n ≥ 40))abnRcdnCn+ -+ -甲甲乙乙 四格表资料四格表资料四格表资料四格表资料χ χ2 2检验的校正检验的校正检验的校正检验的校正l1≤T<<5,而,而n≥40时,需计算校正时,需计算校正χ2值,值,lT<<1或或n<<40时,需用确切概率法进行校正时,需用确切概率法进行校正– –校正校正校正校正χ χ2 2值的公式:值的公式:值的公式:值的公式:– –确切概率法的公式:确切概率法的公式:确切概率法的公式:确切概率法的公式: Pi= —————————————a!b!c!d!n!(a+b)!(c+d)!(a+c)!(b+d)!aba+bcdc+da+cb+dnP表示大于实际四格表表示大于实际四格表|P1-P2|值的各组值的各组Pi之和之和 例:某医生用两种方法治疗心绞痛,结果如下表,试比较例:某医生用两种方法治疗心绞痛,结果如下表,试比较两种疗法的疗效有无差异?两种疗法的疗效有无差异?疗法疗法有效有效无效无效合计合计有效率有效率(%)(%)甲疗法甲疗法23236 6292979.3179.31乙疗法乙疗法27273 3303090.0090.00合计合计50509 9595984.7584.75用两种方法治疗心绞痛效果比较用两种方法治疗心绞痛效果比较T12=29×9/59=4.42<<5 ③③确定确定P值:值: ν=((2--1))×((2--1))=1,, 查界值表得查界值表得χ2 0.05(1)=3.84,, 本例本例χ2 =0.61<<3.84,,P值>值>0.05 。

      疗法疗法有效有效无效无效合计合计有效率有效率(%)甲疗法甲疗法236(4.42)2979.31乙疗法乙疗法2733090.00合计合计5095984.75用两种方法治疗心绞痛效果比较用两种方法治疗心绞痛效果比较①①建立假设:建立假设: H H0 0::ππ1 1=π=π2 2,, H H1 1 ::ππ1 1≠π≠π2 2,,α=0.05α=0.05②②计算计算χ2值:值:T12=29×9/59=4.42<<5,, n=59>>40,,故采用校正公式故采用校正公式④④结论:结论: 按按α=0.05水准,不拒绝水准,不拒绝H0 ,故认为两种疗法治,故认为两种疗法治疗心绞痛无差别疗心绞痛无差别 例例:某医生比较新、旧两种药物的疗效,结某医生比较新、旧两种药物的疗效,结果见下表,问两种药物疗效是否不同?果见下表,问两种药物疗效是否不同?疗法疗法有效有效无效无效合计合计有效率有效率(%)(%)新药新药18181 1191994.794.7旧药旧药13133 3161681.381.3合计合计31314 4353588.688.6新旧两药物治疗某病的疗效比较新旧两药物治疗某病的疗效比较n=35<<40 疗法疗法有效有效无效无效合计合计有效率有效率(%)(%)新药新药18181 1191994.794.7旧药旧药13133 3161681.381.3合计合计31314 4353588.688.6组合组合组合组合1 1 1 12 2 2 23 3 3 34 4 4 45 5 5 5P1-P2P1-P2P1-P2P1-P225.025.025.025.013.413.413.413.42.02.02.02.0-9.5-9.5-9.5-9.5-21.1-21.1-21.1-21.1PiPiPiPi0.0340.0340.0340.0340.2040.2040.2040.2040.3920.3920.3920.3920.2960.2960.2960.2960.0740.0740.0740.07419190 012124 415154 416160 018181 113133 317172 214142 216163 315151 1a!b!c!d!n!(a+b)!(c+d)!(a+c)!(b+d)!P=实际表格实际表格p1-p2=94.7%-81.3%=13.4%;绝对值;绝对值≥13.4%的的有有1,2,5组;故组;故P=P1+P2+P5=0.034+0.204+0.074=0.312;;P>0.05,不拒绝不拒绝H0,故不能认为两种药物疗效有差别。

      故不能认为两种药物疗效有差别如果是单侧检验呢?如果是单侧检验呢? 例例:某医生比较新、旧两种药物的疗效,结某医生比较新、旧两种药物的疗效,结果见下表,问新药物疗效是否优于旧药?果见下表,问新药物疗效是否优于旧药?疗法疗法有效有效无效无效合计合计有效率有效率(%)(%)新药新药18181 1191994.794.7旧药旧药13133 3161681.381.3合计合计31314 4353588.688.6新旧两药物治疗某病的疗效比较新旧两药物治疗某病的疗效比较n=35<<40注意是单侧检验注意是单侧检验 疗法疗法有效有效无效无效合计合计有效率有效率(%)(%)新药新药18181 1191994.794.7旧药旧药13133 3161681.381.3合计合计31314 4353588.688.6组合组合组合组合1 1 1 12 2 2 23 3 3 34 4 4 45 5 5 5P1-P2P1-P2P1-P2P1-P225.025.025.025.013.413.413.413.42.02.02.02.0-9.5-9.5-9.5-9.5-21.1-21.1-21.1-21.1PiPiPiPi0.0340.0340.0340.0340.2040.2040.2040.2040.3920.3920.3920.3920.2960.2960.2960.2960.0740.0740.0740.07419190 012124 415154 416160 018181 113133 317172 214142 216163 315151 1a!b!c!d!n!(a+b)!(c+d)!(a+c)!(b+d)!P=实际表格实际表格p1-p2=94.7%-81.3%=13.4%;;≥13.4%的有的有1,2组;组;故故P=P1+P2=0.034+0.204=0.238;;P>0.05,不拒绝不拒绝H0,故不,故不能认为新药优于旧药疗效。

      能认为新药优于旧药疗效 三、四格表配对资料的三、四格表配对资料的χ2检验检验l配对四格表资料也叫配对四格表资料也叫2×2列联表,是对配对设计研列联表,是对配对设计研究所获得的计数资料进行比较究所获得的计数资料进行比较l配对设计:配对设计:–同一批样品用两种不同的处理方法同一批样品用两种不同的处理方法–观察对象根据配对条件配成对子,同一对子内不观察对象根据配对条件配成对子,同一对子内不同的个体分别接受不同的处理同的个体分别接受不同的处理–在病因和危险因素的研究中,将病人和对照按配在病因和危险因素的研究中,将病人和对照按配对条件配成对子,研究是否存在某种病因或危险对条件配成对子,研究是否存在某种病因或危险因素 例:某研究者用凝集试验和细菌培养两种方法,同时对例:某研究者用凝集试验和细菌培养两种方法,同时对65例慢性菌痢患者的粪例慢性菌痢患者的粪便进行检查,结果如下表,问两种方法检出率是否有差别?便进行检查,结果如下表,问两种方法检出率是否有差别? 基本思想:基本思想:基本思想:基本思想:表中表中a与与d为结果相同的部分,两种方法是为结果相同的部分,两种方法是否有差别可以不予考虑,主要比较结果不同部分否有差别可以不予考虑,主要比较结果不同部分b与与c。

      如果两种方法检查效果相同,理论上应有总体如果两种方法检查效果相同,理论上应有总体B=C,,故可以通过故可以通过b、、c的差别大小来判断两种方法的差别的差别大小来判断两种方法的差别四格表配对资料的四格表配对资料的四格表配对资料的四格表配对资料的χ χ2 2检验检验检验检验凝集法凝集法培养法培养法合计合计++--++37(a)5(b)42--10(c)13(d)23合计合计471865两种方法检出结果两种方法检出结果 配对资料卡方检验公式的推导配对资料卡方检验公式的推导++--++ab--cd 应用公式应用公式lb+c≥40lb+c<<40++--++ab--cd四格表配对资料的四格表配对资料的四格表配对资料的四格表配对资料的χ χ2 2检验检验检验检验ν=(行数-(行数-1))×(列数(列数 --1))=1 例:某研究者用凝集试验和细菌培养两种方法,例:某研究者用凝集试验和细菌培养两种方法,同时对同时对65例慢性菌痢患者的粪便进行检查,结果例慢性菌痢患者的粪便进行检查,结果如下表,问两种方法检出率是否有差别?如下表,问两种方法检出率是否有差别?凝集法凝集法培养法培养法合计合计--+++53742--131023合计合计184765两种方法检出结果两种方法检出结果 检验步骤检验步骤①①建立假设:建立假设: H0::B=C,, H1::B≠C,,α=0.05②②计算计算χ2值:值:b+c=15 <<40,故采用校正公式故采用校正公式③③确定确定P值:值: ν=((2--1))×((2--1))=1,查界值表得,查界值表得χ2 0.05(1)=3.84,, 本例本例χ2 =1.07<<3.84,,P值>值>0.05 。

      ④④结论:结论: 按按α=0.05水准,不拒绝水准,不拒绝H0 ,故认为两种方法检查无差别,故认为两种方法检查无差别凝集法凝集法培养法培养法合计合计++--++37(a)5(b)42--10(c)13(d)23合计合计471865两种方法检出结果两种方法检出结果四格表配对资料的四格表配对资料的四格表配对资料的四格表配对资料的χ χ2 2检验检验检验检验 练习题练习题l l用两种方法检查已确诊的乳腺癌患者用两种方法检查已确诊的乳腺癌患者用两种方法检查已确诊的乳腺癌患者用两种方法检查已确诊的乳腺癌患者120120名,甲名,甲名,甲名,甲方法的检出率为方法的检出率为方法的检出率为方法的检出率为60%60%,乙方法的检查率为,乙方法的检查率为,乙方法的检查率为,乙方法的检查率为50%50%两种方法一致的检出率为两种方法一致的检出率为两种方法一致的检出率为两种方法一致的检出率为35%35%,两种方法的检出,两种方法的检出,两种方法的检出,两种方法的检出率有无差异?率有无差异?率有无差异?率有无差异? 四、行四、行×列表资料的列表资料的χ2检验检验l定义:定义: 行行×列表是指有两个或两个以上的比较组,记录的观列表是指有两个或两个以上的比较组,记录的观察结果也有两个或两个以上的结果。

      察结果也有两个或两个以上的结果l用途:用途: 用于多个样本率或构成比差异的比较用于多个样本率或构成比差异的比较l公式:公式: n为总例数,为总例数,A为每个格子里的实际频数,为每个格子里的实际频数,nR和和nc分分别为与别为与A值相对应行和列合计的例数值相对应行和列合计的例数合计Anc合计nRν=(行数-(行数-1))×(列数(列数 --1)) 地区地区未污染未污染污染污染合计合计污染率污染率(%)甲甲6232979.3乙乙30144431.8丙丙831127.3合计合计44408447.6三个地区花生的黄曲霉毒素三个地区花生的黄曲霉毒素B1污染率的比较污染率的比较练习:某研究者欲比较三个地区花生中黄曲霉毒练习:某研究者欲比较三个地区花生中黄曲霉毒素素B1的污染情况,详见下表,试比较三个地区污的污染情况,详见下表,试比较三个地区污染情况有何差别?染情况有何差别?T32=40*11/84=5.238 检验步骤检验步骤①①建立假设:建立假设: H0:三个地区花生的黄曲霉毒素:三个地区花生的黄曲霉毒素B1污染率相等,污染率相等,π1=π2 = π3,, H1:三个地区花生的黄曲霉毒素:三个地区花生的黄曲霉毒素B1污染率不相等或不全相等,污染率不相等或不全相等, α=0.05 ②②计算计算χ2值:值:③③确定确定P值:值: ν=((3--1))×((2--1))=2,查界值表得,查界值表得χ2 0.05(2)=5.99,, 本例本例χ2 =17.91 >> χ2 0.05(2) ,,P值<值< 0.05 。

      ④④结论:结论: 按按α=0.05水准,拒绝水准,拒绝H0 ,接受,接受H1,故认为三个地区花生的黄曲霉毒素,故认为三个地区花生的黄曲霉毒素B1污染率不相等或不全相等,有地区差异污染率不相等或不全相等,有地区差异地区地区未污染未污染污染污染合计合计污染率污染率(%)甲甲6232979.3乙乙30144431.8丙丙831127.3合计合计44408447.6三个地区花生的黄曲霉毒素三个地区花生的黄曲霉毒素B1污染率的比较污染率的比较行行行行× ×列表资料的列表资料的列表资料的列表资料的χ χ2 2检验检验检验检验 注意事项注意事项l如果假设检验的结果是拒绝无效假设(如果假设检验的结果是拒绝无效假设(H0),只能认为),只能认为各总体率或构成比之间总的来说有差别,但并不能说明各总体率或构成比之间总的来说有差别,但并不能说明他们彼此之间都有差别他们彼此之间都有差别l lχ χ2 2检验要求理论频数不宜太小,否则将导致分析的偏性检验要求理论频数不宜太小,否则将导致分析的偏性一般要求不能有一般要求不能有1/5以上的格子理论数小于以上的格子理论数小于5,或者有一,或者有一个格子的理论数小于个格子的理论数小于1。

      –最好增加样本例数,以增大理论频数最好增加样本例数,以增大理论频数–删去上述理论频数太小的行和列删去上述理论频数太小的行和列–将太小的理论频数所在行或列与性质相近的邻行或邻将太小的理论频数所在行或列与性质相近的邻行或邻列种的实际频数合并,使重新计算的理论频数增大列种的实际频数合并,使重新计算的理论频数增大行行行行× ×列表资料的列表资料的列表资料的列表资料的χ χ2 2检验检验检验检验 练习题:某研究人员调查喂养方式与婴儿腹泻的练习题:某研究人员调查喂养方式与婴儿腹泻的练习题:某研究人员调查喂养方式与婴儿腹泻的练习题:某研究人员调查喂养方式与婴儿腹泻的关系,结果见下表问不同喂养方式的婴儿腹泻关系,结果见下表问不同喂养方式的婴儿腹泻关系,结果见下表问不同喂养方式的婴儿腹泻关系,结果见下表问不同喂养方式的婴儿腹泻发生率有无不同?发生率有无不同?发生率有无不同?发生率有无不同?不同喂养方式的婴儿腹泻发生率比较不同喂养方式的婴儿腹泻发生率比较喂养方式喂养方式例数例数腹泻例数腹泻例数腹泻发生率(%)腹泻发生率(%)母乳喂养母乳喂养348236.61混合喂养混合喂养1062220.75人工喂养人工喂养411229.27合计合计4955711.52 不同喂养方式的婴儿腹泻发生率比较不同喂养方式的婴儿腹泻发生率比较喂养方式喂养方式腹泻腹泻正常正常例数例数母乳喂养母乳喂养23325348混合喂养混合喂养2284106人工喂养人工喂养122941合计合计57438495T31=41*57/495=4.7;;T21=57*106/495=12.2 =29.784ν=(3-1)(2-1)=2 查界值表得查界值表得 =5.99 ,,P<<0.05,差别有统计学意义,,差别有统计学意义,在在a=0.05水准上,拒绝水准上,拒绝H0,接受,接受H1,可以认为三种,可以认为三种不同喂养方式的婴儿腹泻发生率不相同。

      不同喂养方式的婴儿腹泻发生率不相同喂养方式喂养方式例数例数腹泻腹泻正常正常母乳喂养母乳喂养34823325混合喂养1062284人工喂养411229合计合计49557438H0::π1=π2=π3 H1::π1、、π2、、π3不等或不全相等不等或不全相等      小结小结l率的抽样误差:率的抽样误差:l总体率的参数估计:正态近似法、查表法总体率的参数估计:正态近似法、查表法l率的假设检验率的假设检验–Z检验检验–卡方检验卡方检验 练练 习习 题题1.已知已知2010年某医院住院患者中,胃癌患者占年某医院住院患者中,胃癌患者占5%,该指标为:,该指标为: A、发病率、发病率 B、构成比、构成比 C、相对比、相对比 D、标准化率、标准化率2.某地男性男性肺癌发病率是女性的某地男性男性肺癌发病率是女性的10倍,该指标为:倍,该指标为: A、流行率、流行率 B、构成比、构成比 C、相对比、相对比 D、标准化率、标准化率3.下列哪一指标为相对比下列哪一指标为相对比 A、均数、均数 B、中位数、中位数 C、变异系数、变异系数 D、几何均数、几何均数4.假设对两个率差别的假设检验分别用假设对两个率差别的假设检验分别用Z检验和检验和χ2检验,则求出检验,则求出的的Z值和值和χ2值的关系有:值的关系有: A、、χ2检验比检验比Z检验准确检验准确 B、、Z检验比检验比χ2检验准确检验准确 C、、Z==χ2 D、、Z2==χ25.例数例数200的四个样本率的比较,进行卡方检验,其自由度为:的四个样本率的比较,进行卡方检验,其自由度为: A、、199 B、、197 C、、 3、、 D、、4 6.经调查得知甲乙两地的冠心病粗死亡率同为经调查得知甲乙两地的冠心病粗死亡率同为40/万,按年龄构万,按年龄构成标化后,甲地冠心病标化死亡率为成标化后,甲地冠心病标化死亡率为45/万,乙地为万,乙地为38/万,万,因此可认为因此可认为 A、甲地年龄别人口构成较乙地年轻、甲地年龄别人口构成较乙地年轻 B、乙地年龄别人口构成较甲地年轻、乙地年龄别人口构成较甲地年轻 C、甲地冠心病的诊断较乙地准确、甲地冠心病的诊断较乙地准确 D、乙地冠心病的诊断较甲地准确、乙地冠心病的诊断较甲地准确7. 随机选取男随机选取男200人,女人,女100人为某传染病研究的调查对象,测人为某传染病研究的调查对象,测得其阳性感染率分别为得其阳性感染率分别为20%和和15%,则平均阳性率为(,则平均阳性率为( )) A、、18.3% B、、17.5% C、、35% D、、16.7%8.进行四个样本率比较的进行四个样本率比较的χ2检验,如检验,如χ2>> χ2 (0.01,3) A、各样本率均不相同、各样本率均不相同 B、各总体率均不相同、各总体率均不相同 C、各总体率不同或不全相同、各总体率不同或不全相同 D、各样本率不同或不全相同、各样本率不同或不全相同 9.若仅知道样本率,估计率的抽样误差时应用下列哪个指标表示若仅知道样本率,估计率的抽样误差时应用下列哪个指标表示 A、、 sp B、、s C、、σ D、、10、某四格表资料用、某四格表资料用χ2检验的基本公式算得为检验的基本公式算得为A,用专用公式算,用专用公式算得为得为B,则,则 A、、A>>B B、、A==B C、、A<<B D、、A比比B准确准确11、要比较甲乙两厂某工种工人中某职业病患病率的高低,采用、要比较甲乙两厂某工种工人中某职业病患病率的高低,采用标准化法的原理是标准化法的原理是 A、假设甲乙两厂该工种的工人数相同、假设甲乙两厂该工种的工人数相同 B、假设甲乙两厂患该职业病的工人数相同、假设甲乙两厂患该职业病的工人数相同 C、假设甲乙两厂工人的工龄构成比相同、假设甲乙两厂工人的工龄构成比相同 D、假设甲乙两厂该工种工人的工龄构成比相同、假设甲乙两厂该工种工人的工龄构成比相同12、行、行×列表的列表的χ2检验应注意检验应注意 A、任意格子的理论数若小于、任意格子的理论数若小于5,则应该用校正公式,则应该用校正公式 B、若有五分之一以上格子的理论数小于、若有五分之一以上格子的理论数小于5,则要考虑合理并组,则要考虑合理并组 C、任一格子的理论数小于、任一格子的理论数小于5,就应并组,就应并组 D、若有五分之一以上格子的理论数小于、若有五分之一以上格子的理论数小于5,则应该用校正公式,则应该用校正公式 13、用两种方法治疗胆结石,用中药治疗用两种方法治疗胆结石,用中药治疗19人,其中人,其中15人治愈;用西药治疗人治愈;用西药治疗18人,治愈人,治愈12人。

      若比较人若比较两种方法的治疗效果,应该用两种方法的治疗效果,应该用 A、、 B、、 C、、 D、确切概率法、确切概率法14、某医生用甲乙两种药物治疗两组相同疾病患者,、某医生用甲乙两种药物治疗两组相同疾病患者,其中甲组收治的患者是乙组的其中甲组收治的患者是乙组的10倍,若两组治愈倍,若两组治愈率相同,比较两总体治愈率的可信区间,则(率相同,比较两总体治愈率的可信区间,则( )) A.甲组较乙组的准确甲组较乙组的准确 B.甲组较乙组的精密甲组较乙组的精密 C.两组准确度和精确度一样两组准确度和精确度一样D.乙组较甲组的精密乙组较甲组的精密 15.当四格表的周边合计数固定时,如果某格子.当四格表的周边合计数固定时,如果某格子的实际频数减少,则其对应的理论频数(的实际频数减少,则其对应的理论频数( )) A.不变不变 B.减小减小 C.增大增大 D.不变或减小不变或减小16. 四格表中,当四格表中,当a=20,,b=60,,c=15,,d=5时,时,最小的理论频数为最小的理论频数为 (( )) A.T11    B.T12  C.T21    D.T22 判别下列公式各代表什么意义?判别下列公式各代表什么意义?样本中样本中95%正常值的范围正常值的范围总体均数总体均数95%的可信区间的可信区间总体中总体中95%样本均数的范围样本均数的范围总体率总体率95%的可信区间的可信区间 1.某医师用两种疗法治疗脑血管梗塞,结果某医师用两种疗法治疗脑血管梗塞,结果见下表,试比较两种疗法的疗效是否不同见下表,试比较两种疗法的疗效是否不同表表   两种疗法治疗脑血管梗塞效果两种疗法治疗脑血管梗塞效果疗疗     法法法法有效有效有效有效无效无效无效无效合合合合计计有效率(有效率(有效率(有效率(%%))))甲甲甲甲疗疗法法法法25256 6313180.6580.65乙乙乙乙疗疗法法法法29293 3323290.6390.63合合合合     计计54549 9636385.7185.71 2.某研究人员调查了某研究人员调查了343例离退休老年人的生活满例离退休老年人的生活满意度和家庭关系,结果如下表,试分析家庭关系类意度和家庭关系,结果如下表,试分析家庭关系类型与老年人生活满意度的关系型与老年人生活满意度的关系表 343例离退休老年人的家庭关系与生活满意度家庭关系满意度合计满意度(%)满意不满意和睦174 6023474.36一般 36 57 9338.71差 6 10 1637.50合计21612734362.97 3.3.有有有有5050份痰液标本,每份分别接种在甲乙两种培养份痰液标本,每份分别接种在甲乙两种培养份痰液标本,每份分别接种在甲乙两种培养份痰液标本,每份分别接种在甲乙两种培养基中,观察结核杆菌的生长情况,结果如下表,基中,观察结核杆菌的生长情况,结果如下表,基中,观察结核杆菌的生长情况,结果如下表,基中,观察结核杆菌的生长情况,结果如下表,试比较两种培养基的效果试比较两种培养基的效果试比较两种培养基的效果试比较两种培养基的效果表 两种结核杆菌培养基的培养效果比较甲培养基甲培养基乙培养基乙培养基合合计+--+ 23   1235--   7  815合合计302050 练习题练习题l l用两种方法检查已确诊的乳腺癌患者用两种方法检查已确诊的乳腺癌患者用两种方法检查已确诊的乳腺癌患者用两种方法检查已确诊的乳腺癌患者120120名,甲名,甲名,甲名,甲方法的检出率为方法的检出率为方法的检出率为方法的检出率为60%60%,乙方法的检查率为,乙方法的检查率为,乙方法的检查率为,乙方法的检查率为50%50%。

      两种方法一致的检出率为两种方法一致的检出率为两种方法一致的检出率为两种方法一致的检出率为35%35%,两种方法的检出,两种方法的检出,两种方法的检出,两种方法的检出率有无差异?率有无差异?率有无差异?率有无差异? l l4.4.在某克山病区对中小学学生的心肌受损情况在某克山病区对中小学学生的心肌受损情况在某克山病区对中小学学生的心肌受损情况在某克山病区对中小学学生的心肌受损情况进行检查,结果进行检查,结果进行检查,结果进行检查,结果277277名男生中检出率为名男生中检出率为名男生中检出率为名男生中检出率为48.74%48.74%,,,,147147名女生中检出率为名女生中检出率为名女生中检出率为名女生中检出率为57.10%57.10%,试问男女生,试问男女生,试问男女生,试问男女生心肌受损率是否不同心肌受损率是否不同心肌受损率是否不同心肌受损率是否不同 。

      点击阅读更多内容
      相关文档
      【全国硕士研究生入学统一考试政治】2020年考研政治真题.docx 【全国硕士研究生入学统一考试政治】2015年考研政治真题.docx 【全国硕士研究生入学统一考试政治】2010年考研政治真题.docx 【全国硕士研究生入学统一考试政治】1996年政治考研真题(理科)及参考答案.doc 【全国硕士研究生入学统一考试政治】2001年政治考研真题(理科)及参考答案.doc 【全国硕士研究生入学统一考试政治】2016年考研政治真题.docx 【全国硕士研究生入学统一考试政治】2000年政治考研真题(文科)及参考答案.doc 【全国硕士研究生入学统一考试政治】1997年政治考研真题(理科)及参考答案.doc 【全国硕士研究生入学统一考试政治】2007年考研政治真题.doc 【全国硕士研究生入学统一考试政治】1997年政治考研真题(文科)及参考答案.doc 【全国硕士研究生入学统一考试政治】2004年考研政治真题.doc 【全国硕士研究生入学统一考试政治】2003年考研政治真题.doc 【全国硕士研究生入学统一考试政治】2019年考研政治真题.docx 【全国硕士研究生入学统一考试政治】2009年考研政治真题.docx 【全国硕士研究生入学统一考试政治】2001年政治考研真题(文科)及参考答案.doc 【全国硕士研究生入学统一考试政治】2021年考研政治真题.doc 【全国硕士研究生入学统一考试政治】2014年考研政治真题.docx 【全国硕士研究生入学统一考试政治】2018年考研政治真题.docx 【全国硕士研究生入学统一考试政治】2008年考研政治真题.doc 【全国硕士研究生入学统一考试政治】2011年考研政治真题.docx
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.