
有标识-《医学统计学》复习资料.pdf
42页《医学统计学》复习资料 第第 1 页,共页,共 42 页页 《《医学医学统计学统计学》》复习资料复习资料 (按章节顺序编排题号) 一、一、名词解释名词解释((非考试题型,非考试题型,理解性记忆理解性记忆基本概念基本概念)) 1.Population:总体,根据研究目的确定的同质研究对象的全体 1.Sample:样本,从总体中抽取的具有代表性的部分个体 1.Probability:概率,随机事件发生可能性大小的数值度量 1.Sampling error:抽样误差,由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异 2.Medical reference range:医学参考值范围,绝大多数正常人的某指标值的波动范围 2.Central tendency:集中趋势,所有的观测值以某一数值为中心,即频数分布有一个高峰,称为集中趋势,反映资料的平均水平或中间位置 3.Standardized mortality ration, SMR:标准化死亡比,被标化组的实际死亡数与预期死亡数之比 5.Standard error:标准误,样本均数的标准差,是描述均数抽样误差大小的指标。
5.参数估计:指用样本指标(统计量)来推断总体指标(参数) 5.Interval estimation 区间估计 / Confidence interval 可信区间(或称置信区间) :指按预先给定的概率 1 - α,由样本指标确定的包含总体参数的一个范围 5.Hypothesis test:假设检验,先对总体做出某种假定(检验假设) ,然后根据样本信息来推断其是否成立的一类统计方法的总称 5.Level of a test / significant level:检验水准,拒绝 H0时的最大允许误差的概率 5.Type I error:第一类错误,检验假设 H0本来是成立的,经过检验后被拒绝了,即“弃真” ,其发生的概率为 α,为已知[或:拒绝了实际上成立的 H0] 5.Type II error:第二类错误,检验假设 H0本来不成立,经过检验后被接受了,即“取伪” ,其发生的概率为 β,属未知数[或:没有拒绝实际上不成立的 H0] 5.Power of a test:检验效能,当两总体确有差别,按 α 水准能发现它们有差别的能力 10.Linear correlation coefficient:直线相关系数,说明具有直线关系的两个变量间相关关系的密切程度与相关方向的统计指标。
10.Coefficient of determination:决定系数,表示由 x 与y 的直线关系导致的y的变异SS回在总变异SS总中所占的比重 10.Least square method:最小二乘法,实测点到直线的纵向距离的平方和最小来估计回归系数 12.Confounder:混杂因素,影响实验效应并与处理因素同时存在的非处理因素 12.Random sampling:随机抽样,指保证总体中的每一个个体都有同等的机会被抽出来作为样本 12.Random assignment:随机分组,指保证样本中的每一个个体都有同等的机会被分配到实验组或对照组 12.Replication:重复,研究样本要有一定的数量,即在保证研究结果具有一定可靠性的条件下,确定最少的样本例数 12.Balance:均衡原则,实验组和对照组或各实验组之间,除了处理因素以外,其他条件应尽可能相同 12.Randomized block design:随机区组设计,是将几个条件基本相同的受试对象划成一个区组,再将区组中的受试对象采用随机的方法,分配到不同的处理组中,以增强各处理组间的均衡性 《医学统计学》复习资料 第第 2 页,共页,共 42 页页 二二、、是非是非题题((题中标红之处为错误题中标红之处为错误所在所在)) 1.概率介于 0~1 之间的事件称为随机事件。
( ) 1.如果对全部研究对象都进行了调查或测定就没有抽样误差 ( ) 1.等级资料是把观察单位按某种属性(性质)或类别进行分组,清点各组观察单位数所得资料 ( ) 1.统计资料各有其特征和处理方法,因此不能相互转化 ( ) 2.分布末端无确定数据的资料,宜选用中位数来描述其平均水平 ( ) 2.用 P5制定单侧 95%的参考值时,其参考值范围应是(P5,∞) ( ) 2.95%与 99%的参考值范围相比,前者漏诊率大,后者误诊率大 ( ) 2.参考值范围可用来判断某个体值是否正常 ( ) 2.当资料呈正态分布时,均数和中位数相等,且位于分布的中心 ( ) 2.只要单位相同,用标准差(s)和用变异系数(CV)来比较两组变量值的离散度,结论是完全一样的 ( ) 2.四分位数间距反映了中间 50%数据的离散程度,但易受两端极小值、极大值的影响 ( ) 3.一般把发病率高的疾病称为常见病。
( ) 3.标准化法只适用于内部构成不同影响到总率比较的情况 ( ) 3.标准化后的标准化率,既可以反映当时当地的实际水平,又能表示两组相互比较的资料间的相对水平 ( ) 5.可信区间用来判断某个体值是否正常 ( ) 5.置信区间也可以用来判断某个个体值是否正常 ( ) 5.对于同一资料,95%医学参考值范围的宽度小于总体均数 95%可信区间的宽度 ( ) 5.xstx05. 0可用于估计 95%的个体的某个指标所在的范围 ( ) 5.xstx,05. 0的意义为 100 个总体均数中有 95 个落在此范围 ( ) 5.假设检验的目的是排除抽样误差对结果的影响 ( ) 5.t 检验可用于同一批对象的身高和体重均数差异的比较 ( ) 5.两样本均数差别作假设检验,无效假设成立与不成立时所犯 II 类错误的概率相等。
( ) 5.t 检验中,拒绝 H0时,P 值越小,说明两总体均数差异越大 ( ) 5.作两样本均数差别的比较,当 P<0.01 时,统计上认为两总体均数不同,此时推断错误的可能性小于 0.01 ( ) 5.同一资料作单侧和双侧检验,单侧更易得到差别的结论,所以应选用双侧检验 ( ) 5.配对资料也可以用成组 t 检验处理,但这样做降低了统计效率 ( ) 5.完全随机设计资料不能用配对 t 检验进行统计处理以提高统计效率 () 5.两独立样本比较时不服从正态分布可选用近似 t' 检验 ( ) 5.完全随机设计两样本均数比较,方差不齐时既可以选择近似 t' 检验,也可以选择秩和检验 ( ) 5.两次 t 检验都是对两样本均数的差别作统计检验,一次 P<0.01,另一次P<0.05,就表明前者两样本均数差别大,后者两样本均数相差小。
( ) 5.不管是样本资料或总体资料,当对总体下结论时都应进行假设检验 () 6.完全随机设计方差分析中,若 P<0.05,则可认为总体均数两两之间都 不相同 ( ) 6.进行 3 个均数差别的方差分析,当 P<0.05 时,可认为各总体均数之间总的来说有差别,但不能说明彼此之间都有差别 ( ) 6.进行 3 个均数差别的方差分析,当 P<0.05 时,可认为各样本均数之间总的来说有差别,但不能说明彼此之间都有差别 ( ) 6.若单因素方差分析结果为 F>F0.05,ν,可认为各组均数不全相同 ( ) 6. 方差分析的基本思想是把全部观察值的总变异按设计和需要分解成两个或多个组成部分,再进行分析 ( ) 6.q 检验(SNK 检验)适用于事先有明确假设的证实性研究 () 6.随机区组方差分析中,只有当区组间差别的 F 检验结果 P>0.05 时,处理组间差别的 F 检验才是真正有意义的。
() 《医学统计学》复习资料 第第 3 页,共页,共 42 页页 6.完全随机设计资料不能用随机区组设计方差分析进行统计处理以提高统计效率 ( ) 6.随机区组设计的资料可用完全随机方差分析进行统计处理,但这样做就降低了统计效率 () 6.随机区组设计的资料可用完全随机方差分析进行统计处理以提高统计效率 () 6.随机区组设计资料不能分析交互作用 () 6.随机区组设计资料还能分析组间的交互作用 () 7.所有可能发生两分类结果的随机变量均服从二项分布 () 7.单位空间内发生任何稀有现象的次数均可视为 Poisson 分布 () 8.三行四列表做 χ2检验允许有一个 1<T<5。
() 8.四格表资料的校正 χ2检验,当 P 值在界值附近时特别有意义 () 8.对于单向有序行列表,在比较各处理组的效应有无差别时,用 χ2检验不是最好的方法 ( ) 8.χ2值表示的是各个格子实际数和理论数的符合程度 ( ) 8. 对于总合计数 n 为 200 的 5 个样本率比较的行×列表 χ2检验, 其自由度为 199 ( ) 8.对三个地区血型构成的抽样调查资料比较,若有一个理论数小于 5 大于1 且 n40,用校正 χ2检验 ( ) 8.对三个地区血型构成(A、B、O、AB 型) ,作抽样调查后比较,若有 3个理论数小于 5 大于 1 且 n>40,可用 χ2检验的校正公式 () 8.对三个地区血型构成的抽样调查资料比较,若有一个理论数小于 5 大于1 且 n>40,用校正 χ2检验,也可用确切概率法。
( ) 8.χ2检验可用于推断两个或两个以上样本率之间有无差别 ( ) 9.两组资料比较秩和检验,当采用 z 检验时,此时检验属于参数检验 ( ) 9.非参数检验又称任意分布检验,其意义是不涉及特定的总体分布,故其适用范围更广 ( ) 9.完全随机设计多个样本秩和检验两两比较时,需要对 α 进行调整 ( ) 9.能用 t 检验分析的计量资料用秩和检验,会降低统计效率 ( ) 9.无论什么资料,t 检验的检验效率均高于秩和检验 ( ) 9.无论什么资料,秩和检验的检验效率均低于 t 检验 ( ) 9.配对资料比较秩和检验,T 值在界值范围外外则 P 值大于相应概率 ( ) 9.两组资料比较秩和检验,T 值在界值范围内内则 P 值大于相应概率 ( ) 9.两组资料比较秩和检验,T 值在界值范围内内则 P 值小于相应概率 ( ) 9.配对秩和检验中把两组数据混合后统一编秩次 ( ) 9.成组设计两样本比较秩和检验中把两组数据混合后统一编秩次。
( ) 10.回归系数的符号与相关系数的符号是一致的 ( ) 10.rs=0.65,P>0.05,可认为两变量中度相关 ( ) 10.rs = 0.35,P<0.05,可认为两变量无相关关系 ( ) 10.r=0.85,P<0.05,可认为两变量无相关关系 ( ) 10.算得 r = 0.85,可认为两变量间相关较密切 ( ) 10.进行 r 的假设检验应首选单侧检验 ( ) 10.等级相关系数的大小不可以反映两个现象间关系的密切程度 ( ) 10.两变量关联性分析,假设检验 P 值越小,说明两变量关联性越强 ( ) 10.双变量正态分布资料,样本回归系数小于零,P>0.05,可认为两变量呈负相关 ( ) 10.回归分析中 b<0,经检验 P<0.01,则可认为能作相关分析的两变量呈负相关 ( ) 10.同一资料,回归系数的符号与相关系数的符号是一致的。
( ) 10.简单线性回归分析的自变量只能是二分类的资料 ( ) 《医学统计学》复习资料 第第 4 页,共页,共 42 页页 10.简单回归分析的前提条件之一是双变量服从正态分布 ( ) 10.直线回归分析只要求应变量 y 服从正态分布,而自变量 x 可以是正态分布的随机变量,也可以是人为控制大小的变量 ( ) 11.整群抽样研究中,群间差异越大越好 ( ) 11.分层抽样研究中,层间差异越大越好 ( ) 11.抽样研究中,允许误差越大,所需样本量越小 ( ) 12.实验研究中,随机化分组是实现组间均衡的重要手段 ( ) 12.实验研究中,进行随机化分组就能实现组间的均衡 ( ) 12.实验设计的三个基本要素是处理因素、混杂因素和危险因素 ( ) 12.β 越小,所需样本例数越多 ( ) 12.− −1越小,所需样本例数越多。
( ) 12.1–β 越大,两样本比较研究中所需样本例数越多 ( ) 12.进行样本量估计时,所定检验功效越大,所需样本量越大 ( ) 12.预试验的样本标准差 s 越小,所需样本含量 n 越小 ( ) 12.σ 或 s 越大,所需样本例数越多 ( ) 12.实验设计的特点之一就是研究者人为设置处理因素 ( ) 12.对照组在实验中也被看成是一种处理,而且是实验设计的一个重要内容 ( ) 三三、、单项单项选择选择题题((标红标红的的选项选项为为答案答案)) 1.一批病人的血球沉降率(%)是 A.计量资料 B.计数资料 C.等级资料 D.既可作计量也可作计数资料 E.还不能决定是计量资料还是计数资料 1.一批肺炎病人的住院天数是 。
A.计量资料 B.计数资料 C.等级资料 D.既可作计量也可作计数资料 E.还不能决定是计量资料还是计数资料 1.若以舒张压>90mmHg 为高血压,发现 1100 居民中有 180 名高血压患者和 920 名非高血压者,这是 A.计量资料 B.计数资料 C.等级资料 D.既可作计量也可作计数资料 E.还不能决定是计量资料还是计数资料 1.某项调查获得调查对象的职业是 A.计量资料 B.计数资料 C.等级资料 D.既可作计量也可作计数资料 E.还不能决定是计量资料还是计数资料 1.治疗结果分为有效和无效的资料,严格来说属于 A.计量资料 B.计数资料 C.等级资料 D.既可作计量也可作计数资料 E.还不能决定是计量资料还是计数资料 1.某医院用一种中草药治疗 9 名高血压病人,欲比较治疗前后有无差异,治疗前后的舒张压(mmHg)如下,这是 编 号 1 2 3 4 5 6 7 8 9 治疗前 115 110 129 110 116 109 109 102 104 治疗后 116 90 108 92 90 110 87 120 91 A.计量资料 B.计数资料 C.等级资料 D.既可作计量也可作计数资料 E.还不能决定是计量资料还是计数资料 《医学统计学》复习资料 第第 5 页,共页,共 42 页页 1.一批按贫血儿童轻度、中度、重度、极重度分类的资料是 。
A.计量资料 B.计数资料 C.等级资料 D.既可作计量也可作计数资料 E.还不能决定是计量资料还是计数资料 1.抽样误差的根源在于 ,在抽样研究中是不避免的 a.研究设计不合理 b.选择研究对象方法不当 c.个体变异 d.样本例数过少 e.观察或测量方法不一致 1.关于抽样误差的描述,正确的是 A.只要有个体变异就存在抽样误差 B.抽样误差是可避免的 C.抽样误差的大小是无法估计的 D.抽样误差大小与样本含量无关 E.抽样误差是样本统计量之间存在的变异 2.编制频数表,在确定组距时 A.常取最大值的 1/10 取整作组距 B.常取最小值的 1/10 取整作组距 C.常取极差的 1/10 取整作组距 D.取极差除以组数取整作组距 E.以上都不对 2.少数几个数据比大部分数据大几百倍,宜用 表示平均水平 A.算术均数 B.几何均数 C.中位数 D.标准差 E.四分位数间距 2.一组观察值,如果每个值都增加或减少一个不为 0 的常数,则______。
a.均数改变,几何均数不变 b.均数改变,中位数不变 c.均数、几何均数和中位数都改变 d.均数不变,几何均数和中位数改变 e.均数、几何均数和中位数都不变 2.两组资料的标准差相等,则______ a.它们的均数也相等 b.它们的均数必不等 c.它们的均数可能相等也可能不等 d.它们的均数互为倒数 e.它们的均数呈倍数关系 2.关于变异系数,下面说法正确的是 A.变异系数的单位与原始数据的单位相同 B.变异系数的单位与原始数据的单位不同 C.变异系数没有单位 D.变异系数是均数与标准差的相对比 E.变异系数是标准差与中位数的相对比 2.同质资料中, 小的那个样本均数更可靠 A.S B.CV C.XS D.X E.M 2.10 名男性新生儿的身长均数为 50.7cm,标准差为 2.2cm;10 名 6 岁男童的身高均数为 117.5cm,标准差为 3.4cm。
要对比男性新生儿身长与 6岁男童身高的变异程度,说法正确的是 A.6 岁男童身高的变异程度大于男性新生儿身长的变异程度 B.6 岁男童身高的变异程度等于男性新生儿身长的变异程度 C.6 岁男童身高的变异程度小于男性新生儿身长的变异程度 D.因单位相同,可直接利用两者的标准差进行比较 E.经验而言,身高的变异程度与年龄无关 2.测量某地 100 名健康工人的尿 ALA 含量,均数 7.06mg/L,标准差0.95mg/L,现一铅作业工人的尿 ALA 含量为 10.8mg/L,对其做出评价,所用范围是 a. 95. 006. 7)99(05. 0t b.095. 096. 18 .10 c.095. 096. 106. 7 d. 95. 096. 106. 7 e.095. 096. 18 .10 2.为调查某地成年男子 RBC 数,随机抽取 100 名成年男子,其均数为4.8× 1012/L,标准差为 0.42× 1012/L其中有 8 名男子的 RBC 数低于4.0× 1012/L则该地 95%成年男子 RBC 数落在的范围是 。
a. 4.8± 1.96× 0.42 b. 4.8± 1.96× 0.42/100 c.4.8± 1.645× 0.42 d.4.0± 1.96× 0.42/100 e. 4.8+1.645× 0.42/100 《医学统计学》复习资料 第第 6 页,共页,共 42 页页 2.某病人的某项指标高于高于正常人,但有部分重叠,为控制漏诊率漏诊率应当___ a.提高医学参考值范围上限值 b.降低医学参考值范围上限值 c.提高医学参考值范围下限值 d.降低医学参考值范围下限值 e.以上都不对 2. 某病人的某项指标高于高于正常人, 但有部分重叠, 为控制误误诊率诊率应当____ a.提高医学参考值范围上限值 b.降低医学参考值范围上限值 c.提高医学参考值范围下限值 d.降低医学参考值范围下限值 e.以上都不对 2. 某病人的某项指标低低于于正常人, 但有部分重叠, 为控制漏漏诊率诊率应当____ a.提高医学参考值范围上限值 b.降低医学参考值范围上限值 c.提高医学参考值范围下限值 d.降低医学参考值范围下限值 e.以上都不对 2. 某病人的某项指标低低于于正常人, 但有部分重叠, 为控制误误诊率诊率应当____。
a.提高医学参考值范围上限值 b.降低医学参考值范围上限值 c.提高医学参考值范围下限值 d.降低医学参考值范围下限值 e.以上都不对 2.制定参考值范围时,若要控制漏诊率应当考虑______ a. 提高单侧参考值上限值 b. 降低单侧参考值上限值 c. 降低单侧参考值下限值 d. 采用双侧参考值范围 e. 扩大双侧参考值范围 2.正态曲线下,从均数 μ 到 μ±1.96σ 的面积为________ A.45% B.90% C.95% D.47.5% E.99% 2.资料呈偏态分布,90%双侧参考值范围为________ A SX960. 1 B. SX645. 1 C. P2.5~P97.5 D. P5~P95 E. 0~P90 2.资料呈偏态分布,95%双侧参考值范围为 a. sx96. 1 b. sx64. 1 c. P2.5~P97.5 d. P5~P95 e. 0~P90 2.资料呈正态分布,则 95%单侧参考值范围上限为______。
a.SX960. 1 b.P95 c.SX645. 1+ d.P5 e.P2.5~P97.5 2.资料呈正态分布,则 95%双侧参考值范围为______ a.SX960. 1 b.P95 c.SX645. 1+ d.P5 e.P2.5~P97.5 2.通过 可将一般正态分布转换为标准正态分布 A.−x B.xx− C.−x D.xx− E.xsx− 3.一种新药可以控制某病,延长寿命,但不能治愈其病,如果某地采用该药则该地 a.该病发病率将增加 b.该病发病率将减少 c.该病患病率将增加 d.该病患病率将减少 e.以上都不对 3.关于直接标准化法,下面哪个说法是错误的______ a.可用不同年龄组的人口数为标准组 b.可用年龄别死亡率为标准组 c.可用不同年龄组的人口构成比为标准组 d.可直接得到标准化率 e.标化率的大小不代表实际水平 《医学统计学》复习资料 第第 7 页,共页,共 42 页页 3.SMR 是指______。
a.被标化组的实际死亡数与预期死亡数之比 b.标准化死亡率 c.被标化组的预期死亡数与实际死亡数之比 d.标化后待比较两组的预期死亡数之比 e.标化后待比较两组的实际死亡数之比 3.患病率不可能 A.>100% B.<100% C.=100% D.=0% E.>0% 3.抽样调查某地 5~15 岁儿童肺炎的发病率,现求得男女童肺炎发病率分别为 21.2%和 19.1%,可认为 A.男童的肺炎发病率高于女童 B.调查有误 C.资料不具可比性 D.应进行假设检验后再下结论 E.以上都不对 3.一个地区某病死亡顺位提前则说明 A.该病死亡数增多 B.该病死亡率增高 C.该病死因构成比增大 D.该病患病率增高 E.以上都不对 5.测得某地 400 名正常成年男性空腹血糖的样本均数为 4.5mmol/L,标准差为 0.8mmol/L,该样本均数的抽样误差为 A.5 . 48 . 0 B.4008 . 0 C.4008 . 0 D.400.54 E.400.54 5.在可信度确定的情况下,增加样本含量,可信区间的宽度 。
A.增大 B.减小 C.不变 D.随机变化 E.不能确定 5.同一资料,相同的可信度下可信区间与医学参考值范围相比 A.前者范围更宽 B.后者范围更宽 C.二者范围一样 D.无法确定 E.以上都不对 5.比较两药疗效时,若 ,可作单侧检验 A.已知 A 药与 B 药均有效 B.不知 A 药好还是 B 药好 C.不知 A 药和 B 药是否有效 D.已知 A 药与 B 药差不多好 E.已知 A 药不会优于 B 药 5.抽样研究男性和女性的下列指标差别,若_______时应做双侧检验 A.已知女性的平均肺活量比男性小 B.已知女性的平均白细胞数比男性小 C.不知男女性血小板平均数是否相同 D.已知女性的血红蛋白不比男性高 E.以上都不对 5.t 检验的适用条件是 a.计量资料 b.资料服从正态分布 c.两总体方差相等 d.以上都对 e.以上都不对 5. 配对 t 检验中用药前数据减去用药后数据和用药后数据减去用药前数据,两次 t 检验 。
A.t 值符号相反,结论相反 B.t 值符号相同,结论相同 C.t 值符号相反,但结论相同 D.t 值符号与结论无关 E.以上都不对 5.由 20 对(40 个)数据组成的资料做配对 t 检验,其自由度为 A.20 B.40 C.38 D.39 E.19 5.对服从对数正态分布的资料,要进行两样本的比较, a.可直接用 t 检验 b.只能用其他检验方法 c.可用 t' 检验 d.将数据取对数后,再做 t 检验 e.用 z 检验 《医学统计学》复习资料 第第 8 页,共页,共 42 页页 5.两组完全随机设计的计量资料,分布正态但方差不齐,最佳的统计方法为 a. 成组 t 检验 b. t' 检验 c. χ2检验 d. 配对 t 检验 e. 秩和检验 5.两样本均数比较的 t 检验,差异有统计学意义时,t 值越大,则 a. 两样本均数差异越大 b.两总体均数差异越大 c. 越有理由认为两总体均数不同 d.越有理由认为两样本均数不同 e. 不能下结论 5.两样本均数比较的 t 检验,差异有统计学意义时,P 值越小,则 。
a. 两样本均数差异越大 b.两总体均数差异越大 c. 越有理由认为两总体均数不同 d.越有理由认为两样本均数不同 e. 以上都不对 5.t 检验中,t>t0.05,v,P<0.05,拒绝检验假设,其依据是 A.原假设本身是人为的,应该拒绝 B.原假设成立的可能性很小 C.原假设成立是完全荒谬的 D.计算结果证明原假设是错误的 E.原假设不可能成立 5.在比较两组资料的均数时,需要进行 t ' 检验的情况是 A.两总体均数不等 B.两总体均数相等 C.两总体方差不等 D.两总体方差相等 E.以上都不是 5.在完全随机设计两样本均数比较 t 检验中,其检验假设 H0是 a.21xx = b.21= c.21PP = d.21= e.以上都不对 5.对同一样本,分别取以下检验水准,第二类错误最小的是 a. 01. 0= b. 05. 0= c. 10. 0= d. 20. 0= e. 30. 0= 5.提高均数比较 t 检验的功效最直接的做法是 。
a. 增加样本含量 b. 减小总体方差 c. 扩大总体均数间的差别 d. 减小第一类错误 e. 增大第一类错误 6.随机区组设计资料的方差分析将总变异分为 a.组间变异、组内变异两部分 b.处理、区组、误差三部分 c.抽样、系统、随机测量三部分 d.标准差、标准误两部分 e.以上说法都不对 6.方差分析中,当 F>F0.05(v),P<0.05 时,结果______ a. 可认为各样本均数都不相等 b. 证明各总体均数不等或不全相等 c. 可认为各总体均数都不相等 d. 可认为各总体均数不等或不全相等 e. 证明各总体均数都不全相等 6.多组样本均数的两两比较中,若不用 q 检验而用 t 检验,则 A.提高检验效能 B.提高可信度 C.结果更合理 D.增大第一类错误概率 E.增大第二类错误概率 7.二项分布在以下条件时是对称的______ a. 当总体率π=0.5 时 b. 当总体率π>0.5 时 c. 当总体率π<0.5 时 d. 当总体率π接近于 0.1 或 0.9 时 e. π为任意值 8.χ2检验中,如果实际频数和理论频数的差异越大,则 。
A.H0成立的可能性越大 B.H0成立的可能性越小 C.H1成立的可能性越小 D.P 值越大 E.犯第二类错误的可能性越大 《医学统计学》复习资料 第第 9 页,共页,共 42 页页 8.作两样本率的 χ2检验,当差别有统计意义时,χ2值越大则______ a. 两样本率差异越大 b. 两总体率差异越大 c. 越有理由说两总体率不同 d. 越有理由说两样本率不同 e. 不能下结论 8.在完全随机设计两样本率的假设检验中,其检验假设 H0是 a.21xx = b.21= c.21PP = d.21= e.以上都不对 8.作两样本比较的 χ2检验,当差别有统计意义时,χ2值越大则 A. 两总体率差异越大 B. 越有理由说两样本率不同 C. 两样本率差异越大 D. 越有理由说两总体率不同 E.以上都不对 8.χ2检验不适用不适用于 A.两个样本率的比较 B.两个样本均数的比较 C.拟合优度检验 D.多个样本率的比较 E.两个构成比的比较 8.四格表中的一个实际数字为 1,______。
a.就不能作 χ2检验 b.就必须用校正 χ2检验 c.还不能决定是否可作 χ2检验 d.作 χ2检验不必校正 e.不能确定是否需要校正 8.四个样本百分率比较时,有 1 个理论频数小于 5 大于 1 时 a.必须先做合理的并组 b.直接做 χ2检验 c.不能做 χ2检验 d.必须做校正 χ2检验 e.不能确定是否需要校正 8.行×列表资料当有 1/5 以上格子的理论数 T 小于 5 时,不能采取的方法是 a. 仍然做 χ2检验 b. 合并行 c. 删除行或列 d. 增加样本含量 e. 合并列 8.配对计数资料的相关性分析中,b + c<40 时, 应采用 a.精确概率法 b.校正 χ2检验 c.不校正 χ2检验 d.增加 n 后再做检验 e.尚不能决定采用何法 8.配对计数资料的相关性分析中,b+c>40 时,应采用_______。
a.确切概率法 b.四格表 χ2检验的校正公式 c.四格表 χ2检验的专用公式 d.增大样本含量再作检验 e.尚不能决定采用何法 8.某医生采用甲乙两种方法测定 60 例恶性肿瘤患者体内 ck20 基因表达阳性的情况,甲法测定 42 例阳性,乙法测定有 23 例阳性,两法测定均阳性者 16 例,两法测定均为阴性的例数是 a.37 b.26 c.11 d.18 e.7 8.用触诊和 X 摄片对 100 名妇女作乳癌检查,触诊有 40 名阳性,X 摄片有 70 名阴性,两种方法均阳性者 10 名,两种方法检查均为阴性的人数是 a. 20 b. 30 c. 50 d. 40 e. 60 8.四格表资料能用确切概率法的是 a. T>5 b. n>40 c. T<1 或 n<40 d. 1<T<5 e. 以上都可以 8.下表资料,若要比较两组之间治愈率是否相同,可用的方法是 。
组 别 治疗例数 治愈例数 试验组 400 40 对照组 4 1 a. 四格表直接计算概率 d. 四格表 χ2检验 c. 四格表校正 χ2检验 d. 无法做检验 e. z 检验 《医学统计学》复习资料 第第 10 页,共页,共 42 页页 9.配对计量资料,差值分布不接近正态分布,最宜用________ a.配对 t 检验 b.F 检验 c.χ2检验 d.符号秩和检验 e.t’检验 9. 完全随机设计的多组计量资料 (数据波动较大) 比较时, 一般首选_____ a.配对 t 检验 b.成组 t 检验 c.方差分析 d.配对秩和检验 e.多个样本比较的秩和检验 9.两样本秩和检验中,n1=10,T1=150,n2=12,T2=103,查 T 界值表得T0.05=84~146,则 P 值为_________ a.P>0.05 b.P<0.05 c.P=0.05 d.P≤0.05 e.P≥0.05 9.两样本秩和检验中,n1=12,T1=105,n2=10,T2=148,查 T 界值表得 T0.05=84~146,则 P 值为_________。
a.P>0.05 b.P<0.05 c.P=0.05 d.P≤0.05 e.P≥0.05 9.两样本秩和检验中,n1=10,T1=135,n2=12,T2=118,查 T 界值表得 T0.05=84~146,则 P 值为 A. P>0.05 B. P<0.05 C. P=0.05 D. P≤0.05 E. P≥0.05 9.满足 t 检验条件的资料如果采用秩和检验,不拒绝 H0时 a. 增加 I 类错误 b. 减少 I 类错误 c. 减少 II 类错误 d. 增加 II 类错误 e. 两类错误都增加 10.若 r=0.2,P>0.05,则______ a. 证明两变量无相关 b. 可认为两变量有相关关系 c. 可认为两变量无任何关系 d. 尚不能认为两变量有相关关系 e. 可认为两变量关系不密切 10.两组资料中,回归系数 b 大的那组资料______。
a. 相关系数 r 也较大 b. 相关系数 r 较小 c. 两变量相关较密切 d. 相关系数可能大也可能小 e. 有相关关系 10.某资料算得 b=3.25,做 t 检验得 P<0.05,说明两变量是_______ a. 正相关 b. 可能是正相关也可能是负相关 c. 无相关 d. 负相关 e. 还不能判断是否能做相关分析 10.用最小二乘法确定直线回归方程的原则是各观察点 a. 距直线的纵向距离相等 b. 距直线的纵向距离的平方和最小 c. 距直线的垂直距离相等 d. 距直线的垂直距离的平方和最小 e. 距直线的纵向距离的平方和最大 10.以下两变量的关系中,可以用 Pearson 线性相关系数描述的是 a. 母亲受教育程度和家庭规模 b. 饮水质量与腹泻与否 c. 疾病的严重程度与治愈与否 d. 吸烟与否与肺癌 e. 从饮食摄入铁与血红蛋白水平 10. 以下两变量的关系中, 可以用 Spearman 等级相关系数描述的是 。
a. 母亲受教育程度和家庭规模 b. 饮水质量与腹泻与否 c. 疾病的严重程度与治愈与否 d. 吸烟与否与肺癌 e. 从饮食摄入铁与血红蛋白水平 10.下列资料中,可以用 Pearson 相关系数描述相关性的是 a. 药物剂量和治疗效果 b. 饮水质量与腹泻发生 c. 汽车拥有量与交通事故发生 d. 吸烟与否与肺癌 e. 农民的平均家庭收入与平均医疗保健费用支出 10.据下表资料分析年龄与发病率是否有关,可用的统计方法为 年龄组(岁) 0~ 10~ 20~ 30~ 40~ 50~ 60~ 70~ 发病率(%) 10.0 8.57 8.18 9.00 8.00 7.14 a. χ2检验 b. 秩和检验 c. 直线相关分析 d. 等级相关分析 e. t 检验 《医学统计学》复习资料 第第 11 页,共页,共 42 页页 10.一对变量 x1与 y1算得 r1=0.6395,10.01,1rr,另一对变量 x2与 y2算得r2= -0.7218,220.05,20.01,rrr,则 。
a. x1与 y1的关系更密切 b. x2与 y2的关系更密切 c.两对变量相关的密切程度相同 d.还看不出哪一对变量的关系更密切 e.以上都不对 11. 按调查对象涉及的范围,调查方法分为______ a. 普查、抽样调查、病例对照调查 b. 全面调查、典型调查、队列调查 c. 非全面调查、抽样调查、案例调查 d. 普查、抽样调查、典型调查 e. 普查、抽样调查、队列调查 11.以下对概率抽样描述错误的是______ a.概率抽样保证了所抽取样本的代表性 b.实际抽样时可选择一种或几种基本的概率抽样方法 c.相比之下,分层抽样的抽样误差较小 d.概率抽样需要的样本含量较大 e.只有有限总体才能进行概率抽样 11.抽签的方法属于 A.分层抽样 B.系统抽样 C.整群抽样 D.单纯随机抽样 E.多阶段抽样 11.其他条件相同的情况下,抽样误差最大的是 a. 单纯随机抽样 b. 分层随机抽样 c. 整群抽样 d. 系统抽样 e. 无法确定 12.双盲法的主要目的是 。
A.避免抽样误差 B.节省试验开支 C.减小 I 类错误 D.减小 II 类错误 E.避免人为主观因素的影响 12.某医师采用缬沙坦分散片治疗高血压,选用治疗前后血压值作为疗效观察指标,这属于 A.实验对照 B.自身对照 C.相互对照 D.标准对照 E.安慰剂对照 12.为研究中药慢支灵治疗慢性支气管炎疗效,在某医院选择 100 例急性咽炎病人,随机分成试验组和对照组,试验组用慢支灵治疗,对照组用公认有效的复方岩白菜片这种对照在实验设计中称为 A.实验对照 B.自身对照 C.相互对照 D.标准对照 E.安慰剂对照 12.某医师观察中药雾化吸入剂治疗支气管哮喘的疗效,实验组采用中药雾化吸入剂治疗,对照组采用水液雾化剂治疗,这属于 A.实验对照 B.相互对照 C.标准对照 D.安慰剂对照 E.自身对照 12.某医生研究中药止痛袋对原发性痛经的作用,将 100 例原发性痛经患者分为两组,一组是止痛带组,即将中药袋放入加热袋中,围扣小腹通电加热 5~10 分钟;一组是空白电热组,即加热袋中不放任何药物,围扣小腹通电加热 5~10 分钟, 这属于 A.实验对照 B.自身对照 C.相互对照 D.标准对照 E.安慰剂对照 12.若目的是观察新药治疗时是否存在自然痊愈的问题,应设置 。
A.安慰剂对照 B.相互对照 C.标准对照 D.实验对照 E.自身对照 12.实验组与对照组除了 外,其他条件应尽可能相同 A.系统误差 B.年龄人口构成 C.处理因素 D.个体因素 E.抽样误差 《医学统计学》复习资料 第第 12 页,共页,共 42 页页 四四、、应用应用分析分析题题(按题型(按题型和章节和章节排列)排列) 【计算题】 5.某地检查健康男性工人 225 人的血液红细胞,得均数为 470 万/mm3 ,标准差为 30 万/mm3写出公式,代入数据解释,不必计算) (1) 推测该地健康工人的血液红细胞数平均含量 (2) 现有一男性工人的红细胞数为 420 万/mm3 , 问该男性工人的红细胞数是否正常? 答:(1) n=225,为大样本,可用正态近似法估计总体均数的 95%可信区间 xsx96. 1 = 470 ± 1.96×22530 该地健康工人红细胞数平均含量 95%可信区间为 470 ± 1.96×22530万/mm3。
(2) 红细胞数资料服从正态分布,可用正态分布法计算因红细胞数过多或过少均属异常,应计算双侧 95%参考值范围: sx96. 1= 470± 1.96× 30 若该男性工人的红细胞数包含该参考值范围内,则属于正常;若不包含在该参考值范围内,可认为其红细胞数偏高或偏低 5.随机抽取某地 400 名 3 岁女童,测量并算得其平均头围为 48.5cm,标准差为 2.1cm 问:问:(1) 推测该地 3 岁女童的平均头围 (2) 现有一名 3 岁女童的头围为 44.9cm,是否正常? (写出公式,代入数据并解释,不必计算) 答:(1) n=400,为大样本资料,可用正态近似法估计总体均数的 95%可信区间:4001 . 296. 15 .4896. 1=xsx 该地 3 岁女童平均头围的 95%可信区间为4001 . 296. 15 .48(cm) (2) 因头围服从正态分布, 且过大或过小均属异常, 应计算双侧 95%参考值范围:1 . 296. 15 .4896. 1=sx 若该名 3 岁女童的头围包含在该参考值范围内,可认为正常(1 分) ;若未包含在该参考值范围内,可认为其头围偏大或偏小(1 分) 。
5.测定某地 400 名正常男性新生儿的血清胆固醇含量,均数为 72.5 毫克/100ML,标准差 22.0 毫克/100ML (1) 现一男性新生儿的血清胆固醇含量为60.2毫克/100ML, 请给予评价写出公式,代入数据,不必计算结果) (2) 测得该地 360 名女性正常新生儿的血清胆固醇含量均数为 90.2 毫克/100ML,标准差 25.0 毫克/100ML问该地男女新生儿的血清胆固醇含量是否不同? 答:(1) 血清胆固醇含量资料服从正态分布,可用正态分布法计算因红细胞数过多或过少均属异常,应计算双侧 95%参考值范围: sx96. 1= 72.5± 1.96× 22 该地 95%的男性工人红细胞数范围为 470± 1.96× 30 万/mm3 若该男性新生儿的血清胆固醇含量包含该参考值范围内,则属于正常;若不包含在该参考值范围内,可认为其红细胞数偏高或偏低 (2) 该资料为成组设计的计量资料,宜采用成组 t 检验 1) 建立检验假设,确定检验水准 H0:该地男女新生儿的血清胆固醇含量相同 H1:该地男女新生儿的血清胆固醇含量不同 α=0.05 2) 计算检验统计量 t 值(略) 3) 确定 P 值,做出统计推断 若 P>0.05,不拒绝 H0,差异无统计学意义,尚不能认为该地男女新生儿的血清胆固醇含量不同。
若 P≤0.05,拒绝 H0,接受 H1,差异有统计学意义,可认为该地男女新生儿的血清胆固醇含量不同 《医学统计学》复习资料 第第 13 页,共页,共 42 页页 10.某医师调查某药的摄入量(x,mg%)与该药的代谢产物排泄量(y,mg%) 的关系, 结果如下: n =18, 摄入量范围 0.3~10mg%,x=3.0mg%,y=6.0mg%,r =0.6,b =1,Sb=0.33mg% (r 界值表:r0.05,15=0.482,r0.05,16=0.468,r0.05,17=0.456,r0.05,18=0.444) (1) 能否用回归方程描述两者的关系?为什么?如能,请写出方程 (2) 今测得某人该药摄入量为 8mg%,其代谢物排出量平均是多少? (3) 又测量另一个该药摄入量为 12mg%,其代谢物排出量又是多少? 答:(1) 能 ①相关系数的假设检验:H0:两变量间无直线相关关系 H1:两变量间有直线相关关系 α=0.05 已知 r = 0.6,v = 18-2 = 16,现 r(0.6)>r 0.05,16(0.468),P<0.05,有统计学意义,可认为该药摄入量和代谢物排泄量间有直线相关关系。
因为相关系数的假设检验与回归系数的假设检验等价, 既然r的假设检验P<0.05,也可认为两变量有直线关系,可以用回归方程描述两变量间的关系 ②截距:3316=−=−=xbya ③回归方程:xbxay+=+=3ˆ (2) 将 x = 8mg%代入方程,得代谢物排泄量估计值为 11 mg% (3) 因摄入量范围 0.3~10mg%,12mg%超出此范围,不宜用该回归方程估计代谢物排泄量 10.某医师调查某药的摄入量(x,mg%)与该药的代谢产物排泄量(y,mg%) 的关系, 结果如下: n=18, 摄入量范围 0.3~10mg%,x=5.0mg%,y=6.0mg%,r =0.6,b =1,Sb=0.33mg% (t 界值表:t0.05,16=2.120,t0.05,17=2.110) (1) 能否用回归方程描述两者的关系?为什么?如能,请写出方程 (2) 今测得某人该药摄入量为 8mg%,其代谢物排出量平均是多少? (3) 又测量另一人该药摄入量为 12mg%,其代谢物排出量又是多少? 答:(1) 能 ①直线回归方程假设检验:H0:两变量间无直线关系 H1:两变量间有直线关系 α=0.05 已知 b =1,Sb=0.33,则16218030. 333. 01=−===bbsbt tb(3.030)>t0.05,16(2.120),P<0.05,有统计学意义,可认为该药摄入量和代谢物排泄量间有直线关系。
②截距:1516=−=−=xbya ③回归方程:xbxay+=+=1ˆ (2) 将 x = 8mg% 代 入 方 程 , 得 代 谢 物 排 泄 量 的 估 计 值 为981ˆ=+=y(mg%) (3) 因摄入量范围 0.3~10mg%,12mg%超出此范围,不宜用该回归方程估计代谢物排泄量 《医学统计学》复习资料 第第 14 页,共页,共 42 页页 【反例题】 5. 某医师用流脑提纯菌苗免疫 10 名儿童, 免疫前后抗体滴度的倒数见表: 编 号 1 2 3 4 5 6 7 8 9 10 接种前 2 1 4 4 8 8 2 32 16 4 接种后 4 32 64 128 128 256 32 64 128 64 该医师采用两独立样本 t 检验,因方差不齐(F=12.981,P=0.002) ,改用校正 t 检验,得 t’=-3.515,P=0.006,故认为接种前后抗体滴度不同,接种后滴度升高 问:问:(1) 这是什么资料? (2) 该研究属于何种设计方案? (3) 统计处理是否正确?为什么? 答:(1) 计量资料 (2) 配对设计 (3) 不正确。
首先,该资料为自身配对资料,用两独立样本 t 检验处理不妥;其次,抗体滴度的倒数为呈倍数增长的资料,通常为对数正态分布,不能直接用 t 检验,而应该先取对数后,再进行配对 t 检验 5.某医师就下表资料,对比用胎盘浸液钩端螺旋体菌苗对 238 名农民接种前、后(接种后两月)血清抗体的变化,结果如下: 抗体滴度的倒数 0 20 40 80 160 320 640 1280 S 免疫前人数 211 27 19 24 25 19 3 0 76.1 111.7 免疫后人数 2 16 57 76 75 54 25 23 411.9 470.5 该医师用成组 t 检验,t=77,P<0.01,可认为接种后血清抗体有增长请从统计学的角度进行评价 答:该医师统计方法错误首先,该资料为自身对照的配对资料,用两独立样本 t 检验处理不妥,其次,抗体滴度的倒数为呈倍数增长的资料,通常为对数正态分布,不能直接用 t 检验 正确做法:先取对数后再进行配对 t 检验 5.某年某地区疾病预防控制中心评价该地区学龄前儿童白喉的抗体效价,随机抽取了 32 名幼儿园儿童,测定结果如表经完全随机设计两样本均数比较的 t 检验,t =1.364,P>0.05,差异无统计学意义。
某年某县 32 名学龄前儿童白喉的抗体效价测定结果 组别 白喉抗体效价(倒数) 男生 320 20 320 640 80 320 160 40 320 80 160 40 80 320 20 40 女生 20 20 160 40 40 160 40 20 160 40 160 40 40 40 640 80 问:问:(1) 该研究属于何种设计方案? (2) 统计方法是否正确?为什么? 答:(1) 完全随机设计 (2) 不正确由于抗体效价值是等比资料,服从对数正态分布,各组的平均效价应用几何均数(G)描述,其假设检验不能直接用完全随机设计两样本均数比较的 t 检验 (3) 正确做法:应将观察值进行对数变换后再用 t 检验 5.某研究者利用儿童的心理行为发育量表(SDQ)对学龄前后(间隔一年)不同性别的 108 名儿童的行为进行测定,得出情绪、行为、注意力和社会关系四个维度的评分,结果如表该医师分别对男女生学龄前后结果进行完全随机设计两样本均数比较的 t 检验,除女性情绪和品行维度无差别外,其他维度评分的差异均有统计学意义(P<0.05) ;男女生学龄后结果进行完全随机设计两样本均数比较的 t 检验,差异均无统计学意义(P>0.05) 。
由此得出结论为上学事件对儿童的行为有影响,而且儿童的行为变化与性别无关 不同性别儿童学龄前后行为维度评分情况(sx ) 性 别 时间 情绪 品行 注意力 潜在社会关系 男性(n=60) 治疗前 2.2±1.5 1.9±1.6 4.7±1.5 7.1±1.9 治疗后 1.5±1.5 1.3±1.2 3.7±1.6 6.5±1.8 女性(n=48) 治疗前 1.9±1.6 1.5±1.4 4.6±1.6 7.6±1.7 治疗后 1.8±1.5 1.5±1.5 4.1±1.6 6.0±1.8 《医学统计学》复习资料 第第 15 页,共页,共 42 页页 问:(1) 该研究包括哪些设计方案? (2) 该医师的统计处理是否正确?为什么? 答:(1) 配对设计和完全随机设计 (2) 不正确 首先,男童和女童学龄前后比较属配对设计,应行配对 t 检验分别说明上学事件对儿童的行为是否有影响,而作者误用了完全随机设计两样均数比较的 t 检验 其次,要比较上学事件对不同性别儿童的行为影响时,应分别计算出两组学龄前后各行为维度的差值,形成两个新的样本(属完全随机设计) ,再进行完全随机设计两样本均数比较的 t 检验。
而作者误将两组治疗后结果直接进行了两独立样本 t 检验 6.某研究者随机抽取了某单位不同年龄组的男性受试者各 16 名,测量其身高和体重, 按照 “体重指数 (BMI) =体重(kg)/[身高(m)]2” 计算了 BMI,结果如表该研究者采用完全随机设计两样本均数比较的 t 检验进行 3次比较,得出结论:除 30~岁组与 45~岁组的差异无统计学意义外(P>0.05) ,其他两两之间的差异均有统计学意义(P<0.05) 某单位不同年龄组男性受试者的体重指数 年龄(岁) BMI(kg/m2) 18~ 21.65 20.66 25.32 26.02 22.14 18.23 27.43 22.26 22.91 21.30 21.36 20.13 19.57 18.19 27.09 18.82 30~ 27.15 28.58 23.44 27.03 27.32 25.72 29.71 30.48 21.31 25.97 28.02 23.76 24.50 20.50 27.59 23.93 45~60 20.28 22.88 24.45 22.58 25.26 27.18 29.42 24.76 26.59 29.83 24.62 22.41 26.37 29.14 25.56 26.49 问:(1) 该研究属于何种设计方案? (2) 统计方法是否正确?为什么? 答:(1) 完全随机设计(成组设计) 。
(2) 不正确因为 t 检验适用于完全随机设计的两组计量资料的比较,不适用于多组计量资料的比较 (3) 正确做法:单因素方差分析 8.某新技术测试 8 例卵巢内胚窦瘤患者,5 例呈阳性反应,同时测试 25例卵巢颗粒细胞瘤患者,6 例阳性经 χ2检验得 χ2=4.042,P<0.05,认为该新技术测试前组的阳性率高于后组你认为是否正确,为什么? 答:(1) 不正确 (2) 总例数 n=(8+25)=33<40,不能用 χ2检验 (3) 正确做法:四格表确切概率法 8.为评价某种国产抗菌新药的疗效,某医师抽取患有急性肺炎且符合入选条件的 36 例患者,随机分为两组,每组 18 人试验组服用该新药,对照组服用同类公认有效的进口药,临床观察结果见表 1经四格表 χ2检验,得 χ2=3.750,P>0.05,差异无统计学意义 表 1 两组患者用药后有效率比较 分组 例数 有效 有效率(%) 国产抗菌新药 18 11 61.1 同类进口药 18 14 77.8 问:问:(1) 这是什么资料? (2) 该研究属于何种设计方案? (3) 统计处理是否正确?为什么? 答:(1) 计数资料 (2) 完全随机设计。
(3) 不正确因为 n=36 小于 40,不能采用四格表 χ2检验,应该采用四格表确切概率法 《医学统计学》复习资料 第第 16 页,共页,共 42 页页 8.某医师用 A 药治疗急性上呼吸道感染患者 15 例,有效 13 例;用 B 药治疗同类患者 15 例, 有效 8 例 经四格表 χ2检验, 得 χ2=3.968, P =0.046,认为 A 药的疗效优于 B 药 表 2 两种药物治疗急性上呼吸道感染的疗效比较 组别 有效 无效 合计 有效率(%) A 药 13 2 15 86.7 B 药 8 7 15 53.3 合计 21 9 30 70.0 问:问:(1) 这是什么资料? (2) 该研究属于何种设计方案? (3) 统计处理是否正确?为什么? 答:(1) 计数资料 (2) 完全随机设计 (3) 不正确因为 n=30 小于 40,不能采用四格表 χ2检验,应该采用四格表确切概率法 8.某医师对 96 例足月孕妇采用某新药引产,其产后出血发生率为 2.1%(2例) , 低于用原药引产的 19 例产后出血发生率 15.8% (3 例) 因 χ2=7.164,P<0.001,故认为采用新药引产是更安全的措施。
请给予评价 答:(1) 该结论不正确 (2) 列表 组别 出血 未出血 合计 新药 2 94 96 原药 3 16 19 合计 5 110 115 经计算可知,虽然患者总例数 n=115>40,但最小理论频数183. 0115519(min)(min)min===nnnTCR,不能采用 χ2检验 (3) 正确做法:四格表确切概率法 8.某医生采用甲乙两种方法测定 60 例恶性肿瘤患者体内 ck20基因表达阳性率,甲法测定阳性率为 70.0%,乙法测定阳性率为 38.3%,两种方法一致测定阳性率为 26.7%为比较甲乙两种方法的测定阳性率是否有差异,该医生首先将资料整理为下表,然后采用完全随机设计四格表资料的 χ2检验进行假设检验,得 χ2=12.118,P<0.005,差异有统计学意义,故认为甲乙两种方法的测定结果有差别,甲法测定阳性率较高 表 2 两种方法测定结果比较 测定方法 阳性数 阴性数 合 计 阳性率(%) 甲 法 42 18 60 70.0 乙 法 23 37 60 38.3 合 计 65 55 120 54.2 问:(1) 这是什么资料? (2) 该研究属于何种设计方案? (3) 统计分析方法是否正确?为什么? 答:(1) 计数资料。
(2) 自身配对设计方案 (3) 该医师用完全随机设计四格表资料的 χ2检验分析配对设计资料, 其统计表和统计方法均不正确 (4) 正确做法:配对 χ2检验(或 McNemar 检验) 《医学统计学》复习资料 第第 17 页,共页,共 42 页页 8.为比较紫外线瞬间消毒器与高压蒸汽消毒机对牙科消毒灭菌的效果,将刚使用过并清洗处理好的 30 个牙科随机分为紫外线组和高压蒸汽组消毒前细菌培养均为阳性,消毒后细菌培养结果见表 3 表 3 两种方法消毒后细菌培养结果 组 别 阳性 阴性 合 计 阳性率(%) 紫外线组 8 7 15 53.3 高压蒸汽组 1 14 15 6.7 合 计 9 21 30 30.0 注:最小理论数 Tmin = 4.50 问:问:(1) 这是什么资料? (2) 该研究属于何种设计方案? (3) 要比较紫外线组和高压蒸汽组消毒后细菌培养的阳性率, 应采用下列 3 种统计方法中的哪一种?简述选择该方法和不选其他两种方法的理由? ① 四格表 χ2检验:Pearson χ2=7.778,P=0.005,差异有统计学意义 ② 四格表校正 χ2检验:校正 χ2=5.714,P=0.017,差异有统计学意义。
③ 四格表确切概率法:P=0.014,差异有统计学意义 答:(1) 计数资料 (2) 完全随机设计 (3) 第三种方法(四格表确切概率法) 总例数 n=30<40,四格表 χ2检验和校正 χ2检验均不正确当 n<40 或 T<1 时,不宜计算 χ2值,应采用四格表确切概率法直接计算概率 9.某医院将 220 例非典患者随机分为西医组和中西医结合组,治疗结果如表两组疗效经 χ2检验,P<0.01,认为中西医结合组疗效好于西药组 组别 痊愈 好转 死亡 中西医结合组 110(90.16) 7(5.74) 5(4.10) 西医组 72(73.47) 12(12.24) 14(14.29) 问:(1) 这是什么资料? (2) 该研究属于何种设计方案? (3) 统计分析方法是否正确?为什么? 答:(1) 等级资料 (2) 完全随机设计方案 (3) 不正确欲比较两组的疗效是否有差别,其比较的结局变量(分析变量)是等级资料,用 χ2检验不妥,因为如果对其中的两列不同疗效的数值进行调换,χ2值不会有变化,但秩和检验统计量有变化 (4) 正确做法:秩和检验 《医学统计学》复习资料 第第 18 页,共页,共 42 页页 【判断假设检验方法题】 5.将 18 名某病患者随机分成两组,分别用甲、乙两药治疗,测定治疗前后血色素(%)的变化,测定结果如下表。
甲、乙两药治疗某病患者前后的血色素(%) 甲药 病人号 1 2 3 4 5 6 7 8 9 治疗前 36 45 55 55 65 60 42 45 25 治疗后 45 65 66 85 70 55 70 45 50 乙药 病人号 1 2 3 4 5 6 7 8 9 治疗前 55 50 65 60 70 40 45 35 30 治疗后 80 80 70 60 85 75 60 50 60 问:(1) 该研究包括哪些设计方案? (2) 要比较甲、乙两药的疗效有无差别,应如何统计分析? (3) 简述主要检验步骤(包括判断结果等,不必计算) 答:(1) 该研究的设计方案包括配对设计和完全随机设计 (2) 要比较甲、乙两药的疗效有无差别,应分别计算出两组药物治疗前后的差值(分别反映两种药物的效应) ,形成两个新的样本(属完全随机设计) ,再进行完全随机设计两样本均数比较的 t 检验 (3) 检验步骤 1) 建立检验假设,确定检验水准 H0:甲、乙两药的疗效相同 H1:甲、乙两药的疗效不同 α = 0.05 2) 计算检验统计量 t 值(略) 3) 确定 P 值,做出统计推断 如果 P>0.05,不拒绝 H0,差异无统计学意义,尚不能认为甲、乙两药的疗效不同。
如果 P≤0.05,拒绝 H0,接受 H1,差异有统计学意义,可认为甲、乙两药的疗效不同 5.某医院在治疗肝硬化疾病中采用介入法改善门脉高压,不同性别的患者治疗前后门脉 Vmin(cm/s)的水平如表 3 表 3 不同性别的患者治疗前后门脉 Vmin(cm/s)的水平 编 号 1 2 3 4 5 6 7 8 9 男性 治疗前 15.3 16.4 15.1 13.8 13.5 15.4 12.3 11.3 10.5 治疗后 9.9 10.3 11.5 11.2 10.9 9.6 5.3 7.8 8.8 编 号 1 2 3 4 5 6 7 8 9 女性 治疗前 13.5 14.5 15.9 12.3 9.6 15.2 13.6 8.9 10.7 治疗后 10.3 10.3 10.6 10.9 8.6 14.1 10.3 10.3 10.7 问:问:(1)该研究包括哪些设计方案? (2)要比较介入法对不同性别肝硬化患者的疗效,应采用何种统计方法? (3)请写出假设检验的基本步骤,不必计算结果 答:(1) 该研究的设计方案包括配对设计和完全随机设计 (2) 要比较介入法对不同性别肝硬化患者的疗效, 应分别计算出两组治疗前后的差值,形成两个新的样本,再进行完全随机设计两样本均数比较的 t 检验。
1) 建立检验假设,确定检验水准 H0:介入法对不同性别肝硬化患者的疗效相同 H1:介入法对不同性别肝硬化患者的疗效不同 α = 0.05 2) 计算检验统计量 t 值(略) 3) 确定 P 值,做出统计推断 如果 P>0.05,不拒绝 H0,差异无统计学意义,尚不能认为介入法对不同性别肝硬化患者的疗效不同; 如果 P≤0.05,拒绝 H0,接受 H1,差异有统计学意义,可认为介入法对不同性别肝硬化患者的疗效不同 《医学统计学》复习资料 第第 19 页,共页,共 42 页页 6.某医师随机检查四种职业成年男子的血红蛋白(g%)资料为: (1)A职业 25 人,平均血红蛋白为 9.58g%,标准差为 1.25g%; (2)B 职业30 人, 平均血红蛋白为 10.25g%, 标准差为 1.05g%; (3) C 职业 32 人,平均血红蛋白为 12.12%,标准差为 0.95g%; (4)D 职业 35 人,平均血红蛋白为 11.52g%,标准差为 0.89g% 问:(1)该资料属于何种设计? (2)四种职业成年男子的血红蛋白有无差异?(列出统计方法及基本步骤,不必计算结果) 答:该资料为多个独立样本的计量资料,宜用单因素方差分析。
(1) 建立检验假设,确定检验水准 H0:四种职业成年男性的血红蛋白总体均数相同 H1:四种职业成年男性的血红蛋白总体均数不同 α=0.05 (2) 计算检验统计量 F 值(略) (3) 确定 P 值,做出统计推断 若 P>0.05,不拒绝 H0,尚不能认为四种职业成年男性的血红蛋白总体均数不同 若 P≤0.05,拒绝 H0,接受 H1,可认为四种职业成年男性的血红蛋白总体均数不同采用 LSD-t 或 q 检验等进行两两比较 6.某农业研究所作赤霉病麦粗毒素对大鼠的毒性实验中,将窝别、性别、月龄等一致的健康大鼠配成一个组,每组有 5 只大鼠对同一组内的大鼠分别给予不同剂量(500ppm, 250ppm, 100ppm, 10ppm, 空白对照)的赤霉病麦粗毒素处理 3 个月,结果如下表,试比较不同剂量赤霉病麦粗毒素对大鼠的体重的影响 大鼠组别 赤霉病麦粗毒素剂量(ppm) 500 250 100 10 空白对照 1 61.0 167.0 194.5 199.3 200.2 2 120.3 155.2 101.8 135.1 168.2 3 96.0 111.8 134.5 150.7 188.5 4 122.9 135.5 156.4 177.8 185.8 5 105.5 143.2 158.5 189.5 200.3 6 99.8 133.5 158.2 187.2 198.2 指出可用的统计方法,列出基本步骤,不必计算结果。
答:该资料为随机区组设计的计量资料,宜采用随机区组设计的方差分析 (1) 建立检验假设,确定检验水准 对于处理组: H0:不同剂量组的总体均数相等 H1:不同剂量组的总体均数不全相等 对于区组: H0:6 个区组的总体均数相等 H1:6 个区组的总体均数不全相等 α=0.05 (2) 计算检验统计量 F 值(略) (3) 确定 P 值,做出统计推断 若 P>0.05,不拒绝 H0,尚不能认为不同剂量组的总体均数不全相等 若 P≤0.05,拒绝 H0,接受 H1,可认为不同剂量组的总体均数不全相等可采用 LSD-t 或 q 检验等进行两两比较 《医学统计学》复习资料 第第 20 页,共页,共 42 页页 8.某医院治疗胃炎患者,A 药治疗 85 例,有效率为 64.7%;用 B 药治疗55 例,有效率 70.9%问 A 药和 B 药的疗效是否相同? 答:要比较 A 药和 B 药的疗效,应选用四格表 χ2检验 (1) 建立检验假设,确定检验水准 H0:A 药和 B 药的疗效相同 H1:A 药和 B 药的疗效不同 α = 0.05 (2) 计算检验统计量 χ2值 组别 有效 无效 合计 A 药 85×64.7%≈55 30 85 B 药 55×70.9%≈39 16 55 合计 94 46 140 因总例数 n=140>40,最小理论数507.181404655(min)(min)min===nnnTCR,可采用四格表 χ2检验的基本公式或专用公式。
(3) 确定 P 值,做出统计推断 若 P>0.05,不拒绝 H0,尚不能认为 A 药和 B 药的疗效不同; 若 P≤0.05,拒绝 H0,接受 H1,可认为 A 药和 B 药的疗效不同 8.某医师将病情相似的重症乙型脑炎患者随机分成两组,分别用方剂加人工牛黄和方剂两种方式治疗方剂加人工牛黄组 120 例,治愈 71 例;方剂组 70 例,治愈 26 例问两种治疗方法的治愈率是否相同? 答:要比较两种治疗方法的治愈率,应选用四格表 χ2检验 (1) 建立检验假设,确定检验水准 H0:两种治疗方法的治愈率相同 H1:两种治疗方法的治愈率不同 α = 0.05 (2) 计算检验统计量 χ2值 组别 治愈 未治愈 合计 方剂加人工牛黄组 71 49 120 人工牛黄组 26 44 70 合计 97 93 190 因总例数 n=190>40,最小理论数526.341909370(min)(min)min===nnnTCR,可采用四格表 χ2检验的基本公式或专用公式 (3) 确定 P 值,做出统计推断 若 P>0.05,不拒绝 H0,尚不能认为两种治疗方法的治愈率不同; 若 P≤0.05,拒绝 H0,接受 H1,可认为两种治疗方法的治愈率不同。
《医学统计学》复习资料 第第 21 页,共页,共 42 页页 8.为比较使用含氟牙膏和使用一般牙膏者的患龋率,随机调查了使用含氟牙膏 200 人,龋齿 70 人;使用一般牙膏者 150 人,龋齿 75 人使用含氟牙膏和使用一般牙膏者的患龋率是否不同?可用什么统计方法? 答:要比较使用含氟牙膏和使用一般牙膏者患龋率,应选用四格表 χ2检验 (1) 建立检验假设,确定检验水准 H0:使用含氟牙膏和使用一般牙膏者的患龋率相同 H1:使用含氟牙膏和使用一般牙膏者的患龋率不同 α = 0.05 (2) 计算检验统计量 χ2值 组别 龋齿 无龋齿 合计 含氟牙膏 70 130 200 一般牙膏 75 75 150 合计 145 205 350 因总例数 n=350>40,最小理论数514.62350145150(min)(min)min===nnnTCR,可采用四格表 χ2检验的基本公式或专用公式 (3) 确定 P 值,做出统计推断 如果 P>0.05,不拒绝 H0,尚不能认为使用含氟牙膏和使用一般牙膏者的患龋率不同(1 分) ; 如果 P≤0.05,拒绝 H0,接受 H1,可认为使用含氟牙膏和使用一般牙膏者的患龋率不同(1 分) 。
8.为研究慢支口服液对慢性支气管炎的疗效,某课题组将 240 例慢性支气管炎患者随机等分为慢支口服液试验组和消咳喘对照组,疗程 2 周结果试验组 120 例患者中有效 105 例,对照组 120 例患者中有效 86 例 问问::(1) 该研究属于何种设计方案? (2) 列出分析表格 (3) 要比较两药治疗慢性支气管炎的疗效, 应采用何种统计方法?写出假设检验的基本步骤,不必计算结果 答:(1) 完全随机设计 (2) 列表 两种药品治疗慢性支气管炎的疗效比较 组 别 有效 无效 合计 试验组 105 15 120 对照组 86 34 120 合 计 191 49 240 (3) 要比较两药治疗慢性支气管炎的疗效,应采用四格表 χ2检验 1) 建立检验假设,确定检验水准 H0:两药治疗慢性支气管炎的疗效相同 H1:两药治疗慢性支气管炎的疗效不同 α = 0.05 2) 计算检验统计量 χ2值 因总例数 n=240>40,最小理论频数55 .2424049120(min)(min)min===nnnTCR,可直接计算 χ2值 χ2值计算: (略) 3) 确定 P 值,做出统计推断 如果 P>0.05,不拒绝 H0,差异无统计学意义,尚不能认为两药治疗慢性支气管炎的疗效不同。
如果 P≤0.05,拒绝 H0,接受 H1,差异有统计学意义,可认为两药治疗慢性支气管炎的疗效不同 《医学统计学》复习资料 第第 22 页,共页,共 42 页页 9.下表为 10 例垂体催乳素微腺瘤手术前后的血催乳素浓度,问手术前后的血催乳素浓度是否有差异? 编号 1 2 3 4 5 6 7 8 9 10 术前 276 880 1600 324 398 266 500 1700 500 220 术后 41 110 280 61 105 43 25 300 215 92 答:由于数据波动较大,差值不服从正态分布,要比较手术前后的血催乳素浓度有无差异,应采用配对秩和检验 (1) 建立检验假设,确定检验水准 H0:手术前后血催乳素浓度差值的总体中位数等于 0 H1:手术前后血催乳素浓度差值的总体中位数不等于 0 05. 0= (2) 计算检验统计量(略) (3) 确定 P 值,做出统计推断 如果 P>0.05,不拒绝 H0,差异无统计学意义,尚不能认为手术前后的血催乳素浓度不同; 如果 P≤0.05,拒绝 H0,接受 H1,差异有统计学意义,可认为手术前后的血催乳素浓度不同 9.用两种不同的方法测定 10 个水样中硫酸盐的含量,结果如表。
问两种方法测定结果是否有差异? 水样号 1 2 3 4 5 6 7 8 9 10 EDTA 法 129.89 59.68 28.79 69.85 46.78 2.35 1.56 78.88 56.87 66.85 重量法 119.58 52.63 29.68 70.56 42.56 3.21 3.42 70.56 50.55 62.45 答:由于数据波动较大,不服从正态分布,要比较两种方法测定结果是否有差异,应采用配对秩和检验 (1) 建立检验假设,确定检验水准 H0:两种方法测定结果差值的总体中位数等于 0 H1:两种方法测定结果差值的总体中位数不等于 0 05. 0= (2) 计算检验统计量(略) (3) 确定 P 值,做出统计推断 如果 P>0.05,不拒绝 H0,差异无统计学意义,尚不能认为两种方法测定结果不同; 如果 P≤0.05,拒绝 H0,接受 H1,差异有统计学意义,可认为两种方法测定结果不同 9.某医师用中西医结合治疗肺炎,将 220 名肺炎患者随机分为两组,西医组用常规西医治疗,中西医结合组在西医组治疗的基础上,加用中药治疗两组疗效有无差异?(写出步骤,不必计算) 分组 例数 痊愈 好转 死亡 中西医结合组 122 110(90.16) 7(5.74) 5(4.10) 西医组 98 72(73.47) 12(12.24) 14(14.29) 答:采用成组设计两样本比较的秩和检验。
(1) 建立检验假设,确定检验水准 H0:两种治疗方法组疗效的总体分布相同 H1:两种治疗方法组疗效的总体分布不相同 α=0.05 (2) 计算检验统计量 T 值(略) (3) 确定 P 值,做出统计推断 若 P>0.05,不拒绝 H0,拒绝 H1,尚不能认为两种治疗方法组疗效的总体分布不相同 若 P≤0.05,拒绝 H0,接受 H1,可认为两种治疗方法组疗效的总体分布不相同 《医学统计学》复习资料 第第 23 页,共页,共 42 页页 【SPSS 结果解释题】 5. 两地分别测定井水中硝酸盐含量(mg/L) ,结果如下试问两地井水中硝酸盐含量水平有无不同, 可采用什么统计方法?计算参见 SPSS 结果 甲地:2.90,5.41,5.48,4.60,4.03,5.10,5.92,4.97,4.24,4.36,2.72,2.37, 2.09, 7.10 乙地:5.18,8.79,3.14,6.46,4.01,5.60,4.57,7.71,4.99 Group Statistics 地区 N Mean Std. Deviation Std. Error Mean 硝酸盐含量 甲地 14 4.3779 1.44989 .38750 乙地 9 5.6056 1.78734 .59578 Independent Samples Test Levene's Test for Equality of Variances t-test for Equality of Means 硝酸盐含量 95% Confidence Interval of the Difference F Sig. t df Sig. (2-tailed) Mean Difference Std. Error Difference Lower Upper Equal variances assumed .341 .566 -1.811 21 .085 -1.22770 .67801 -2.63770 .18230 Equal variances not assumed -1.727 14.593 .105 -1.22770 .71071 -2.74623 .29083 答:该资料为完全随机设计的计量资料,服从正态分布,宜用成组 t 检验。
(1) 建立检验假设,确定检验水准 H0:两地井水中硝酸盐含量水平相同 H1:两地井水中硝酸盐含量水平不同 α=0.05 (2) 计算检验统计量 t 值 1) 描述统计量:n1 = 14,1x= 4.3779,S 1 = 1.44989 n2 = 9,2x= 5.6056,S 2 = 1.78734 2) Levene’s 方差齐性检验: F = 0.341, P = 0.566, 可认为两总体方差齐,应选用 t 检验结果 t 检验:t = -1.811,ν = 21 (3) 确定 P 值,做出统计推断 P=0.085>0.05,不拒绝 H0,差异无统计学意义,尚不能认为两地井水中硝酸盐含量水平不同 5.某医生随机抽取正常人和脑病患者各 11 例,测定尿中类固醇排出量(mg/dl) 结果见表 问脑病患者与正常人的尿中类固醇排出量是否相同? 正常人和脑病患者尿中类固醇排出量(mg/dl)测定结果 分 组 尿中类固醇排出量(mg/dl) 正 常 人 2.90 5.41 5.48 4.60 4.03 5.10 4.97 4.24 4.37 3.05 2.78 脑病患者 5.28 8.79 3.84 6.46 3.79 6.64 5.89 4.57 7.71 6.02 4.06 Group Statistics 组别 N Mean Std. Deviation Std. Error Mean 尿中类固醇排出量 正常人 11 4.2664 .98515 .29703 脑病患者 11 5.7318 1.62565 .49015 Independent Samples Test Levene's Test for Equality of Variances t-test for Equality of Means F Sig. t df Sig. (2-tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Lower Upper 类固醇排出量 Equal variances assumed 2.597 .123 -2.557 20 .019 -1.4655 .57313 -2.66098 -.26993 Equal variances not assumed -2.557 16.472 .021 -1.4655 .57313 -2.67761 -.25330 答:该资料为完全随机设计的计量资料,服从正态分布,宜用成组 t 检验。
(1) 建立检验假设,确定检验水准 H0:脑病病人与正常人的尿中类固醇排出量相同 H1:脑病病人与正常人的尿中类固醇排出量不同 α=0.05 (2) 计算检验统计量 t 值 1) 描述统计量:n1 = 11,1x= 4.266,S 1 = 0.985 n2 = 11,2x= 5.732,S 2 = 1.626 2) Levene’s 方差齐性检验: F = 2.597, P = 0.123, 可认为两总体方差齐,应选用 t 检验结果 t 检验:t = -2.557,ν = 20 (3) 确定 P 值,做出统计推断 P=0.019<0.05,拒绝 H0,接受 H1,差异有统计学意义,可认为脑病病人和正常人的尿中类固醇排出量不同 《医学统计学》复习资料 第第 24 页,共页,共 42 页页 5. 两组雄性大鼠分别以高蛋白和低蛋白饲料喂养后, 观察第 28 至 84 天间,每只大鼠所增加的体重,资料如下: 高蛋白组 134 146 104 119 124 161 107 83 113 129 97 126 低蛋白组 70 118 101 85 107 132 94 Independent Samples Test Levene's Test for Equality of Variances t-test for Equality of Means F Sig. t df Sig. (2-tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Lower Upper 增加体重 Equal variances assumed .027 .871 1.913 17 .073 19.250 10.063 -1.980 40.480 Equal variances not assumed 1.934 13.110 .075 19.250 9.954 -2.236 40.736 答:该资料为完全随机设计的计量资料,服从正态分布,宜用成组 t 检验。
(1) 建立检验假设,确定检验水准 H0:两组大鼠增加体重的均值相同 H1:两组大鼠增加体重的均值不同 05. 0= (2) 计算检验统计量 t 值 1) 描述统计量:n1 = 12,1x=120.25,S 1 =21.44 n2 = 7,2x= 101.00,S 2 =20.62 2) Levene’s 方差齐性检验: F = 0.027, P = 0.871, 可认为两总体方差齐,应选用 t 检验结果 t 检验:t = 1.913,ν = 17 (3) 确定 P 值,做出统计推断 P=0.073>0.05,不拒绝 H0,差异无统计学意义,尚不能认为两组大鼠增加体重的均值不同 5.某医师研究甲、乙两种方法测定血清钠含量(mmol/L)的差别,随机抽取 10 名正常成年男子,分别用甲、乙两种方法测定,结果见表问甲、乙两种方法测定的血清钠含量有无差别 甲、乙两法对 10 名正常成年男子血清钠含量的测定结果(mmol/L) 编号 1 2 3 4 5 6 7 8 9 10 甲法 137.1 145.5 144.6 149.5 142.6 141.8 139.5 137.9 138.6 147.8 乙法 139.1 146.2 142.2 148.7 144.6 143.8 138.5 139.9 142.7 146.2 Paired Samples Statistics Mean N Std. Deviation Std. Error Mean Pair 1 甲法 142.490 10 4.2886 1.3562 乙法 143.190 10 3.3600 1.0625 Paired Samples Correlations N Correlation Sig. Pair 1 甲法 & 乙法 10 .882 .001 Paired Samples Test Paired Differences t df Sig. (2-tailed) Mean Std. Deviation Std. Error Mean 95% Confidence Interval of the Difference Lower Upper Pair 1 甲法 - 乙法 -.7000 2.0645 .6529 -2.1769 .7769 -1.072 9 .312 答:该资料为配对设计的计量资料,宜采用配对 t 检验进行统计分析。
(1) 建立检验假设,确定检验水准 H0:甲、乙两种方法测定的血清钠含量无差别 H1:甲、乙两种方法测定的血清钠含量有差别 α=0.05 (2) 计算检验统计量 t 值 1) 描述统计量:1x=142.49,S1=4.2886;2x=143.19,S2=3.36,n =10 2) 相关分析:n =10,r =0.882,P=0.001,可认为甲、乙两种方法的测定结果有相关 3) 配对 t 检验:7000. 0−=d,t =-1.072,ν =9 (3) 确定 P 值,做出统计推断 P=0.312,不拒绝 H0,差异无统计学意义,尚不能认为甲、乙两种方法测定的血清钠含量有差别 《医学统计学》复习资料 第第 25 页,共页,共 42 页页 5. 18 名黑热病兼贫血患者被随机分成两组各 9 名,分别用葡萄糖锑钠(A)和复方葡萄酸锑钠(B)治疗,观察治疗前后血色素(%)的变化,测定结果如表 4 表 4 A、B 两药治疗黑热病贫血患者前后的血色素(%) 病人号 1 2 3 4 5 6 7 8 9 A 药 治疗前 36 45 55 55 65 60 42 45 25 治疗后 45 65 66 85 70 55 70 45 50 病人号 1 2 3 4 5 6 7 8 9 B 药 治疗前 55 50 65 60 70 40 45 35 30 治疗后 80 80 70 60 85 75 60 50 60 问:问:(1) 该资料是什么资料? (2) 该研究包括哪些设计方案? (3) 要比较 A、B 两药的疗效有无差别,应如何统计分析? (4) 简述主要检验步骤,计算结果参见 SPSS 的输出结果。
Paired Samples Statistics Mean N Std. Deviation Std. Error Mean Pair 1 治疗前治疗前A 47.56 9 12.53 4.18 治疗后治疗后A 61.22 9 13.45 4.48 Pair 2 治疗前治疗前B 50.00 9 13.69 4.568 治疗后治疗后B 68.89 9 11.93 3.98 Paired Samples Test Paired Differences t df Sig. (2-tailed) Mean Std. Deviation Std. Error Mean 95% Confidence Interval of the Difference Lower Upper Pair 1 治疗前治疗前A - 治疗后治疗后A -13.67 12.65 4.22 -23.39 -3.94 -3.241 8 .012 Pair 2 治疗前治疗前B - 治疗后治疗后B -18.89 11.93 3.98 -28.06 -9.72 -4.749 8 .001 Group Statistics 药物药物 N Mean Std. Deviation Std. Error Mean 治疗治疗前后差前后差 A药药 9 13.6667 12.64911 4.21637 B药药 9 18.8889 11.93152 3.97717 Independent Samples Test Levene's Test for Equality of Variances t-test for Equality of Means F Sig. t df Sig. (2-tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Lower Upper 治疗治疗前后前后差差 Equal variances assumed .107 .748 -.901 16 .381 -5.22 5.80 -17.50 7.06 Equal variances not assumed -.901 15.946 .381 -5.22 5.80 -17.51 7.07 答:(1) 计量资料 (2) 该研究的设计方案包括配对设计和完全随机设计。
(3) 要比较 A、B 两药的疗效有无差别,应分别计算出两组药物治疗前后的差值(分别反映两种药物的效应) ,形成两个新的样本(属完全随机设计) ,再进行完全随机设计两样本均数比较的 t 检验 (4) 检验步骤: ①建立检验假设,确定检验水准 H0:A、B 两药的疗效相同 H1:A、B 两药的疗效不同 α = 0.05 ②计算检验统计量 A 药:治疗前后血色素改变均数=13.67,标准差=12.65 B 药:治疗前后血色素改变均数=18.89,标准差=11.93 方差齐性检验 F=0.107, P=0.748, 可认为两组方差齐, 采用成组 t 检验 t=-0.901,,v=16 ③确定 P 值,做出统计推断 P=0.381,不拒绝 H0,差异无统计学意义,尚不能认为两种药物治疗黑热病贫血患者的疗效不同 《医学统计学》复习资料 第第 26 页,共页,共 42 页页 6.为研究 A、B、C 三种治疗缺铁性贫血药物的疗效,某研究者将 30 例患者随机等分为三组,分别给予 A、B、C 三种药物,治疗结果见表 5 表 5 3 组患者红细胞数增加量(×1012/L) 组别 红细胞增加量(×1012/L) A 组 1.3 1.5 1.2 1.1 1.4 1.2 1.1 1.3 1.6 1.4 B 组 1.2 0.9 1.0 1.2 0.8 0.9 1.1 1.1 0.8 0.9 C 组 0.9 1.4 1.6 1.1 1.2 1.2 1.3 1.1 1.1 1.2 SPSS 软件的输出结果如下: Descriptives 红细胞数增加量 N Mean Std. Deviation Std. Error 95% Confidence Interval for Mean Minimum Maximum Lower Bound Upper Bound A组 10 1.310 .1663 .0526 1.191 1.429 1.1 1.6 B组 10 .990 .1524 .0482 .881 1.099 .8 1.2 C组 10 1.210 .1912 .0605 1.073 1.347 .9 1.6 Total 30 1.170 .2136 .0390 1.090 1.250 .8 1.6 Test of Homogeneity of Variances 红细胞数增加量 Levene Statistic df1 df2 Sig. .004 2 27 .996 ANOVA 红细胞数增加量 Sum of Squares df Mean Square F Sig. Between Groups .536 2 .268 9.194 .001 Within Groups .787 27 .029 Total 1.323 29 Post Hoc Tests Homogeneous Subsets 红细胞数增加量 Student-Newman-Keulsa 组别 N Subset for alpha = 0.05 1 2 B组 10 .990 C组 10 1.210 A组 10 1.310 Sig. 1.000 .201 Means for groups in homogeneous subsets are displayed. a. Uses Harmonic Mean Sample Size = 10.000. 问:问:(1)该研究属于何种设计方案? (2)要比较三组患者红细胞数的增加量,应采用何种统计方法? (3)写出假设检验的基本步骤,计算结果参见 SPSS 的输出结果。
答:(1) 完全随机设计 (2) 单因素方差分析 (3)【检验步骤】 1) 建立检验假设,确定检验水准 H0:三组患者红细胞数增加量的总体均数相同 H1:三组患者红细胞数增加量的总体均数不全相同 α = 0.05 2) 计算检验统计量 F 值 A 组:n1=10,1x=1.310,S1=0.1663 B 组:n2=10,2x=0.990,S2 =0.15242 C 组:n3=10,3x=1.210,S3 =0.191 方差齐性检验:Levene's F=0.004,P=0.996,可认为各总体方差齐,可选用单因素方差分析结果 方差分析结果:F = 9.194 3) 确定 P 值,做出统计推断 P=0.001,拒绝 H0,接受 H1,差异有统计学意义,可认为三组患者红细胞数增加量的总体均数不全相同 SNK 检验结果:B 组与 A 组和 C 组的均数不在同一列(P<0.05) ,差异有统计学意义;而 A 组与 C 组的均数在同一列(P>0.05) ,差异无统计学意义;即除 A 组与 C 组的差异无统计学意义外,其余两两之间的差异均有统计学意义,可认为 B 组患者红细胞数增加量的总体均数小于 A 组和 C组。
《医学统计学》复习资料 第第 27 页,共页,共 42 页页 6.某人研究某研究机构工作人员的血脂水平,随机抽取不同年龄组男性各10 名受试对象,检测其总胆固醇含量(mmol/L) ,其结果如表试分析三组人群的总胆固醇含量是否相同 三组人群的总胆固醇含量(mmol/L) 组别 总胆固醇含量(mmol/L) 青年组 4.9 4.85 4.92 5.16 4.92 4.75 5.16 4.88 5.06 5.2 中年组 5.11 5.12 4.88 5.22 4.98 5.13 5.15 4.97 5.16 5.24 老年组 5.2 5.26 5.23 5.12 5.32 5.24 5.2 4.99 5.16 5.18 SPSS 输出结果如下,请给予解释 Oneway Descriptives 总胆固醇含量(mmol/L) N Mean Std. Deviation Std. Error 95% Confidence Interval for Mean Minimum Maximum Lower Bound Upper Bound 青年组 10 4.9800 .15384 .04865 4.8699 5.0901 4.75 5.20 中年组 10 5.0960 .11597 .03667 5.0130 5.1790 4.88 5.24 老年组 10 5.1900 .08944 .02828 5.1260 5.2540 4.99 5.32 Total 30 5.0887 .14708 .02685 5.0337 5.1436 4.75 5.32 Test of Homogeneity of Variances 总胆固醇含量(mmol/L) Levene Statistic df1 df2 Sig. 3.046 2 27 .064 ANOVA 总胆固醇含量(mmol/L) Sum of Squares df Mean Square F Sig. Between Groups .221 2 .111 7.358 .003 Within Groups .406 27 .015 Total .627 29 Post Hoc Tests Homogeneous Subsets 总胆固醇含量(mmol/L) Student-Newman-Keuls 组别 N Subset for alpha = 0.05 1 2 青年组 10 4.9800 中年组 10 5.0960 老年组 10 5.1900 Sig. 1.000 .098 Means for groups in homogeneous subsets are displayed. a. Uses Harmonic Mean Sample Size = 10.000. 答:该资料为完全随机设计的计量资料,宜采用单因素方差分析。
(1) 建立检验假设,确定检验水准 H0:三组人群的总胆固醇含量相同 H1:三组人群的总胆固醇含量不全相同 α=0.05 (2) 计算检验统计量 t 值 1) 描述统计量:n1=10,1x=4.980,S1=0.15384; n2=10,2x=5.096,S2 =0.11597; n3=10,2x=5.190,S3 =0.08944 2) 方差齐性检验:P=0.064,可认为各总体方差齐,可选用单因素方差分析结果 3) 方差分析结果:F = 7.358 (3) 确定 P 值,做出统计推断 P=0.003,拒绝H0,接受H1,差异有统计学意义,可认为三组人群的总胆固醇含量不全相同 SNK 法两两比较结果:中年组与老年组均数同处一个的亚组(P>0.05) , 差异无统计学意义; 青年组与中年和老年分列于不同亚组 (P<0.05) ,差异有统计学意义,即除了中年组与老年组的差异无统计学意义,其余两两之间的差异均有统计学意义,可认为青年组血清总胆固醇含量低于中年组与老年组 《医学统计学》复习资料 第第 28 页,共页,共 42 页页 6.观测龙葵浓缩果汁对 S180 实体瘤 NK 细胞活性的影响,将同种属 32只大白鼠按窝别、 性别、 体重配成 10 个区组, 建成 S180 实体瘤模型。
一定时间后将小鼠脱椎处死,测定并计算 NK 细胞活性,结果见下表: 龙葵浓缩果汁不同剂量组小鼠 NK 细胞活性测定结果(%) 配伍组 高剂量组 中剂量组 低剂量组 对照组 1 20.7 17.3 12.3 6.5 2 12.4 11.6 18.6 8.4 3 14.9 14.6 10.8 11.3 4 18.5 9.4 19.9 15.6 5 13.2 9.0 9.0 8.9 6 14.2 20.1 11.5 14.1 7 12.8 11.5 7.3 12.3 8 13.5 11.7 14.7 10.6 9 14.4 10.9 12.6 9.8 10 13.8 18.4 9.5 7.2 SPSS 软件结果如下,请给予解释 Tests of Between-Subjects Effects Dependent Variable: NK 细胞活性 Source Type III Sum of Squares df Mean Square F Sig. Corrected Model 212.947a 12 17.746 1.519 .178 Intercept 6599.761 1 6599.761 564.955 .000 处理组 100.373 3 33.458 2.864 .055 区组 112.574 9 12.508 1.071 .415 Error 315.412 27 11.682 Total 7128.120 40 Corrected Total 528.359 39 a. R Squared = .403 (Adjusted R Squared = .138) Homogeneous Subsets NK细胞活性细胞活性 Student-Newman-Keulsa,b 处理组 N Subset 1 2 对照组 10 10.470 低剂量组 10 12.620 12.620 中剂量组 10 13.450 13.450 高剂量组 10 14.840 Sig. .144 .329 答:该资料为随机区组设计的计量资料,宜采用随机区组设计的方差分析。
(1) 建立检验假设,确定检验水准 对于处理组: H0:不同处理组的总体均数相等 H1:不同处理组的总体均数不全相等 对于区组: H0:10 个区组的总体均数相等 H1:10 个区组的总体均数不全相等 α=0.05 (2) 计算检验统计量 F 值,确定 P 值,做出统计推断 1) 对于处理组:F=2.864,P=0.055>0.05,差异无统计学意义,尚不能认为不同剂量组小鼠 NK 细胞活性的均数不同 因四组间总的差异无统计意义,故不必解释 SNK 结果 2) 对于区组:F=1.071,P=0.415>0.05,差异无统计学意义,尚不能认为十个区组小鼠 NK 细胞活性的均数不同 《医学统计学》复习资料 第第 29 页,共页,共 42 页页 6.为研究克拉霉素的抑菌效果,某实验室对 28 个短小芽孢杆菌平板依据菌株的来源不同分成了 7 个区组,每组 4 个平板随机分配给标准药物低剂量组(SL) 、标准药物高剂量组(SH) 、克拉霉素低剂量组(TL) 、克拉霉素高剂量组(TL) ,给予不同处理后观察抑菌圈的直径,结果见表 不同处理组短小芽孢杆菌平板菌株的抑菌圈直径(mm) 区组 SL SH TL TH 1 18.23 21.41 18.12 19.65 2 18.15 20.20 18.25 20.85 3 18.02 19.99 18.38 19.96 4 18.35 19.96 18.54 19.62 5 18.36 20.26 18.22 19.64 6 18.05 20.22 18.15 19.62 7 18.05 20.24 18.48 19.95 SPSS 软件结果如下,请给予解释。
(8 分) Tests of Between-Subjects Effects Dependent Variable: 抑菌圈直径 Source Type III Sum of Squares df Mean Square F Sig. Corrected Model 25.685a 9 2.854 20.479 .000 Intercept 10295.825 1 10295.825 73882.115 .000 处理组 25.254 3 8.418 60.406 .000 区组 .432 6 .072 .516 .788 Error 2.508 18 .139 Total 10324.018 28 Corrected Total 28.193 27 a. R Squared = .911 (Adjusted R Squared = .867) Homogeneous Subsets 抑菌圈直径抑菌圈直径 Student-Newman-Keulsa,b 处理组 N Subset 1 2 3 SL 7 18.1729 TL 7 18.3057 TH 7 19.8986 SH 7 20.3257 Sig. .514 1.000 1.000 答:该资料为随机区组设计的计量资料,宜采用随机区组设计的方差分析。
(1) 建立检验假设,确定检验水准 对于处理组: H0:不同处理组的总体均数相等 H1:不同处理组的总体均数不全相等 对于区组: H0:10 个区组的总体均数相等 H1:10 个区组的总体均数不全相等 α=0.05 (2) 计算检验统计量 F 值,确定 P 值,做出统计推断 1) 对于处理组:F=60.406,P<0.001,差异有统计学意义,可认为不同处理组短小芽孢杆菌平板菌株的抑菌圈直径不同 SNK 法两两比较结果:除 SL 组与 TL 组之间的差异无统计学意义外,其余两两之间的差异均有统计学意义(P<0.05) 2) 对于区组:F=0.516,P=0.788>0.05,差异无统计学意义,尚不能认为七个区组短小芽孢杆菌平板菌株的抑菌圈直径不同 《医学统计学》复习资料 第第 30 页,共页,共 42 页页 8.某医院分别用中西药治疗胃炎患者 135 例,结果西药组治疗 80 例,有效 64 人, 中药组治疗 55 例, 有效 48 人 问两种方法的疗效有无差别? SPSS 软件的输出结果如下: Crosstabs 组别组别 * 疗效疗效 Crosstabulation 疗效 Total 有效 无效 组别 西药组 Count 64 16 80 % within 组别 80.0% 20.0% 100.0% 中药组 Count 48 7 55 % within 组别 87.3% 12.7% 100.0% Total Count 112 23 135 % within 组别 83.0% 17.0% 100.0% Chi-Square Tests Value df Asymptotic Significance (2-sided) Exact Sig. (2-sided) Exact Sig. (1-sided) Pearson Chi-Square 1.220a 1 .269 Continuity Correctionb .759 1 .384 Likelihood Ratio 1.255 1 .263 Fisher's Exact Test .353 .193 Linear-by-Linear Association 1.211 1 .271 N of Valid Cases 135 a. 0 cells (0.0%) have expected count less than 5. The minimum expected count is 9.37. b. Computed only for a 2x2 table 问:问:(1) 这是什么资料? (2) 该研究属于何种设计方案? (3) 要比较两种方法疗效有无差别,应用何种统计方法? (4) 写出假设检验的基本步骤,计算结果参见 SPSS 的输出结果。
答:(1) 计数资料 (2) 完全随机设计 (3) 四格表 χ2检验 (4) 【检验步骤】 1) 建立检验假设,确定检验水准 H0:两药疗效相同 H1:两药疗效不同 α = 0.05 2) 计算检验统计量 χ2值 频数表:西药:治疗 80 人,有效人数 64 人,有效率 80%; 中药:治疗 55 人,有效人数 48 人,有效率 87.3 χ2检验结果:n=135>40,Tmin=9.37>5,应选择四格表 χ2检验的结果 得 χ2 =1.220,ν =1 3) 确定 P 值,做出统计推断 P=0.269>0.05,不拒绝 H0,差异无统计学意义,尚不能认为两药疗效不同 《医学统计学》复习资料 第第 31 页,共页,共 42 页页 8. 某医院欲比较异梨醇口服液和氢氯噻嗪降低颅内压的疗效,将 200 例颅内压增高症患者随机等分为异梨醇口服液试验组和氢氯噻嗪对照组,治疗结果见表 6 表 6 两种药品降低颅内压的疗效比较 组 别 有效 无效 合计 有效率(%) 试验组 91 9 100 91.0 对照组 77 23 100 77.0 合 计 168 32 200 87.0 SPSS 软件的输出结果如下: Crosstabs 组别组别 * 疗效疗效 Crosstabulation 疗效疗效 Total 有效有效 无效无效 组别 试验组 Count 91 9 100 % within 组别组别 91.0% 9.0% 100.0% 对照组 Count 77 23 100 % within 组别组别 77.0% 23.0% 100.0% Total Count 168 32 200 % within 组别组别 84.0% 16.0% 100.0% Chi-Square Tests Value df Asymptotic Significance (2-sided) Exact Sig. (2-sided) Exact Sig. (1-sided) Pearson Chi-Square 7.292a 1 .007 Continuity Correctionb 6.287 1 .012 Likelihood Ratio 7.505 1 .006 Fisher's Exact Test .011 .006 Linear-by-Linear Association 7.255 1 .007 N of Valid Cases 200 a. 0 cells (0.0%) have expected count less than 5. The minimum expected count is 16.00. b. Computed only for a 2x2 table 问:问:(1) 这是什么资料? (2) 该研究属于何种设计方案? (3) 要比较两种药品降低颅内压的疗效,应采用何种统计方法? 写出假设检验的基本步骤,计算结果参见 SPSS 的输出结果。
答:(1) 计数资料 (2) 完全随机设计 (3) 四格表 χ2检验 【检验步骤】 ① 建立检验假设,确定检验水准 H0:两种药品降低颅内压的疗效相同 H1:两种药品降低颅内压的疗效不同 α=0.05 (2) 计算检验统计量 χ2值 试验组:治疗 100 人,有效人数 91 人,有效率 91.0%; 对照组:治疗 100 人,有效人数 77 人,有效率 77.0%; n=200>40,Tmin=16.00>5,应选择 Pearson χ2检验的结果 χ2 = 7.292,ν = 1 (3) 确定 P 值,做出统计推断 P=0.007,拒绝 H0,接受 H1,差异有统计学意义,可认为两种药品降低颅内压的疗效不同,异梨醇口服液的有效率(91.0%)高于氢氯噻嗪(77.0%) 《医学统计学》复习资料 第第 32 页,共页,共 42 页页 8.为比较复方丹参滴丸与复方丹参片治疗冠心病心绞痛的疗效,某医师将200 例 65~76 岁确诊的冠心病稳定型心绞痛患者随机分为两组,每组100 例试验组服用复方丹参滴丸,对照组服用复方丹参片,结果如表问两种药品治疗冠心病心绞痛的疗效是否相同? 两种药品治疗冠心病心绞痛的疗效比较 组 别 有效 无效 合计 有效率(%) 试验组 91 9 100 91.0 对照组 73 27 100 73.0 合 计 164 36 200 82.0 SPSS 输出结果如下,请给予解释。
Crosstabs 组别 * 疗效 Crosstabulation 疗效 Total 无效 有效 组别 试验组 Count 9 91 100 % within 组别 9.0% 91.0% 100.0% 对照组 Count 27 73 100 % within 组别 27.0% 73.0% 100.0% Total Count 36 164 200 % within 组别 18.0% 82.0% 100.0% Chi-Square Tests Value df Asymp. Sig. (2-sided) Exact Sig. (2-sided) Exact Sig. (1-sided) Pearson Chi-Square 10.976a 1 .001 Continuity Correctionb 9.790 1 .002 Likelihood Ratio 11.398 1 .001 Fisher's Exact Test .001 .001 Linear-by-Linear Association 10.921 1 .001 N of Valid Cases 200 a. 0 cells (0.0%) have expected count less than 5. The minimum expected count is 18.00. b. Computed only for a 2x2 table 答:该资料为完全随机设计的计数资料,宜用四格表 χ2检验进行统计分析。
(1) 建立检验假设,确定检验水准 H0:两种药品治疗冠心病心绞痛的疗效相同 H1:两种药品治疗冠心病心绞痛的疗效不同 α=0.05 (2) 计算检验统计量 χ2值 1) 试验组:治疗 100 人,有效人数 91 人,有效率 91.0%; 2) 对照组:治疗 100 人,有效人数 73 人,有效率 73.0%; χ2检验结果:n=200>40,Tmin=18.00>5,应选择 Pearson χ2检验的结果,得 χ2 = 10.976,ν = 1 (3) 确定 P 值,做出统计推断 P=0.001,拒绝 H0,接受 H1,差异有统计学意义,可认为两种药品治疗冠心病心绞痛的疗效不同,复方丹参滴丸的疗效(91.0%)高于复方丹参片(73.0%) 《医学统计学》复习资料 第第 33 页,共页,共 42 页页 8.某医师用两种方法测定 60 例恶性肿瘤患者体内 CK 基因表达阳性率,结果如下表: 甲法 乙法 合计 阳性 阴性 阳性 16 26 42 阴性 7 11 18 合计 23 37 60 问:(1) 该资料是何种类型? (2) 该资料属于何种设计方案? (3) SPSS 软件结果如下,请给予解释。
甲法甲法 * 乙法乙法 Crosstabulation 乙法 Total 阳性 阴性 甲法 阳性 Count 16 26 42 % of Total 26.7% 43.3% 70.0% 阴性 Count 7 11 18 % of Total 11.7% 18.3% 30.0% Total Count 23 37 60 % of Total 38.3% 61.7% 100.0% Chi-Square Tests Value df Asymptotic Significance (2-sided) Exact Sig. (2-sided) Exact Sig. (1-sided) Pearson Chi-Square .003a 1 .954 Continuity Correctionb .000 1 1.000 Likelihood Ratio .003 1 .954 Fisher's Exact Test 1.000 .588 Linear-by-Linear Association .003 1 .954 McNemar Test .001c N of Valid Cases 60 a. 0 cells (0.0%) have expected count less than 5. The minimum expected count is 6.90. b. Computed only for a 2x2 table c. Binomial distribution used. 答:(1) 计数资料。
(2) 自身配对设计 (3) 配对计数资料的分析包括两个方面: 1) McNemar 检验(优劣性检验) McNemar P=0.001,可认为两种诊断方法的阳性率不同,甲法的阳性率(70.0%)高于乙法的阳性率(38.3%) 2) 相关分析 n=60>40,最小理论数 T=6.90>5,采用四格表 χ2检验的专用公式,Pearson χ2=0.003,P=0.954,尚不能认为两种方法的测定结果有关 《医学统计学》复习资料 第第 34 页,共页,共 42 页页 8.为比较临床诊断和 B 超对 120 名胆结石诊断的差异将每个患者用两种诊断方法进行诊断,得到如下结果:临床诊断的确诊率为 50%,B 超的确诊率为 60%,两法同时一致确诊率为 35%问两种方法检查的结果有无差别?SPSS 结果如下,请做解释 临床诊断临床诊断 * B 超超 Crosstabulation B超 Total 阳性 阴性 临床诊断 阳性 Count 42 18 60 % of Total 35.0% 15.0% 50.0% 阴性 Count 30 30 60 % of Total 25.0% 25.0% 50.0% Total Count 72 48 120 % of Total 60.0% 40.0% 100.0% 答:该资料为配对计数资料,宜用配对 χ2检验。
(1) 建立检验假设,确定检验水准 H0:两种方法检测的阳性率相同 H1:两种方法检测的阳性率不同 α=0.05 (2) 计算检验统计量 (3) 确定 P 值,做出统计推断 McNemar 检验 P=0.111(>0.05) ,不拒绝 H0,尚不能认为两种方法检测的阳性率不同 8.对 380 名钩端螺旋体病人同时用间接免疫荧光抗体实验和显微镜凝聚实验进行血清学诊断,结果间接免疫荧光抗体实验 300 名阳性,显微镜凝聚实验 100 名阴性,两种方法均为阴性者 60 人问两种方法的诊断结果有无差别? SPSS 结果如下,请做解释 答:该资料为配对计数资料,宜用配对 χ2检验 (1) 建立检验假设,确定检验水准 H0:两种方法检测的阳性率相同 H1:两种方法检测的阳性率不同 α=0.05 (2) 计算检验统计量 (3) 确定 P 值,做出统计推断 McNemar 检验 P=0.013(<0.05) ,拒绝 H0,接受 H1,可认为两种方法检测的阳性率不同,间接免疫荧光抗体实验的阳性率较高 《医学统计学》复习资料 第第 35 页,共页,共 42 页页 9.某医师用中西医结合治疗非典患者,将 220 名非典患者随机分为两组,西医组用常规西医治疗,中西医结合组在西医组治疗的基础上,加用中药治疗,治疗结果如下。
表 7 两种治疗方法的疗效比较(例数,%) 分组 例数 痊愈 好转 死亡 中西医结合组 122 110(90.16) 7(5.74) 5(4.10) 西医组 98 72(73.47) 12(12.24) 14(14.29) 问:问:(1) 该资料属于什么类型的资料? (2) 为比较两种治疗方案对非典患者的疗效有无差别, 应该选择以下哪一种方法?简述选与不选的理由? ① 行× 列表 χ2检验 ② Kruskal-Wallis 秩和检验 (3) 写出假设检验基本步骤及并判断结果(根据上一题选择的方法及下面给出的 SPSS 分析结果) 分组分组 * 疗效疗效 Crosstabulation 疗效 Total 死亡 好转 痊愈 分组 中西医结合组 Count 5 7 110 122 % within 分组 4.1% 5.7% 90.2% 100.0% 西医组 Count 14 12 72 98 % within 分组 14.3% 12.2% 73.5% 100.0% Total Count 19 19 182 220 % within 分组 8.6% 8.6% 82.7% 100.0% Chi-Square Tests Value df Asymp. Sig. (2-sided) Pearson Chi-Square 11.026a 2 .004 Likelihood Ratio 11.140 2 .004 Linear-by-Linear Association 10.720 1 .001 N of Valid Cases 220 a. 0 cells (0.0%) have expected count less than 5. The minimum expected count is 8.46. Descriptive Statistics N Mean Std. Deviation Minimum Maximum Percentiles 25th 50th (Median) 75th 疗效 220 2.7409 .60527 1.00 3.00 3.0000 3.0000 3.0000 分组 220 1.4455 .49815 1.00 2.00 1.0000 1.0000 2.0000 Ranks 分组 N Mean Rank Sum of Ranks 疗效 中西医结合组 122 118.84 14498.00 西医组 98 100.12 9812.00 Total 220 Test Statisticsa 疗效 Mann-Whitney U 4961.000 Wilcoxon W 9812.000 Z -3.295 Asymp. Sig. (2-tailed) .001 a. Grouping Variable: 分组 答:(1) 等级资料 (2) 选第二种方法(Kruskal-Wallis 秩和检验) 。
因为如果对其中两列不同疗效的数值进行调换,χ2值不会有变化,但秩和检验统计量有变化能更好地利用等级信息 (3)【检验步骤】 1) 建立检验假设,确定检验水准 H0:两种治疗方法的疗效分布相同 H1:两种治疗方法的疗效分布不同 α=0.05 (2) 计算检验统计量 中西医组:治疗 122 人,死亡率 4.1%,好转率 5.7%,痊愈率 90.2% 西医组:治疗 98 人,死亡率 14.3%,好转率 12.2%,痊愈率 73.5% Kruskal-Wallis 秩和检验结果:Z=-3.295 中西医组的平均秩次高于西医治疗组的平均秩次 (3) 确定 P 值,做出统计推断 P=0.001,拒绝 H0,接受 H1,差异有统计学意义,可认为两种治疗方法的疗效不同,中西医结合治疗优于西医治疗 《医学统计学》复习资料 第第 36 页,共页,共 42 页页 10. 某医院 20 例糖尿病患者的糖化血红蛋白 (%, x) 与空腹血糖 (mmol/L,y)的测量值见表 8 表 8 20 例糖尿病患者糖化血红蛋白与空腹血糖的测量值 编 号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 糖化血红蛋白 8.2 6.9 10.8 8.3 11.3 9.6 8.5 9.8 7.9 6.4 8.7 7.8 8.0 6.9 12.3 8.0 10.3 9.8 8.9 9.9 空腹血糖 11.2 8.8 12.3 11.6 14.9 10.4 11.1 13.2 9.6 13.3 9.3 10.6 13.6 9.6 16.0 10.1 14.8 13.2 10.8 10.2 SPSS 软件的输出结果如下: Regression Variables Entered/Removeda Model Variables Entered Variables Removed Method 1 糖化血红蛋白糖化血红蛋白b . Enter a. Dependent Variable: 血糖 b. All requested variables entered. Model Summary Model R R Square Adjusted R Square Std. Error of the Estimate 1 .630a .398 .364 1.6515 a. Predictors: (Constant), 糖化血红蛋白 ANOVAa Model Sum of Squares df Mean Square F Sig. 1 Regression 32.390 1 32.390 11.876 .003b Residual 49.092 18 2.727 Total 81.482 19 a. Dependent Variable: 血糖 b. Predictors: (Constant), 糖化血红蛋白 Coefficientsa Model Unstandardized Coefficients Standardized Coefficients t Sig. B Std. Error Beta 1 (Constant) 4.177 2.223 1.879 .076 糖化血红蛋白 .847 .246 .630 3.446 .003 a. Dependent Variable: 血糖 问:问: (1)要用糖化血红蛋白估计空腹血糖,应采用何种统计方法? (2)写出假设检验的基本步骤,计算结果参见 SPSS 的输出结果。
(3)写出上述分析的方程,并估计当糖化血红蛋白为 8.7%时,患者的平均空腹血糖为多少 mmol/L? 答:(1) 简单直线回归分析 (2) 【检验步骤】 ① 建立检验假设,确定检验水准 H0:糖尿病患者糖化血红蛋白与空腹血糖之间无直线关系 H1:糖尿病患者糖化血红蛋白与空腹血糖之间有直线关系 α=0.05 ② 计算检验统计量 复相关系数 R = 0.630,决定系数 R2 = 0.398 F=11.876,P=0.003,可认为糖尿病患者糖化血红蛋白与空腹血糖的直线回归方程成立 a = 4.177,b = 0.847 回归系数 t 检验结果:t =3.446 ③ 确定 P 值,做出统计推断 P=0.003,拒绝 H0,接受 H1,有统计学意义,可认为糖尿病患者糖化血红蛋白与空腹血糖之间有直线关系 (3) 糖化血红蛋白估计空腹血糖的直线回归方程:x..y ˆ84701774+= 当糖化血红蛋白为 8.7%时,患者的空腹血糖平均为 11.5mmol/L 《医学统计学》复习资料 第第 37 页,共页,共 42 页页 10.某地 10 名成年男性的体质指数(kg/m2,x)与腰臀比(y)数据见表 9。
表 9 10 名成年男性的体质指数与腰臀比 编号 1 2 3 4 5 6 7 8 9 10 体质指数 24.14 21.75 20.12 24.65 24.03 24.05 15.09 22.86 24.08 22.03 腰臀比 0.88 0.97 0.92 0.99 0.97 0.98 0.80 0.87 0.98 0.92 SPSS 软件的输出结果如下: Regression Variables Entered/Removeda Model Variables Entered Variables Removed Method 1 体质指数体质指数b . Enter a. Dependent Variable: 腰臀比 b. All requested variables entered. Model Summary Model R R Square Adjusted R Square Std. Error of the Estimate 1 .739a .546 .489 .04456 a. Predictors: (Constant), 体质指数 ANOVAa Model Sum of Squares df Mean Square F Sig. 1 Regression .019 1 .019 9.607 .015b Residual .016 8 .002 Total .035 9 a. Dependent Variable: 腰臀比 b. Predictors: (Constant), 体质指数 Coefficientsa Model Unstandardized Coefficients Standardized Coefficients t Sig. B Std. Error Beta 1 (Constant) .574 .115 4.988 .001 体质指数体质指数 .016 .005 .739 3.099 .015 a. Dependent Variable: 腰臀比 问:问:要用体质指数估计腰臀比,应采用何种统计方法? 写出假设检验的基本步骤,计算结果参见 SPSS 的输出结果。
答:简单直线回归分析 【检验步骤】 ① 建立检验假设,确定检验水准 H0:成年男性体质指数与腰臀比之间无直线关系 H1:成年男性体质指数与腰臀比之间有直线关系 α=0.05(1 分) (2) 计算检验统计量 引入变量为体质指数,无剔除变量,方法为 Enter 法 复相关系数 R = 0.739,决定系数 R 2 = 0.546 回归方程方差分析结果:F=9.607,P=0.015,可认为体质指数与腰臀比的直线回归方程成立 a = 0.574,b = 0.016 回归系数 t 检验结果:t =3.099 (3) 确定 P 值,做出统计推断 P=0.015(1 分) ,拒绝 H0,接受 H1,有统计学意义,可认为成年男性体质指数与腰臀比之间有直线关系 体质指数估计腰臀比的直线回归方程为x..y ˆ01605740+= 《医学统计学》复习资料 第第 38 页,共页,共 42 页页 10.为研究体重与骨密度的关系,某医师测量了12例20~25岁成年女性的体重(kg)和左髋骨Neck部位的骨密度(BMD) (g/cm2) ,结果见下表 编号 1 2 3 4 5 6 7 8 9 10 11 12 体重 52.0 54.0 49.0 51.0 45.0 58.0 59.0 55.0 57.0 63.0 62.0 60.0 BMD 0.81 0.90 0.80 0.89 0.79 1.12 0.97 1.11 0.97 1.25 1.29 1.16 相关回归分析的SPSS结果如下,请作解释(9分) 答:要用体重估计 BMD,应采用简单直线回归分析 (1) 建立检验假设,确定检验水准 H0:成年女性体重与骨密度无直线数量关系 H1:成年女性体重与骨密度有直线数量关系 α=0.05 (2) 计算检验统计量 1) 体重为引入变量,无剔除变量,引入/剔除方法为 Enter 法。
2) 复相关系数 R = 0.888,决定系数 R 2 = 0.788 3) 回归方程方差分析:F=37.238,P<0.001,可认为成年女性体重与骨密度的直线回归方程成立 4) 回归系数 t 检验:① a = –0.588,b = 0.029 ② 回归系数 t =6.102 (3) 确定 P 值,做出统计推断 P=0.032,拒绝 H0,接受 H1,有统计学意义,可认为成年女性体重与骨密度有直线数量关系 直线回归方程:xy029. 0588. 0ˆ+−= 《医学统计学》复习资料 第第 39 页,共页,共 42 页页 10.随机抽取 10 名 20 岁男性青年,测得身高(cm)和前臂长(cm)如下表所示 编 号 1 2 3 4 5 6 7 8 9 10 身 高 170 173 160 155 173 188 178 183 180 162 前臂长 45 42 44 41 47 50 47 46 49 43 SPSS 结果如下,请给予解释 (9 分) Correlations 身高 前臂长 身高 Pearson Correlation 1 .826** Sig. (2-tailed) .003 N 10 10 前臂长 Pearson Correlation .826** 1 Sig. (2-tailed) .003 N 10 10 **. Correlation is significant at the 0.01 level (2-tailed). Variables Entered/Removeda Model Variables Entered Variables Removed Method 1 前臂长b . Enter a. Dependent Variable: 身高 b. All requested variables entered. Model Summary Model R R Square Adjusted R Square Std. Error of the Estimate 1 .826a .683 .643 6.344 a. Predictors: (Constant), 前臂长 ANOVAa Model Sum of Squares df Mean Square F Sig. 1 Regression 693.651 1 693.651 17.236 .003b Residual 321.949 8 40.244 Total 1015.600 9 a. Dependent Variable: 身高 b. Predictors: (Constant), 前臂长 Coefficientsa Model Unstandardized Coefficients Standardized Coefficients t Sig. B Std. Error Beta 1 (Constant) 37.158 32.589 1.140 .287 前臂长 2.974 .716 .826 4.152 .003 a. Dependent Variable: 身高 答:(1) 相关性分析结果 r = 0.826,P = 0.003,身高和前臂长之间有高度正相关关系。
(2) 回归分析结果 1) 应变量为身高,自变量为臂长 2) 复相关系数 R=0.826,决定系数 R2=0.683 3) 方差分析结果:F=17.236,P=0.003,回归方程成立 4) 回归系数 t 检验结果:t = 4.152,P = 0.003,有统计学意义,可认为前臂长与身高之间有直线关系 直线回归方程:xy974. 2158.37ˆ+= 《医学统计学》复习资料 第第 40 页,共页,共 42 页页 【案例分析题】 12.某疾控中心研究菊花艾叶香预防感冒和空气消毒效果对象为某幼儿园分住三幢楼的儿童中间楼是中班儿童(160 人) ,东楼是小班儿童(110 人) ,这两栋楼燃香;西楼是大班儿童(170 人)作为对照组,不燃香结论为菊花艾叶香无预防感冒效果试从统计学的角度对其设计和结论给予评价 答:该结论错误 理由:未进行随机分组,将中班儿童和小班儿童分到实验组,大班儿童分到对照组,年龄不一样,不满足均衡性原则 正确做法:将每幢楼的研究对象都随机分为试验组和对照组,分别比较每幢楼两组之间的效果,或者比较三幢的合并试验组和合并对照组之间的效果。
12.为验证大锅药预防流感的效果,某医师以两个条件相近的幼儿园儿童作为研究对象,以甲幼儿园的儿童作为试验组服大锅药,乙幼儿园儿童作为对照组不服大锅药,结果经统计分析后,认为大锅药有预防流感的效果(P<0.05) 答:(1) 该结论不可信 (2) 缺陷是对照不当,违背了随机化原则和均衡性原则,混杂因素是饮食习惯和营养条件等 (3) 正确做法:将甲幼儿园儿童随机分成两组,试验组服用大锅药,对照组不服;同样,乙幼儿园儿童随机分成两组,试验组服用大锅药,对照组不服试验组与对照组除治疗药物不同外,其他条件尽可能相同,采用盲法治疗和观察一段时间后,将甲幼儿园试验组与乙幼儿园试验组合并,再将两个幼儿园的对照组合并,比较合并的试验组和对照组的流感发病率有无差别 12.某中医院观察某中药治疗高血压的疗效,用复方降压片作为对照选择住院病人为中药治疗组,为增加实验病人的数量,以门诊病人作为对照,结果实验组效果优于对照组,并且有统计学差异故认为“尽管中药组的病情较重,仍取得较好疗效,如果病情相同,则效果的差异将更明显” 试从统计学的角度对其设计和结论给予评价 答:该结论错误 理由:未进行随机分组,将住院病人分入中药治疗组,门诊病人分到对照组,导致组间混杂因素不均衡。
正确做法:应该选择病情相近的患者作为受试对象(如都为住院或门诊)进行随机分组,比较两组的疗效 12.有人在一般治疗的基础上加用小剂量干扰素及三氮唑核苷治疗流行性乙型脑炎 99 例,采用仅接受了一般治疗的 73 例该病患者作为对照,两组患者在病情严重程度上没有差异病人入院均采用了传统降温、镇静、降颅内压、肾上腺皮质激素及抗生素预防感染等一般治疗在此基础上治疗组选择发病在 5 天以内的病人,加用干扰素和三氮唑核苷静滴两组疗效比较有统计学差异,结论为在一般治疗的基础上加用小剂量干扰素和三氮唑核苷治疗流行性乙型脑炎的疗效优于一般治疗请对此研究予以评价 答:该结论错误 理由:因为未遵循随机分组原则,治疗组选择发病在 5 天以内的病人,导致组间混杂因素不均衡 正确做法:随机分组 《医学统计学》复习资料 第第 41 页,共页,共 42 页页 12.某医师研究果胶治疗铅中毒疗效时,采用治疗前后血铅和尿铅作为观察指标,治疗 40 名铅中毒患者,结果治疗前测得血铅为 0.181±0.029mg/l,尿铅为 0.116±0.009mg/l;治疗后血铅为 0.073±0.019mg/l,尿铅为 0.087±0.010mg/l。
血铅、尿铅治疗前比较 P 值均小于 0.01,差异有统计学意义,结论为:果胶有良好的驱铅作用,可以用于治疗铅中毒患者请你从统计学角度进行分析 答:(1) 该临床试验设计有缺陷,结论不可信 (2) 主要缺陷是对照不足虽然该设计中设置了治疗前后的自身对照,但由于人体内的铅存在自身排泄的现象,可影响试验结果,此时自身对照难以说明结果的可靠性,因此,在试验中应设立空白对照组和标准药物对照组,消除混杂因素的影响 (3) 正确做法:抽取足够数量的铅中毒患者,按随机分配原则将患者分为果胶试验组、空白对照组和标准药物对照组,试验组与对照组除治疗药物不同外,其他条件尽可能相同,采用盲法治疗和观察,结果经假设检验后再下结论 12. “复方黄精片治疗糖尿病的疗效评价”一文,研究者将经确诊符合要求的糖尿病患者随机分为两组,试验组采用复方黄精片治疗,对照组采用淀粉治疗,均在服用 8 周后比较两组血糖水平,发现试验组血糖水平较对照组明显偏低,因而认为复方黄精片有较显著治疗糖尿病效果 问:(1)该设计有无对照?如有,属何种类型?(2)该对照的设置有无不妥?为什么? 答:(1) 该设计有对照,属于安慰剂对照 (2) 对照组设置不妥。
首先,该临床试验的对象为糖尿病患者,而淀粉分解为葡萄糖,具有升血糖作用,是一种混杂因素,因此,试验组与对照组的实验结果没有可比性;其次,糖尿病患者服用淀粉,易加重病情,不符合医学伦理原则 (3) 正确做法:①设置标准对照,即对照组采用某种公认有效的降血糖药物治疗试验组与对照组除治疗药物不同外,其他条件尽可能相同,采用盲法治疗和观察,结果经假设检验后再下结论 12.为评价某种国产抗菌新药的疗效,某医师抽取患有某种疾病且符合入选条件的 60 例患者,按患者经济条件分为两组,每组 30 人经济条件差的为试验组服用该新药,对照组服用同类公认有效的进口药,临床观察结果见表经四格表 χ2检验,得 χ2=2.99,P>0.05,差异无统计学意义 两组患者用药后有效率比较 分组 例数 有效 有效率(%) 国产抗菌新药 30 18 60.0 同类进口药 30 25 83.3 问:(1) 该研究属何种类型? (2) 在设计的过程中是否遵循了实验设计的基本原则? (3) 该临床试验为何种对照? (4) 该医师的结论是否可靠?为什么? 答:(1) 该研究属临床试验设计 (2) 在设计与实施的过程中,该医生是按照经济条件将入选的 60 例患者随意分组,未按照随机化原则分组。
(3) 该临床试验为标准对照 (4) 由于该医生未遵循随机化原则,样本的代表性差,两组患者的非处理因素不均衡,可比性差,因此其结论不可靠 12.为确定某种降糖新药的起始用药剂量,将 21 例新确诊的 2 型糖尿病患者按就诊的先后顺序依次分入低、中、高三个剂量组一个疗程后,比较三组患者的空腹血糖变化值来选择该降糖药的剂量 问:(1) 三组之间是否具有可比性?为什么? (2) 请对此实验设计提出改进意见 答:(1) 无可比性因为受试对象是按就诊的先后顺序依次分入低、中、高三个剂量组的,未遵循随机分组原则,导致各组之间的混杂因素分布不均衡,所以不具可比性 (2) 改进意见:根据随机分组原则,将受试对象随机等分为低、中、高三个剂量组,三组除处理因素不同外,其他条件尽可能相同,采用盲法治疗和观察,结果经假设检验后再下结论 《医学统计学》复习资料 第第 42 页,共页,共 42 页页 12.为评价某降压新药疗效,研究者将经确诊符合要求的 120 例高危高血压患者随机等分为试验组(服用降压新药)和对照组(服用无药理作用的淀粉) ,进行随机、双盲、平行对照临床试验一个疗程后,试验组的舒张压下降值大于对照组(P<0.05) ,故认为该新药有降压作用。
问:(1) 该临床试验的对照属于何种类型? (2) 对照的设置有无不妥?为什么? (3) 请对此实验设计提出改进意见 答:(1) 安慰剂对照 (2) 对照设置不妥高危高血压患者病情严重,服用无药理作用的淀粉(安慰剂)会延误病情和治疗,不符合医学伦理原则 (3) 改进意见:设置标准对照,即对照组采用某种公认有效的降压药治疗试验组与对照组除治疗药物不同外,其他条件尽可能相同,采用盲法治疗和观察,结果经假设检验后再下结论 12.在一项降糖新药安全性和有效性评价的 III 期临床试验中,某课题组选择了东部地区 15 所医院,各抽取 50 例共 750 例 2 型糖尿病患者组成试验组;同法选择了西部地区 15 所医院的 750 例 2 型糖尿病患者组成标准对照组,进行同期盲法对照试验所有医院都按统一的标准操作程序测定受试对象的血脂指标比较两组用药前、用药 4 周和 12 周的空腹血糖、餐后 2h 血糖和糖化血红蛋白等指标,结果表明,用药 12周时试验组糖化血红蛋白含量的平均下降值大于标准对照组(P<0.001) ,故认为该降糖新药疗效好于标准药 问:(1) 试验组和对照组之间是否具有可比性?为什么? (2) 请对此实验设计提出改进意见。
答:(1) 无可比性因为受试对象是按地域分配到试验组或对照组的,未遵循随机分组原则,导致两组间的混杂因素分布不均衡,所以不具可比性 (2) 改进意见:根据随机分组原则,首先将每所医院的受试对象随机分配到试验组和标准对照组,两组除处理因素不同外,其他条件尽可能相同,采用盲法治疗和观察然后将所有医院试验组的数据合并,对照组的数据也合并,比较合并后试验组和对照组血糖变化量有无差别 12.某研究者欲评价多糖铁复合物治疗儿童轻度缺铁性贫血的疗效,在城北小学抽取 60 名确诊为轻度缺铁性贫血的儿童,服用多糖铁复合物为实验组;在城南小学抽取 60 名确诊为轻度缺铁性贫血的儿童,未服用多糖铁复合物为对照组,观察指标是血红蛋白含量结果城北小学观察对象血红蛋白均值明显上升,城南小学观察对象血红蛋白略有提高,但比城北小学低,故认为多糖铁复合物有升血红蛋白作用,能有效治疗缺铁性贫血 问:(1) 该研究者遵循的均衡原则是否合理?为什么? (2) 该研究的混杂因素是什么?(3) 应该怎样正确设计? 答:(1) 不合理该实验设计的缺陷是违背了随机化原则和均衡原则,即不清楚两所小学儿童的家庭经济条件、地理位置、儿童饮食习惯、营养条件是否相同或很相近,因此认为该设计是不均衡设计。
(2) 本研究的混杂因素是饮食习惯和营养条件等 (3) 正确设计:应采用交叉均衡设计,即将城南小学(60 名)、城北小学(60 名)儿童分别随机等分为试验组和对照组,试验组服用多糖铁复合物,对照组不服药观察一段时间后,分别比较城南小学和城北小学试验组和对照组的血红蛋白有无差别,也可将城南小学和城北小学的试验组合并,对照组也同时合并,比较合并后试验组和对照组的血红蛋白有无差别。












