好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

常用统计分析方法介绍与实例解析分析解析课件.ppt

55页
  • 卖家[上传人]:m****
  • 文档编号:591410909
  • 上传时间:2024-09-17
  • 文档格式:PPT
  • 文档大小:1.55MB
  • / 55 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 常用推断性统计分析方法介绍 及其实例解析 浙江省疾病预防控制中心 何 凡 Tel: 0571-87115148; 13777843290 Email: zjhefan@ 1 2 基本概念——变量类型 常用推断性统计分析 1. 两组之间比较—定性资料 2. 两组之间比较—等级资料 3. 两组之间比较—定量资料 4. 两组以上资料(无序多分类)的比较—定性资料 5. 两组以上资料(无序多分类)的比较—等级资料 6. 两组以上资料(无序多分类)的比较—定量资料 7. 两等级变量关系的分析 8. 等级变量与定量变量之间的关系分析 9. 两定量变量关系的分析 10. 多选题分析 11. Logisitic回归分析 目 录 基本概念——变量类型 1、定性变量:、定性变量: ? 最常见的是分类变量或名义变量; 如职业:工人、农民、民工、商人、学生等,此为多分类变量;最简单和最常用的分类变量是二分类变量,如性别:男、女,某种疾病:有、无,某种结局:出现、未出现等 3 ? 有序变量或等级变量 与分类变量不同,各种可能的“取值”中自然地存在着次序,如问卷调查中对某件事情的满意程度:非常不满意、有点满意、满意、很满意、非常满意;临床体检或实验室检验常用-、±、+、++、+++来表示测量结果;再如《护理与康复》,2004,3(1):54-55,临床教学中培养护生观察能力的方法探讨,作者选用了讲座、教学查房和案例教学三种方法,提高护生观察能力的作用变量为:很有帮助、有帮助、一般。

      4 2、定量变量:分两种、定量变量:分两种→→离散型和连续型离散型和连续型 ? 离散型:只能取整数值,如一年中的手术病人数,一年里的新生儿数,细菌菌落数等; ? 连续型:可以取实数中的任何数值,如血压、身高、体重等,可以在实数的一定范围内连续取值;有一些测量值,如红细胞计数,虽然以“个”为单位时只能取连续值,但其数值很大,当以“千”或“万”为单位时,却可取小数值,故通常把这类变量也作为连续型变量处理 5 ? 有时为了数据分析的方便,可以将一种类型的变量转化为另一种类型但只能由高级向低级转化,即连续型→有序→分类→二分类 实例:实例:如《护理与康复》2004,3(1):3-4,全子宫切除术后最佳下床活动时间与肛门排气时间关系的探讨,作者把肛门排气时间分为三个等级(<=24h,25~30h,>30h),然后再进行分析 6 常用推断性统计分析方法常用推断性统计分析方法 7 ? 两组之间比较两组之间比较————定性资料定性资料 (1)二分类资料 I 成组设计:所用统计方法为四格表χ2 2 检验 8 实例 2:血压与冠心病患病之间的关系 结 局 血 压 患病 未患病 血压偏高 19 61 血压正常 20 465 实例1:两种药物治疗某种疾病的疗效比较 疗效 药物 种类 治愈 未治愈 药物A 30 10 药物B 11 49 9 10 II II 配对设计:配对设计:对一组样品同时用两种检测方法对其进行检测,每种检测方法检测结果都分为阳性和阴性,数出两种检测方法同时判定为阳性、阴性的样品数以及它们检测结果不一致的样品数,将结果表示成配对四格表的资料格式。

      所用统计方法为配对四格表χ2 检验 11 实例1:两种探针同时检测的结果 P探针检测结果 生物探针 检测结果 + - + 40 4 - 3 39 实例1中,两种检测方法不知何者为优,任何一种方法检测的结果都有假阳性和假阴性,比较它们检测结果不一致的两个频数,无论差别有无统计学意义,都不能说明两种检测方法何者为优,缺乏“金标准”,因而没有必要做统计分析 实例2属于隐含金标准的配对四格表资料,若甲培养基培养出阳性结果,而乙却培养出阴性结果,表明甲优于乙,这种阳性结果为真阳性,此时值得做统计分析实例3则可以明确地判定试验检测方法的优劣配对四格表的χ2 检验可用McNemar χ2 检验,以检测结果不一致部分差别是否具有统计学意义当然也可用Kappa检验法检验两种检测方法的检测结果是否具有一致性 12 实例2:两种培养基对同一批痰液标本 同时培养的结果 乙培养基 甲培养基 + - + 36 34 - 0 135 实例3:两种检测方法对同一组受试者检测的结果 金标准 试验方法 + - + 31 4 - 3 30 估计值 P值值 卡方 34.0000 5.51121E-09 校正卡方 32.0294 1.51856E-08 估计值 P值值 卡方 0.1429 0.705457 校正卡方 0.0000 1.000000 结果 结果 13 (2)无序多分类资料:所用方法为2×C表的χ2检验。

      14 实例 1:某地城市和农村已婚妇女避孕方法比较 避孕方法 地区 节育器 服避孕药 避孕套 其它 城市 153 33 165 40 农村 320 75 43 18 SPSS数据格式 可以采用两组有序变量资料的可以采用两组有序变量资料的WilcoxonWilcoxon秩和检验 15 ? 两组之间比较——等级资料 干预 过去三个月您抽烟吗 U Value P Value 从不 很少 有时 经常 前 4648 461 345 291 -2.8851 0.0039 后 3163 297 181 164 合计 7811 758 526 455 16 17 可以选用的方法有成组设计的t检验、u检验、单样本t检验(与总体作比较,实际上此时因素也为二分类)、配对t检验、非参数Wilcoxon检验、符号检验、符号秩和检验等 18 参数检验与非参数检验的区别? 通常参数检验的检验效能要高于非参数检验,但当参数检验的条件(正态性、方差齐性)得不到满足、开口资料、等级资料或资料的总体分布未知时,可以使用非参数检验的方法进行分析 成组设计和配对设计的区别? 配对设计是按照一些非实验因素将受试对象配成对子,给予每对中的个体以不同的处理,配对的条件一般为年龄、性别、体重……。

      其优点是在同一对的试验对象间取得均衡,从而提高试验的效率通常分为自身配对设计(某中措施作用于同一个体或两种措施作用于同一个体)和非自身配对设计两种 ? 两组之间比较两组之间比较————定量资料定量资料 (1)成组设计的t检验,设计类型为成组设计,且因素变量为二分类变量,分析前需要先对资料的正态性和方差齐性进行检验(这是很多参数检验的前提条件) 19 例:两组雌鼠,分别饲以高蛋白和低蛋白饲料,8周后记录各鼠体重增加量(克),问两组动物的增重是否有差别?(此处正态性和方差齐性检验略) 利用SPSS进行分析,数据文件及格式见“成组设计t检验.sav ”,SPSS菜单操作为:分析→比较均值→独立样本T检验 结果见下页 Independent Samples T est.015.9051.89117.0761.91113.082.078Equal variances assumedEqual variances not assumed体重增加量FSig.Levene 's Test fo rEquality ofVariancestdfSig. (2-tailed)t-test for Eq uality of Means 方差齐性检验的分析结果,P值(Sig)=0.905>0.05,表明方差齐性 t检验分析结果,P值(Sig)=0.076>0.05,表明两组动物增加的重量无差异(无统计学意义)。

      当方差齐性时,看第一行的结果(t=1.891,P=0.076),当方差不齐时,看第二行的结果(t=1.911,P=0.078) 20 (2)成组设计的u检验,当样本量较大时,两组之间均数的比较可以用u检验,其在SPSS中的实现过程同t检验,此处略 (3)单样本t检验; 21 例:通过以往大规模调查,已知某地婴儿出生体重均数为3.30kg ,今测得某地一组婴儿的出生体重,问该地婴儿出生体重是否与一般婴儿出生体重不同? 利用SPSS进行分析,数据文件及格式见“单样本t检验.sav ”,SPSS菜单操作为:分析→比较均值→单样本T检验 One-Sample Test-1.23211.244婴儿体重tdfSi g. (2-tailed)Test Va lue = 3.30 (4)配对t检验 22 例:用某药治疗10例高血压病人,测得治疗前后各病人的舒张压,问该药是否有降低舒张压的作用? 利用SPSS进行分析,数据文件及格式见“配对t检验.sav ”,SPSS菜单操作为:分析→比较均值→配对样本T检验 结果见下页 Paired Samples T est9.70012.3472.4849.035治疗前 - 治疗后Pa ir 1MeanStd. Devi ationPa ired DifferencestdfSig.(2-tai led)23 (5)非参数Wilcoxon秩和检验,适用于成组设计资料。

      24 例:测得某病的健康人12人和患者10人的某指标值,问两组之间该指标值是否有差异? 25 (1)二分类:所用方法为R×2表的χ2检验 如几种药物的疗效(有效、无效)比较;不同职业人群某病发生率的比较等等 26 实例 三种药物治疗某种疾病的疗效比较 疗效 药物 种类 治愈 未治愈 药物A 30 10 药物B 11 49 药物C 50 20 ? 两组以上资料(无序多分类)的比较两组以上资料(无序多分类)的比较————定性资料定性资料 27 (2)多分类:所用方法为R×C表的χ2检验 28 实例 1:某医院三年间四种甲状腺疾病在 四季中发病人数的分布情况 季 节 甲状腺 病分类 春 夏 秋 冬 甲亢 411 451 294 284 亚甲炎 249 329 331 204 甲低 60 61 59 52 甲状腺肿瘤 45 50 46 40 实例实例 2:心律失常种类与心肌梗塞部位关系的调查结果:心律失常种类与心肌梗塞部位关系的调查结果 部位 心律失 常种类 下壁 前壁 后壁 心内膜下 窦性过缓 8 7 2 1 被动心律 1 1 0 0 房室阻滞 6 3 1 1 束支阻滞 1 16 1 0 实例2中小于5的理论频数的格子数超过了总格子数的1/5,若选用一般的χ2检验公式计算,将增大犯假阳性错误的概率,故此处应选用Fisher's精确检验法。

      29 30 31 此时资料属于单向有序的R R×CC表资料,可以使用秩和检验、RiditRidit分析和LogisticLogistic回归的方法分析 32 实例:三种药物治疗某病患者疗效的观察结果实例:三种药物治疗某病患者疗效的观察结果 药物 种类 疗效 治愈 显效 好转 无效 药物 A 15 49 31 5 药物 B 4 9 50 22 药物 C 1 15 45 24 ? 两组以上资料(无序多分类)的比较——等级资料 Kruskal-Wallis Test: 使用SPSS分析实例2资料,数据格式见右侧截图 菜单操作为:分析→非参数检验→旧对话框→ K 个独立样本 注意:例数必须先进行加权操作 Test Statisticsa,b61.1462.000Chi-SquaredfAsymp. Sig.疗效Krus kal Wallis Tes ta. Grouping Var iable: 药物b. 33 当多组之间比较时,可以选用的方法有单因素方差分析、配伍组设计的方差分析(属两因素方差分析,其与二分类的配对t检验相对应)、非参数Kruskal-Wallis检验及非参数Friedman检验等。

      34 (1)单因素方差分析)单因素方差分析 例:某医生为研究一种四类降糖新药的疗效,以统一的纳入标准和排除标准选择了 60名2型糖尿病患者,按完全随机设计方案将患者分为三组进行双盲临床试验其中,将糖新药高剂量组21人、低剂量组19人、对照组20人对照组用公认的降糖药物,治疗 4周后测得其餐后2小时血糖的下降值问治疗 4周后,餐后2小时血糖下降值的三组总体平均水平是否不同?(此处正态性和方差齐性检验略) 利用SPSS进行分析,数据文件及格式见“单因素方差分析.sav”,SPSS菜单操作为:分析→比较均值→单因素 Anova ? 两组以上资料(无序多分类)的比较——定量资料 截图二:两两比较对话框,常用的有LSD、S-N-K、Bonferroni、Duncan、Dunnett方法 35 截图一:方差同质性检验 Test of Homogeneity of Variances血糖下 降值.177257.838Levene Statisticdf1df2Sig.ANOVA血糖下 降值176.76 5288.3 825.53 7.0 06909.87 25715.9 63108 6.6 3759Between Grou psWith in Gro up sTotalSum of Sq uaresdfMean Sq uareFSig.方差齐性检验结果:P>0.05,方差齐 方差分析结果,F=5.537,P=0.006<0.05,说明三组之间总体平均水平不同。

      因而进一步用Dunnett法作多个试验组与一个对照组间的比较(见下页) 36 Multiple ComparisonsDep en den t Variab le: 血糖下降 值3.39 52*1.26 50.010.8625.92 83.76 52*1.24 83.0041.26 66.26 5-3.3 95 2*1.26 50.010-5.9 28-.86 2.370 01.28 00.774-2.1 932.93 3-3.7 65 2*1.24 83.004-6.2 65-1.2 66-.37 001.28 00.774-2.9 332.19 33.39 52*1.26 50.029.2756.51 63.76 52*1.24 83.011.6866.84 4-3.3 95 2*1.26 50.029-6.5 16-.27 5.370 01.28 001.00 0-2.7 873.52 7-3.7 65 2*1.24 83.011-6.8 44-.68 6-.37 001.28 001.00 0-3.5 272.78 73.76 52*1.24 83.007.9346.59 7.370 01.28 00.941-2.5 333.27 3(J) 组别低剂量组对照组高剂量组对照组高剂量组低剂量组低剂量组对照组高剂量组对照组高剂量组低剂量组对照组对照组(I) 组别高剂量组低剂量组对照组高剂量组低剂量组对照组高剂量组低剂量组LSDBo nferroniDu nn ett t (2 -sided)aMeanDifferen ce (I-J)Std. Erro rSig.Lower Bo un dUpper Bo un d95% Co nfidence IntervalThe mean difference is significant at the .05 level.*. Dunnett t-tests treat one group as a control, and compare all other groups against it.a. 37 (2 2)非参数Kruskal-Wallis检验 例:仍以上述资料为例,假设此时资料不符合正态性或方差齐性的要求,我们使用非参数Kruskal-Wallis检验进行分析。

      SPSS菜单操作为:分析→非参数检验→旧对话框→ K 个独立样本 38 I 当两变量属性不同时,称这样的列联表资料为双向有序且属性不同的R×C列联表资料 39 两等级变量关系的分析 实例 1:地方性甲状腺肿患者各年龄组疗效的观察结果 疗效 年龄 (岁) 治愈 显效 好转 无效 11~ 35 1 1 3 20~ 32 8 9 2 30~ 17 13 12 2 40~ 15 10 8 2 50~ 10 11 23 5 此时,根据分析目的的不同,可以选用不同的分析方法 40 (1)只关心各年龄组患者治疗结果之间的差别是否有统计学意义,此时可将其视为单向有序的R×C列联表资料,可以选用的统计方法有秩和检验、Ridit分析或Logistic回归分析等 (2)希望考察年龄与疗效之间是否存性相关关系,此时可以选用处理定性资料的相关分析方法,通常采用Spearman秩相关分析方法(见下页) (3)若两个有序变量之间的相关关系有统计学意义,希望进一步知道两者之间的变化关系是呈直线关系还是呈某种曲线关系,此时宜选用线性趋势检验 (4)若仅希望考察R×C表各行上频数分布是否相同,此时可以选用一般的卡方检验或Fisher‘s精确检验法。

      利用SPSS进行Spearman相关分析,分析→ 相关→ 双变量… 41 Correlations1.000.416**..000219219.416**1.000.000.219219Correlation CoefficientSig. (2-tailed)NCorrelation CoefficientSig. (2-tailed)N年龄疗效Spearman's rho年龄疗效Correlation is significant at the 0.01 level (2-tailed).**. 数据 格式 分析结果 相关分析对话框 II 当两变量属性相同时,称这样的列联表资料为双向有序且属性相同的R×C列联表资料 42 实例 1: 446 例流行性出血热病情转化情况 最后定型 早期 分度 轻型 中型 重型 轻型 111 21 1 中型 5 163 20 重型 0 1 124 实例 2: 100 例脑肿瘤患者的临床诊断与 CT 诊断的结果 CT 诊断结果 临床诊断结果 检出 疑似 未检出 检出 60 4 2 疑似 4 12 3 未检出 3 3 9 左侧两组资料都希望回答两种方法结果是否具有一致性的问题,这其实是配对四格表资料的扩展,只不过,在处理配对四格表资料时,人们更关心两种检测方法的检测结果不一致部分的数量之间的差别是否具有统计学意义,而在处理此类资料时,更关心的是两种检测方法检测结果之间是否具有一致性,常用一致性检验(或称Kappa检验)方法。

      43 44 此时可以使用Spearman相关分析或用有序变量的Logistic回归分析方法进行分析如研究收入水平对一个人自感健康状况(很好、好、一般、不好、很不好)的影响在SPSS中的分析过程同上,此处不再详细介绍 45 ? 等级变量与定量变量之间的关系分析 ? 两定量变量之间的关系分析 可以做相关分析或回归分析,分析两个变量之间的相关性或依赖性 小结小结 ? 资料类型: 定性(无序多分类、二分类) 等级(有序) 定量 ? 分析方法: 卡方检验:定性 T检验:两组,定量 方差分析:>=三组,定量 Wilcoxon:两组,等级、定量 Kruskal-wallis:>=三组,等级、定量 相关分析:等级(kendall),非正态、定量(spearman) 正态、定量:pearson相关分析 46 多选题的两种形式:多选题的两种形式: 47 ? 多选题分析多选题分析 第一种形式: 您认为健康的生活方式包括哪些内容: a. 戒烟、限酒 b. 平衡膳食 c. 心胸开阔 d. 多吃保健品、营养品 e. 控制体重 f. 多吃多睡 g. 经常运动 h. 不知道 第二种形式: 对公众进行流感或人禽流感预防和控制等方面最主要的宣传形式(限选三种)______ a.报纸 b.杂志 c.电视 d. 广播 e.网络 f. 发放宣传材料 g.社区宣传栏/墙报/街头标语 h.社区咨询 48 49 Logistic回归分析 ? Logistic回归是适用于反应变量(即因变量)为分类变量的回归分析,近年来在许多研究领域得到了广泛的应用。

      ? Logistic归按照反应变量的类型可分为: ?两分类反应变量的Logistic回归; ?多分类有序反应变量的Logistic回归; ?多分类无序反应变量的Logistic回归 ? Logistic回归按照研究设计的类型可分为: ?非条件Logistic回归,即研究对象未经匹配; ?1:1的条件Logistic回归,即研究对象按1:1进行匹配; ?1:m或m:n的条件Logistic回归,即研究对象按1:m或m:n进行匹配 51 单因素 52 多因素 53 单因素分析结果 多因素分析结果 ?条件条件Logistic回归分析(回归分析(n:m的个体匹配设计)的个体匹配设计) 54 危险因素 人数 % OR 95%CI 病例 对照 病例 对照 收玉米 8 14 27 25 1.3 0.31-5.6 收黄豆 16 13 52 23 3.6 1.4-9.6 种麦 23 47 82 83 0.89 0.17-4.7 某市恙虫病发病危险因素病例对照研究结果某市恙虫病发病危险因素病例对照研究结果 55 。

      点击阅读更多内容
      相关文档
      高等学校学生手册.doc 2025年区教育系统招聘编外教师储备人才事业单位考试押题.docx 2025年秋季青岛版三年级数学上册认识轴对称现象教学课件.pptx 2025年秋季青岛版三年级数学上册用乘法估算解决问题教学课件.pptx 2025年秋季青岛版三年级数学上册两、三位数乘一位数的笔算(不进位)教学课件.pptx 2025年秋季青岛版三年级数学上册1200张纸有多厚教学设计范文.docx 2025年秋季青岛版三年级数学上册多位数除以一位数教学课件.pptx 2025年秋季青岛版三年级数学上册认识平移、旋转现象教学课件.pptx 2025年秋季青岛版三年级数学上册多位数乘一位数教学设计范本.docx 2025年秋季青岛版三年级数学上册认识平移与旋转教学设计范文.docx 2025年秋季青岛版三年级数学上册乘数中间有0或末尾有0的乘法教学课件.pptx 2025年秋季青岛版三年级数学上册两位数乘一位数的笔算(进位)教学课件.pptx 2025年秋季青岛版三年级数学上册《两、三位数乘一位数的笔算(不进位)》教学设计与意图.docx 2025年秋季青岛版三年级数学上册我学会了吗教学课件.pptx 2025年连云港市妇幼保健院招聘专业技术人员考试笔试试题.docx 2025年深圳市大鹏新区发展和财政局招聘考试笔试试卷.docx 2025年绵阳市梓潼县财政投资评审中心招聘考试试题.docx 2025年来宾市妇幼保健院招聘考试笔试试题.docx 2025年无极县教育系统招聘教师考试笔试试卷.docx 2025年灵山县第三中学调配教师考试笔试试题.docx
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.