
科研设计相关统计基本概念和原则.ppt
45页基本概念和原则基本概念和原则实验研究之前,在设计阶段,须要考虑统计,尤其运用统计的原则l样本与总体l同质与差异l变量的类型l因果与联系基本概念和原则基本概念和原则l对照原则:比较才能鉴别,控制非处理因素的影响注意事项:其它因素同实验组,两组均衡或齐同,两组样本量要相等l对照形式空白对照:不加任何处理动物致癌实验,需设置种属、年龄、性别、体重相同的动物为空白;临床实验?阳性对照:必然产生阳性反应证实实验方法的敏感性自身对照:对照与实验在同一受试对象进行基本概念和原则--例子基本概念和原则--例子l超细SiO2颗粒对细胞的毒性作用l纳米硫化铅对大鼠精子形成的影响空白对照组,超细颗粒实验组(不同剂量),??l某市苯作业人员职业健康检查分析以到本中心参加体检的220名苯作业工人为接触组,以参加体检的不接触有害物质的421名人员为对照组,??l某石化公司汽油作业人员职业健康检查分析2011年参加体检的某石化公司1357人为对象,男、女两组,?基本概念和原则基本概念和原则l随机化:由此控制那些次要的、大量的、不能控制的因素而那些主要的、少量的、可控制的因素可以均衡原则来排除l重复原则动物实验研究动物实验研究---随机化原则随机化原则动物分组1. 完全随机实验设计:将动物完全随机地分配实验与对照组或几个比较组中去。
优点:设计和统计处理简单缺点:效率不高例子:20只同性别大鼠,随机分为甲乙两组动物实验研究动物实验研究---随机化原则随机化原则按其体重依次编号为1,2,3…,20甲组动物号 1,3,7,8,10,11,12,19,20 (9只)乙组动物号 2,4,5,6,9,13,14,15,16,17,18 (11只)动物实验研究动物实验研究---随机化原则随机化原则应从乙组随机地抽一只动物到甲组中去:随机数字表,查的第6行第21栏数字为56,除以11得余数1,应把乙组第一只动物调整到甲组甲组动物号 1,3,7,8,10,11,12,19,20 (9只)乙组动物号 2,4,5,6,9,13,14,15,16,17,18 (11只)甲组动物号 1, 2,3,7,8,10,11,12,19,20 (10只)乙组动物号 4,5,6,9,13,14,15,16,17,18 (10只)动物实验研究动物实验研究---随机化原则随机化原则2. 配对的实验设计在实验设计中将实验对象按某些特征配成对子2.1 同源配对:例如同窝、同性别、同年龄、同体重的动物配成对子,每对一只进入实验组,另一只进入对照组2.2 自身配对:实验对象自身实验前后的对比2.3 其它配对:。
动物实验研究动物实验研究---随机化原则随机化原则动物实验研究动物实验研究---随机化原则随机化原则3. 随机区组的实验设计这种设计实际上是配对设计的扩大,是将多方面相近的实验对象配成一组,叫做一个区组每个区组实验对象的数取决于对比组的数目,如果一个实验组有四个对比组,那么一个区组就有四个实验对象每个区组的实验对象按随机方法分到各个对比组去动物实验研究动物实验研究---随机化原则随机化原则例子:20只动物,设计分为5个区组,进行四种处理的比较首先将多方面相似的4只动物配成一个区组,按体重依次编号,如1-4号为第一区组,5-8号为第二区组,余类推按随机数字表法分别将其分到四种处理组去动物实验研究动物实验研究---随机化原则随机化原则l余数确定前三只动物的组别如第一区组中第一个余数为2,在“甲乙丙丁”四字中,列第二位的为乙,故将第1号动物列入乙组;第二个余数也为2,此时在“甲丙丁”三字中,列在第二位的为“丙”,将二号动物分入丙组余类推 分层分层((stratification))l分层:根据特定标准如年龄,社会经济状况等将一个样本分成几个亚组的过程或结果l分层分析目的在于控制研究因素以外的其它混杂因素的影响。
l例如:研究大气污染和肺癌之间的联系,应控制吸烟这个混杂因素,即将人群按照吸烟与否(或程度)分层然后,在各层内评价大污染与肺癌的关系目的:控制混杂因素,也是检测效应修饰作用均衡性问题均衡性问题有人观察噬菌体预防痢疾的效果选择一个托儿所为实验组(服噬菌体),另一个托儿所为对照组(不服用)然而,两个托儿所卫生条件相差大:实验组卫生条件好,对照组条件差结果:实验组痢疾发病率比对照组低,且差异显著但是,它是卫生条件还是噬菌体的作用,分不清改进办法:①??? ② 对照例数问题对照例数问题 对照例数问题对照例数问题注:两组例数相等,其合并标准误最小,检验的效应高数据(资料)的性质数据(资料)的性质l计量资料:测定获得的数据资料l等级资料:介于二者间的,档次、等级数据资料l计数资料:靠清点数字获得的百分数的问题百分数的问题l对于百分数,须理解、分清楚它的含义:l率(%):表示事件(疾病)发生的频率,如:患病率、发病率l比:表示二者的比,某部分占总体的构成比武钢尘肺构成武钢尘肺构成上海市青浦区工业性手外伤患者的流行病上海市青浦区工业性手外伤患者的流行病学研究学研究 l方法:收集2009年在复旦大学附属中山医院青浦分院住院的急诊工业性手外伤患者资料 l结果:以每天12-18时为事故高发时段(61例,48.8%)。
每年3、4月份(25例)及 7、8月(32例)份为事故高发期 l结论: 针对其发病特征制定预防措施,可降低发病率 患病率与发病率l患病率(prevalence rate):某个时点(或时期)内患有某疾病的人数占该时间点(或观察期中点)可能患有某病人数之比l断面调查(cross sectional study)获得的率是患病率表表2.2.某汽车厂不同性别工人MSDs年患病率疼痛部位患病率及患病率及95% CI95% CI((% %))男子妇女合计颈*44.4(39.3-49.4)68.4(63.7-73.1)50.3(45.2-55.4)肩*37.1(32.2-42.0)59.8(54.9-64.8)42.7(37.7-47.7)背*32.3(27.5-37.1)44.3(39.3-49.4)35.3(30.4-40.1)肘12.6(9.23-15.9)11.4(8.20-14.6)12.3(8.97-15.6)腰*58.3(53.3-63.3)66.2(61.3-71.0)60.2(55.3-65.2)腕/手*29.7(25.0-34.3)34.3(29.4-39.1)30.8(26.1-35.5)髋/臀12.0(8.76-15.4)12.7(9.33-16.1)12.2(8.90-15.5)膝25.6(21.1-30.0)25.4(21.0-29.8)25.5(21.1-30.0)踝/足19.6(15.6-23.7)18.1(14.2-22.1)19.2(15.2-23.3)* 08年10月调查某汽车厂3800名工人,性别间比较,卡方检验,P<0.05某化工厂职业性三硝基甲苯白内障发病情况分析方法:该厂300名工人为调查对象,职业健康检查。
患病率与发病率l发病率(incidence rate):人群中新事件(疾病)的发生速率分子为新事件数(即规定时期内,报告或诊断的新病例数),分母为病例所在人群的总数l发病率由队列调查(Cohort study)获得数据统计分析的原则数据统计分析的原则l计量资料:t 检验,方差分析l等级资料:秩和检验l计数资料:卡方检验数据统计分析数据统计分析l计量资料:lt 检验:要求两组方差齐同,数据成正态分布方差分析也如此l两个均数的检验l样本与总体l配对t 检验数据统计分析数据统计分析l方差分析(analysis of variance, ANOVA),也称F检验,一般用于多组均数的检验l单因素l多因素l两因素之间的比较,有多个模型l也要求组间方差齐同,数据成正态分布数据统计分析数据统计分析l卡方检验(chi-square test ),用于率的检验l四格表l2XK表l行列表l配对资料的卡方检验数据统计分析数据统计分析l相关与回归分析(correlation and regression analysis):分析两个事物(现象)之间的关系如果相关,再做回归分析,以公式数量表达这种关系。
l注意有无因果关系l作为原因的变量称为自变量,作为结果的变量称为因变量数据统计分析数据统计分析l秩和检验:用于等级资料的分析,及介于计量和计数之间的那些档次、等级数据资料l不知道某资料是否呈正态分布,或不呈正态分布,可用此检验l在t检验和方差分析均可用到秩和检验l秩和检验比较粗略样本例数问题样本例数问题l原则:l计数资料:患病、发病率需要大样本:200-300例,几千例,甚至达到上万l计量资料:无须太大的样本:10例,几十l它与事件发生频率、指标的标准差、显著性水平有关l办法:计算样本量;参考文献样本大小的估计方法凭经验估计(约定俗成)凭经验估计(约定俗成) 正常值范围估计(正常值范围估计(100 100 人以上)人以上) 肿瘤调查(万人以上,几千人)肿瘤调查(万人以上,几千人) 人口普查(人口普查(10%10%,,5%5%))查表法(本教材中未给出)查表法(本教材中未给出)尝试法(估计法)尝试法(估计法) 常用的样本大小估计方法 ——两样本均数比较两样本均数比较公式 完全随机设计、两组、数值变量 α 可取单侧或双侧,一般取0.05; β 只取单侧,一般取0.10,最大取0.20, s 取s1和s2中大者, ,t和t的取值与n有关,不能直接估计n。
用uα和uβ代替 t和t ,其结果再加2-3例即可。












