
试验设计之调查研究设计.ppt
63页调查研究设计童新元 中国人民解放军总医院试验设计之二名人格言• •在观察领域中,机遇总是偏爱有在观察领域中,机遇总是偏爱有 准备的头脑准备的头脑• •------路易丝路易丝. .巴斯德(法国微生物学家,巴斯德(法国微生物学家,1822-18951822-1895))•“没有调查,就没有发言权一、 试验设计基础回顾•进行一项科学试验如同建造一座大厦,试 验设计如同建筑设计一样举足轻重•设计的工作量和经费占总试验5%. [投入]•一项完美的科研设计,预示该项研究已至少 完成75% [产出] 1 试验设计的三要素•1)、试验因素•2)、试验对象•3)、试验效应2 实验设计的三原则随机对照重复(均衡)经典案例1 已烯雌酚的作用•已烯雌酚DES是一种人工激素,用于防止自 发性流产二十世纪六十年代,美国每年给5 万名妇女发放这种药,治疗自发性流产•问题:•采用已烯雌酚治疗对防止妇女流产好吗?妇女怀孕后自发性流产的药物治疗•医学、统计学家Chalmers等收集了8次临 床研究报告,它们都是来评估DES的作用 的。
—————————————————————设计 赞成用 不赞成用 —————————————————————历史对照 5 0随机对照 0 3 —————————————————————• 1966至69年间,美国妇产科医生Herbst在 波斯顿发现8例女青年患一种极罕见的阴道 透明细胞腺癌她研究其发病的原因.•Herbst调查发现其中有7例服用DES经过 严密试验设计(1:4病例对照研究)证实 DES的负作用,它增加阴道癌的危险性.•美国FDA于1971年禁止给妇女服用该药经典案例2 霍乱原因的研究•1848-1849年, 英国伦敦地区霍乱流行,流行 病学家研究其原因,当时对霍乱的流行原因主 要有两种观点:•一种是Farr 的混浊空气致病“瘴气”学说;•另一种是J. Snow提出的“水污染所致的传染 病”的假说谁对谁错?•当1853-1854年霍乱再次流行时,Farr和 Snow一起分析资料。
Snow对比了伦敦自 来水厂供水范围的霍乱死亡人数•分别在污染轻的泰晤河上游取水和污染重 的泰晤河下游取水分析用户数、死亡数 、 死亡率表1-2 1853-1854年伦敦霍乱死亡率 —————————————————————水源 用户数 死亡数 死亡率(1/万户) —————————————————————重污染 40046 1263 315.4轻污染 26107 98 37.5*伦敦其它地区 256423 1422 55.5* —————————————————————*表示与重污染地区比较,P<0.05表1的统计结果支持Snow水污染的假说医学生物学证实• 1883年,R. Koch在水中发现霍乱弧 菌,最终证实了Snow提出的“水污染所致 的传染病”的假说,否定了Farr 的混浊空 气致病“瘴气”学说 经典案例3 吸烟与健康关系的研究•现在国家卫生部在全民健康教育中宣传 大量吸烟、过量饮酒会危害健康,而运 动、积极乐观的心情会有利于健康。
但确实有情况不少相反的个例,如邻居甲 每天既大量吸烟又过量饮酒,活到90岁 仍身体健壮,但邻居乙既不吸烟又不饮 酒,40岁就死于肺癌现代医生的职责•传统医生的职责”治病救人,救死扶伤”•现代医生的职责还需要”健康教育” •做为现代医生当你遇到一个”烟鬼”,怎么样 对患者进行健康教育呢?•要使人信服全民健康教育的宣传,就必须 提供的科学研究结果,令人信服的数据以 理服人吸烟与肺癌的研究及结果•1950年,英国Doll and Hill进行大规模 研究他们根据自已的观察先提出一项假 说:吸烟导致肺癌.设想如下:1)将肺癌与非肺癌患者配对,肺癌组吸 烟者应比非肺癌组多,吸烟史也应更长;2)将吸烟者与非吸烟者配对随访,吸烟 者组肺癌发病率应比非吸烟组高;研究设计•研究者向60,000名英国医生发出关于吸 烟的问卷, 其中40,000名应答, 据此将 他们分成吸烟组和不吸烟组•借助英国良好的死亡登记系统追踪他们 的结局,时间从1950年至1964年•然后统计学家对数据进行分析.吸烟与发病的关系 相对危险度RR 24 1.4让数据说话•统计表中的数据显示:•吸烟得肺癌相对危险度是不吸烟的24倍.•吸烟得心脏病相对危险度是不吸烟的1.2倍.• 要使人信服全民健康教育的宣传,就 必须提供的科学研究结果。
即显示吸烟人 群的死亡率(或发病率)与不吸烟、不饮酒人 群的对比结果两种不同设计类型•从设计上看,霍乱流行的原因,吸烟与肺癌关系研 究同已烯雌酚作用的研究有什么本质的不同?•已烯雌酚的作用研究中,医生根据医学经验知识加 给病人的干预治疗法,病人可以服,也可以不服.•吸烟与肺癌关系的研究中,研究者不可能随机的安 排一部份人去吸烟,安排另一部人不吸烟, 吸烟 与否是受试者自选的.两种设计类型•干预试验 (动物实验,临床试验)•观察研究 二、调查研究设计•研究者无须或无法施加干预措施,而是对现 场发生的实际情况进行观察,称为调查研究 (Investigation Study),亦称观察研究( observation study)例如:•研究肥胖对冠心病的影响情况;•研究当今中国儿童生长发育情况;•研究分析经济危机形成的原因;••无法随机化分组•组间不均衡•存在混杂因素•例如, 肥胖对冠心病的影响研究中,研究者不可 能象药物研究那样, 随机地安排一部份人去肥 胖,安排另一部人不肥胖两组人群中存在着很 多因素不均衡的因素混杂, 从而需要特殊的统 计学设计和分析调查研究资料的特点1) 调查方法•根据调查的范围和调查对象的选择方式 可分为:•普查•抽样调查1.普查(overall survey)•亦称全面调查(complete survey),将组 成总体的所有观察单位全部加以调查•普查一般都是用于了解总体某一特定“时点” 的情况,如年中人口数、时点患病率等。
•如我国人口普查等•优点:•①理论上只有普查才能取得总体参数, 因为普查没有抽样误差;•②普查能全面地了解总体的分布特征•缺点:•①普查工作量大,较费时费力;•②调查质量难以保证,系统误差大2.抽样调查(sampling survey)•抽样调查是从总体中随机抽取一定数量的 观察对象组成样本,用样本信息推断总体 特征•抽样调查是统计学上第一次技术革命.• 抽样调查技术通过部分认识整体,同时,节 省大量时间大量的人力,物力和成本优缺点•优点:①费用较少,速度较快,覆盖面较大, 正确性较高;②许多医学问题只能作抽样调查 ,如药物疗效观察等 •缺点:调查设计、实施及资料分析复杂,若样本 达到总体75%时则直接采用普查•例如,在美国大选中,对1000名至3000名选民 进行调查,来预测近1亿选民的投票情况,抽样 误差不超过3%2) 抽样方法•简单随机抽样(simple random sampling)•系统抽样(systematic sampling)•分层抽样(stratified sampling)•整群抽样(cluster sampling)㈠简单随机抽样 P10•简单随机抽样亦称单纯随机抽样要求每个观察对 象有同等概率被选入样本。
•从有N个观察单位中抽取m个观察单位方法: •先将N个观察单位编号,并且每个赋一个随机数 再将N个随机数排序,前m个随机数对应的观察 单位编号即为所抽取•优缺点 简单随机抽样是最基本的抽样方法,优 点是均数(或率)及其标准误的计算简便,缺点是 当总体例数较多时,实施抽样比较困难适用于 小型调查CHISS的实现•例如,现在某校有500名研究生,要随机抽 取10%,即50同学参加比赛,问:该如何抽取 ?CHISS实现•1 编号建数据库 将500学生的学号录入数据库 中,建立数据库,并每人给一个编号从1,2,…500 .•2 产生随机数 点击 •设计→实验设计→随机化方法→产生随机数•选择条件:正态分布,数据行数为500,正态分布 平均数为0,标准差为1 •3 排序 按随机数从小到大排序,前50名即为所 求•数据→行编辑→数据排序 选变量:RND正态•→数据练习题•现在某班有20个同学,要从中随机抽取5名参 加比赛,如何平公的进行抽取?㈡系统抽样•系统抽样又称等距抽样或机械抽样方法是按 照一定顺序,机械地每隔若干个观察单位抽取一 个观察单位组成样本• 例如:要从1000户中抽取100户作样本,可先 在门牌号1~ 10号之间随机抽取一户(假定为第 5号住户),其后每间隔10号抽取一户,即抽取5、 15、25、35、…、995,共100户组成样本。
•抽样间隔=总数/样本含量•3.优缺点 优点是易于理解,简便易行,容 易得到一个按比例分配的样本;缺点是 一般情况下,虽然系统抽样的抽样误差小 于简单随机抽样,但是在某些特殊情况下 可能有偏性•例如:上述例子中我们抽取的住户均为 单号,其住房可能都是一个朝向,若作采光 等卫生学调查,将产生明显的偏性•典型案例:央视收视率调查㈢整群抽样•先将总体划分为K个群,每个群包括若干 个观察单位,再随机抽取t个“群”(kt) ,并将被抽取t个群的全部观察单位组成样 本•例如:要检查某学校学习情况时,随机抽取 几个班,对几个班的全部同学进行考查•优缺点 优点是在大规模调查中,整群抽 样易于组织,可节省人力物力,容易控 制调查质量;缺点是一般来说各群间差 异较大,所以抽样误差较大㈣分层抽样•先按影响观察值变异较大的某种特征,将总体分为 若干层(strata),再从每层内随机抽取一定数量的 观察单位组成样本(样本含量为n)又称分类抽样•优缺点 ①抽样误差比较小;②先要将总体分层, 层内个体差异越小越好,层间个体差异越大越好, 便于对不同的层采用不同的抽样方法CHISS的实现•例如,某校有3个不同专业的研究班,每班10个同学, 现要从每班各随机抽取3名同学参加比赛,如何抽取 ?•CHISS实现步骤:•1 编号建数据库 将30学生的学号及班级录入数据 库中,建立数据库.•2 产生随机数 点击 •设计→实验设计→随机化方法→分层抽样•选择分层变量:班级每个班人数都赋值为3•→数据 查看抽样结果: 1标记为被抽取对象练习题•现某年级2个班,1班6名同学,2班9名同学, 现要从1班随机抽取2名同学, 2班随机抽 取3名同学参加比赛,如何抽取?各种抽样方法抽样误差的关系•各种抽样方法的存在抽样误差,一般是:•整群抽样单纯随机抽样系统抽样分层 抽样。
三、 调查设计的主要内容(一)调查研究的目的和任务 • •对所调查的目的应当十分明确,通过调 查要解决什么问题每次调查都应紧紧 围绕一个中心, 不能分散调查的内容,致 使调查内容庞杂,达不到预期效果•如2004年,一个十五攻关课题:“慢性乙肝 中医辩证规范及疗效评价体系的研究” •从统计学的角度来说,调查主要解决两个 问题:•一是了解参数,用以说明总体的特征,如 某当今中国儿童的身高均数、体重均数等 ;•二是研究事物间的相关联系,如吸烟与冠 心病的联系、肥胖与糖尿病的联系等二)暴露因素和观测指标。
