
5.队列研究_20150501085252.ppt
49页朱 益 民浙江大学医学院流行病学与卫生统计学系,队列研究cohort study,,流行病学研究基本方法,一、队列研究原理,按照研究对象是否暴露于某因素或暴露于某因素的不同水平,分为暴露组和非暴露组然后随访一定时间,观察和比较两组某种结局的发生率如发病率或死亡率,以检验该暴露因素与疾病之间的关系a,b,a/(a+b),,,,,c,d,c/(c+d),前瞻性观察,现 在,将 来,,队列研究基本模式,暴露组,非暴露组,队列研究特点,观察性研究方法前瞻性研究从因到果研究设立对照组,前瞻性研究 prospective study发生率研究 incidence study随访研究 follow-up study定群研究,队列研究类型,,,,,,随访观察,,,,,,,追溯收集历史资料,,过 去,现 在,将 来,回顾性,前瞻性,,,双向性队列研究,回顾性队列研究实例,胃癌普查人群,,胃粘膜标本蜡块保存,,,,发 病,未发病,,,,,,HP+,HP-,,98年,70年代,HE染色,巢式病例对照研究,又称套叠式或嵌入式病例对照研究,也称队列内病例对照研究(case-control study nested in a cohort)将队列研究与病例对照研究相结合的一种研究方法。
在队列研究的基础上,收集队列成员基线时的暴露资料和生物标本以随访期内发生的病例组成病例组,按照病例的发病时间,以未发病的人群中,随机选择对照组研究方法与分析方法与普通病例对照研究相同(配比或成组的病例对照研究)分为前瞻性巢式病例对照研究和回顾性巢式病例对照研究,,,随访,收集生物标本,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,病例对照分析,起点,确定队列人群,,收集基线资料,标本库,数据库,基线调查,,病例,,对照,数据分析,巢式病例对照研究模式,巢式病例对照研究特点,在疾病发病前收集暴露资料,信息偏倚和选择偏倚较小;病例与对照来自于同一队列,可比性好;统计效率和检验效率高于传统病例对照研究,可以计算发病率 研究样本量小于经典的队列研究,节约人力和物力;符合因果推断的时间顺序,论证强度高维生素D与胰腺癌危险性,1.研究目的:体内维生素D与胰腺癌的危险性2.研究方法 巢式病例对照研究3.研究人群 在1985-1988,芬兰一个男性队列人群年龄在50至69岁,已收集基线暴露资料和血清标本低温保存 病例:在1985.1-2001.12期间诊断的胰腺癌200例; 对照: 在随访队列中,在病例发病时存活的、未患肿瘤的队列人群。
按年龄(±5岁)、基线抽血时间(±30天)、1:2匹配4. 检测25(OH)维生素D水平5. 病例组和对照组25(OH)D水平差异不同血清维生素D水平与胰腺癌危险性,二、队列研究设计,1.明确研究目的2.研究方法的选择3.研究因素的选择谨慎选择研究因素主要研究因素和混杂因素暴露因素测定 通过访谈、实验室检查和查阅记录定性、半定量或等级(暴露分级)和定量:暴露的强度;接触的时间;暴露方式 测量方法的标准化,研究对象条件:代表性、易感人群、基线时无结局暴露组选择 暴露人群的条件:已处于暴露因素之中或有特殊的暴露史;能提供可靠的暴露史; 来源:特殊暴露人群、职业人群、某地区自然人群、有组织的人群或团体非暴露组的选择:条件:不具有暴露因素;可比性 形式:内对照:一群研究对象内部 外对照:一群研究对象外部 一般人群对照:所在整个地区的发病或死亡资料 多种对照:两种或以上的对照形式,4.研究对象选择,固定队列:年龄老化,人数减少(发病、死亡)变动队列:符合自然队列特点、年龄结构稳定、人数较稳定,固定队列,变动队列,样本含量,影响因素 1.一般人群中所研究疾病的发病率; 2.两组研究人群发病率之差; 3.第类错误(显著性水平); 4.第类错误,研究效能power=1- 估计方法:查表或根据公式计算,P1、 P0为暴露组和非暴露组的估计发病率;q1=1-P1,q0=1-P0;P=(P0+P1)/2,q =1-P;Zα和 Zβ为分别α和β水平时的正态离差,5. 随访,目的:队列人群发生结局人数(分子);研究对象是否仍处于观察之中(分母);收集暴露和混杂因素的信息 随访内容:暴露因素及变化资料;混杂因素资料;失访和人口变动资料;结局资料 结局(outcome):指研究者预期的结果事件,或研究对象出现的结果,如发病、死亡或生化检查的异常等。
结局判断标准随访时间:开始随访时间和终止时间;终点出现时间;获得足够病例(分子)所需的人数;潜伏期随访的方法和途径,,基线资料调查:包括研究对象的暴露状况、疾病与健康状况、年龄、性别、职业、文化、婚姻等个人状况、家庭环境、个人生活习惯及家族疾病史等 获取基线资料的方式有: 查阅记录或档案 访问研究对象或其它能够提供信息的人 对研究对象进行体格检查和实验室检查 环境调查与检测定期的健康检查,,三.队列研究资料分析,分析内容 1. 发病(或死亡)率的计算 2. 显著性检验 3. 联系强度分析,计算发病(或死亡)率,1.累积发病率(cumulative incidence, CI) 观察人口数固定时:2. 发病密度 ( incidence density,ID)当观察人口数有变化时(增加或失访等)人时(person time):,年龄组 1980年 1982年 1983年 1984年 1985年 1986年 1987年 合 计 (岁) 1月1日 1月1日 1月1日 1月1日 1月1日 1月1日 1月1日 人年<45 607 547 471 392 324 246 210 …… 2,875.545-54 598 596 604 599 603 625 598 …… 5,27955-65 369 406 433 472 493 496 519 ……. 4303.565- 62 75 95 111 132 158 180 …… 1,386合计 1636 1624 1603 1574 1552 1525 1507 ……..1,3844 计算年龄组死亡率时,以死亡时属该年龄组的对象为分子,以该年龄组合计暴露人年数为为母。
大样本人年的计算(近似法),男性各年龄级各年末存活人数,寿命表法,当年进入队列或退出队列(失访或出现结局)均按观察1/2人年计算、,显著性检验,组 别 发病数 未发病数 发病率暴露组 a b a/a+b非暴露组 c d c/c+d合 计 a+c b+d N,,,,,二项分布U检验 直接概率法 泊松(Poisson)分布检验 2检验 计分检验(score test),联系强度分析,1.相对危险度(relative risk, RR)RR>1.0,表示该暴露因素是危险因素,RR越大,联系强度越高;<1.0,表示该因素是保护因素, RR越小,联系强度越高;,,相对危险度与联系强度,2. 特异危险度(attributable risk, AR) 归因危险度、率差、超额危险度 完全由于暴露因素所致的危险度 Ie=暴露组人群的率,Iu=非暴露组人群的率 3. 特异危险度百分比(attributable risk percentage, AR%) 暴露组人群中由于该暴露因素导致的发病或死亡占暴露者发病或死亡的比例。
吸烟者与非吸烟者死于不同疾病的AR、RR,RR: 表明暴露者与非暴露者比较增加相应疾病危险性的倍数,具有病因学意义AR: 表明暴露因素消除,可减少的发病数量,具有疾病预防和公共卫生学意义,,,,,服用反应停与短肢畸形发生的关系,相对危险度 RR=42.00/0.24=175特异危险度 AR=42.00-0.24=41.76%,4.人群特异危险度(populational attributable risk, PAR)是指人群中由于部分人暴露于某因素所导致的发病或死亡率5.人群特异危险度百分比(PAR%):人群中因暴露于某因素所致的发病或死亡占人群发病或死亡的百分比即人群中疾病的发生或死亡有百分之多少可归因于该暴露因素 It: 人群发病率或死亡率Pe: 人群的暴露率,It 人群发病率或死亡率,,,,,相对危险度、人群暴露率(Pe)和人群归因危险度百分比的关系,6. 标准化死亡比(standardized mortality ratio, SMR),,Oi为观察人群各层中实际死亡人数;ni与pi分别为标准人群各层的人数及死亡率暴露组某疾病的死亡率是标准人口死亡率的多少倍SMR>100 表示观察人群的死亡或发病危险高于标准人群。
SMR<100时,表示观察人群的死亡危险低于一般人群例 某队列人群在观察期内实际死亡391人,,,,,例 糖尿病增加恶性肿瘤的发病危险,SIR, standardized incidence ratio,6.剂量反应关系,,,,,四、队列研究的偏倚(bias)及控制,选择偏倚及控制,选择对象方法不当选定的研究对象拒绝参加历史性队列研究中部分档案丢失或记录不全志愿者队列研究开始时未能发现早期病人等研究对象因迁移、外出、死于非终点疾病或拒绝继续参加观察而退出抽样方法正确,严格按规定标准选择对象选择便于随访的人群所需样本量的基础上扩大10%组织工作,加强对随访员的管理制定随访计划和监测和分析原因对于有缺项或漏项的对象进行补查,产生原因,控制措施,疾病、暴露标准不明确检验仪器不精确、检测技术调查方法不当,记录错误,造假等,提高临床诊断技术、明确评价标准选择精确稳定的测量方法调准仪器严格实验操作规程同等对待每个研究对象培训调查员,提高技巧,统一标准,产生原因,控制措施,信息偏倚及控制,设计阶段:限制研究对象,匹配分析阶段:分层分析、标准化或多因素分析,混杂偏倚及控制,回归系数β的意义:当其它变量不变时,变量x变化一个单位时的效应。
回归系数β的意义:,控制年龄、性别因素后,Logistic回归模型分析吸烟与膀胱癌的危险性,单因素分析,1.可直接计算和估计疾病的发病率、联系强度;2.暴露史资料较准确;3.先因后果,符合因果关系的时间顺序检验病因假说能力强;4.能了解疾病的自然史5.能研究一个暴露因素与多种疾病的关系,1.不适合发病率低的疾病的病因研究;2.易发生失访偏倚;3.费时间、人力、花费较高优点,局限性,。





![河南新冠肺炎文件-豫建科[2020]63号+豫建科〔2019〕282号](http://img.jinchutou.com/static_www/Images/s.gif)






