队列研究.ppt
75页山东大学公共卫生学院山东大学公共卫生学院School of Public HealthShandong University流行病与卫生统计学研究所流行病与卫生统计学研究所贾崇奇贾崇奇 队列研究 队列研究(cohort study)又称定群研究、前瞻性 研 究 ( prospective study) 、 纵 向 研 究( longitudinal study) 、 随 访 研 究 ( follow-up study)及发病研究(incidence study)等名称虽多,但最常用的名称是队列研究和定群研究 队列研究与病例对照研究都属于分析流行病学研究方法虽然队列研究的病因意义大于病例对照研究,但由于其耗费大、实施比较困难,因此一般是在病例对照研究的基础上再进行队列研究 一、概述 ㈠ 概念 队列研究是将研究人群按暴露因素的有无分为暴露组与非暴露组或按不同暴露水平分为多个亚组,然后追踪观察一定时间,比较两组或各组的发病率或死亡率,以验证暴露因素与研究疾病之间有无联系以及联系程度大小的一种研究方法。
队列研究的设计原理可用下图予以说明 一般人群—— 病 人 非病人 暴 露 —||—非暴露—||— 发 病 未发病 未发病 发 病 图1 队列研究设计原理示意图 队列研究中的研究对象必须是未患疾病的人,即在研究开始时尚未出现疾病者理论上,暴露组与非暴露组除暴露因素之外,其它能影响疾病发病或死亡的因素方面应保持齐同,以提高其可比性 暴露是指研究对象接触过某种因素、具有某种特征、处于某种状态、或具有某种行为这些因素、特征、状态、行为即为暴露因素暴露因素既可以是环境因素,也可以是宿主因素;宿主因素既可以是先天具有的,也可以是后天获得的,如年龄、性别、吸烟、燥声等暴露因素既可以是有害的,也可以是有益的 研究队列可有两种形式一是固定队列,即观察人群在某时间进入队列后,在观察期间固定不变;二是动态队列,指在观察期间研究对象进出队列的时间不一致,可随时有新的研究对象的加入及研究对象的退出 ㈡ 特点 从队列研究的概念中可体现出队列研究有如下特点 ⒈ 属于观察性研究 队列研究中的暴露组与非暴露组是按暴露因素的有无划分的,是自然存在的群组;暴露因素亦是客观存在而非人为给予的,因此该研究方法属于观察性研究。
尽管队列研究有时可观察暴露转变后人群事件的变化,如吸烟者戒烟后疾病发病率的变化,此时其被称之为“人群自然实验”,但这种暴露的转变是一种自然的情况,并非人为干预的结果 ⒉ 由“因”到“果”的研究 队列研究是从暴露即“原因”开始,然后追踪观察到将来疾病即“结果”的产生,属于前瞻性研究,而病例对照研究恰恰与此相反,是回顾性研究 ⒊ 研究结果可作为暴露与疾病因果关系的验证 由于研究者通过随访能够得到暴露与疾病发生或死亡的确切数据,因此研究结果的说服力较病例对照研究大,可作为暴露因素与疾病因果关系的验证 ㈢ 用途 队列研究的主要用途是验证病因假设,既可以验证一种暴露因素与一种疾病之间的因果关系,如吸烟与肺癌之间的关系,也可同时验证一种暴露因素与多种疾病之间的因果关系,如吸烟与肺癌、冠心病、脑梗塞等之间的关系 二、种类 根据观察开始时间与终了时间的不同,队列研究可分为以下3个类型 ㈠ 回顾性队列研究 回顾性队列研究又称历史性队列研究。
研究是从过去某时间开始,根据暴露因素的有无分组,然后追踪观察到现在疾病发生的情况,因此在研究开始时暴露与疾病均已发生 回顾性队列研究所需的有关暴露与疾病的资料完全依赖于历史记录,因此该研究的可行性与结果的真实性取决于历史记录的完整性和准确性一般而言,历史记录的资料与现在调查获得的资料相比完整性与准确性差,所以利用该类资料进行研究所得结果存在偏倚的可能性大但由于回顾性队列研究所需时间短、费用低、可迅速取得研究结果,特别是对于那些诱导期或潜隐期长、发病率较低的疾病更适合于该种研究方法 ㈡ 前瞻性队列研究 前瞻性队列研究中研究对象的分组是根据现在暴露因素的有无划分,然后追踪观察到将来某时间疾病发生的情况,因此在研究开始时暴露已经存在而疾病尚未发生一般所说的队列研究是指的该种研究方法 由于前瞻性队列研究所需的暴露与疾病的资料可在随访过程中调查测量获得,因此资料的完整性好、准确性高,所以研究结果的真实性好但由于前瞻性队列研究一般所需观察时间长、观察人口数多,所以费用高,特别是对于那些诱导期或潜隐期长、发病率较低的疾病更是如此。
这是制约该种研究方法可行性的关键因素观察时间越长、人口数越多、费用越高、则可行性越差 ㈢ 双向性队列研究 其又称混合型队列研究,它是在进行回顾性队列研究之后再继续进行前瞻性队列研究,是上述两种队列研究类型的结合 三、研究对象的选择 ㈠ 暴露组的选择 ⒈ 注意的问题 在选择暴露组时应考虑到:⑴欲选择的对象已处在研究因素的暴露之中或已有研究因素的暴露史;⑵所选择的暴露组能够提供准确的暴露史;⑶所选择的暴露组便于追踪观察 ⒉ 暴露组的选择方法 暴露组可从以下几个方面选择 ⑴ 特定地区的人群 即选择某地区中有所研究暴露因素的全部人口,或其某一年龄组的全部人口,或其中的一个随机样本选择该地区的首要条件是便于研究,即人口的流动性小,居民合作及当地医疗卫生条件好等 ⑵ 特殊暴露人群 某些职业常存在特殊危险因子的暴露,选择这些职业人群作为暴露组,不但所需观察人口数少、随访方便、费用低,而且病例发生频率远高于一般人群,便于验证暴露因素与疾病之间的因果关系。
例如选择染料厂工人研究联苯胺与膀胱癌的关系;选择接触石棉工人研究其肺癌发病情况等 但应注意的是,职业暴露的危害一般并非在开始时就会被识别,常常是经过多年之后,已经出现某种疾病后才会被怀疑并引起重视,并且大多都采取一定的防护措施以减少暴露,所以此时适宜的队列研究已不是前瞻性队列研究,而是回顾性队列研究了 ⑶ 特别便于研究的人群 即在医疗就诊、随访观察等方面特别方便的人群中选择暴露组这样可节省费用,且随访质量高,研究结果的真实性好 例如,英国学者Doll与Hill所做的关于吸烟与肺癌关系的队列研究,所选的研究对象就是在1951年英国有登记注册的医生之所以选择这些医生为研究对象,是因为其都登记注册而不会遗漏,便于随访调查;医生懂得医学知识,依从性好,应答率高,所调查的暴露信息真实、完整;可获得确切的死亡与诊断资料,因为死亡者必然由注册被除名并存有死因诊断明确的死亡通知书 某些人群如志愿者、持人寿保险者等也是特别便于研究的人群 ㈡ 非暴露组的选择 ⒈ 注意的问题 非暴露组的设立是为了便于与暴露组比较,用以估计暴露的效应,因此其选择的合适与否直接影响研究结果的真实性。
理论上非暴露组与暴露组除研究因素之外其它能影响疾病发病或死亡的因素方面均应保持齐同,但这在实际工作中很难做到,甚至根本不可能事实上,如果某些因子能够被测量以及在资料分析时能够用适宜的方法加以调整,那么对于这些因子非暴露组可以与暴露组不同 ⒉ 非暴露组的选择方法 非暴露组可从以下几个方面选择 ⑴ 内部比较 即内对照除由特殊暴露人群组成的队列之外,多数队列研究本身就包含有非暴露组或低水平暴露组,可将其作为对照组,此即内部比较 例如在某一人群研究吸烟与肺癌的关系时,将不吸烟者作为对照组;又如研究血清胆固醇水平与冠心病的关系时,将血清胆固醇水平最低者作为对照组 内对照的设立不但省事,而且其与暴露组在除研究因素之外的其它影响因素方面齐同性可能较好,因而可比性较高 ⑵ 设立比较组 亦称外对照,选择另一个与暴露组具有可比性的、没有暴露或具有低水平暴露的人群作对照 例如选择具有可疑危险因素暴露的某工厂工人作为暴露组,选择无该因素暴露的其它工厂工人作为对照组 ⑶ 用一般人群资料作比较 即在研究开始时不设立对照组,而是当研究结束后将暴露组与现有的全人群的统计资料进行比较,这在职业流行病学研究中常用。
该种对照的优点在于可节省研究费用但由于暴露组与一般人群在影响疾病发病或死亡的人群特征如年龄、性别等构成往往不尽一致,因此两组齐同性差、可比性低,并且职业工人常较一般人群健康状况良好,致使暴露因素的危险程度被低估,此即所谓的“健康工人效应” ⑷ 多重比较 即用上述两种或两种以上形式的对照同时与暴露组比较,以提高研究结果的真实性 四、样本含量 样本含量是任何流行病学研究方法中皆应注意的问题样本过大可造成不必要的人力、物力、财力及时间等浪费,而样本过小则代表性差,研究结果的精确性低确定研究所需合适的样本含量就是取得一个使研究结果具有显著性差异时的最小样本含量 队列研究样本含量的计算用以下4个参数进行估计: ⒈ 非暴露组发病率或死亡率的估计值P0 ⒉ 暴露组发病率或死亡率的估计值P1 ⒊ 显著性水平α,即检验假设时出现的第I类错误概率 ⒋ 研究效力1-β,亦称把握度β为检验假设时出现的第II类错误的概率 当上述4个参数确定后,可用下式估计暴露组与非暴露组各需的观察人数。
式中:N为暴露组或非暴露组所需观察人数Zα与Zβ分别为α与β水平时标准正态离差P0为非暴露组发病率或死亡率,Q0=1-P0P1为暴露组发病率或死亡率,Q1=1-P1 (式1) 例如拟用队列研究方法验证孕妇服用某药与后代先天性心脏病之间的病因关系,现有资料显示非暴露孕妇其后代先天性心脏病的发病率为8‰,暴露引起的相对危险度RR为2假设α=0.05及β=0.10,进行双侧检验,问所需观察人数应为多少? 根据题意,P0=0.008,Q0=0.992,P1=RR·P0=2×0.008=0.016,查表1得,,所以: Q1=0.984,, =3892 即暴露组与非暴露组各需观察3892人 表1 标准正态分布的分位数 α或βZα(单侧检验)Zα(双侧检验)Zβ(单侧及双侧检验)0.0013.0903.2900.0022.8783.0900.0052.5762.8070.0102.3262.5760.0202.0582.3260.0251.9602.2420.0501.6451.9600.1001.2821.6450.2000.8421.282 由于队列研究观察时间长,随访期间研究对象可能有失访,因此需预先估计失访率,以便据此校正计算所得的样本含量。
一般情况下,失访率按10%估计,所以按公式计算的样本含量应再加其10%作为实际研究的样本量 五、随访观察及资料收集 研究对象随访的完整性及研究资料的准确性与全面性是影响队列研究成败的关键研究所需的资料因研究内容的不同而不同,但应包括三个方面,即暴露信息、结局信息及其它信息如一些可能的混杂因素等反映这些信息的变量应该具有明确的、具体的规定,且最好用客观性的定量指标予以反映 ㈠ 基线资料 在正式开始队列研究之前往往要进行一次现况调查,获得基线资料,以便对研究对象进行分组及将来的随访观察提供依据 基线资料可从以下4个方面获得 ⒈ 从有关记录获得 如门诊记录、医院病案、企事业的人事档案、健康档案等 ⒉ 调查询问获得 如研究对象的暴露史、疾病史、生活及行为因素等 ⒊ 经医学检验或检查获得 如研究对象的生理、生化指标等,象血压、血脂、血糖等 ⒋ 从环境检测获得 如生活环境、工作环境中有害物质的浓度等。
㈡ 随访观察 ⒈ 随访期 当确定了暴露组与非暴露组,然后测量其发病或死亡率并进行比较是一件简单的事情,然而确定合理的随访开始时间及期限则是一件困难的事,需要根据对暴露因素与疾病生物学上的认识来完成理论上随访开始时间及期限因疾病诱导期和潜隐期的不同而异诱导期是指病因开始起作用至出现病理生理变化的时间段;潜隐期则指自出现病理生理变化至疾病临床症状出现的时间段合理的随访应在疾病的最短诱导期和潜隐期之后开始,然而这在实际中很难做到,因为许多疾病特别是慢性疾病的诱导期和潜隐期是未知的,以及相同疾病不同病因的诱导期也不一致所以许多研究不得不把暴露开始的时间作为随访开始的时间这种做法是建立在对最短诱导期和潜隐期的假设为零的基础之上,这种极端的假设往往是不正确的,但却是在实际工作中经常所采用的潜隐期的长短影响随访期限,潜隐期短的疾病所需随访期短,而潜隐期长的疾病所需随访期长 ⒉ 研究对象 无论是回顾性队列研究还是前瞻性队列研究,保持研究对象在随访期不变化是很困难的,特别是观察时间长者更是如此在前瞻性队列研究中,虽然可与研究对象定期接触以保持联系,但日益增长的社会流动性使这种定期接触所需费用大增。
如果研究对象失访过多,研究结果的真实性可能受到严重影响因此无论如何应积极采取措施以尽量降低失访率,并对失访可能产生的偏倚作出适当的估计 ⒊ 暴露因素 在前瞻性队列研究中,可通过定期随访以获得研究因素准确、完整的信息但在回顾性队列研究中,研究因素信息的获得完全依赖于历史记录这种来源的资料一般而言准确性及完整性差,因而可利用性低,使研究结果常存在偏倚例如研究某药物暴露与疾病关系的回顾性队列研究,暴露的确定始于处方之时,然而实际上可能有人在处方之后根本没用药或经过一段时间后才用药又如研究职业暴露危害时,如果没有工作环境有害物质浓度的记录,暴露程度只能根据工作性质来推断 对于病因的作用,历史记录信息似乎一定不如直接对暴露测量的信息,但情况并非总是如此当过去的暴露与现在的疾病关系非常密切时,过去不甚准确的暴露信息可能比现在对暴露直接测量信息的病因意义更加合理例如过去饮食结构史对估计现在心血管病营养危险因素的作用比测量当前7日食物消耗量的信息更具有合理性,对于后者即使应用多么先进的生化分析方法亦是如此同样,在研究职业危害时,对于过去暴露的估计比现在对暴露有害物质的直接测量在对现在疾病病因的作用上更加合理。
有关暴露的另一问题是暴露在随访期间不断变化的情况,如暴露水平的改变,间断暴露等处理这种问题非常复杂利用累积暴露量或平均暴露量则可能是解决这一问题的简单方法 对于暴露的测量应该要用公认的、标准的方法进行,并且在随访期间最好保持不变 ⒋ 研究结局,亦即观察终点 多数队列研究的结局变量是疾病的发病或死亡,但如抗体水平、血脂、血糖等一些检测指标也可视为结局变量,这因研究内容的不同而异不管结局变量如何,都要有明确的规定,并用标准的方法对其进行测量与判断,且这些方法与标准应在研究过程中自始至终保持不变对于研究结局,要尽可能核实诊断,如果不能对所有病例进行核实,至少要对其一个样本进行核实,以免造成错误分类偏倚 只有出现结局变量的对象才能终止对其随访观察,否则应继续追踪直至研究结束,如果不能继续观察则作失访处理例如观察的结局是肺癌的发病,如某人患了胃癌则不应视为观察终点,而应对其继续随访;假如某人心梗猝死,尽管不能对其继续随访,但仍不能视为已达观察终点,应作失访对待 六、资料分析 在资料分析之前应首先核对原始资料,以保证其完整与准确。
队列研究资料分析主要计算各组的发病率或死亡率并进行比较,以验证暴露因素与疾病之间有无联系及联系程度 ㈠ 队列研究中的两类率 根据研究队列的不同,队列研究中率的计算有以下两种情况 ⒈ 累积率 如果研究队列是固定队列,即观察对象在观察期间固定不变,以观察期间的病例数作分子,以观察开始的人口数作分母计算率,此为累积率(cumulative incidence) ⒉ 人时率 如果研究队列是动态队列,即观察对象在观察期间不断变化,此时不宜用观察人口数作分母,应以观察人时数作分母,以观察期间的病例数作分子计算率,此为人时率又称发病密度(incidence density) ㈡ 人时的计算 人时数为观察的人数乘观察的时间时间可以是日、周、月、年如果时间以年为单位,此时称人年人年计算可用以下几种方法 ⒈ 近似法计算 此法适用于大样本该法计算人年时,年内观察人口数可近似用年初人口与年末人口数的平均值代替以表2中年龄小于50岁组的资料为例,人年数为(605+549) /2+(549+535) /2+(535+495) /2+(495+454) / 2×0.5=1871.25,其它组依次类推,最后合计得总观察人年数,见表2。
表2 各年龄组年内观察人数年龄组1975,12,311976,12,311977,12,311978,12,311979,6,30人年数<506055495354954541871.2550~5885264885564981849.5055~4024564303983501473.0060~3523863423543021245.00合计194719171795180316046438.75 ⒉ 用寿命表法计算 此法亦需大样本该法计算人年时,将进入、失访及出现研究结局(发病或死亡)者皆视为在年内中点发生人年数的计算公式如下式中:LX为X时间内暴露人年数 IX为X时间开始时的观察人数 NX为X时间内进入队列的人数 DX为X时间内发病或死亡人数 WX为X时间内失访人数 (式2) (式3) 现以表3资料为例,第一年观察人年数为: =1425.5 =1448 表3 用寿命表法计算人年数 观察年数年初人数年 内进入数年 内发病数年 内失访数人年数XIXNXDXWXLX11403794301425.521448452111464.03148060381504.54152952191521.051513107251502.0合计7417.0依次类推,合计得总观察人年数,见表3。
⒊ 精确法 即对观察对象逐一计算,然后合计得总观察人年数此法计算结果精确,但计算过程繁杂若用手工计算则必须是小样本然而随着计算机的普及,繁杂的计算变的简单易行因此即使是大样本也应该首选此方法现以两名观察对象为例说明其计算方法,见表4和表5表4 研究对象出生日期与进出观察时间编号出生日期进入研究时间退出研究时间结局11927,03,211966,07,191977,09,14失访21935,04,091961,11,111973,12,01死亡表5 精确法计算人年年龄组对象1对象2合计25~61,11,11至65,04,08共3年4个月27天即3.41人年3.4130~65,04,09至 70,04,08共 5人年5.0035~66,07,19至 67,03,20共 8个月即0.67人年70,04,09至73,12,01共3年7个月22天即3.65人年4.3240~67,03,21至 72,03,20共 5人年5.0045~72,03,21至 77,03,20共 5人年5.0050~77,03,21至 77,09,14共 5个月24天即0.48人年0.48合计11.15人年12.06人年23.21 以上是常用的3种计算人年的方法。
由于10人观察10年与100人观察1年皆为100人年,但获得的病例数可能不一致因此在作人时率比较时,应注意的是观察的人数及观察的时间各组相差不宜太大,特别是对于发病少、潜隐期长的慢性病更是如此 ㈢ 显著性检验与暴露效应的测量 显著性检验的方法可用精确概率法及近似法由于精确法计算繁杂,故在此只介绍Mantel-Haenszel近似法该方法适用于正态分布的大样本数据对于分层资料,层数少但每层观察数多或每层观察数少但层数多的资料皆可满足其使用条件 暴露效应的测量包括了点估计及区间估计区间估计也有精确法与近似法,在此也只介绍区间估计的近似法 ⒈ 未分层资料 即不考虑混杂因素的影响或效应修饰时,初步分析暴露因素与疾病之间的联系 ⑴ 显著性检验 未分层的累积率资料可整理成表6形式,显著性检验用公式4 表6 队列研究未分层累积率资料 发病数未发病数合计暴 露abN1非暴露cdN0合 计M1M0T,df=1 (式4) 未分层的人时率资料可整理成表7形式,显著性检验用公式5。
表7 队列研究未分层人时率资料 发病数人时数暴 露aN1非暴露cN0合 计MT(式5) ⑵ 暴露效应的测量 ① 相对危险度(relative risk,RR)又称率比与危险比,指暴露组率(Ie)与非暴露组率(Iu)的比值,说明暴露者发病危险性是非暴露者的倍数,用下式计算 (式6) lnRR标准误的近似计算,累积率资料用公式7,人时率资料用公式8 式7) (式8) RR的95%可信限近似估计用公式9或以基于检验的方法,用公式10 exp(lnRR±1.96 SlnRR) (式9) (式10) ② 特异危险度(attributable risk,AR)又称率差或归因危险度,它是暴露组率(Ie)与非暴露组率(Iu)的差值,说明完全由暴露因素所致的危险程度,用下式计算 (式11) AR标准误的近似计算,累积率资料用公式12,人时率资料用公式13 (式12) (式13) AR的95%可信限近似估计用公式14或以基于检验的方法,用公式15 AR±1.96SAR (式14) (式15) ③ 特异危险度百分比(attributable risk percent,AR%)指在暴露组中由暴露因素所致危险程度占暴露组发病或死亡的百分数,用下式计算。
(式16) AR% 的可信限可根据RR可信限的端点推算 ④ 人群特异危险度(population attributable risk,PAR)是人群的率(It)与非暴露组率(Iu)的差值,说明在人群中完全由暴露因素所致的危险程度,用下式计算式17) 式中Pe为研究因素在人群中的暴露率,AR为特异危险度 PAR的可信限可根据AR可信限的端点推算 ⑤ 人群特异危险度百分比(population attributable risk percent,PAR%)指在人群中由暴露因素所致危险程度占人群中发病或死亡的百分数,用下式计算式18) 式中Pe为研究因素在人群中的暴露率,RR为相对危险度 PAR%的可信限可根据RR可信限的端点推算 ⒉ 分层资料 在队列研究的未分层资料分析中可能存在着某些混杂因素的影响,因此可用分层分析的方法估计调整混杂后暴露因素与疾病之间的联系,分层分析也可用于判断分层因素对暴露因素是否存在效应修饰 在队列研究中,假定将研究资料按分层因素分为k层,第i层(i=1,2,…,k)累积率资料可整理成表8形式,而人时率资料可整理成表9形式。
表8 队列研究分层累积率资料 i层发病数未发病数合计暴 露aibiN1i非暴露cidiN0i合 计M1iM0iTi表9 队列研究分层人时率资料 i层发病数人时数暴 露aiN1i非暴露ciN0i合 计MiTi⑴ 各层暴露效应的点估计 ① 各层相对危险度(RRi)用下式计算 (式19) ② 各层特异危险度(ARi)用下式计算 (式20) ⑵ 各层暴露效应的一致性检验 ① 各RRi的一致性检验用下式计算 ,df=层数-1 (式21) 式中lnRRi为RRi的自然对数值;Wi为第i层的权重,累积率资料用公式22计算,人时率资料用公式23计算 (式22) (式23) ② 各ARi的一致性检验用下式计算 ,df=层数-1 (式24) 式中Wi为第i层的权重,累积率资料用公式25计算,人时率资料用公式26计算 (式25) (式26) ⑶ 分层后合并暴露效应的显著性检验 当各层的暴露效应一致时,可用下列公式对合并的暴露效应进行显著性检验,累积率资料用公式27,人时率资料用公式28 , df=1 (式27) (式28) ⑷ 分层后合并暴露效应的估计 当各层的暴露效应一致时,说明层间效应的差别是由机会所致,可用下列公式对合并的暴露效应进行估计,以反映分层调整混杂后暴露因素与疾病之间的联系强度。
① 分层后合并的相对危险度(aRR) 用公式29计算,lnaRR的方差用公式30计算两公式中Wi同公式21中的Wi (式29) (式30) aRR的95%可信限近似估计用公式31计算,或用基于检验的方法,用公式32计算 (式31) (式32) ② 分层后合并的特异危险度(aAR) 用公式33计算,aAR的方差用公式34计算两公式中Wi同公式24中的Wi (式33) (式34) aAR的95%可信限近似估计用公式35计算或用基于检验的方法,用公式36计算 (式35) (式36) ⑸ 标准化暴露效应的估计 当各层的暴露效应不一致时,说明分层因素对暴露因素具有效应修饰作用,因此不能计算合并的暴露效应,需计算标准化的暴露效应以反映暴露因素与疾病之间的联系强度 ① 标化相对危险度(SRR)用下式计算 (式37) 式中Iei为各层暴露组的率,Iui为各层非暴露组的率;Wi为第i层的标准权重,累积率资料用各层暴露组的观察人数,而人时率资料用各层暴露组的人时数作标准权重 lnSRR标准差的近似计算,累积率资料用公式38,人时率资料用公式39。
两公式中的Wi同公式37,为第i层的标准权重 (式38) (式39) SRR的95%可信限的近似估计用下式计算 exp(lnSRR±1.96SlnSRR) (式40) ② 标化特异危险度(SAR)用下式计算 式中Wi为第i层的标准权重,累积率资料可用各层暴露组的观察人数,而人时率资料可用各层暴露组的人时数作标准权重 (式41) SAR标准差的近似计算,累积率资料用公式42,人时率资料用公式43两公式中的Wi同公式41为第i层的标准权重 (式42) (式43) SAR的95%可信限的近似估计用下式计算 SAR±1.96SSAR (式44) ⒊ 暴露分级资料 在队列研究资料分析时,常需探讨暴露因素与疾病发病或死亡之间是否存在剂量反应关系,为病因验证进一步提供理论依据,此时将暴露因素分为不同的等级,计算各暴露水平的发病率或死亡率或相对危险度等指标,以观察是否随着暴露量的增加,疾病的发病或死亡危险性也增加 暴露分级累计率资料可整理成表10形式 表10 暴露分级累计率资料 暴露分级(Xj)发病数(aj)未发病数(bj)合计(Nj)率(Yj)0a0b0N0Y01a1b1N1Y12a2b2N2Y2...............nanbnNnYn暴露分级人时率资料可整理成表11形式。
表11 暴露分级人时率资料 暴露分级(Xj)发病数(aj)人年数(Nj)率(Yj)0a0N0Y01a1N1Y12a2N2Y2............nanNnYn 暴露因素与疾病之间剂量反应关系可用加权直线回归方法进行分析,以暴露分级为自变量X,以率或相对危险度为因变量Y,拟合直线回归方程Y=a+bX每一暴露水平的权重Wj是该水平方差的倒数即: 剂量反应关系的显著性可通过回归系数的显著性检验来实现 累计率资料每一暴露水平的权重为: 人时率资料每一暴露水平的权重为: 加权直线回归方程Y=a+bX的拟合如下 回归系数b由用下式计算: 回归系数的标准误由用下式计算: 上面两公式中: n为分级数,Wj为第j级的权重 (式45) (式46) 回归系数b的显著性检验用用下式计算 ,df=n-2 (式47) 回归系数b的95%的可信限为: 常数项a由用下式计算 式中: , (式48) ⒋ 多因素分析 多因素分析可同时控制多个混杂变量的混杂作用,并可用于研究因素之间的交互作用应注意的是用于多因素分析的各种数学模型其优缺点及应用条件不尽一致,需根据情况选择合适的模型。
常用的数学模型有多元线性回归、Logistic回归、Cox回归、对数线性模型、Poisson回归等,可参考有关书籍 ⒌ 标准化死亡比 标准化死亡比(Standard Mortality Ratio,SMR)是职业流行病学研究中经常采用的,用以反映职业暴露危害的一个指标它是队列人群观察死亡数与以标准人群死亡率为参比计算的预期死亡数的比值 ⑴ SMR的计算用下式计算 (式49) 式中di为第i层的观察死亡数,E(di)为第i层的预期死亡数;D为总观察死亡数,E为总预期死亡数 ⑵ SMR的显著性检验用公式50或公式51计算 (式50) 式中若D>E则=D;若D 表13 两暴露组SMR的计算 年龄 一般人口 分组 死 亡 率暴露1暴露2人口数预期死亡数人口数预期死亡数青年 0.0005 10,0005 1,000 0.5老年 0.0020 1,0002 10,000 20合计7 20.5由表12及表13资料得暴露1组的SMR及其可信限为: ,P<0.01 SMR的95%可信限: 同理,暴露2组的SMR为2.20,95%的可信限为1.60~2.94, =4.59,P<0.01 从上述例子可看出,本来两暴露组的死亡率相同,然而其SMR却相差甚远因此,SMR之间具有不可比性,即不可进行两个或多个SMR的比较,即使用相同标准人口率计算的SMR亦是如此因为SMR实质是以一般人口的率作标准,队列人群间接标准化率与一般人口率的比值在间接标准化率的计算过程中,加权来自于队列人口,而非标准人口,所以当各队列人口在影响疾病发病或死亡的人群特征上如年龄等构成不一致时,间接标准化率不可比较在上述例子中,两暴露组的年龄构成相差很大,所以其SMR相差甚远。 如果要进行两个或多个SMR的比较,则各比较组之间在影响疾病发病或死亡的人群特征上如年龄等构成必须一致才行 七、队列研究中常见的偏倚与控制 ㈠ 失访偏倚 当观察时间长,观察人数多时,无论是回顾性还是前瞻性队列研究都难免发生失访如果失访的人数较多,失访者与未失访者在影响疾病发病或死亡的人群特征构成上不一致时,可造成研究结果的偏倚避免失访偏倚最好的方法就是积极采取各种措施,以减少或避免失访的发生对于失访可用以下方法加以处理 ⒈ 子样估计法 即从失访者中随机抽取一个子样对其进行调查,然后比较该子样与未失访者的研究指标及主要人群特征,如果两者之间无显著差异,可以有理由认为失访不会造成偏倚;如果两者之间有显著差异,则需对可能的偏倚作出估计 ⒉ 多次访问法 一般而言,随着访问次数的增加,失访率也随之降低,但是其相对费用则随之升高,因此有时需对此利弊加以权衡 ㈡ 易感性偏倚 队列研究中易感性偏倚典型的例子是“健康工人效应”它是指在研究某些职业暴露的危害而以一般人口作参比时,由于职业工人相对于一般人群健康,从而降低了暴露因素与疾病之间的真实联系程度。 控制“健康工人效应”可从以下几个方面进行 ⒈ 设立对照组而不是以一般人群作参比设立的对照组最好能使除了研究因素之外的其它能影响疾病发病或死亡的因素与暴露组相一致 ⒉ 如果一定要用一般人群作参比,那么所选择的一般人群的率最好是与暴露组相同地区、相同年代、相同人群特征构成者 ⒊ 用下述方法进行校正 ⑴ 研究人群各亚组的预期死亡数按一定比例进行折扣,例如都乘以90%这种方法简便,但比较机械,对有的疾病未必合适 ⑵ 通过实际调查获得能够代表本地区的职工和一般人群死亡率的比值,以此为校正系数乘以研究人群各亚组预期死亡数进行校正 ⑶ 通过实际调查获得能够代表本地区的职工和一般人群各亚组的死亡率比值(如年龄)作为校正系数,分别乘以研究人群相应各亚组的预期死亡数进行校正 ㈢ 测量偏倚 如果研究指标的测量方法及疾病的诊断方法等不准确,或者在研究过程中这些方法与标准不统一,则可出现测量偏倚以致发生错误分类 控制测量偏倚的方法是应用统一的、准确的、标准的测量与诊断方法,并在研究过程中自始至终保持不变。 ㈣ 混杂偏倚 在队列研究中,可因混杂因素的存在而产生混杂偏倚控制混杂偏倚的方法可在研究设计时采用限制、配比的手段,也可在资料分析时采用分层分析及多因素分析方法但应说明的是,配比队列研究极少被采用,其原因,一是这种研究类型耗费巨大,二是队列研究观察期限往往很长,观察队列很难固定不变,因此当队列人群发生变化后,原来在比较组间分配平衡的配比因素可能变的不再平衡 八、队列研究的优缺点㈠ 主要优点⒈ 研究人群范围明确,故能直接计算率及联系强度指标⒉ 可同时研究一种因素与多种疾病之间的关系⒊ 经随访可得到研究因素与疾病等详细数据,故资料偏倚少⒋ 由“因”到“果”的研究,故结果说服力强㈡ 主要缺点⒈ 不适合于发病率低的疾病,特别是前瞻性队列研究⒉ 观察时间长,失访的可能性大⒊ 研究费用高,因而限制了可行性 Thanks 。

卡西欧5800p使用说明书资料.ppt
锂金属电池界面稳定化-全面剖析.docx
SG3525斩控式单相交流调压电路设计要点.doc
话剧《枕头人》剧本.docx
重视家风建设全面从严治党治家应成为领导干部必修课PPT模板.pptx
黄渤海区拖网渔具综合调查分析.docx
2024年一级造价工程师考试《建设工程技术与计量(交通运输工程)-公路篇》真题及答案.docx
【课件】Unit+3+Reading+and+Thinking公开课课件人教版(2019)必修第一册.pptx
嵌入式软件开发流程566841551.doc
生命密码PPT课件.ppt
爱与责任-师德之魂.ppt
制冷空调装置自动控制技术讲义.ppt


