
肿瘤登记的基本统计方法.ppt
56页肿瘤登记的基本统计方法肿瘤登记的基本统计方法孙喜斌河南省肿瘤肿瘤防治研究办公室登记资料统计分析登记资料统计分析•肿瘤登记数据的结果一般以比值(率、比、比例等)的形式呈现不同时间、不同人群间的比较是对各种率或比例值的比较 (绝对数与相对数) •同时,一些比值也是评价登记质量的常用指标内容内容•率(rate)及率的标化•比例(proportion)•比(ratio)率及率的标化率及率的标化•定义、率、人年定义、率、人年•粗率粗率•年龄别率年龄别率•标化率(年龄标化标化率(年龄标化-直接法)直接法)发生率发生率/死亡率的计算需要两个元素:死亡率的计算需要两个元素:1、限定时期内限定人群中事件(发病、死亡、限定时期内限定人群中事件(发病、死亡) 发生数发生数——分子2、限定时期内限定人群的人年数、限定时期内限定人群的人年数——分母 xxx肿瘤登记处肿瘤新病例报告卡 编编 号号______________________________ ICD ICD编码编码____________________ 门诊号 门诊号____________________________ 住院号 住院号________________________ 身份证号身份证号 口口口口口口口口口口口口口口口口口口口口口口口口口口口口口口口口口口口口 患者姓名 患者姓名___________ ___________ 性别性别__________ __________ 实足年龄实足年龄____________________岁岁 出生年月 出生年月————年年————月月————日日 民族民族____________________ ____________________ 职 职 业业 ( (具体工种、性质具体工种、性质)______________ )______________ 工作单位工作单位__________________________________________ 正式户口 正式户口 详细地址 详细地址_______________ _______________ 区、县区、县_____________ _____________ 街道、乡街道、乡________________________________ 诊 诊 断断__________________________________________________________ 病理学类型 病理学类型__________________________________________________ ( (如是继发性肿瘤请尽可能注明原发部位如是继发性肿瘤请尽可能注明原发部位) ) 诊断日期 诊断日期____________年年________月月________日日 报告单位 报告单位________________________________________报告医师报告医师____________________报告时间报告时间______________年年__________月月__________日日 死亡日期 死亡日期________________年年__________月月__________日日 死亡原因死亡原因________________________________________________________________ 诊断依据:在序号上打∨1 临床 6 病理(继发)2 X线、CT、超声 7 病理(原发)3 手术、尸检(无病理) 8 尸检(有病理)4 生化、免疫 9 不详5 细胞学、血片 0 死亡补发病肿瘤登记病例信息•基本数据:基本数据:Ø 年龄(发病年龄(发病/死亡)死亡)Ø 性别性别Ø 原发部位(原发部位(ICD))• 其它信息:其它信息:Ø 时间时间(发病发病/死亡年份死亡年份) Ø 诊断依据诊断依据Ø 病期病期Ø 组织学类型组织学类型Ø 职业职业/婚姻婚姻Ø 随访结果随访结果Ø 生存时间生存时间人口数据• 登记地区相应年度内的(分性别、年龄组)登记地区相应年度内的(分性别、年龄组) 人口数人口数• 标准人口年龄构成(中国、世界)标准人口年龄构成(中国、世界)理想中,想要知道人群中某一年龄个体在特理想中,想要知道人群中某一年龄个体在特定时间点发生(癌症)的危险度:定时间点发生(癌症)的危险度: ——发病力发病力或或 ——即刻发生率即刻发生率实际上,我们只能估计到人群在某一时间段实际上,我们只能估计到人群在某一时间段内新病例(如癌症)的发生的频率(概率):内新病例(如癌症)的发生的频率(概率): ——发病率发病率统计指标:统计指标:Ø 年龄别率年龄别率Ø 粗率粗率Ø 标化率标化率Ø 截缩率截缩率Ø 累积率累积率 新发病例数据 发病率:反映登记地区人群癌症负担指标发病率:反映登记地区人群癌症负担指标 肿瘤发病率• 公式公式发病率发病率= ×100000• 男女男女 性别、年龄别发生率性别、年龄别发生率• 年龄组发病数过少时年龄组发病数过少时,评价变化意义不大(随机波动较大)评价变化意义不大(随机波动较大)• 分部位的肿瘤发生率分部位的肿瘤发生率• 合计年份资料的发病率计算合计年份资料的发病率计算人口数(分母)人口数(分母)•如果是计算某年份的率则用年中人口数或 年初人口数+年末人口数/2•如一个时期(如5年)合计发病率则将5年的平均人口相加做分母,这一时期合计的发病数做分子(或中间年份人口数×时期长度)。
年龄别发病率年龄别发病率•考虑年龄分组:考虑年龄分组:0-4,,5-9,,10-14,,…80-84, 85+. 年龄分年龄分18组组(i=1,2,3,……18; A=18)以以ri 代表代表(一定时期内一定时期内)第第i年龄组的肿瘤发生数年龄组的肿瘤发生数;全部年龄组的肿瘤发生数为全部年龄组的肿瘤发生数为R,则则:R= r1 + r2 + r3+…...+ rA 同样以同样以ni 为相同时期的第为相同时期的第i年龄组的人口数年龄组的人口数,各年龄人各年龄人口数合计为口数合计为N, 则则:N= n1 + n 2 + n3+…...+ nA 每每100,,000人年的粗率(全部年龄组)为:人年的粗率(全部年龄组)为:粗率粗率=C = ×100000i.e. C= ×100000 各年龄组发病率为各年龄组发病率为ai ,,则:则: ai= ×100000年龄组标年龄组标 ((i)) 年龄组年龄组 发病数 (ri) 观察人年数 (ni) 年龄别发病率( ri / ni)(1/10万)1 0-4 0 827400 0.002 5-9 0 856500 0.00 3 10-14 0 1061500 0.00 4 15-19 0 1157400 0.00 5 20-24 4 1074900 0.37 6 25-29 3 917700 0.337 30-34 29 890300 3.268 35-39 61 816000 7.489 40-44 153 724400 21.1210 45-49 376 706800 53.2011 50-54 902 703800 128.1612 55-59 1819 691200 263.1713 60-64 2581 610900 422.49 14 65-69 3071 511800 600.0415 70-74 3322 425600 780.5516 75-79 2452 266800 919.0417 80-84 1202 122500 981.2218 85+ 429 54700 784.28 合计合计 16404 12420200例1. 粗率和年龄别发病率计算表1 1980-84年苏格兰男性肺癌发生数据年龄别发病率的计算例如例如40-44岁组(岁组(i=9):): a9= ×100000 = ×100000 = 21.1/10万万粗率计算粗率计算发病粗率发病粗率 C各年龄组合计发病数为各年龄组合计发病数为16404,, R= =16404各年龄组合计人口数为各年龄组合计人口数为12420220,, N= =12430220 C= = ×100000 =132.1/10万万男性胃癌粗率比较男性胃癌粗率比较卡里,哥伦比亚卡里,哥伦比亚新发病例数(1982-86) 620男性人口数(1984) 622922年均粗率 19.9/10万 =620/(5×622922)伯明翰,伯明翰, 英格兰英格兰发病率数 (1983-86) 3468男性人口数(1984) 2556200 年均粗率 33.9/10万 =3468/(4×2556200)伯明翰男性发生胃癌的危险高于卡利男性吗??伯明翰男性发生胃癌的危险高于卡利男性吗??男性胃癌粗率比较(分年龄组)男性胃癌粗率比较(分年龄组)卡利卡利 CR=19.9 per 100000年龄年龄 0-44 45-64 65+ 病例数病例数(1982-86) 39 266 315 男性人口数男性人口数 (1984) 524220 76304 22398年均发病率(年均发病率(/10万)万) 1.5 69.7 281.3 人口年龄构成比人口年龄构成比(1984) 84 12 4 伯明翰伯明翰 CR= 33.9 per 100000年龄年龄 0-44 45-64 65+ 病例数病例数(1983-86) 79 1037 2353 男性人口数男性人口数 (1984) 1683600 581500 291100年均发病率(年均发病率(/10万)万) 1.2 44.6 202.0 人口年龄构成比人口年龄构成比(1984) 66 23 11粗率粗率•描述癌症负担的指标。
描述癌症负担的指标•比较时往往产生误导比较时往往产生误导•年龄是癌症发生的重要决定因素年龄是癌症发生的重要决定因素•进行率的比较时,一定要考虑不同年龄构成的影响进行率的比较时,一定要考虑不同年龄构成的影响•粗率没有考虑年龄的影响粗率没有考虑年龄的影响•因此,要对年龄别发病率进行比较因此,要对年龄别发病率进行比较不同地区的胃癌比较不同地区的胃癌比较 不同地区人群不同地区人群 胃癌胃癌 (暴露)(暴露) (结果)(结果) 年龄年龄 (混杂)(混杂) 年龄调整发病率(标准化)年龄调整发病率(标准化)• 适用情况适用情况Ø不同人群之间的比较不同人群之间的比较Ø不同时间之间的比较不同时间之间的比较除了年龄调整率这一综合度量外,仍应对不同人群、不同时间的年龄别除了年龄调整率这一综合度量外,仍应对不同人群、不同时间的年龄别发病率进行比较。
发病率进行比较 • 计算方法计算方法Ø 直接法直接法Ø 间接法间接法• 截缩调整发病率截缩调整发病率Ø 35-64 35-64岁组(岁组(i=8 i=8 ~~ i=13 i=13))• 标准人口标准人口 直接法计算年龄调整发病率 i -----------年龄组标年龄组标 ai -----------年龄组发病率年龄组发病率 wi -----------标准人口的年龄组人口数标准人口的年龄组人口数计算步骤计算步骤(5步)步)1、计算人群的年龄别率、计算人群的年龄别率ai 2、、 ai 与标准人口的年龄组人口数(与标准人口的年龄组人口数(wi)相乘)相乘3、各年龄组的、各年龄组的ai 与与wi 的积相加得到的积相加得到∑aiwi4、各年龄组、各年龄组wi 相加得到相加得到∑wi5、计算年龄调整率(标化率)、计算年龄调整率(标化率)ASR= ∑aiwi/ ∑wi•ASR是一理论率(是一理论率(“假值假值”),由关注人群的年龄别),由关注人群的年龄别率与参照人口构成计算而获得率与参照人口构成计算而获得•参照人口被称作标准人口参照人口被称作标准人口。
•标准人口的各年龄组标准人口的各年龄组(i)的人口数称为权数的人口数称为权数Wi•有很多套权数可以运用有很多套权数可以运用•不同的标准人口计算出的标化率不同不同的标准人口计算出的标化率不同•通常用世界标准人口(通常用世界标准人口(Segi‘s世界标准人口世界标准人口 )、中国)、中国82年人口构成年人口构成•进行率的比较时,强调参照进行率的比较时,强调参照“新新”与与“旧旧”的标准人的标准人口无任何意义(只会造成混乱与不便)口无任何意义(只会造成混乱与不便)年龄调整发病率(年龄调整发病率(1/101/10万)万) 年龄调整发病率 ASR=48.8/10万截缩(年龄)调整发病率(TASR)TASR= = 0.35+0.89+1.76+6.14+10.63/6000+6000+5000+4000+4000 =截缩率往往在数据质量不可靠时截缩率往往在数据质量不可靠时(如老年组及低年组率)用的较多如老年组及低年组率)用的较多 截缩率考虑到癌症发生的高峰年龄及截缩率考虑到癌症发生的高峰年龄及 老年人群癌症登记数据存在的完整性和有老年人群癌症登记数据存在的完整性和有 效性问题,数据的灵敏度及稳定性佳。
效性问题,数据的灵敏度及稳定性佳 儿童肿瘤的截缩率相对应的年龄别发儿童肿瘤的截缩率相对应的年龄别发病率和标准人口为病率和标准人口为0-14岁,即岁,即i从从1到到3,,计算方计算方 法相同标化率比较举例标化率比较举例卡利,哥伦比亚:卡利,哥伦比亚:年龄年龄 0-44 45-64 65+ 病例数病例数(1982-86) 39 266 315 男性人口数男性人口数 (1984) 524220 76304 22398年龄别发病率年龄别发病率ai((/10万)万) 1.5 69.7 281.3世界标准人口世界标准人口wi 74000 19000 7000ai × wi 111000 132400 196900 ASR= ∑aiwi/ ∑wi=111000+1324000+196900/7400+19000+7000 =3404000/100000=34.04/10万万伯明翰,英格兰:伯明翰,英格兰:年龄年龄 0-44 45-64 65+ 病例数病例数(1982-86) ri 79 1037 2352 男性人口数男性人口数 (1984) ni 1683600 581500 291100年龄别发病率年龄别发病率ai((/10万)万) 1.2 44.6 202.0世界标准人口世界标准人口wi 74000 19000 7000ai × wi 89000 847000 141400 ASR= ∑aiwi/ ∑wi=89000+847000+141400/7400+19000+7000 =2350000/100000=23.5/10万万卡利与伯明翰地区男性胃癌比较卡利与伯明翰地区男性胃癌比较 不同地区人群不同地区人群 胃癌胃癌 (暴露)(暴露) (结果)(结果) 年龄年龄 (混杂)(混杂)去除年龄的混杂影响:去除年龄的混杂影响:伯明翰伯明翰 Crude=33.9; ASR=23.5卡利卡利 Crude=19.9; ASR=34.0 年龄调整率(直接法)的标准误及可信区间年龄调整率(直接法)的标准误及可信区间年龄调整率方差:年龄调整率方差: Var((ASR))=标准误标准误 s.e.(ASR)=可信区间可信区间 ASR ± Zα/2 × (s.e.(ASR)) •方差公式为方差公式为Binomial 近似法近似法(另一种为另一种为Poisson近似法近似法)•可信区间常用可信区间常用 95% 和和 99% , Zα/2 值分别为值分别为1.96和和2.58年龄调整率标准误计算(年龄调整率标准误计算(Poisson 近似法)近似法) 年龄组年龄组 年龄别率(年龄别率(1/10万)万) (ai) 世界标准人口世界标准人口 ((wi)) 人年数人年数 ((ni) aiwi2×100000/ni0-4 0.00 12000 827400 05-9…. 0.00 …. 10000 …. 856500 …. 0 ….29-24….80-8485+ 0.37 …. 981.22 748.28 8000 …. 500 500 1074900 …. 122500 54700 2202996 …. 200248976 358446048 调整率方差:调整率方差:标准误:标准误:ASR 95%可信区间可信区间: ASR±Zα/2 × (s.e.(ASR))=90.62±1.96 ×0.73 =89.19 — 92.05两个标化(年龄调整)率(直接法)的比较两个标化(年龄调整)率(直接法)的比较公式:公式: (ASR1/ASR2) 1±2α/2 /x ASR1/ASR2 为标准化率比(为标准化率比(SRR)) X= Zα/2 =1.96 为为95%水平水平 Zα/2 =2.58 为为99%水平水平 第一步计算出第一步计算出SRR 第二步计算第二步计算X值值 第三步计算第三步计算SRR 95%(或(或99%)的上下限值,区间内不包括)的上下限值,区间内不包括1.0,差异差异 有显著性意义有显著性意义 举例举例苏格兰苏格兰:1980-84年男性肺癌标化发病率年男性肺癌标化发病率90.6(ASR1),标准误,标准误0.73。
1960-64年男性肺癌标化发病率年男性肺癌标化发病率68.3(ASR2),标准误,标准误0.67计算计算SRR=ASR1/ASR2=90.6/68.3=1.326 X= = = =22.51 95%可信区间( Zα/2 =1.96 )下限=(1.326) 1-(1.96/22.51) =1.29 上限=(1.326) 1+(1.96/22.51) =1.36如果两个率相同那么如果两个率相同那么SRR等于等于1,现,现SRR为为1.326,而且,而且95%区间()区间()不包括不包括1,则两率的差异在,则两率的差异在5%的水平上有显著性意义的水平上有显著性意义 累积率• 定义定义– 累积率(累积率(Cumulative rate):出生到):出生到74岁每岁的发病率相加后,以百分岁每岁的发病率相加后,以百分 数表示(儿童肿瘤为数表示(儿童肿瘤为0-14岁)。
岁)– 累积危险度(累积危险度(Cumulative risk):个体在某一年龄期间(如):个体在某一年龄期间(如0-74)发)发 某种疾病的危险度,以百分数表示某种疾病的危险度,以百分数表示某市男性肺癌年龄别发病率如下:某市男性肺癌年龄别发病率如下:0- 5- 10- 15- 20- 25- 30- 35- 40- 45- 50- 55- 60- 65- 70- 75-0 0 0 0 0 0.7 0.5 5.8 14.8 … … … … … 369.2 416.9 • 0-740-74岁累积率:如;岁累积率:如;0.0+0.0+0.0+0.0+………………..265.7+354.1+369.2=1263.8..265.7+354.1+369.2=1263.8 1263.8 1263.8××5=6319.05=6319.0 ((6319.0 6319.0 //10000001000000))×100100((% %))=6.3% 累积危险度• 相互关系相互关系 例子例子6.1%累积率可作为累积危险度的近似估计值累积率可作为累积危险度的近似估计值比、比例比、比例l比(比(ratio),定义为一个变量的数值被另一个变量的数值来除所得到),定义为一个变量的数值被另一个变量的数值来除所得到的商。
这两个变量可以是单位相同,也可以不同比的分子和分母是的商这两个变量可以是单位相同,也可以不同比的分子和分母是彼此分离的(不相包含或重叠)比没有单位,其数值代表两个两个彼此分离的(不相包含或重叠)比没有单位,其数值代表两个两个指标对比的一个指数指标对比的一个指数 如:男女性别发病比,死亡发病比等如:男女性别发病比,死亡发病比等l比例(比例(proportion),表示同一事物局部与总体之间数量上的比值,),表示同一事物局部与总体之间数量上的比值,分子分母单位相同,分子是分母的一部分分子分母单位相同,分子是分母的一部分 如:发病(死亡)构成比、诊断依据百分比,病理组织学诊断比例,如:发病(死亡)构成比、诊断依据百分比,病理组织学诊断比例, 死亡补发病的比例,未指明部位的肿瘤新病例的百分比等死亡补发病的比例,未指明部位的肿瘤新病例的百分比等 各死因死亡数占死亡总数百分比恶性肿瘤占死亡总数的百分比恶性肿瘤占死亡总数的百分比 胃癌占恶性肿瘤死亡总数的百分比胃癌占恶性肿瘤死亡总数的百分比数据整理与审核数据整理与审核• 登记机构年报内容登记机构年报内容Ø 登记机构简介登记机构简介Ø 登记地区及人口登记地区及人口Ø 恶性肿瘤分类恶性肿瘤分类Ø 性别、年龄和部位分组例数性别、年龄和部位分组例数Ø 常见恶性肿瘤(前十位)常见恶性肿瘤(前十位)Ø 图示法图示法• 专题报告内容专题报告内容Ø 长期累积资料统计分析长期累积资料统计分析Ø 检查错误和补充遗漏等检查错误和补充遗漏等Ø 时间趋势和生存率统计时间趋势和生存率统计• 登记资料的质量评价登记资料的质量评价 肿瘤登记机构简介•机构名称、地址、负责人及其专业及登记机构工作概况 病例报告形式(主动收集、被动报告,混合) 随访情况(主动、被动) 资料的计算机化程度登记地区医疗及人口情况介绍登记覆盖地区范围及医疗资源情况(肿瘤诊治水平)和分性别、分年龄组的人口年龄组年龄组合计合计男性男性女性女性性比例性比例合计合计 185038589255650 82482081.000-7425937501349581.071-4869952439642430311.005- 11283565745635537931.04…………………………80-15133869456818820.8585-7599828770472280.61肿瘤编码标准及报告病例范围•ICD-O, ICD-10•尸检、筛查病例•中枢神经系统良性肿瘤•原位癌•细胞学诊断是否作为病理组织学诊断登记报告期内恶性肿瘤分性别、年龄和部位病例数及死亡数如下表:某地某年X性恶性肿瘤发病例数(死亡数) 部位部位 ICD10年龄组(岁)年龄组(岁) ALL age 0~ 5~ ……… 85~ 唇唇C001900……..4舌舌C02,C022500…….1…………………….………….……..其他及不明其他及不明部位部位O&U12201…….0合计合计All4567845 52……1720除皮肤其他除皮肤其他癌(癌(C44))ALL But C444105745521668十个常见肿瘤部位•分性别的十个常见肿瘤部位的登记病例数、粗发病率(死亡率)和年龄调整率,见下表:表 xx 某地某年性前十位恶性肿瘤发病率(死亡率)(1/10万) *世界标准人口构成世界标准人口构成部位(部位(ICD-0)位次位次病例数病例数构成比构成比粗率粗率年龄调整率年龄调整率*所有部位所有部位6956100250.1239.0胃(胃(C15))1165123.7359.456.2肺(肺(C34))2140320.1650.048.4肝(肝(C22))3106315.2838.233.7…………………………… 胰腺(胰腺(C25))101311.834.74.4年度报告内常用的一些统计指标•登记时期分性别的各部位年龄组发病(死亡)率、粗率、及年龄调整率。
•35-64岁截缩率•0-74岁累积率•各部位肿瘤新病例(死亡)数占新病例(死亡)总数的构成比表XX 某地某年X性恶性肿瘤发病(死亡)率(1/10万)部位部位所有年所有年龄龄年龄年龄不知不知0-…….85-粗率粗率构成比构成比中国标化中国标化率率世界标化世界标化率率截缩率截缩率累积率累积率(%)ICD-10唇唇50_….0.110.140.060.080.100.300.01C00舌舌200_….2.410.240.230.240.350.530.04C01….白血病,白血病,未特指未特指351_….2.60.990.400.960.930.480.07C95其他或部其他或部位不明位不明2983_….9.158.413.434.656.051.450.64O&N所有部位所有部位合计合计8696292.34….11.78245.39100118.09156.38345.6717.88All所有部位所有部位除外除外C44862342.22….11.71243.3399.16117.23155.18343.8717.77Allb图示法图X 年龄别发病(死亡)率曲线图图X 某市恶性肿瘤世界人口调整发病(死亡)率图X 某地恶性肿瘤发生构成地理分布图谢谢!谢谢!。
