
Poisson分布和回归课件.ppt
31页Poisson分布和回分布和回归课件件一、一、Poisson分布的定义及特点分布的定义及特点以放射性脉冲计数为例以放射性脉冲计数为例将一段规定时间内平均放射的脉冲将一段规定时间内平均放射的脉冲数记为数记为 ,把这段时间等分为,把这段时间等分为n份,份, 则每小段时间内平均放则每小段时间内平均放射的脉冲数为射的脉冲数为 /n假定:假定:• n足够大,以致在每一小段时间内有或无脉冲,出现足够大,以致在每一小段时间内有或无脉冲,出现2个及以个及以上脉冲的机会可以忽略(大量、有或无)上脉冲的机会可以忽略(大量、有或无)•每小段时间内出现脉冲的概率都是每小段时间内出现脉冲的概率都是 /n (重复、小概率)重复、小概率)•不同时间段内脉冲出现与否是独立的(独立)不同时间段内脉冲出现与否是独立的(独立)在这在这n小段时间内出现的脉冲总数小段时间内出现的脉冲总数X服从二项分布服从二项分布B((n,, /n),),概率函数为概率函数为当当n趋于趋于 时,时,P(X=x)的极限为的极限为上式中,常令上式中,常令 /n = 令罕见事件发生数为令罕见事件发生数为X,若,若X的发生概率的发生概率P(X)则称则称X服从参数为服从参数为μ的的Poisson 分布,记为分布,记为X~P( μ)。
其中其中X为为单位时间单位时间(或面积、容积等或面积、容积等)某罕见事件发生数,某罕见事件发生数,μ是是Poisson 分布的总体均数分布的总体均数Poisson 分布常用于描述单位时间、单位面积或空间中分布常用于描述单位时间、单位面积或空间中罕见罕见事件发生数事件发生数的分布规律的分布规律观察单位与发生事件一般不对应观察单位与发生事件一般不对应Poisson分布的定义分布的定义罕见事件发生数罕见事件发生数• 放射性物质单位时间内的放射次数放射性物质单位时间内的放射次数• 单位体积内粉尘的计数单位体积内粉尘的计数• 显微镜下细胞或微生物计数显微镜下细胞或微生物计数• 单位面积内细菌计数单位面积内细菌计数•发病率很低的疾病(不具传染性、无永久免疫、无遗传发病率很低的疾病(不具传染性、无永久免疫、无遗传性)在人群中的发病数性)在人群中的发病数Poisson分布的特点分布的特点•事件的发生是完全随机;事件的发生是完全随机;• 事件发生与否是独立的;事件发生与否是独立的;• 事件发生的概率事件发生的概率P不变;不变;• Poisson分布的总体均数为分布的总体均数为µ;;• Poisson分布的均数和方差相等,分布的均数和方差相等, µ==σ2。
Poisson 分布、正态分布及二项分布的关系分布、正态分布及二项分布的关系•当当µ较小时,较小时, Poisson分布呈偏态分布,随着分布呈偏态分布,随着µ增大,增大,迅速接近正态分布,当迅速接近正态分布,当µ≥20时,可以认为近似正态分布时,可以认为近似正态分布•Poisson分布是二项分布的特例,某现象的发生率分布是二项分布的特例,某现象的发生率π很小,而样本例数很小,而样本例数n很大时,则二项分布接近于很大时,则二项分布接近于Poisson分布 µ == n π ((应用:应用: Poisson替代二项替代二项分布)分布)例例1::某车间在生产工艺改革前后各测某车间在生产工艺改革前后各测1次粉尘浓度,每次粉尘浓度,每次测次测1升空气,分别测得升空气,分别测得39和和25颗粉尘请据此推断改颗粉尘请据此推断改革前后粉尘浓度是否相同?革前后粉尘浓度是否相同?,认为该车间改革前后粉尘浓度相同认为该车间改革前后粉尘浓度相同1.当观察单位相同时两样本比较当观察单位相同时两样本比较二、二、Poisson分布的分布的Z检验检验例例2::某车间在生产工艺改革前测某车间在生产工艺改革前测3次粉尘浓度,每次测次粉尘浓度,每次测1升空气,分别测得升空气,分别测得38,,29和和36颗粉尘;改革后测颗粉尘;改革后测2次,次,分别由分别由25和和18颗粉尘。
请据此推断改革前后粉尘浓度是颗粉尘请据此推断改革前后粉尘浓度是否相同?否相同?,认为该车间改革前后粉尘浓度不同认为该车间改革前后粉尘浓度不同2.当观察单位不同时两样本比较当观察单位不同时两样本比较三、三、Poisson回归回归1.基本原理基本原理用于分析服从用于分析服从Poisson分布的罕见事件发生数(或率)与一分布的罕见事件发生数(或率)与一组解释变量之间的关系,常用对数线性模型进行分析组解释变量之间的关系,常用对数线性模型进行分析 令有令有k个解释变量个解释变量X1,,X2,,…,,Xk,,其中其中Log(n)称为偏移量(称为偏移量(Offset)2. 假设检验假设检验((1))模型检验模型检验(拟合优度检验):(拟合优度检验):当,说明可以接受拟合当,说明可以接受拟合的模型•似然比检验(似然比检验(the likelihood ratio test))•Pearson卡方检验卡方检验评价模型拟和的好坏:评价模型拟和的好坏:大多数单元格的标准化残差或调整大多数单元格的标准化残差或调整残差的残差的 绝对值小于绝对值小于2((2))自变量自变量检验检验::•检验回归系数是否为零。
检验回归系数是否为零• RR的意义假定假定X1为二分类变量(取值为为二分类变量(取值为0和和1),则固定其他变量),则固定其他变量时,时,RR=EXP(( 1))例例3::变量说明:变量说明:E:是否吸烟,:是否吸烟,1=吸烟;吸烟;2=不吸烟;不吸烟;N:肺癌发生数,:肺癌发生数,PT:人年先按照变量先按照变量N进行加权,再统计分析进行加权,再统计分析RR:(,):(,)例例4:某车间在生产工艺改革前后各测:某车间在生产工艺改革前后各测1次粉尘浓度,每次粉尘浓度,每次测次测1升空气,分别测得升空气,分别测得39和和25颗粉尘请据此推断改颗粉尘请据此推断改革前后粉尘浓度是否相同革前后粉尘浓度是否相同((见数据文件见数据文件)?)?变量说明:变量说明:E:改革前后,:改革前后,1=改革前;改革前;2=改革后;改革后;N:粉尘数:粉尘数 ,,PT:空气升数空气升数例例5:某车间在生产工艺改革前测:某车间在生产工艺改革前测3次粉尘浓度,每次测次粉尘浓度,每次测1升空气,分别测得升空气,分别测得38,,29和和36颗粉尘;改革后测颗粉尘;改革后测2次,次,分别由分别由25和和18颗粉尘。
请据此推断改革前后粉尘浓度是颗粉尘请据此推断改革前后粉尘浓度是否相同否相同((见数据文件见数据文件)?)?变量说明:变量说明:E:改革前后,:改革前后,1=改革前;改革前;2=改革后;改革后;N:粉尘数:粉尘数 ,,PT:空气升数空气升数例例6:采用职业人群回顾性队列研究方法对所有:采用职业人群回顾性队列研究方法对所有1966年年8月月18日到日到1991年年12月月31日在湖北某厂工作日在湖北某厂工作5年以上者的年以上者的生存情况作了调查符合进入队列的条件者生存情况作了调查符合进入队列的条件者9572人,观人,观察人年察人年114488,其中有,其中有159人死亡,按年龄与是否暴露人死亡,按年龄与是否暴露这两个因素分组的资料见下表,问年龄与暴露因素对死这两个因素分组的资料见下表,问年龄与暴露因素对死亡率有无影响?亡率有无影响?变量说明:变量说明:E:是否暴露,:是否暴露,2=非暴露;非暴露;1=暴露;暴露;age:年龄,:年龄,5=<40,,4=40-49,,3=50-59,,2=60-69,,1=>=70;;N:死亡数:死亡数 ,,PT:人年先按照变量先按照变量N进行加权,再进行进行加权,再进行Poisson回归回归结论:结论:暴露组相对于非暴露组,,说明暴露因素增加了死亡风险。
暴露组相对于非暴露组,,说明暴露因素增加了死亡风险与与<40岁年龄组相比,岁年龄组相比,40-49岁组、岁组、 50-59岁组、岁组、 60-69岁组、岁组、 >=70岁组的岁组的RR分别为:、、、,说明随着年龄的增大,死亡风险分别为:、、、,说明随着年龄的增大,死亡风险增高谢谢观赏谢谢观赏。
