
对数线性模型课件.pptx
55页单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,,,‹#›,,Loglinear Analysis Model,对数线性模型,,对数线性模型课件,1,(一)对数线性模型,的任务,应用于分类变量的多元统计方法,可以分析各因素之间的联系,主要用于两个以上分类变量的高维列联表分析一)对数线性模型的任务应用于分类变量的多元统计方法,可以分,2,(二)对数线性模型,的基本原理,(四格表),,四格表,1.,变量特点,因变量:,四格表中各格的频数二)对数线性模型的基本原理(四格表)四格表1.变量特点,3,对应的概率表,对应的概率表,4,2.,对数线性模型(四格表),,,,此模型包括主效应、因素,A,与,B,的交互作用,称为,饱和模型,(saturated model),此,,模型称为,不饱和模型,(unsaturated model),或简约模型,(reduced model),如果模型中的交互项为,0,,则模型为,2.对数线性模型(四格表)此模型包括主效应、因素A与B的交互,5,在对数线性模型中,通过交互效应项反映各因素是否有关及其效应大小对数线性模型不区分各因素为因变量和自变量,综合考虑所有因素对频数的影响。
饱和模型,(saturated model),包括各级交互作用项,这种模型可以完全拟合数据,没有误差也没有自由度,所以无分析价值在对数线性模型中,通过交互效应项反映各因素是否有关及其效应大,6,3.,模型估计方法:,最大似然法(,Maximum Likelihood Method,):,构造似然函数(,Likelihood function,),通过迭代法估计一组参数(,,0,,,,,1,,,,,2,…..,,m,),使,L,达到最大3.模型估计方法:通过迭代法估计一组参数(0, 1 ,,7,4.,模型及自变量的统计检验,(,1,),模型检验,(拟合优度检验):,当,P>0.05,,说明可以接受拟合的模型似然比检验(,the likelihood ratio test,),,,Pearson,卡方检验,,,评价模型拟和的好坏:,大多数单元格的标准化残差或调整残差的 绝对值小于,2,4.模型及自变量的统计检验,8,,(,2,),自变量,检验,:,主要关心哪些交互效应有统计学意义偏相关检验:比较两个嵌套模型的似然比,,2,的,变化参数检验:计算参数估计值、标准误及,Z,检验OR,=exp(,,),,lnOR=,OR=exp() lnOR=,9,5.,模型选择,拟合检验好,•,参数有统计学意义,•,层次模型或谱系模型,(hierarchical model),谱系规则:当模型中包含了某几个变量的高级交互效应项时,这几个变量的低级交互效应项与主效应项也一定包含在模型之中。
随着列联表的维度增加,层次模型数量剧增,可以采用后退法筛选模型5.模型选择,10,例,1,:,在一项病例对照研究中,考察吸烟与肺癌是否有关例1:在一项病例对照研究中,考察吸烟与肺癌是否有关11,变量说明:,ca,:是否为肺癌患者,,0=,对照;,1=,病例;,smoke,:是否吸烟,,0=,不吸烟,,1=,吸烟;,freq,:频数变量说明:ca:是否为肺癌患者,0=对照;1=病例;smok,12,,,,一般对数线性模型,,先按照变量,freq,进行加权,再统计分析,一般对数线性模型先按照变量freq进行加权,再统计分析,13,,,,多项分布,,多项分布,14,,A.,拟合饱和模型,A.拟合饱和模型,15,,对数线性模型课件,16,,,,,,,对数线性模型课件,17,,对数线性模型课件,18,,,OR,:,6.876,(,1.789,,,26.417,),OR:6.876(1.789,26.417),19,,,B.,拟合不饱和模型,B.拟合不饱和模型,20,,,,对数线性模型课件,21,,C.,,2,检验,C.2检验,22,对数线性模型课件,23,对数线性模型课件,24,,,,对数线性模型课件,25,,,对数线性模型课件,26,高维列联表(三维为例),,,,例,2,:,370,名女职工生育史、子宫后倾、工作姿势调查结果。
高维列联表(三维为例)例2:370名女职工生育史、子宫后倾、,27,变量说明:,a,:是否有生育史,,1=,有生育史;,2=,无生育史;,b,:工作姿势,,,1=,立姿,,2=,坐姿;,c,:,是否子宫后倾,,1=,后倾,,2=,不后倾;,freq,:频数变量说明:a:是否有生育史,1=有生育史;2=无生育史;b:,28,,模型选择,,,先按照变量,freq,进行加权,再统计分析,A.,模型选择,模型选择先按照变量freq进行加权,再统计分析A.模型选择,29,,,对数线性模型课件,30,,,对数线性模型课件,31,,对数线性模型课件,32,,对数线性模型课件,33,,,,,K,维及,K,维以上交互作用是否有统计学意义,K维及K维以上交互作用是否有统计学意义,34,,,饱和模型的偏相关检验分析表,饱和模型的偏相关检验分析表,35,,,饱和模型的所有参数估计值及置信区间,饱和模型的所有参数估计值及置信区间,36,第,1,步,第1步,37,第,2,步,第2步,38,第,3,步,第3步,39,第,4,步,第4步,40,最终模型,最终模型,41,最终模型的拟合优度检验,,,,最终模型的拟合优度检验,42,B.,估计参数及统计检验,,,B. 估计参数及统计检验,43,,,,对数线性模型课件,44,,对数线性模型课件,45,,对数线性模型课件,46,,,,对数线性模型课件,47,,,对数线性模型课件,48,对数线性模型课件,49,结论:,生育史与工作姿势无关,与是否子宫后倾也无关,但工作姿势,(,是坐姿还是立姿,),与子宫是否后倾有关,不过这种关系不受生育史状态影响,(,即有、无生育史并不影响工作,姿势与子宫后倾的关系,),。
结论:,50,变量间的四种独立性,•,边际独立,(marginally independent),:不考虑,A,的影响下,,B,与,C,独立,则称,B,与,C,边际独立 •,条件独立,(conditionally independent),:若,B,与,C,在,A,的各个水平下均独立,则称,B,与,C,对给定,A,条件独立联合独立,(jointly independent),:若,C,与,D,(,A,、,B,的组合)独立,则称,C,与,A,、,B,联合独立相互独立,(mutually independent),:三个变量中的任何一个与其它两个联合独立变量间的四种独立性,51,四种独立性间的关系,若,A,、,B,、,C,相互独立,则一定有,A,与,B,、,C,联合独立,,B,与,A,、,C,联合独立,且,C,与,A,、,B,联合独立若,C,与,A,、,B,联合独立,则一定有,C,与,A,、,C,与,B,边际独立,并有给定,A,,,C,与,B,条件独立;给定,B,,,C,与,A,条件独立注意:若,A,、,B,条件独立,则不一定有,A,、,B,边际独立;,A,、,B,边际独立;也不一定有,A,、,B,条件独立。
四种独立性间的关系,52,A.,假想的,2,,2,,2,三维列联表(条件独立),OR,XY|Z1,=(4/6)/(6/9)=1,,,OR,XY|Z2,=(3/36)/(70/840)=1,;,OR,YZ|X1,=(4/6)/(3/36)=8,,,OR,YZ|X2,=(6/9)/(70/840)=8,;,OR,XZ|Y1,=(4/6)/(3/70)=15.6,,,OR,XZ|Y2,=(6/9)/(36/840)=15.6,;,X,与,Y,对给定,Z,条件独立,此资料属于条件独立模型(,XZ,,,YZ,)OR,XY,=(7/42)/(76/849)=1.86,,,,,,,,,A.假想的222三维列联表(条件独立)ORXY|Z1=(,53,B.,假想的,2,,2,,2,三维列联表(联合独立),B.假想的222三维列联表(联合独立),54,OR,XY|Z1,=(9/6)/(6/54)=13.5,,,OR,XY|Z2,=(3/2)/(2/18)=13.5,;,OR,YZ|X1,=(9/3)/(6/2)=1,,,OR,YZ|X2,=(6/2)/(54/18)=1,;,OR,XZ|Y1,=(9/3)/(6/2)=1,,,OR,XZ|Y2,=(6/2)/(54/18)=1,;,OR,YZ,=(15/5)/(60/20)=1,,,OR,XZ,=(15/5)/(60/20)=1,。
此资料属于联合独立模型(,Z,,,XY,)ORXY|Z1=(9/6)/(6/54)=13.5,ORXY,55,。












