
[理学]多层线性模型简介.ppt
34页多层线性模型简介王 鹏v在许多研究中,取样往往来自不同层级和单位,这 种数据带来了很多跨级(多层)的研究问题,解决 这些问题的一种新的数据分析方法——多层模型分 析技术v这一方法的开创及发展的主要贡献者之一是英国伦 敦大学的Harvey Goldstein教授及研究者把这种方 法称作“多层分析”另一主要开拓者美国密歇根大 学的StephenW.Raudenbush教授和同行把它称为“ 分层线性模型结构”在此,我们按照张雷等人的叫 法称其为“多层线性模型”或“多层模型”主要内容v一、多层线性模型简介v二、多层线性模型基本原理v三、多层线性模型HLM软件的应用多层线性模型简介v1、多层数据结构的普遍性v多层(多水平)数据指的是观测数据在单位上具有 嵌套的关系v(1)教育研究领域vEG:学生镶嵌于班级,班级镶嵌于学校,或者学生 简单地镶嵌于学校,这时学生代表了数据结构的第 一层,而班级或学校代表的是数据结构的第二层; 如果数据是学生镶嵌于班级,而班级又是镶嵌于学 校,那么就是三层数据结构多层线性模型简介v(2)组织心理学研究领域vEg:雇员镶嵌于不同的组织、工厂v(3)发展心理学领域vEg:纵向研究、重复研究v在一段时间内对儿童进行多次观察,那么不同时间 的观测数据形成了数据结构的第一层,而儿童之间 的个体差异则形成了数据结构的第二层。
这样,就 可以探索个体在其发展趋势或发展曲线上的差异多层线性模型简介v2、多层数据的传统分析方法v多层数据一直困扰着研究者大概半个世纪之 久由于个体的行为既受个体自身特征的影 响,也受到其所处环境的影响,所以研究者 一直试图将个体效应与组效应(背景效应或 环境效应)区分开来v个体效应:由个体自身特征所造成的变异v组效应:由个体所处环境所造成的变异多层线性模型简介v(1)只关注个体效应,而忽视组效应v只在个体这一层数据上考虑变量间的关系, 那么导致所观测到的效应既包含个体效应, 又包含组效应,从而增大了犯一类错误的概 率,夸大了变量间的关系v(2)在组水平上进行分析v把数据集中起来,使其仅在第二层的组间发 挥作用,从而丢失了重要的个体信息多层线性模型简介v(3)组内分析组间分析v对相同的数据进行三次计算:v一是在组内的个体层上进行的分析,称为组内效应v二是通过平均或整合第一层中的个体数据,得到第二层的组 间数据,称为组间效应v三是忽视组的特性而对所有的数据进行分析,称为总效应v在此基础上,计算组内效应和组间效应在总效应的比例,从 而确定变异来自于组间还是组内v组内分析组间分析的方法较前两种方法更多的考虑到了第一 层数据及第二层数据对变异产生的影响,但并无法对组内效 应和组间效应做出具体的解释,也就无法解释为什么在不同 的组变量间的关系存在差异。
多层线性模型简介v3、多层线性模型分析方法v回归的回归方法vEg:学生成绩(X) 学习动机(Y)v v 班级教师教学水平(W)v(1)求各个班级学生成绩对学习动机的回归多层线性模型简介v(2)求教师教学水平对β0j和 β1j 的回归方程多层线性模型简介v4、多层线性模型的优点v(1)使用收缩估计的参数估计方法,使得估计结 果更为稳定、精确v收缩估计:使用两个估计的加权综合作为最后的估 计其一是来自第一层数据的OLS估计,另一个是 来自第二层数据的加权最小二乘法估计,最后的估 计是对以上两个估计的加权v(2)可以处理样本不等的数据veg:当某些第二层单位在第一层的取样甚少时,可以 借助于其他二层单位和二层预测变量,对取样较少 的一层单位进行回归分析第一层单位3个及以上 多层线性模型简介v5、多层线性模型的应用范围v(1)组织和管理研究v(2)对个体进行追踪、多次观测的发展研究v(3)教育研究v(4)元分析研究多层线性模型基本原理v1、多层线性模型的基本形式v水平1(如:学生) v水平2(如:学校)jju0000+=gbYij---第j个 学校的第i 个学生jju1101+=gb指固定成分随机成分多层线性模型基本原理v 为固定成分,指第二层单位间β0j 和 β1j 的平均值v 为随机成分,指第二层单位β0j 和 β1j 的变异多层线性模型基本原理v把第一层和第二层方程整合如下:v误差项间是相关的:同一第二层单位的个体 有相同的v误差项间方差不等:相同第二层单位内的个 体间相似性比不同单位内个体相似性高v误差项与自变量有关:残差项包含残差项多层线性模型基本原理v因此,多层数据并不满足传统OLS回归分析 关于残差项的诸多假设。
而多层线性模型将 残差项进行了分解,更符合实际情况,所以 对于多层数据使用多层线性模型进行分析更 为合理多层线性模型基本模型v2、多层线性模型的基本模型v零模型(The Null Model)v第一层和第二层均没有预测变量,只是将方 程分解为由个体差异造成的部分及由组差异 造成的部分,这种方法为方差成分分析多层线性模型——零模型v第一层:v第二层:v合并模型:ijojijeuY++=00g多层线性模型——零模型v 指第j个二层单位Y的平均值 v 指第j个二层单位Y的变异v 指所有二层单位的Y的总体平均数v 指第二层方程的残差(随机项)v跨级相关:指Y的总体变异中有多大比例是由 第二层的变异引起的v 多层线性模型——完整模型v完整模型(The Full Model)v既包含了第一层的预测变量,又包含了第二层的 预测变量,可通过理论建构来说明解释Y的总体 变异是怎样受第一层和第二层因素的影响v第一层:多层线性模型——完整模型v第二层: jjjuW001000++=ggb多层线性模型——完整模型v在第一层方程中,0代表截据,1代表斜率v在第二层方程中,第一个下标代表第一层参 数的类型;第二个下标代表第二层参数的类 型。
vβ0j和β1j的预测变量可以相同,也可以不同 多层线性模型——协方差模型v在零模型与完整模型之间,可通过向各层方 程中增加不同的变量,设定不同的随机成分 与固定成分来建构各种分析模型v协方差模型(ANCOVA Model)v第一层:v第二层:多层线性模型——协方差模型v第一层方程中,预测变量采用总体平均数为参 照的离差,与传统协方差分析的区别是β0j被 进一步分解为 和vβ1j没有随机项,反映了协方差分析的一个重 要前提,协变量对因变量的回归系数的组间一 致性检验这种假设的方法是把 纳入到方 程中,并检验 是否成立多层线性模型——随机效应回归模型v随机效应回归模型(Radom Eeffect Regression Model)v第一层:v第二层:jju0000+=gbjju1101+=gb多层线性模型——随机效应回归模型v此模型与完整模型的区别在于第二层没有预 测变量;与传统OLS回归区别在于第一层的 β0j和β1j是随机的而非固定的,其目的是寻 找第一层的截据、斜率在第二层单位上的变 异多层线性模型——发展模型v发展模型v发展模型是把多次观测结果作为时间的某种 数学函数来建构模型。
它多用于发展研究、 纵向研究或者追踪研究v在这种模型中,第一层数据为不同时间的观 察结果,第二层数据为个体的特征多层线性模型——发展模型v第一层:线性发展模型vTime:一般用编码的形式来反映增量vEg: 0、1、2、3、4、5v -5、-4、-3、-2、-1、0v线性发展模型的第一层方程并不一定为线性方程,也可以 为非线性方程vEg:多层线性模型——发展模型v“确定发展变异”的第二层:jju0000+=gbjju1101+=gb时间变量编码为0 时Y的总体平均数线性发展斜率 的总体平均值指个体j与平 均发展斜率 的离差指个体j与平均 截据的离差多层线性模型——发展模型v“预测发展变异”的第二层:jjjuW001000++=ggb考虑第二层的预测 变量W后第一层的 截据和第一层的斜 率在第二层单位间 的残差方差代表第二层的变量W 对第一层截据的效应多层线性模型——三层模型v三层模型是二层模型的直接扩展,我们也可以根据 需要选择零模型与完整模型之间的任何模型v模型1:零模型v第一层:v第二层:v第三层:多层线性模型——三层模型v第一个下标表示第一层方程中的参数;第二 个下标表示第二层方程中的参数;第三个下 标表示第三层方程中的参数。
v 表示第二层单位之间的变异, 表示第 三层单位之间的变异v跨级相关:v第一层的方差和总方差之比:v第二层的方差和总方差之比:v第三层的方差和总方差之比:多层线性模型——三层模型v模型2:完整模型v第一层:v第二层:多层线性模型——三层模型v第三层:。
