
交叉分类的模型.pptx
51页交叉分类的模型内容安排• 描述基于多水平分析技术的交叉分类随机 效应模型分析的基本原理• 演示如何用HLM6版本软件对交叉分类模型 数据进行处理研究实例 • 社区和学校对学生成绩的影响 – 同一社区的学生到不同学校,同一 学校的学生来自不 同社区 • 初中和高中对学生成绩的作用 – 同一初中的学生到不同高中读书, 同一高中的同学来 自不同初中 • 不同单位对员工收入的影响 – 有人频频跳槽, 有人在一个单位干到退休 • 社区和医院对病人的影响 – 同一社区的病人到不同医院看病, 同一医院的病人来 自不同社区 • 社会调查中访员和调查地区对调查对象的影响 – 同一个访员在不同地区访问, 同一地区有不同访员进 行调查交叉分类数据结构VS多水平数据结构交叉分类的数据结构师 大 附 中蓝蓝 天 中 学新 街 口太 平 庄交叉分类数据结构VS多水平数据结构多水平数据结构海 淀崇 文崇文中学天坛中学清华华附中人大附中数 据 整 理 格 式交叉分类vs多水平• 数据都是nested的• 交叉分类的数据结结构不是多水平数据结结构• 使用多水平方法和概念处处理交叉分类问题问题– 使用HLM– 非常简单简单• 但要能够够看懂输出结结果交叉分类的研究例子--社区和学校对对学生成绩的作用学生学生学生学生学生学生学生学生学生学校1学校2学校3社 区 1社 区 2社 区 3学生变变量:成绩,年龄…社区特征:收入水平学校特征:是否重点要研究的问 题 • 计算成绩绩的方差在社区间间、学校间间和儿童间间(每个 格子)的大小 • 找出对对成绩绩有影响的社区和学校特征 • 进进一步计算在考虑虑了学生、社区和学校变量的作 用后成绩绩的方差在社区间间、学校间间和儿童间间(每个 格子)的大小(残差方差) • 计算学生特征对对成绩的作用在社区、学校和格子 间的变变异情况 • 计计算社区特征的作用在学校间间的变变异情况 • 计计算学校特征的作用在社区间间的变变异情况 • 计算特定社区或学校的独特作用交叉分类类模型的构成• 一个交叉分类模型包括两个分模型 – 格子:两个高水平的单位交叉而成 • 社区和学校 • 水平1模型(格子内模型) – 研究学生水平变量间的关系, 性别->成绩 • 水平2模型(格子间模型)– 考察学校或社区特征的作用方差分解模型(零模型) 计计算学校间间、社区间间和格子内的方差在格子jk 内的儿童i的成绩绩,住社区j到学校k上学的儿童i的成绩绩在格子jk 内的所有儿童的平均成绩绩,住社区j到学校k上学的所 有儿童的平均成绩绩随机的儿童效应,儿童ijk的成绩绩与在格子jk的所有儿童平均成 绩绩的差值, 被假定服从均数为0、方差(格子内)为 的 正态态分布j为社区编号, j =1 ……524社区,, k为学校编编号 , k=1 ……17学校水平1(格子内) 模型方差分解模型(零模型) 计计算学校间间、社区间间和格子内的方差所有儿童成绩绩的平均数社区j的随机主效应应, 社区j在所有学校间的平均作用,服从均数为为0 ,方差为 的正态态分布j为社区编号, j =1 ……524社区,, k为学校编编号 , k=1 ……17学校水平2(格子间) 模型学校k的随机主效应应, 学校k在所有社区间间的平均作用,服从均数 为为0,方差为 的正态态分布随机的交互效应应,格子的平均数与由总总体均数和社区和学校主效应 而预测预测 的均数之间间的差,服从均数为为0,方差为 的正态态分布实际实际 上,格子内的样样本量往往太小,很难把交互效应的方差 和格子内的方差 区分开来,二者往往混在一起, 因此在计计算 时时一般把交互效应应的方差项项去掉方差分解模型(零模型, unconditional model)j为社区编号, j =1 ……524社区,, k为学校编编号 , k=1 ……17学校水平2(格子间) 模型总总公式j为社区编号, j =1 ……524社区,, k为学校编编号 , k=1 ……17学校总总公式中各项项的含义义成绩总体平 均成绩社区作用学校作用交互作用格子内离 差总结• 交叉分类分析的关键部分结束了 – 总变总变 异分解为为格子内、社区、学校、社区学校的交互 成分 • 考察不同来源的变异占总变异的比例 – 按照公式进行简单计算 • 考察不同自变量(性别、收入水平、是否重点校)对 成绩的作用 – 在方程中添加自变量 • 查看输出结果 – 依据输出结果修正模型 – 整理结果各方差所占比例 单单位内相关 intra-unit correlation 同住同校同住不同校同校不同住两个**儿童成绩的相关程度• 学生自变量的作用可能是固定的、只在社 区间随机、只在学校间随机或两者都随机 , 或受社区学校交互作用的影响 • 社区自变量的作用可能是固定的、在学校 间随机 • 学校自变量的作用可能是固定的、在社区 间随机考察自变变量作用的模型 conditional model只有学生自变变量的模型水平1方程水平2截据方程水平2斜率方程水平1的截据和斜率在水平2不同单位间的变异可能显著或不显著假定斜率在水平2的变变异不显著aijk: gender只有学生自变变量的模型水平1方程水平2截据方程水平2斜率方程假定斜率在水平2的变变异不显著aijk: sex假定社区和学校特征对对成绩绩的作用是固定的包含水平2自变变量的模型水平1方程水平2截据方程水平2斜率方程假定斜率在水平2的变变异不显著 并且社区和学校特征对对成绩绩的作用是固定的aijk: gender假定社区和学校特征对对成绩绩的作用是随机的if社区的作用在学校间间是随机的 ,学校的作用在社区间是随机的Xk: 学校特征, Wj: 社区特征包含水平2 自变变量的模型水平1方程学校作用在社 区j间间随机水平2斜率方程假定斜率在水平2的变变异不显著 并且社区和学校特征对对成绩绩的作用是随机的aijk: genderXk: 学校特征, Wj: 社区特征j: 社区 编号, 共524社区K: 学校 编号, 共17 学校 社区 作用在 学 校k 间间随机水平2截据方程更加复杂杂的模型• 水平1斜率在水平的一个或全部单位随机 • 更多社区和学校变量的作用 – 对斜率的作用 – 对截据的作用 • 社区和学校变量的交互作用 • 格子水平的自变量--社区学校间的距离 • 更多其它情况实际上……• 很多效应不显著 • 尤其是交互作用项的作用,因为很难与格 子内变异区分往往不被估计 • 通过限制参数而使模型简洁 – 参数个数 – 是否随机演示例子• 2310学生 • 来自542个社区 • 就读于17个学校 • 因变量是7年级学习成绩 • 儿童性别和其它变量 • 社区收入水平 • 学校特点运用HLM软件分析数据• 调用现成的命令 • 需要3个文件– 学生水平文件 – 水平2-行(row)-文件• 社区特征 – 水平2-列(column)-文件• 学校特征 • 通常把数量多的水平2单位(社区)当作行水 平 1 文 件水 平 2 社 区 文 件水 平 2 学 校 文 件创建MDM文件选择选择 要进进 行交叉分 类类分析选择选择 文件界面选择选择 水平1文件中的变量选择选择 水平2行文件中的变量选择选择 水平2列文件中的变量输入MDM文件名,生成用于交叉分类类分析的MDM文件打开用于进行交叉分类分析的MDM文件设设定因变量无条件模型行邻邻居变变异成绩总总体平均数列学校变变异交互项项?方程总总体均数邻居的变变异格子内变变异学校的变异计算单单位内相关同住同校:格子内相关=0.074同住不同校: 邻居内相关=0.139同校不同住:学校内相关=0.074添加性别自变量到方程中只包括性别自变量的模型,性别的作用不随机性别的作用不随机 社区的作用不随机性别的作用不随机 社区的作用在学校间随机性别的作用不随机 社区的作用、学校的作用不随机性别的作用不随机 社区的作用学校间随机 学校的作用在社区间随机HLM软件的Bug?输出结果Where is the Male from?Where is the Male from? c01 & b01 has nothing to do with male now结果整理格式无条件模型条件模型1其它模型固定部分系数(标准差)(显著性)系数(标准差)(显著性)系数(标准差)(显著性)随机部分方差(标准差)(显著性)方差(标准差)(显著性)方差(标准差)(显著性)方差变化方差变化。









![2019版 人教版 高中语文 必修 上册《第一单元》大单元整体教学设计[2020课标]](http://img.jinchutou.com/static_www/Images/s.gif)


