好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

结构方程模型检验拟合指数与卡方准则.pdf

9页
  • 卖家[上传人]:艾力
  • 文档编号:36524856
  • 上传时间:2018-03-30
  • 文档格式:PDF
  • 文档大小:1.34MB
  • / 9 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 收稿日期: 2003- 02- 22*本研究得到全国教育科学?十五?规划教育部重点课题(DBA010169) 以及香港中文大学和华南师范大学心理应用研究中心( 教育部文科基地)资助 通讯作者: 温忠麟, Email: wenzl@ scnu. edu. cn结构方程模型检验: 拟合指数与卡方准则*温忠麟1, 2? 侯杰泰1? 马什赫伯特3(1香港中文大学教育学院,香港) (2华南师范大学教科院, 广州 510631)(3西悉尼大学教育学院, 悉尼, 澳大利亚)摘? 要? 讨论了Hu和 Bentler( 1998, 1999)推荐的检验结构方程模型的 7个拟合指数准则, 对这 7 个指数的历史、 特点和表现做了比较详细的述评指出了他们基于这 7 个指数的单指数准则和 2- 指数准则的不足之处提出了超低显著性水平下的卡方准则, 并部分重复他们的模拟例子, 将卡方准则与这 7 个指数准则比较, 结果说明新的卡方准则优于其中的 6个, 与另一个相当最后简要说明了应当如何检视拟合指数进行模型检验和模型比较关键词? 结构方程, 模型检验, 拟合指数, 临界值, 卡方检验分类号? B841. 2? ? 近年来, 结构方程( structural equation) 分析( 包括 验证性因子分析) 在我国的心理、 教育、 社会、 管理和传播等研究领域已经逐步有了一些应用。

      面对结构方程分析软件( 如流行的 LISREL、 EQS、 AMOS) 输出结果, 如何检视诸多的拟合优度统计量( 也称为拟合指数, 以下简称指数) 以检验或选择模型, 是应用工作者很感兴趣的问题本文研究的问题可以简单地 归结为: 第一, 应当根据哪些指数来检验模型? 第二, 多大的指数值才算是一个? 好?的模型? 所谓指数, 是反映模型与样本数据吻合程度的统计量, 所以第一个问题就是用什么统计量来检验所拟合的模型第二个问题类似于通常的假设检验中统计量( 如 t 检验中的统计量) 的临界值( 以下称为界值) 如 何确定实际上, 这两个问题都是结构方程分析中很重要、 且尚未很好解决的问题1 ? 问题的背景? ? 拟合指数的研究在结构方程分析的历史上受到了相当的重视, 不少文献与指数的研究有关, 而且其中部分文献被高频率引用( 如文献[ 1~ 5] 等) 从1973年 Tucker 和 Lewis[1]提出的第一个指数 TLI 至1996 年Marsh 和 Balla[ 6]提出的 NTLI, 文献上正式发表、 有名字的指数有 40 多个指数研究的历史上可 谓争论不断, 争论的焦点就是上面提到的两个问题:一是哪些指数比较好? 这个问题, 从不同的角度分 析会有不同的结果, 这是指数家族庞大的重要原因。

      二是指数的界值( cutoff value) 取多大合适? 很长一段时间比较公认的标准是, 相对指数在0. 9 或以上,拟合的模型可以接受[3]; RMSEA 小于 0. 05 表示模型拟合得好, 在 0. 05? 0. 08 之间表示模型基本可以接受[7, 8]新近的结果是, Hu 和 Bentler[ 9,10]经过文献分析和模拟研究, 对ML 估计( 极大似然估计, 他们报告的模拟结果和本文的模拟结果都是基于 ML 估计) 和 GLS 估计( 广义最小二乘估计) , 推荐联合使用SRMR 和以下指数中的一个: TLI、 BL89、 RNI( 或CFI) 、 Gamma Hat、 Mc 和 RMSEA 来检验模型他们建议的界值是 TLI、 BL89、 RNI( 或 CFI) 和 Gamma Hat为0. 95, Mc 为 0. 9, SRMR 为0. 08, RMSEA 为 0. 06由于作者之一 Bentler( EQS 的作者) 的名气和载文刊 物?Psychological Methods?[ 9]( 1996 年从?PsychologicalBulletin?分出来的美国心理协会最主要的心理方法和统计期刊) 的影响都很大, 他们这种比较苛刻的新准则很可能成为检视指数的普遍标准( 参见文献[ 11] ) 。

      本文对他们的新准则进行评论和质疑首先我们根据前人的研究, 给出一个好指数应有的特征, 对上述指数的表现和特征做出评价; 然后就 Hu和 Bentler[10]模拟研究中, 根据他们的新准则得到的 第一类( 拒真) 和第二类( 受伪) 错误率的总和, 来说? 心? 理? 学? 报? 2004, 36(2) : 186~ 194 ? Acta Psychologica Sinica186? ?明他们的新准则有何不妥; 接着我们重复他们的部 分模拟, 结论是如果选择适当的显著性水平, 传统的?2检验与他们的 Mc 准则相当, 比其他 6 个新准则都好最后, 我们简要说明了在检验和评价所拟合的模型时应当如何检视指数为行文方便, 将一个 指数连同一个界值称为一个指数准则2 ? 指数分类? ? 将众多的指数按其功能分类, 有助于对指数的 理解和合理使用1988年 Marsh 等人最早提出了指数分类的雏形[ 12], 有几个指数是受到他们分类的启发而提出的后来出现了许多不同的分类方法( 如 文献[ 9, 10, 13~ 15] 等, 中文如[ 16] ) , 分类的依据各有侧重Marsh, Hau 和 Grayson[17]将指数分成三大类: 一类是绝对指数( absolute index 或 stand- aloneindex) ; 一类是相对指数( relative index) , 也称为增值 指数( incremental index) 或比较指数( comparative in?dex) ; 还有一类是省俭指数( 也称为简约指数, parsi?mony index) 。

      绝对指数又可( 有重叠地) 分成: 直接 基于拟合函数的指数、 拟合优度指数、 基于离中参数的指数、 近似误差指数和信息指数; 相对指数又可分成有模型复杂性校正和无模型复杂性校正两种为 让读者熟悉Hu 和 Bentler 建议使用的 7个指数, 表 1列出了这些指数的计算公式、 所属类型, 表注中有它们的英文名称 指数虽多, 但除了 RMR、 SRMR、 GFI、 AGFI 和 PGFI 外, 其他都是统计量 ?2( 以下用 CHI 表示) 的函数绝对指数( 如 GFI, SRMR, RMSEA) 衡量了所考虑的理论模型( theory model) 与样本数据的拟合程度, 它只基于理论模型本身, 不与别的模型比较相 对指数则将理论模型与虚模型( null model) 比较, 都可以写成 这样的 形式: [ f ( CHIN) -f ( CHIT) ] /f( CHIN) , 其中 f ( CHI) 是 CHI 的函数, f ( CHIN) 和f( CHIT) 分别 是拟 合虚模 型和 理论 模型得 到的f( CHI) 它衡量了相对于虚模型的 f( CHI) 而言, 所检验的理论模型的 f( CHI) 减少的比率。

      最简单的 情形是 f( x ) = x, 此时 f( CHIN) = CHIN, f( CHIT) =CHIT, 对应的相对指数是 NFI[6]省俭指数是前两类指数派生出来的一类指数, 某个指数对应的省俭指数是用省俭比 d fT/ d fN乘以该指数( 其中分子和分母分别表示拟合理论模型和虚模型对应的自由 度) , 目的是惩罚复杂模型( 即自由度少的模型) 表 1? Hu和 Bentler 建议使用的 7 个指数指数名称及定义LISREL 缩写分类TLI =(CHIN/ d fN- CHIT/ dfT) / ( CHIN/ dfN- 1)NNFI相对、 校正BL89 =( CHIN?CHIT) /( CHIN-dfT)IFI相对、 校正CFI = 1 ?max( CHIT- dfT, 0) /max( CHIT- dfT,CHIN- dfN, 0)CFI相对Gamma Hat= p/ [ 2( CHIT- dfT) / (N- 1) + p]无此指数绝对、 基于离中参数Mc = exp {- 1/ 2[ ( CHIT- dfT) / (N- 1) ] }无此指数绝对、 基于离中参数SRMR= sqrt2? i? j( sij- ^ ?ij)2/ [ p( p+ 1) ]Standardized RMR绝对、 近似误差RMSEA= sqrt{max[ ( CHIT-dfT) /( N- 1) , 0] / dfT}RMSEA绝对、 近似误差、 校正注: N 是样本容量。

      p 是观测变量个数CHI= ?2, 它等于拟合函数的极小值的( N - 1) 倍d f 表示自由度CHIN和 d fN分别表示拟合虚模型( 即所有观测变量互不相关的模型, 与其他模型相比,它的 CHI 和df 都比较大) 得到的 CHI 和自由度CHIT和 d fT分别表示拟合待检验的理论模型得到的 CHI和自由度max 是最大值函数, exp 是指数函数, sqrt 是平方根函数sij是样本相关系数; ^ ?ij是由模型再生的相关系数的估计TLI( Tucker- Lewis Index) 亦称为 NNFI(Non- Normed Fit Index, 非范拟合指数) BL89 是 Bollen 在1989 年定义的指数, 亦称 IFI( Incremental Fit Index,增值拟合指数) CFI( Comparative Fit Index, 比较拟合指数) 是 RNI(Relative Non- centrality Index, 相对离中指数) 的规范形式( 即大于 1 时就取为1, 小于 0 时就取为 0) Mc ( Measure of centrality) 和 Gamma Hat 都不是LISREL 的指数, 但Mc 是EQS 的指数。

      SRMR( Standardized Root Mean squareResidual) 是标准化残差均方根RMSEA( Root Mean Square Error of Approximation) 是近似误差均方根3 ? 一个好的指数应当具有的特征? ? 一个好的指数应当具有如下特征: 与样本容量N 无关; 惩罚复杂的模型; 对误设模型敏感3. 1 ? 不受样本容量的系统影响? ? 一个理想的指数, 应当与 N 无关或者关系不 大, 即不受样本容量的系统影响许多研究者都注意到这一点( 如[ 5, 9, 12, 13, 18] ) 道理并不复杂,因为一个指数如果会随样本容量而系统变化, 那么 由样本计算的指数是总体指数的有偏估计一般说来,用它检验模型时, 不同的 N 往往会有不同的结果, 而且基于总体和基于样本的结果会出入很大所以, 一个指数如果会随样本容量而系统变化, 那么 就难于判断指数值多大, 模型才能接受Marsh 等? 2 期温忠麟等: 结构方程模型检验: 拟合指数与卡方准则187? ?人[12]使用Monte Carlo 模拟方法, 对多种真模型( true model) 及误设模型( misspecified model) , 检查了 31 个指数( 其中几个指数当时还没有名字) 受样本容量影响的情况。

      他们发现 TLI 是当时惟一被广泛使用的与样本容量相对无关的指数McDonald 和 Ho[14]重 申, 如果一个指数相对地不受取样偏差的影响, 可以用来检验模型[ 5] ? 不过也有人指出[19], 对于信息指数如AIC, 与 N有关是合适的这类指数的功能与其他指数不同, 由于本文不涉及这类指数, 不多介绍3. 2 ? 惩罚复杂的模型? ? 一个理想的指数, 应当惩罚复杂模型对一组 确定的变量及其关系, 要估计的自由参数越多( 即自由度越少) , 模型越复杂在模型选择时, 即使增加的自由参数本来是多余的, 也会让人觉得模型拟合在。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.