
评价中心效度研究概述.doc
12页.评价中心的效度研究概述学生**:巫田森学号:专 业:应用心理学课程教师:陈永进 博士 课程名称:人力资源测量与评估 **大学贸易与行政学院二OO九年四月评价中心的效度研究概述巫田森〔**大学贸易与行政学院,**400044〕摘 要:评价中心作为一种流行的人才测评方式,其效度一直受到学者和实施者的关注本文通过收集国内外的相关专业文章,对评价中心的构造效度、校标关联效度及效度影响因素等方面进展了总结关键词:评价中心;构造效度;校标关联效度The Review of the Validity of AssessmentCenterWu Tian-Sen(ChongqingUniversity, Institute of Trade and Administration, Chongqing 400044, China)Abstract:AssessmentCenter is a popular method for personnel appraisement, and it’s validity has always been the focusof the researchers and implementers. With collecting and reading lots of related papers and articles, This article summarized the construct validity, the discriminant validity and influencing factor to the AssessmentCenter.Key words:AssessmentCenter;Construct Validity; Discriminant Validity.引言:评价中心源于20世纪20年代,是一种测定个体在多种情境作业中表现出的行为特征的操作程序[1]。
随着不断的开展和改良,评价中心已经成为国际上流行的、准确率较高的一种人才选拔技术作为一种先进的人才测评方法,其测评效度一直以后都是研究者和实际工作者极为关注的一个问题在心理测量学上,效度指的是一个测验对其所要测量的理论构造或特质测量到什么程度的估计其中,内容效度、构造效度和校标关联效度是支持效度结论的三个证据或者推论根底由于评价中心从测量设计到实际操作应用都以对目标岗位的工作分析作为出发点来设计测评内容,其典型的测评方法情境模拟练习更是强调模拟工作的真实性,从情境的取材要与目标岗位的工作内容尽量相关联,因而其内容效度在测评的设计与应用阶段已经得到了较好的控制[2]所以,现在对于评价中心的效度研究主要集中于研究评价中心的构造效度和效标关联效度,尤其是以评价中心的构造效度研究为主要方向据统计,在近十年来的评价中心相关文献中有近90%的研究都是关注与构造效度证据的获取[3]下面主要对评价中心的构造效度和校标关联效度的研究内容进展概述一、评价中心的构造效度研究(一)考核评价中心构造效度的三个维度构造效度(construct validity)指的是测验能说明理论所设想的构造或特质的程度,或者用某种构造或特质来解释测验分数的恰当程度,其着重点是测验本身、测验赖以编制起来的心理构造理论和测验测量到某理论构造或特质的能力。
对评价中心的构造效度的研究一般表现为三个方面[4]:(1)会聚效度(convergent validity),指同一评分维度的评分在不同测评方法之间的相关,相关系数越高,说明会聚效度越好;(2)区分效度〔discriminant validity〕,是指同一测评方法内不同评分维度之间评分的区分性,也用相关系数表示,相关越低,说明区分效度越好越好;(3)总体评价〔overall assessment ratings, OARs〕,它反映对被评价人员的绩效的全面性评价,因此除了包含前两个层面的水平外,总体评价还反映了其它来源的信息,例如同伴评价、人格测量、能力测验分等但总的看来,目前对评价中心构造效度的研究多集中于前两个层面,即:会聚效度和区分效度,通过这两种指标能大体上反映评价中心构造效度的优劣二)评价中心构造效度的研究方法对于评价中心构造效度的研究,多采用多质多法〔MTMM〕和验证性因素分析〔CFA〕两种方法多质多法[5]是Campbell和Fiske于1959年提出的一种分析测验的设想效度的方法,这种方法适用于多种特质在多种测评方法中进展评定时对设想效度的检验对评价中心的设想效度进展验证时,测评维度被看成是特质,而测评方法(或称测评情景) 那么被看成是方法;验证性因素分析[6]是20世纪60年代后从探索性因素分析开展而来,它根据潜在的构造而不是可观测的 变量对MTMM进展解释。
通过拟合不同的模型,并对其进展验证,然后选取拟合最好的一种模型加以分析对于多质多法的批评意见,主要是认为这种方法以包含测量误差的可观测变量间的相关为根底,来对潜在的构造进展解释,而实际上测量误差每次是不一致的,从而会影响到相关系数,进而影响对潜在构造解释的准确性验证性因素分析方法那么可以解决这个问题,它对误差和相关的变量进展控制,进而得出一个更加令人满意的结果在这种方法中,同一特质不同测评方法所决定的因素代表测评的设想效度,而同一测评方法不同测评特质所代表的因素那么说明了测评方法的效应每一个可观测变量均由特质因素、方法因素和测量误差三局部组成其最大优点在于能对因素的负荷进展固定,并对提出的不同假设模型进展检验[7](三)关于评价中心构造效度的研究成果几十年来,各国许多学者就评价中心的构造效度进展了大量的实证研究,但对于评价中心的构造效度还没有得出一致性的意见,甚至一度还出现了比拟大的争议其中争议的焦点可以归结为Klimoski & Brickher在1987年提出的关于AC的构造效度解释模型,即个体特征模式和角色一致模式[8]1、个体特征模式观点这类学者通过研究发现,评价中心的会聚效度与区分效度都比拟理想,会聚效度高于区分效度,即构造效度比拟理想。
如Neiding在研究中发现了中等程度的同质异法间相关,即在评价中心中发现了会聚效度,但同时也发现这些相关都明显都低于异质同法间的相关,且光环效应、区分效度低的现象在研究中也存在[9]另外,Shore和Thornton在研究中也得到了类似的研究结果[10]据此,他们提出评价中心能够在测评过程中就受测被试的特质维度进展评价,评价中心测量到了代表个体的特定特征,认为评价中心的按维度进展等级评分的模式可以反映北师的个体特征、技能和能力,并把不同的AC情境模拟练习看成是诱发被试与待测特质相关的系列行为的刺激即他们认为评价中心主要是以测评维度为导向的,Klimoski & Brickher把这种模式成为个体特征模式2、角色一致模式观点这类学者那么在研究中发现了低的构造效度,特别是会聚效度往往低于区分效度如Sackett 和Dreher(1982) [11]所做的一个著名的研究就是以多质多法为手段,对采自三个不同企业的评价中心的评分数据进展了研究结果说明,不同测评方法的同一维度之间没有相关,即会聚效度很差,同时还发现区分效度也差,而且同质异法间的相关低于异质同法间的相关Sackett与Harris(1988) [12]年采用验证性因素分析法,并在原有数据的根底上增加了两个企业评价中心的数据进展了重新论证分析,得到的结论仍然与之前的研究结果一致。
后来,很多学者的研究结果也说明评价中心的构造效度不显著〔Brannick,1989;Bycio,1987;Joyce,1994;Neubauer,1989;Russell,1987〕我国学者X志明等人的实证研究结果说明在评价中心中,会聚效度〔0.11〕低于区分效度〔0.455〕,构造效度不理想[7]另外,彭平根采用多质多法得出,反响会聚效度指标的同质异法间相关系数平均值为0.391,中等相关,会聚效度尚可;而反响区分效度指标的异质同法间的相关平均值为0.775,区分效度不理想;总体上认为评价中心的构造效度不是很理想[2]这类认为评价中心是以测验情境为导向性,测验结果所代表的主要是测评情境中的绩效水平,而不是各个测评维度上的绩效水平即AC的测评结果反映的是练习情境而不是特质维度,并不能真正就被试的深层次特质进展区分评价,Klimoski & Brickher把这种模式成为角色〔绩效〕一致模式Schleicher 等人[13]认为测评方法〔情境〕导向性产生的原因有以下几点:首先,评分者的信息加工能力有限,评分者在评分时难免会出现误差第二,评分者往往需要依据被评价者表现出的同样的行为,同时在几个能力维度上为其打分;而且,在不同的测试方法中,同一评分维度又可能有着不同的定义和解释,这些都可能造成测评方法效应。
第三,设计者对于评分维度的定义往往流于广泛,不够具体和操作化,这就更增加了评分的难度最后,评价中心技术是由几种不同的测评方法组成的,因此评分者的评分很容易受到测试方法的影响,而很难按照统一的评分维度进展评价所以,现在学术届对于评价中心的构造效度还没有达成一致的看法,这就需要学者们在以后进展进一步的深入研究,这将是今后关于评价中心研究的重点,也是研究的难点二、评价中心的效标关联效度研究效标关联效度(criterion-related validity),也称实证效度,指一个测验对特定情境中的个体行为进展预测时的准确性,也就是对我们所感兴趣的行为能够预测得怎样虽然,评价中心存在着一定的局限性,但它具有较高的预测效度,其测评结果能够预测被试未来的工作表现国内外的研究证明,评价中心的效度远远高于心理测验[14]如心理测验中著名的人格测验16PF和MBTI,虽然被广泛地应用于商业测量,但它们对未来才成就的预测效度都很低,最高可能也就只有0.15;而评价中心的预测效度平均为0.41,其中构造化行为访谈为0.35-0.45,单个情境模拟为0.4左右[15]而且如果评价中心设计得好,它的预测效度可以到达0.53,甚至更高。
[16]殷雷对1970年至1987年之间关于评价中心预测效度的研究结果进展了总结[17],结果发现评价中心测评总结果〔OAR〕的预测效度最低为0.27,最高为0.64,平均为0.41具体结果如下表所示:Gaugler等人对关于评价中心的研究得出的107个效度系数进展了元分析[18],发现在不同的效标类型下,评价中心的效标关联效度分别是:绩效评定为0.36、潜能评定为0.53、培训中的表现为0.35、职业生涯进展为0.36评价中心应用于不同目的时的效度是:选拔为0.41、提升为0.30、早期识别为0.46、研究为0.48Clark曾经做过一次评价中心预测效度的元分析[19],结果发现,评价中心的预测效度为0.31-0.63,能力测验为0.25-0.53,行为型面试为0.24-0.40,人格测验为0.15-0.22可以看出,与其它测评方法相比,评价中心具有更好的效度彭平根的研究结果说明[2],在预测管理类岗位的受测被试的工作绩效上,评价中心的预测效度系数到达0.35;而对技术类岗位的受测被试,评价中心的预测效度系数仅为0.115说明评价中心在预测不同职位类别的工作表现的预测效度不同,在预测被试的管理潜质方面有一定的有效。
