
语言测试的信度和效度及其关系.doc
10页科技信息 2008年 第 17期 SCIENCE &TECHNOLOGY INFORMATION我们知道 , 测试是教与学的向导 ,而为了让它发挥出向导的作用 , 一份好的试 卷是必不可少的 , 而且是至关重要的 .一般情况下 , 我们判断一份试卷的好坏的主 要标准是:是否有信度、 效度、区分度、 实用性、 全面性、 公正性及后期效应 其中, 以信度和效度最为重要一、 语言测试的信度语言测试的信度,又叫可靠性, 是指考试结果的可靠性和稳定性 即看学生的 分数是否稳定, 如果同一个学生做同一套试卷 , 做的几次的结果都是一致的 , 那么 我们说这次考试是有信度的; 反之 , 如果分数 忽高忽低就说明信度不高 , 那么表明 考试的信度不高信度可以分为复测的效度、判卷的效度和每一个测试项目的效 度 同一学生 不管考多少次, 所得的分数都是一样, 那么就说这个分数 有复测的可靠性影响分 数的一个很重要的因素就是判卷人,在判卷 过程中, 不同的判卷人对同一试卷也会 做出不同的反映; 同一个人在 不同的时间对同一试卷给的分数也是不一样的 试 卷不仅要达到其整体的可靠性, 而且每一题都必须能达到这个标准, 那才是一份有 信度 的试卷。
与能力无关却又会影响试卷信度评判的因素有很多,例如:1. 考试条件差, 天气 热、考场周围太吵闹等 2.考试条件不一样 同一个学 生在安静与吵闹的环境中 做同一份试卷,其结果不一样 3.监考施 策 不同的老师对考生的松与严, 看见考 生作弊或违纪不勒令禁止 4. 题目要求不清, 学生根本无法弄清题义, 也就无法真 实的反映考生的水平 5.保密工作做的不好, 泄题事件发生 6. 评分主观测试 的评分常常因评卷人而异, 难以达到较高的信度; 客观试卷的评分不受评 卷人的影 响因此信度较高 7. 样品数量太小, 样本不足 8. 身体及 心理状态不好等等,这些 因素都会影响到信度因此,为了提高信度, 我们必须对症下药,采取各种措施例 如:提供统一规范的考试环境、 规范监考、题目必须做到明了易懂等等通常, 用来检测信度最常用的有三种方法:1.考后复测法 在考试 后再让学生 做同一套试卷, 如果几次考试的结果是一致的, 这份试卷 就是有信度的 但是在实 际操作过程中, 学生在不断的学习提高, 而且 记忆因素也会影响复测的结果,因此用 这一方法很难检测考试的信 度 2.平行测试法 设计试卷时, 设计两份难度一样 的试卷, 在不同的 时间给学生做, 如果结果一致, 则有效。
但是, 在设计试卷时我们 无法确信两套试卷在难度及内容上是否完全相同,因此操作起来很困难 这种方法 常用在补考试题的设计中 3. 分半法设计一套试题让学生做, 然后把结果分为奇 数和偶数题进行分析评判,并算出它们之间的 相关性二、 语言测试的效度效度, 即有效性, 是指试题是否考了出题者想考的内容或多大程 度上考了出题 者想考的内容效度是语言测试的最重要的一个指标, 或者说是语言测试的基本出 发点, 效度不高的测试是没有意义的 效度可分为以下五种:1. 表面效度 表面效度就是说, 一套试卷看起来是否合适, 像不像 一套试卷 具有表面效度的测试容易引起人的兴趣 Alan Davies 曾 说, 表面信度是可以达到 的, 但却不是必要的, 表面的但却又是有用 的他可以让别人相信试卷是有效的2. 内容效度内容效度是指是否符合大纲的要求, 是否与测试目 的有关例如: 老师教了一个学期想看看学生对于所教内容掌握得如 何, 但是在选题时, 所出的题 目与学生学的内容无关,则这套试卷没内 容效度在有内容效度的测试中考查的语 言要素和技能都能有所体 现成绩测试和诊断测试尤其要注意符合教学内容3. 同期效度。
同期效度就是一次测试的结果与另一次时间相近的 有效测试的 结果相比较,或同教师对学生的评估相比较而得出的系 数4. 预测效度它是指试卷结果是否,或者在多大程度上可以预测 将来的考试成 绩5. 结构效度即从理论上说, 试卷的各个部分是否出的有道理 结 构效度测 试是说一套测试要以一定的语言学习理论为依据Alan Davies 在论述语言测试的信度时说,信度的种类与运用有 关 例如:成绩 考试既要表面效度又要内容效度; 能力测试要有表面效 度、 结构效度和内容效度 特别依靠内容效度; 水平测试必须要有表面 效度、 预测效度和同期效度 语言测 试的种类不同, 对各种效度的要求 也就不同语言潜能测试多基于某种语言行为理 论和语言学习理论, 因此重视编制效度 水平测试强调共时效度和预示效度 成绩 测试和诊断测试要受教学大纲的限制, 因此首先要看内容效度提高效度的常用方法有:明确考试的目的、 决定与目的相反的考试内容、 决 定考试的方法以及增加考试的信度四种三、 信度和效度的关系通常, 我们把信度和效度看成是不同的, 但是却在测试中两者又 是具有相互联 系的特征尽管效度是最重要的特征,但是信度却是效 度必不可少的条件。
但在涉 及到测试的方法时, 两者的差异就变的模 糊了Campbell , Lyle F. Bachman 和 Fiske 都曾对信度和效度的关系做 过经典的论 述 Lyle F. Bachman 认为:在研究影响分数的因素时, 信度 和效度是互为补充的两 个方面信度回答的是引起考试结果不一致的 原因有多少是由测量误差所引起的; 然而, 效度则是找出考试结果中 那些导致有效的不一致的因素, 即考试结果有多少 是由考生的某种特殊语言能力的程度而引起的因此, 我们可以说信度是考查考试 结果哪些是由想考的内容以外的因素引起的, 效度则是看考试结果的差异 哪些是由 语言能力所引起的信度和效度有密切的联系,但它们的关系是单方面的效度是信 度的前提, 但 有信度的试卷可能是高效度的,也可能是效度较低的, 即 效度较高不能保证信度也 一定较高一项测试有信度 , 它的效度有可 能高 , 也有可能低; 但是如果一项测试 没有信度, 则这次测试必然是无 效的 信度差效度就差, 但效度差不一定信度就 差信度是效度必不可 少的条件, 试卷如果没有信度根本不可能对测试进行(下转 第 214 页语言测试的信度和效度及其关系曹桂花(孝感学院外国语学院 湖北 孝感 432000【摘 要】 语言测试是对语言教学的评价。
通过对语言知识或语言技能及语言 能力的测试, 老师可以了解教学效果, 了解到学生对知识的掌 握程度, 看到他们的进 步与不足, 有利于教学的调整要达到这个目的, 就必须有好的试卷,我们一般从信 度、效度、 区分度、 实用性、 全面性、 公正性及后期效应来对试卷进行评价 本文讨论了其中极其重要的两个标准信度和效度以及它们之间的关系 关键词】 语言测试 ; 信度 ; 效度The relationship between validity and reliability of language testingCao Gui-hua(school of foreign language, Xiaogan University【 Abstract 】 Language testing is a way to value the language teaching. From language testing, the teachers can know whether the students master what they have taught, the students ' weaknesses and strengths and improvement, which is helpful to the language teaching. To achieve this purpose a well-designed paper is needed. Usually, we think good qualities of good test include:validity, reliability, discrimination, practicality, and backwash effect. This paper is mainly validity and reliability and the relationship of these two.【 Key words 】 language testing ; validity ; and reliability°咼校讲坛。
科技信息 2008年 第 17期 SCIENCE &TECHNOLOGY INFORMATION(上接第 182页有效的解释例如:我们希望对学生进行一次期中测试, 检查一下学生半学期 以来对所学知 识的掌握程度假如试卷本身设计得不合理,有些题目 好学生不会做而基础较差的 学生却做得出来, 或者由于外界的条件较 差, 非常吵闹, 气温很高, 或者评卷人的主 观评卷等, 都会影响测试的 信度, 那么的测试结果就根本达不到检测学生的目的,因 为评判的条件没有达到, 此次测试就是无效的了, 也无从判断试卷本身的效度 只 有我们确信测试是有效的了之后, 对效度做出判断才是有意义的在 确信了测试是 有效的之后, 我们才可能从内容、 结构共时、 预测和表面 等几个方面来判断测试 是否达到了考试的目的,即是否考了想考内容 又如, 我们想了解学生的写作能力, 可是给他们考的题型却是多项 选择题、听力和阅读, 根本没有设计写作的题型 这样的考试虽然是有 效的, 但却偏离了考试的初衷, 因此不能很好的检测学生的写 作能力, 因此此次考试无效的 反之, 我们确信试卷的效度很低, 即没考想考的 内容, 那么我们说其信度可能高也可能低,因为影响信度的因素主要 是我们上文提到, 与 效度没有多大关系。
需要指出的是, 高效度和高信度是测试者的目标, 但是这只是一 种理想,一项测 试既有高信度, 又有高效度是不可能的四、 结论语言测试的信度及效率问题一直是语言测试专家关注的问题, 也 是教师所关心 的了解了测试中的信度和效度这两个最重要的标准及 其关系后, 试卷的设计者在 设计试卷时一定要注意试题的本身的科学 性, 紧扣考试的目的; 而监考者在测试的 过程中也应尽量减少来自于 外界的影响测试的效度和信度的因素,以期测试能更好 的服务于教 学 参考文献】[1] 李筱菊 .语言测试科学与艺术 [M]. 湖南教育出版社 ,1997.[2] 刘润清,韩宝成 .语言测试和它的方法 [M]. 外研社 ,2000.[3] Davies, Alan. 1990. Principles of Language Testing . Oxford:Basil Blackwell.[4] Bachman, Lyle F. 1990. Fundamental Consideration in Language Testing . Oxford University Press.[5] Bachman, L. F. &Adrian S. Palmer . 1996. Language Testing in Practice. Oxford University Press.作者简介:曹桂花(1979— , 女,湖北荆州人, 孝感学院外国语学院讲师, 英语语 言文学硕士。
[责任编辑:张新雷]科科好的生活方式和能积极地参加体育锻炼国家鼓励、 扶持社会组织或 者个人 兴办老年福利院、敬老院、 老年公寓、 老年医疗康复中心和老年 文化体育活动场 所等设施更需要大量专业的社会体育的组织者和引 路人奥运会的推动作用。












