好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

现代语言测试的新发展.docx

7页
  • 卖家[上传人]:枫**
  • 文档编号:408151242
  • 上传时间:2023-11-24
  • 文档格式:DOCX
  • 文档大小:39.42KB
  • / 7 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 现代语言测试的新发展曾用强(作者简介:曾用强,博士,教授,广东外语外贸大学外国语言学及应用语言学研究中 心主任,广东广州,510420)摘要:语言测试从20 世纪60 年代开始发展,经过四十多年,现代语言测试有了新的发 展,突出体现在以下四个方面:考试内容的真实、能力评估的过程化、考试形式的个性化以 及考试手段的电脑化关键词:语言测试 真实性 能力评估 个性化 计算机化考试语言测试随着语言教学的发展而发展,语言测试发展到今天,已自成一门学科,有其自 身的不同于语言教学学科的内容、特点、要求和考虑语言测试从 20世纪 60 年代开始发展, 首先它从语言学领域的结构主义语言学获得了科学的内容,从测量学领域的心理测量学借取 了科学的手段,形成了历史上第一代的科学语言测试其后四十多年,语言测试一方面接受 了语言学及应用语言学领域,尤其是语言教学的先进思想和方法,在考试内容和形式等方面 得到了发展;另一方面随着科学技术的进步,语言测试手段开始朝着更加科学化和现代化方 向发展经过几十年的发展,现代语言测试有了新的发展,突出体现在以下四个方面:考试 内容的真实、能力评估的过程化、考试形式的个性化以及考试手段的电脑化。

      1.考试内容的真实性所谓真实性(au then ti ci ty)就是指,考试的内容要真实于实际的语言交际任务°Bachman & Palmer(1996)把真实性定义为语言测试的任务与使用目标语言的真实任务之间的一致性 程度,也就是考试的内容必须真实体现受试者在实际的语言交际情景中可能或必须完成的任 务,而不是简单地把语言分解成词汇、语法和四个基本技能(听、说、读和写)进行单项的考 试早在20世纪70年代,语言教学就开始提倡“交际法”(communicative approach)交 际”或“真实”语言测试80年代以后才被引入语言测试的研究领域中进入90年代以后, 语言测试开始越来越强调测试内容的“交际性”和“真实性”,主要有两方面的原因:一方 面因为语言教学强调培养学习者的语言交际能力,它必然要求语言测试与之相适应;另一方 面由于越来越多的人感到标准化的选择填空考试不够真实,在一定程度上减低了考试的效度 (validity),其反拨作用(washback)也比较差语言测试的“交际性”和“真实性”研究在过去的十多年里取得了很大的进展,比如: 在试卷结构和题型设计方面,人们更多考虑了如何考察受试者的实际语言应用能力,尤其是 产出性能力(productive skills)的测量。

      我国流行的几种公开的大型考试,开始引进真实 情景对话的考试,如:公共英语等级考试、高考英语复试和大学英语四、六级考试等都增加 了不同形式的口头表达能力的测试,对改进我国英语教学和培养学生的实际语言应用能力起 到了积极的促进作用近些年发展起来的语言行为评估(performance assessment)和跨文化交际中的语用能 力测试(pragma tic compe tence in cross-cu ltu ral communica tion也是真实性语言测试发 展的产物在 80 年代以前,语言测试的发展主流依然是传统的语言能力 (1inguistic competence)考试,如:词汇和语法以及语言四项基本技能(听、说、读和写)但是,随着 基于任务的语言教学(t ask-based language t eaching)的兴起,语言行为评估也随之诞生 所谓语言行为评估,就是根据语言行为的真实标准对受试者完成具体某项语言任务的过程作 出评估Norris et al l998年对语言行为评估和基于任务的语言教学等问题作了详尽的论 述,提出了如何发展语言行为评估的具体原则和过程此外,应用语言学的不断发展,使得 人们对语言能力(language ability)和语言使用(language use)有了新认识,语言测试的研 究融入应用语言学的领域中,它开始吸收二语习得、语用学和社会语言学的研究成果,促使 语言测试的内容从语言能力向语用能力的转移。

      2.能力评估的过程化自从20世纪70年代以来,外语教学的研究中心开始从教学方法的研究转移至学习过程 的研究这种研究中心的转移促使研究者开始重视调查学习者特征以及二语习得的研究,尤 其是外语学习过程的认知因素、学习策略与学习效果之间的关系等问题这种趋势也同样影 响了语言测试的研究,越来越多的语言测试研究者也开始对影响测试行为的各种因素感兴趣 (如:测试条件、试题形式以及测试者的个性特征等)语言测试研究的中心开始转移到测试 的过程中,也就是结合二语习得的研究成果,研究测试者的认知特征如何影响测试的过程, 如:学习策略与测试成绩之间的关系、认知策略与测试行为之间的关系等等语言测试是一个从受试者的观察分(observed score)推导出其能力真分(true score) 的过程,如何保证观察分真实有效地反映能力真分是语言测试研究中的一个基本问题在 80 年代之前,测试者关心的只是这个过程的结果,即:受试者答题的正确与否,比如:在 经典真分模式(Classical True Score Model)中,受试者的能力估算只是简单地计算他/她 正确回答测试项目的数量(即答对率);项目反应理论(Item Response Theory, IRT)则是根 据受试者对不同难度项目的反应推导出其能力值。

      不论是经典模式,还是项目反应理论,目 前采用的能力评估模式都是建立在单维能力假设(unidimentionality)的基础上,即:影响 受试者测试行为的因素只是受试者某一特定的单一语言能力(如:词汇能力或阅读理解能力 等)但是,我们都知道,在实际的语言测试中,影响受试者测试行为的因素除了受试者的 语言能力外,还有许多其他因素,如:测试条件、测试焦虑以及其他个性特征等所有这些 其他因素在单维能力假设中被认为是构成测试误差的主要来源单维能力假设的最大缺陷就 是,在估算能力真分的过程中,它不考虑影响受试者测试行为的诸多因素,因此无法对受试 者的能力真分作出客观、准确的评估随着语言测试理论的发展和测试手段的现代化,语言 测试已经开始朝着多维能力评估的方向发展,即受试者的测试行为被认为是多个能力共同作 用的结果受试者语言能力的评估不仅仅考虑了他们的测试结果,而且开始考虑受试者的测 试过程,即:受试者在答题过程应用了哪些策略和心理思维过程等研究考试过程的方法包 括自我评估(introspectivemethods)(Buck, 1991; Wijgh, 1996; Story, 1997; Wu, 1998) 和问卷调查(Purpura, 1993; 1997; 1999)等方法。

      关于能力评估过程化,笔者作了一个关于自信心与语言测试行为之间关系的实验研究 实验要求参加者在计算机上完成50 道词汇单项选择题,试题的形式如下:With hundreds of works left behind, Picasso is regarded as a very ___ artis.t A.profound B.productiveC.prosperous D.plentiful 你答对本题的自信心是:O完全有信心O非常有信心O比较有信心O—般O信心不足 O非常没信心O完全没信心在这个实验中,受试者首先从A、B、C和D中选择最佳答案,然后评估自己对答对这个 测试项目的自信心受试者的最终成绩是依据他们的答题结果(对或错)和答题自信心进行计 算的,具体的计算方法是:如果受试者答对某测试项目,他的成绩就是加上自信心分值,否 则减去他的自信心分值自信心分值从l至7,分别代表从完全没信心至完全有信心等7个 不同等级的自信心有关能力评估过程化的其他研究实例还包括,在能力评估过程中考虑了受试者的答题时 间、修改答案次数以及正确回答测试项目的条件(如:是否获得有关的帮助等)3.考试形式的个性化 考试形式个性化与能力评估过程化是相辅相成的。

      能力评估过程化就是考虑了不同的受 试者可能表现出不同的测试行为,为了能够客观、准确地评估每一个受试者的语言能力,我 们必须充分考虑他/她的测试过程°Kunnan(1998)列出了二十多项可能影响测试过程的受试 者特征,如:语言水平、学业背景、职业、母语、文化、性别以及其他认知心理特征等,所 有这些个性特征都会导致他们在测试过程中表现出完全不同的测试行为现代语言测试开始 越来越重视受试者的个性特征对其测试行为的影响作用,使测试过程在最大程度上适应于受 试者的个性特征在传统的语言测试中,所有的受试者,不论其语言水平如何,都必须回答相同的测试项 目已经有研究表明,这种传统的纸笔考试中至少有一半的测试项目是浪费,因为这些测试 项目对于任何一个受试者而言不是太难就是太容易 正如语言教学强调个性化 (individualiza tion)和适应性(adap tat ion) —样,语言测试也开始注重体现适应性和个性 化的特征,也就是测试的过程要在最大程度上适应于测试者的个性特征(如:测试者的语言 水平和认知特征等)最典型的个性化考试就是适应性测试(adaptive testing)根据项目反应理论(Item Response Theory)设计的适应性测试(Adaptive Testing)就是 在难度上适应于测试者的语言能力。

      适应性测试是为测试者提供项目难度与其语言能力相适 应的一种测试方法,实行机考的 TOEFL 就是采用这种考试方式实现适应性测试的基本过程 是:考生首先回答一个中等难度的测试项目(初始项目),如果回答正确,下一个测试项目则 较之难些,反之则容易些;考生每回答一个测试项目就获得一个能力估算值 (ability estimate),这个能力估算值就成为选择下一个测试项目的依据,也就是下一个测试项目的 难度要适应于这个能力估算值,这种“适应性”一直延续到测试结果达到特定的精度为止 近十年来, 在适应性测试的基础上又发展了一种新型测试模式:自适应性测试 (self-adap tive test ing, SAT)适应性测试和自适应性测试的最大区别在于:在自适应性 测试中,考生可以自己确定每一个测试项目的难度,而在适应性测试中,测试项目的难度是 依据考生的能力估算值而定的,考生能力又是根据已有的考试行为(项目反应)进行估算根 据项目反应理论的项目参数不变性特征,不论考生回答什么难度的测试项目,其能力估算值 是不变的( Hambleton, 1989)因此,考生在适应性测试和自适应性测试中,所回答的测试 项目可能不同,但是他们的能力估算值是在同一量表上具有可比性的。

      笔者在1997 年对适 应性和自适应性测试进行了对比研究,研究结果发现: (1)自适应性测试由于是考生自己选 择测试项目,因而对自己的选择往往有更高的自信心,从而减低考试焦虑度这种测试心理 给测试带来的直接结果是:考生对测试项目作出反应所需时间相对减少,同时提高了项目答 对率,因此考生在自适应性测试中的成绩高于适应性测试,测试时间却缩短了;(2)在自适 应性测试中,学生选题时,可能由于在某些测试项目上对自己的能力估计不够准确或不够认 真,从而导致选择测试项目的精确度减低,因此,为了达到与适应性测试相同的测试精度水 平所需要的测试项目数量相对多一些适应性测试和自适应性测试都只是在项目难度上适应于受试者的语言能力水平,一个真 正的个性化考试不仅在测试项目难度上,而且在认知心理特征等方面都应该适应于受试者的 个性特征,使语言测试过程更具个性化比如,笔者在自适应性测试的基础上,结合对受试 者的答题自信心与其测试行为之间关系的研究结果,设计了一个个性化的自适应性测试模 式,如图1 所示:i终止判断(蔽标准误盘區議于预先定义的水平)|理目反应(从ARC和D中选择杲隹答案。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.