您所在位置：网站首页 > 行业资料 > 教育/培训 > 语言评估与测试

语言评估与测试.ppt

80页

卖家[上传人]：飞***

文档编号：54115237

上传时间：2018-09-08

文档格式：PPT

文档大小：1.26MB

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

12金贝

下载

/ 80 举报版权申诉马上下载

文本预览

下载提示

常见问题

语言评估与测试,,定义主要研究对象基本研究方法基本发展概况以及其例子主要研究成果主要价值发展前景可待解决的问题,,四个概念的对比,测试是一种特殊测量技术，以获取量化（由数字体现）的信息为目的，该信息反映应试者所掌握的某一方面的知识或能力的程度测量指收集量化的信息来决定被测量之物（不限于知识或能力）存在的程度在这一点上测量和测试是一致的但在测量中可以使用那些不要求评分人对其答案做出正误判断的问题评估不局限于量化手段例如用面晤、问卷调查、观察等定性手段来系统地收集信息，目的是做出价值判断或决定在语言教学效果评估中，语言测试是常用的手段之一评述是使用最宽泛的术语，既可以和测试换用，也可以和广义地指收集语言数据，包括测试数据，又可以狭义地指不包括测试的各种评估手段，如面晤、个案研究、问卷调查、观察等从某种意义上说，评估是评述的一种形式，是需要做出价值判断或决定的评述测量是评估的一种形式，仅采用定量手段收集信息测试是测量的一种形式，仅由评分人可以对其答案做出正误判断或是否达到测试要求的判断的题目构成测试的种类,测试可以根据其在教育中的作用或功能分成若干种类，包括学业测试、进展测试、水平测试、学能测试、诊断测试、分级测试等。

学业测试考察学习者掌握教学大纲规定的学习内容的情况学业测试通常在一门课程结束的时候实施，测试内容的选择应以该课程的教学大纲规定的教学目标和教学内容为依据，不受具体课程和教材的影响很多学业测试采用标准化测试形式，由测试专家组命题我国高中的各学科的会考和大学中的非英语专业英语四六级考试和英语专业四八级考试是典型的学业测试进展测试又称课程进展测试，和学业测试很类似课程进展测试可以在一门课程的不同阶段或结束时实施，目标是考察学习者掌握课程或教材内容的情况课程进展测试通常由任课教师命题，参加考试的学习者人数较少测试的正式程度一般低于学业测试水平测试考察学习者掌握学科知识的水平，不以教学大纲、课程计划或教材为命题依据有些水平考试以考察应试者的一般知识或能力水平为目的，例如，我国的公共英语等级考试考察的就是应试者的一般英语水平有些水平考试则用来确定应试者是否具备接受某种教育或培训的学科知识水平如托福、雅思也有一些水平测试用来考察应试者是否具备其所从事的职业要求的语言水平如教师资格证、秘书证学能测试又称预测性测试，用来考察应试者学习某一学科的潜能 Carroll和S.Sapon设计的MLAT和Pimsleur设计的PLAB是著名的语言学能测试。

诊断测试的目的是确定学习者学习中的困难和存在的问题或已经学过但尚未掌握的教学内容，以便教师在后面的教学活动中采取补救措施尽管诊断测试一词在教学和测试文献中使用频率很高，但很少有测试完全为诊断目的而设计学业测试和进展测试，甚至水平测试，都可以用于诊断目的分级测试考察应试者的科学知识或能力水平，并以此为依据把他们纳入适当的课程计划中入学新生都参加英语分级测试，根据测试结果，他们分别进入一、二、三或四级英语学习其他几种重要的测试,分立式测试和综合式测试反应测试设计者的语言观和语言能力观分立式测试的倡导者认为语言是由小的语言成分构成，人的语言能力也是可以分解的，由具体的成分构成分立式题目彼此独立应试者的语言水平由其掌握的语言成分之和体现而综合式测试则与分立式测试的思想相反常模参照性测试和准则参照性测试是根据解释应试者所得分数的方法区分的两类测试常模参照性测试的作用是根据应试者在测试中的表现（分数的高低）将其排成等级序列，应试者所得的分数本身没有确切的含义，不能说明这些应试者达到何种水平或标准而是以等级序列的方法建立分界线托福”是典型的常模参照性测试准则参照性测试测量应试者应掌握的某一目标行为领域的知识或能力的水平。

准则参照性测试以事先确定的标准作为测量依据应试者的分数只与这些既定的标准比较，而不必彼此比较以确定相对位置雅思”是典型的准则参照性英语水平测试，采用九分制，每一个分数对应一套行为描述另外，期中考试、期末考试、毕业考试、原非英语专业大学英语四六级考试（有分界线的）等也都是准则参照性考试能力测试与运用测试语言测试的最终目的不是取得反应测试表现的分数，而是对在非测试环境下的语言运用情况进行推测语言能力是不可能直接观察的，因而也不能直接测量，只有通过测量能够体现能力的各种行为来对能力进行推测语言运用是可以直接观察的，因而可以直接测量能力测试：测试表现→推测→不可观察的语言能力→推测→ 非语言测试环境下的语言运用运用测试：测试表现→推测→非语言测试环境下的语言运用例子：美国教育测试服务中心开发并实施的“托福考试”是典型的能力测试，而英国——澳大利亚测试专家联合开发的“雅思考试”则是运用测试的典型代表试题的种类,强制选择类强制选择类试题亦称选择答案类试题或固定选择类试题构建答案类构建答案类试题也被称作开放类试题根据评分的客观性或客观程度把构建答案类试题进一步分为限制答案类试题和扩展性答案类试题。

限制答案类试题要求应试者自己构建答案这类试题答案一般只有一个或少数几个正确答案答案通常很简单，有一个词或短语构成语句填空题、语篇填空题和简短答案题、句型转换题都是典型的答案限制题扩展性答案类试题要求应试者构建自己的语篇性答案而且这类答案不限于一个或几个分立性试题和综合性试题分立性试题相互独立，每一试题测量应试者语言能力中的一个成分，例如对一个语音、词汇、语法结构的把握综合性试题涉及一个以上的语言技能或一个以上的语言层次的知识完形填空、听写、口语面试等都是典型的综合性试题分离试题和语篇依附试题分离试题指那些自主的、相互无关连的试题同时这些试题也不和语篇或启用它辅助材料发生关系语篇依附试题指依附于语篇的试题阅读理解和听力理解测试经常使用语篇依附试题测试的评价标准,测试的评价标准测试的质量一般可以用三个标准衡量：效度、信度、实用性这是教育测量学和语言测试文献反复涉及的概念效度效度指证据支持我们根据测试分数做出的推论取得证据的过程即应试者从一个总体语言水平测试中该所的的分数是否能作为我们判断这些应试者的总体语言水平的依据也就是说，他们测试分数的差异是否说明他们总体语言水平的差异，或者说，在多大程度上他们测试分数的差异说明他们总体语言水平的差异。

效度研究就是为支持我们根据测试分数作出的推论取得证据的过程效度研究的主要形式有三类：内容效度研究、关联效度研究、结构效度研究,内容效度研究就是取得证据说明测试内容代表测试范围的程度的过程，或取得证据说明根据应试者的测试分数推论其掌握测试范围的情况的合理性程度的过程准则关联性效度研究是取得证据说明可以根据应试者的测试成绩去推论他们在同一变量的其他测量形式中的表现的合理性程度准则关联性效度可分为两类：同期效度研究和预测效度研究两者的区别之一是作为准则的测量手段的实施时间结构效度研究结构指心理结构，是对无法直接测量或观察的人类行为的一个方面的理论阐述智能、学能、语言能力、阅读能力等都是这样的结构在语言测试中，结构可以被定义为测试行为反应的一种能力或一套技能，可以根据测试分数对其作出推论结构效度研究指取得证据说明一项测试确实测量了该测试的设计者想要测量的心理结构的过程，同时也取得证据说明根据分数推论应试者在测量相同结构的测试中的表现的合理性程度的过程信度信度指测试分数的稳定性、一致性和没有测量误差的程度信度分测试信度和评分人信度评分人信度分为评分人之间信度和评分人内部信度,实用性实用性也是衡量测试的一个重要指标。

例如测试时间的长短、测试所需要的费用等等都是需要考虑的方面定量方法和定性方法都是科学的研究方法，在语言学研究中不能只局限于一种一般来说，从事社会科学和人文科学的人比较熟悉定性方法，但在社会科学和人文科学中引进数学的方法更体现了当前科学发展中的纹理渗透、学科渗透的特点，是有广阔的前景的一些边缘语言科学的产生会使定量方法成为不可缺少的部分实验方法在语言学中的应用,定量研究也可以称为实验性研究，定量方法也就是实验方法实验方法是建立在可计算性原则的基础上的，是把计算的理论、模型和人的行为加以比较的重要手段实验方法有时建立在信息处理原则的基础上的，是把人脑看成是一个有限通量的信息处理系统实验方法是科学研究经常使用的方法和程序由于采取定性的研究方法更难作出实验和实际活动的区别，更不容易作出对人的复杂因素的分离工作，所以实验方法即定量方法在语言学的研究中越来越被广泛采用科学实验主要涉及到两个问题：效度的问题和信度的问题效度的问题，即怎样准确判断哪些事件和个案是相同的信度的问题，即怎样把所得到的结果应用到更一般的场合实验方法的特点：系统性、逻辑性、经验性、简约性、重复性和传递性社会科学实验比物理实验困难，表现以下的几个方面实验的对象是人，而人是很难重复的。

社会科学的实验并非在实验室里做的，而是在现实的世界里做的，所以，实验室条件对所有的被试者不容易保持一致，也很难区别实验和实际活动人是一个十分复杂的统一体，即使是同一个被试者，在不同的外部环境下，每一次测试都会显示出智力上的、生理上的、心理上的差异，从而影响测试的结果语言测试有悠久的历史其间，经历了传统语言测试、心理测量学—结构主义语言测试、综合测试方法、交际语言测试语言测试的目标、手段都有很大的变化传统语言测试主要采用面试、翻译、作文等试题这和当时依赖于开放性、综合性、主观性试题的教育测试的情况基本一致心理测量学—结构主义语言测试的理论基础是心理测量学、结构主义语言学、对比分析和外语教学听说法把这些思想基础，特别是前三者，结合起来，完成心理测量学—结构主义语言测试模式构建的是美国应用学家Robert Lado心理测量学—结构主义语言测试的核心思想，即作为该语言测试的目标的语言成分和语言技能以下是语言成分与语言技能相互之间的关系表：,语言成分是分离性的，而语言技能是综合性的心理测量学——结构主义语言学测试的整体框架,语言→分析↓,↓抽样↓ 测试语言能力→构卷→测试语言运用→测量→分数→判断→结果,构卷其过程包括测试设计、命题、试题、评议和修改、试测和项目分析、确定试题、复制测试六个步骤。

心理测量学——结构主义语言测试方法评述,优点该语言测试方法的出现是语言测试史上划时代的事件它结束了传统语言测试时期，开创了现代语言测试时代从心理测量学——结构主义语言测试方法开始语言测试成为了一门学科语言测试史第一次有了对语言测试目标的以语言学为基础的清晰的描述心理测量学——结构主义语言测试方法第一次给语言测试引入了一套测试开发的科学程序，从测试设计、题目审查、试测，一直到项目分析和测试分析心理测量学——结构主义语言测试方法第一次给语言测试引入了分立式、间接式客观试题，丰富了语言测试手段，使语言测试的信度达到了空前的高度心理测量学——结构主义语言测试方法第一次给语言测试的分数解释引入了一套统计方法：集中趋势、离散趋势、百分位、标准分等丰富了分数解释的手段和科学性缺陷心理测量学——结构主义语言测试框架中，作为测试目标的语言运用能力得到了清晰的解释但这个解释本身有问题解释不够全面解释存在明显的历史局限性语言测试方法上片面性，导致在有些测试中语言形式知识被过度测量当然和心理测量学——结构主义语言测试方法所青睐的客观、间接性测试的经济性优势有密切的关系语言测试方法在测量手段上有局限性。

综合语言测试测试目标综合语言测试的代表人物是美国教育家J.Oller他提出的“整体语言能力假设”和语言知识——语言技能模型针锋相对根据Oller的观点，作为综合语言测试的测试目标的整体语言能力假设包括三方面的内容：语言能力不可分不可分的语言能力可以直接用综合测试项目来测量可用来直接测量不可分语言能力的测试项目包完形程序和听写。

点击阅读更多内容