
中学历史课程学业评价与测量.doc
5页中学历史课程学业评价与测量第一节 中学历史学业评价●中学历史学业评价中学历史学科的学业评价是以中学历史教学目标为依据,运用一切可行的科学方法,系统地搜集信息,对中学历史教学所引起的学生在认知行为上的变化进行价值判断的过程,它为教学决策提供依据历史学业评价分类目的角度:选拔性评价、水平性评价、反馈性评价 ;认知角度:知识评价、技能评价、能力评价;作用角度:形成性评价、诊断性评价和终结性评价;运用的方法和标准角度:相对性评价和绝对性评价;评价者和被评价者关系角度: 他人评价和自我评价,等等中学历史学业评价的地位和功能◆地位:教学活动离不开教学评价,评价是 教学活动的有机组成部分教学实践也证明,科学的教学评价会促进教学活动在改革中不断完善,推动教学向纵深发展我们这里探讨的是对学生的学业评价问题功能:★ 学业评价是检查历史教学目标是否达成 的重要环节 ★ 学业评价是及时纠正历史教学过程中存在的问题,改进教学的重要方法 ★ 学业评价对教师和学生都有激励作用 ★ 学业评价(主要是考试)是检查教学质量的基本形式 中学历史学业评价的内容高中历史课程标准强调要对教学质量与水平给予全面、综合的评估历史学业评价应该全面反映教学目标,要变单一的知识评价为知识、能力和情感等方面的综合的、全面的评价。
知识方面包括基础的、重点的历史知识、历史概念等;能力方面包括历史思维能力与基本技能;情感方面包括学生思想、品行、态度 (比如学生的历史责任感、民族自豪感、公民义务感、爱国主义情感等方面行为态度)等的变化就是说,不仅要评价学生的知识水平,而且还要评价学生的能力水平和情感水平近年来,中学历史教学界对学生思维能力的考查和评价问题已有不少研究成果,但对情感领域的考查和评价,尚未引起足够重视当然,这一领域的评价比较难以操作,这正是我们需要努力研究的重要领域 中学历史学业评价的形式◆ 开、闭卷结合 ◆ 口试 ◆ 论文答辩式 ◆ 课堂测试中学历史学业评价的原则◆形成性评价与终结性评价相结合◆静态评价与动态评价相结合◆定性评价与定量评价相结合 课程改革中的评价新理念以质性评定取代量化评定评定的功能由侧重甄别转向侧重发展尊重学生个性化、培养学生合作精神注重评定问题的真实性和情境性 不仅重视结论,更加重视得出结论的过程第二节 教育测评中的常见质量指标一、信度 概念与理解信度:信度: 是“表示一种测量工具及其测量结果的一致性和稳定性程度亦即可信或可靠程度”。
换句话说,信度指的是测量结果的稳定性和可靠程度,以及测量的结果是否真实、客观地反映了考生的实际水平理解:①信度指实测值和真实相差的程度,相差越小,测量信度越高②信度指统计量与参数之间的接近程度统计量是指样本上的各种数字特征,参数是总体上的各种数字特征统计量越接近参数,这个统计量的可靠性便越高,因此信度就越高③信度指两次重复测量或等值测量之间的关联程度如果对同一对象进行两次重复测量或者等值测量后,两次测量的相关系数越高,说明测量的信度就越高提高信度的方法①适当增加测验题目的数量测验题目数量越多,题目的代表性就越大这种方法既可以提高信度,也可以提高效度②测验的难度要适中测验的难度适中,能使测验的信度达到最大,也能使测验的区分度达到最大③测验的程序应统一测验的过程直接关系到信度的高低,可以说信度主要是在实施过程中重点保证的测验的程序统一包括试卷统一、测验开始时的指导语、回答问题的方式、分发及收回试卷的方法、测验时间的掌握等方面的统一这些都是影响信度的重要因素在一些重大的考试中(如我国的高考) ,考试的信度尤为重要④测验的时间要充分测验的时间限制也会影响信度的高低如果安排的时间不够,就不能真实反映应试者的实际水平。
因此,要保证大多数学生能够在规定的时间内做完试题⑤评分要尽量做到客观化,减少评分误差信度系数实际上是根据实得分数计算出来的,如果评分不准确,信度也就不准了因此,要求评分要尽量做到客观,减少评分误差特别是主观性试题,首先要明确有关的评分标准,其次,最好是多个专家同时评一份试卷,或者单个评分者反复多次评一批试卷,对于几次结果误差比较大的,要复评 二、效度概念与理解效度 :亦称 “测验的有效性”是指测量结果的准确性和有效性的程度,亦即测量是否达到了预期目的理解:①测量的效度始终是对一定的测量目的而言的任何测量都有某种特定的目的与功能,判断效度的高低,就是判断测验达到目的的程度如果能正确、真实地测量出想测量的东西,那么,对于这一目的的效度是高的,反之,则是低的例如,一次测量的目的是“智力测验”,但是实际测量的不是智力的高低而是知识的多少,那么,此次测验的效度就是低的②测量的效度也是对测量的结果而言的一种测量工具只有经过实际测量,才能根据它的结果判断它的效度,所以,也可以把效度理解为测量的结果正确反映所欲测量的特性或功能的程度③测验结果总是有一定效度,只是效度的高低不同④在教育测量中效度问题比在其他领域的测量更为重要。
提高效度的方法 控制系统误差 精心编制试题 妥善组织测验 合理处理好效度和信度的关系 适当增加测验的长度 三、难度 概念与理解难度 : 指测验试题的难易程度教育测量中的难度一般用正确回答试题人数与参加测验的总人数之比作为指标其公式为:P=R÷N(式中P表示试题难度,R为答对试题的人数,N代表参加测验的总人数)理解:①难度是试题对学生知识和能力水平的适合程度的指标试题的难度不仅对题目的区分度有影响,而且对试题的信度和效度也有较大的影响②难度是一个相对概念,难度的高低与被试的水平直接相关,是由参与测量的被试群体的整体水平决定的●难度的计算▲ 客观题难度的计算: P=R ÷N式中,P表示难度指标,N表示参加考试的总人数, R表示答对某道客观题的人数这里的难度指标,表示的是试题的通过率通过率越高,题目越容易;反之,越难例如:100 人参加测验,某题 60 人答对,则此题的难度为:P=R÷N=60÷100=0.60此题通过率为 60%,难度适中▲▲主观题难度计算: P=X÷K式中,P 表示难度指标,X表示所有考生在这道题上的平均得分,K表示这道题的满分例如:某道论述题满分12 分,所有考生在这道题上平均的分为 3.6分,则此题难度为:P=X÷K=3.6÷12= 0.3此题偏难 控制题目难度的基本方法 影响题目难度的主要因素有:考查知识点的多少;考察能力的复杂程度或层次的高低;考生对题目的熟悉程度;命题的技巧性。
在具体测试中,除了上述因素外,还可以通过其他方法来控制难度如在平时测验中,教师可依据对学生情况的熟知和了解来控制难度;在大型的测验中,则通过预测来掌握难度,即事先由命题人员根据上述因素估计一个难度范围,然后通过测试看这个估计的准确程度经过预测取得难度的题目可以进入题厍,以备后用四、区分度 区分度的概念区分度是指测验对考生实际水平的区分程度一般用符号D 表示具有良好区分度的测验,实际水平高的应该得高分,实际水平低的应该得低分所以,区分度又叫鉴别力它是评价试题质量,筛选试题的主要指标与依据区分度分为正区分(D>0)、零区分(D=0)和负区分(D<0),正区分又称积极区分,负区分又称消极区分正区分时,实际水平高的考生得了高分,实际水平低的考生得了低分;负区分正好相反;零区分是指实际水平高低与得分之间没有太大关系,呈现出零相关任何测验,其目的都是希望能够鉴别出学生的实际水平这一点,区分度和效度、信度在题目上的要求是一致的 区分度与难度的关系P :难度1.00 0.90 0.70 0.50 0.30 0.10 0.00D:最大值 0.00 0.20 0.60 1.00 0.60 0.20 0.0由上表可以得知,难度适中,可以使区分度达到最大值。
●● 区分度的计算方法区分度的计算方法☆☆ 客观题区分度的计算方法:客观题区分度的计算方法: D=PH-- PL以上公式中以上公式中 D代表区分度,代表区分度, PH代表高分组的难度,代表高分组的难度, PL表示低分组的难度表示低分组的难度 例如,某题高分组有60%人答对,低分组有 30%的人答对,则此题区分度为 0.30● 提高区分度的方法使题目的难度适中,使整个的考试难度适中由于难度适中可以使区分度达到最大值,因此,使试题难度适中是提高区分度的重要方法着重考查复杂的学习结果,使高能学生能得高分或最高分,这样可以提高区分度 ● 区分度的评价标准区 分 度 评 价 0.40 以上 非常良好 0.30—0.39 良好如能改进更好 0.20—0.29 尚可用时需做改进 0.19 以下 劣必须淘汰或改进以提高区分度后方可使用 ● 参考书目:《历史教育测量与评价》:陈伟国 何成刚著 高等教育出版社2003年版《新课程与评价改革》:新课程实施过程中培训问题研究课题组编写科学教育出版社2001年版《教育测量》:王孝玲编著 华东师范大学出版社2004年版《教育评价的理论与技术》:王孝玲编著 上海教育出版社1999年版《简明国际教育百科全书· 教育测量与评价》:许建钺等编译 教育科学出版社1992年版《教育评鉴的模式》:黄光雄编译 (台 湾)师大书苑有限公司1989年版《教育评价》:【美】B.S. 布卢姆等 邱渊等译 华东师范大学出版社1987年版《计划评价的基本原理》:【美】泰勒 著 施良方译 人民教育出版社1994年版《中学历史教育论》:聂幼犁著 学林出版社 1999 年版。
