您所在位置：网站首页 > 高等教育 > 研究生课件 > 心理测量学教案(昉生)

心理测量学教案(昉生).ppt

212页

卖家[上传人]：cl****1

文档编号：577054413

上传时间：2024-08-21

文档格式：PPT

文档大小：919.50KB

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

20金贝

下载

/ 212 举报版权申诉马上下载

文本预览

下载提示

常见问题

《《心理测量学心理测量学》》昉生参考教材与参考书目参考教材与参考书目《心理测量》金瑜主编华东师范大学出版社《心理测量学》郑日昌、蔡永红、周益群著人民教育出版社《心理教育与测量》张厚粲主编浙江教育出版社《现代教育与心理测量学原理》漆书青戴海崎丁树良编著江西教育出版社《心理教育测量》戴海崎张锋陈雪枫主编暨南大学出版社《学校心理测量学》顾海根编著广西教育出版社《心理测验与常用量表》陈国鹏主编科学普及出版社第一章第一章心理测验绪论心理测验绪论第一节第一节心理测验的历史心理测验的历史一心理测验在我国的发展史孔子：中人、中人以上和中人以下孟子：“权，然后知轻重；度，然后知短长物皆然，心为甚刘劭：《人物志》对人要观其感变，以审长度将人分为十二类，如强毅之人、柔顺之人、雄悍之人、惧慎之人、辩博之人、沉静之人等等，南唐的刘勰：使左手画方，右手画圆，无一俱成西汉时代的扬雄，曾以词作为心理鉴定的重要内容自从隋炀帝创行开科取仕，将考试作为选拔人才的主要方法，科举制度在我国通行了1300年，经过历代的改进，形式上日臻完善。

清朝末年，心理学由西方传入我国1914年有人在广东测验了500名儿童的记忆和比喻理解力1916年樊炳清首先介绍了“比奈—西蒙智力测验”1918年俞子夷曾编制“小学生毛笔书法量表”，这是我国最早的标准化教育测验1920年，北京高等师范学校和南京高等师范学校建立了我国最早的两所心理学实验室廖世承和陈鹤琴在南京高师开设测验课，并用心理测验试测投考该校的学生，这便是我国正式开始的科学心理测验1921年他俩正式出版《智力测验法》一书，这是我国最早的心理测量专著1922年，比奈量表由费培杰译成中文，并在江苏、浙江两省的一些小学生中进行过测试1922年美国测验专家麦柯尔博士应中华教育改进社聘请来华讲学，在他的指导下，北京师范大学、北京大学、燕京大学、北京女子高等师范学校、东南大学等校的教授和学生开始编制测验1923年，中华教育改进社对全国22个城市和11个乡镇的9.2万名小学生进行了测验，引起教育界的关注1924年，陆志韦先生发表了《订正比奈—西蒙智力测验说明书》，1936年又与吴天敏再次做了修订1931年在艾伟、陆志韦、陈鹤琴、肖孝荣等人的倡议下中国测验学会成立1932年《测验》杂志创刊到抗日战争前，我国心理学家自编和修订国外心理测验达二十多种、教育测验五十多种。

1978年中国心理学会在保定开会时，组织心理测验座谈会1979年中国心理学会在天津开会时，医学心理专业委员会成立了心理测验协作组，并推选湖南医学院龚耀先主持修订韦克斯勒成人智力量表同年，龚耀先在长沙湖南医学院开办了医疗卫生系统测验学习班1980年5月，中国心理学会实验心理学专业委员会在武汉召开克全国心理测验研究协作会议，会上决定由林传鼎、张厚粲主持修订韦克斯勒儿童智力量表，吴天敏主持修订比奈智力量表1980年初，北京师大心理系首次开设心理测验课许多单位陆续编制或修订了一些心理测验在1984年召开的第五界全国心理学年会上，成立了以北师大心理系张厚粲教授为首的测验工作委员会（后改称测验专业委员会），加强了对测验工作的指导，这标志着我国心理测量已进入了一个新的高速发展时期1990年，中国心理学会心理测量专业委员会在无锡召开第一次学术会议在测量学学科建设方面，出版了大量有关心理与教育测量的著作80年代以前孟承先《测量之学理的研究》、王叔林《心理与教育测验》、陈选善《教育测验》、艾伟《小学儿童能力测验》、孙正邦《心理与教育测验》80年代以后宋兆鸿等《现代教育测量》（1986）；郑日昌《心理测量》（1987）；戴忠恒《教育与心理测量》（1987）；俞嘉元《教育与心理测量》（1987）；王汉澜主编《教育测量学》（1988）；彭凯平《心理测验——原理与实践》（1989）；刑最智、司徒伟成《现代教育测量理论》（1989）；漆青书、戴海崎《项目反应理论及其应用研究》（1992）；黄光扬《心理测量的理论与应用》（1997）等。

二　科学心理测验的产生与发展（一）心理测验的产生是社会的需要（二）心理测验的先驱１、冯特２、高尔顿３、卡特尔４、比奈（三）心理测验的发展１、编制出一批操作测验，既可弥补语言文字量表在理论上的缺陷，又可适用于文盲和有言语障碍的人２、编制出团体智力测验，扩大了测验的应用范围３、多重能力倾向测验逐渐受到重视４、桑代克等人，利用心理测验原理，编制了第一批标准化的教育测验，一些专门的测验机构成立５、心理测验发展的另一领域涉及情感适应、人际关系、动机、兴趣、态度、性格等人格特点的测量６、60年代后，由于认知心理学的崛起，将实验法与测验法结合，产生了信息加工测验，为了解心理能力提供了一些补充方法，使心理测验出现了新的发展趋势（四）心理测量的三大来源中国的科举考试西方学校的考试制度心理学对个别差异的研究第二节　心理测量的性质美国心理学家桑代克在1918年曾说：“凡物之存在必有其数量”美国测量学家麦柯尔于1922年又提出：“凡有数量的东西都可以测量一　测量的定义（一）定义一测量就是依据一定的法则使用量具对事物的特征进行定量描述的过程所谓“一定的法则”，是指任何测量都要建立在科学规则和科学原理基础之上，并通过科学的方法和程序完成测量过程。

所谓“事物的特征”是指所要测量的事物的特定属性所谓“量具”是指测量中所使用的工具所谓“定量描述”，是指任何测量的结果总是对事物特征的量的确定（１）测量的精确度决定于测量对象本身的性质①确定型，即在一定条件下，事物的量保持恒定不变②随机型，即事物的量随机改变③模糊型，即事物的量本身就是模糊不定的，难以获得确定的量（２）测量的精确度决定于测量工具的精密性①物理测量：即对事物的物理特征的测量②生理测量：即对机体生理特征的测量③社会测量：即对社会现象的测量④心理测量：即对人的心理特征的测量（二）定义二美国心理与教育测量学家布朗认为：“测验是测量一个行为样本的系统程序心理测验就是通过观察人的少数有代表性的行为，对于贯穿在人的全部行为活动中的心理特点作出推论和数量化分析的一种科学手段说明：（１）测验测量的是人的行为，严格地讲，只是测量了做测验的行为，也就是一个人对测验项目所进行的反应２）一个测验不可能包括所要测量的行为领域中所有可能的项目，它所包含的只是全部可能项目的一个样本３）在编制、施测、评分和解释方面依据一套系统的程序使用标准化测验应注意以下一些事项：（１）与被试建立融洽的关系，减轻被试者的紧张与焦虑。

２）创造良好的测验环境测验场所应肃静、宽敞、明亮、通风，不使被试过度疲劳３）宣读测验指导语要清晰、缓慢，务使被试者准确理解指导语的含义４）严格按测验说明书的程序评分，务使评分客观、准确５）被试的测验成绩应适当保密（三）定义三史帝芬斯说：“就其广义来讲，测量是按照法则给事物指派数字测量的三个要素：（１）测量的对象——事物属性（２）测量的结果——数字（３）测量的方法——法则（四）定义四美国心理测量学家阿娜斯塔西认为：“心理测验实质上是对性样本的客观和标准化的测量１、行为样本２、标准化测验的标准化需要具备下列条件：（１）测验内容的标准化（２）施测条件的标准化（３）评分规则的标准化４）测验常模的标准化３、难度或应答率４、信度和效度二　心理测量的特性（一）心理测量的间接性（二）心理测量的相对性（三）心理测量的客观性１、测验用的项目或作业、施测说明、施测者的言语、态度及施测时的物理环境等，均经过标准化，测验的刺激是客观的２、评分记分的原则和手续经过了标准化，对反应的量化是客观的３、分数的转换和解释经过了标准化，对结果的推论是客观的四）心理测量的稳定性三　测量的基本要素（一）测量的参照点参照点有两种：绝对参照点，即以绝对的零点作为测量的起点。

相对的参照点，即以人为确定的零点作为测量的起点（二）测量的单位理想的测量单位应当具备两个条件：1、要有确定的意义即对同一单位，所有的人的理解都是相同的，不允许作出不同的解释 2、要有相等的价值即第一单位与第二单位之间的距离等于第二单位与第三单位之间的距离四　测量的量表（一）命名量表（类别量表）它只是用数字代表事物或用数字对事物进行分类命名量表又可细分为两种形式：一是名称量表，即用数字指代个别事物二是类别量表，即用数字指代事物的种类（二）顺序量表（次序量表、等级量表）它不仅能够指代事物类别，而且能够表明不同类别的大小、等级或事物具有某种特征的程度既没有相等的单位，也没有绝对的零点（三）等距量表（间距量表）它不仅能够指代事物的类别、等级，而且具有相等的单位没有绝对的零点四）比率量表（等比量表）除了具有类别、等级、等距的特征外，还具有绝对的零点量表名称性质统计方法类别测量只能对事物进行分类，具有区分性次数，百分比，2，列联相关等级测量能把事物分等，具有等级或序列性中位数，百分位数，等级相关，秩次检验等距测量能把事物作等距的分等，具有等距性均数，标准差，积矩相关，T检验，F检验比率测量能测量事物差异的比例关系，具有可加性几何均数，等比量数四种测量在三个维度上的表现类别等级等距比率绝对零点无无无有相等单位无无有有大小关系无有有有第三节心理测验的种类与功能一心理测验的种类（一）按测验功能分类1、能力测验能力测验可分为实际能力测验与潜在能力测验。

能力测验又可分为普通能力测验和特殊能力测验 2、成就测验（教育测验）主要用来测量个人（或团体）经过某种正式教育或训练之后对知识和技能掌握的程度成绩测验有两种类型：（1）学科成就测验2）综合成就测验 3 、人格测验主要用于测量性格、气质、兴趣、态度、品德、情绪、动机、信念、价值观等方面的个性心理特征，亦即个性中除能力以外的部分（二）按测验对象分类1、个别测验每次以一位被试为对象，通常是由一位主试与一位被试在面对面的情形下进行优点：（1）主试对被试的作题行为有仔细的观察，有机会获得测量分数之外的信息 2）主试与被试面对面交流的机会更多，容易与被试建立起融洽的合作关系，易于激发被试的测验动机，有较多的观察与控制机会3）对于一些特殊被试（如幼儿、文盲）只能采用个别测量，以便主试代替被试记录其行为反应缺点：（1）费时，难以在短时间收集大量的测量资料2）测验手续比较复杂需经过较高水平训练的人担任主试２、团体测验指每次测验过程中由一个或几个测验者对数量较多的被测验者(一个群体)同时实施测验优点：节省时间，可以在短时间内收集到大量的测量数据缺点：由于同一时间内接受测量的被试多，不易有效地控制被试的行为，容易产生测量误差，从而影响测验的信度和效度。

（三）按测验内容的形式来分类１、文字（纸笔）测验这类测验通常为文字项目组成，由文字说明做法和作出回答优点：实施起来方便，团体测验多采用此种方式编制缺点：容易受被试的文化背景的影响，从而降低测验的效度２、非文字（操作）测验这类测验的项目多由实物、图片、模型之类的直观材料制作组成，测验也多以操作方式进行优点：此种测验不受或少受文化背景的影响，也适用于测量学前儿童及文盲的心理特征缺点：常局限于个别测量，在时间上不经济（四）按测验功能来分类１、成就测验与预测测验成就测验的目的是测量个人在某一领域已经达到的实际成就预测测验的目的在于测量个人在未来某一方面获得成功的可能性２、难度测验与速度测验难度测验的功能在于识别个人能够达到的最高水平速度测验的功能在于识别个人做题的最快速度３、描述测验与诊断测验描述测验的功能在于通过测量来描述某一特定群体在某一心理特质上的一般状况描述测验的功能在于通过测量来描述某一特定群体在某一心理特质上的一般状况（五）按评价所参照的标准来分类１、常模参照测验是根据被试对量表中所规定的题目答对多少来评分的，被试成绩的优劣，是根据所得分数在常模中所处的地位来确定的，不是以是否达到某个标准来决定。

２、目标参照测验是将被试水平与一绝对标准相比较，以便评价被试有无达到该标准为目的测验，也称标准参照测验３、潜力参照测验是将被试水平与自身潜力相比较，以评价被试有无充分发挥自身潜力为目的的测验（六）按测验要求分类１、最高作为测验２、典型作为测验（七）按测验应用来分类１、教育测验２、职业测验３、临床测验二　心理测验的功能（一）在教育工作上的应用１、心理测验是教师了解学生的有用手段２、心理测验也可使教师发现学生的心理问题，以便及时地进行心理或干预３、心理测验是教育评价的重要工具４、心理测验是教育研究的重要方法（二）在临床医学上的应用１、临床工作中借助心理测验对儿童进行心理指导２、临床工作中对器质性精神病的鉴别，往往借助于一些专门的心理测验３、在临床科研中，借助于心理测验也可以观察病情程度，比较疗效三）在智能缺陷早期诊断上的应用（四）在人才选拔、工作安置上的应用１、借助心理测验以便预测人们从事各种活动的适宜性，从而提高人才选拔和职业训练的效率２、借助心理测验，可以做到人与工作的较好匹配，做到人尽其才，从而提高工作效率３、心理测验在解决实际问题中发挥了较广泛的作用第四节　心理测验的正确使用一　对心理测验的正确态度（一）两种极端的看法１、认为测验完美无缺。

２、认为测验无用且有害二）对心理测验的正确态度１、心理测验是一种有用的研究手段和测量工具２、测验作为一种研究手段和测量工具尚不完善３、为更好地发挥测验的效能，必须防止测验的滥编乱用为防止测验的滥编乱用，要注意以下几个问题：（１）测验的编制和修订必须由有关领域的专家来主持２）测验的出版和发行要严加控制二　心理测验使用者的资格（一）心理测量工作者的知识结构心理测验工作者可分为两个不同的层次：（１）专业研究工作者，主要从事心理测量学的理论研究工作和各种测验的编制工作２）实际应用工作者，主要从事运用心理测量解决各行各业的实际问题的工作心理测量工作者应当具备相应的基础知识和专业知识１、基础知识（１）普通心理学、发展心理学、教育心理学等广泛的心理学基本知识２）扎实的心理统计学的基本知识２、专业知识（二）对心理测验的科学态度（三）心理测验工作者的道德准则１、测验的保密和控制使用２、测验中个人隐私的保护测验工作者应当采取适当的保护措施：（１）只有在必要的情况下，测验工作者才能询问个人的隐私，凡是与测验目的无关的方面就不应涉及２）对受测者保证为其保密，并在实际上为受测者严守秘密３）凡测验中必须涉及的个人隐私应事先征得受测者本人或其他有关人员的同意。

三　心理测验使用中的注意事项（一）测验前准备的注意事项１、要选择合适的量表２、要准备好测验的场所３、要准备好测验的器材４、要熟悉测验的方法和步骤（二）测验过程中的注意事项１、协调好与被试的关系，充分激发被试的测验动机，使其能配合做好测验２、严格按照规定的步骤和方法进行测试，时限的掌握要准确，指导语要统一，不能对被试有任何的暗示３、要注意排除各种干扰测验的无关因素（三）测验后的注意事项１、严格按照测验规定的标准记分２、测验结果的解释应慎重，注意教育性原则，尽量使测验结果的解释有利于被试发展与身心健康，避免对被试造成不良后果３、对测验结果要保密，未经被试同意，不能告诉其他人四　测验的使用在测验时也必须注意以下几个问题 (1)慎重选择测验量表(2)与被测验者建立协调关系(3)控制实施测验的误差(4)正确解释测验结果(5)遵守测验的道德(6)注意测验的保密第二章　心理测验的编制与应用第一节　心理测验编制的一般程序一　确定测验目的与对象（一）测量对象（二）确定并分析测量的目标（三）测验用途二　拟定编制计划例如：塞斯顿基本心理能力成套测验美国著名心理学家塞斯顿，采用因素分析方法，对56个分测验之间的交互相关进行因素分析，概括出七种基本心理能力，提出了智力的多因素结构理论，并围绕着这七种基本心理能力，编制了一套由七个分测验组成的“塞斯顿基本心理能力成套测验”。

塞斯顿于1941年正式出版了“基本心理能力测验（简称为PMAT），这是当时较为著名的智力测验这七个测验分别是：（1）言语理解，即测量阅读时理解文意的能力2）数字计算，即测量运算的速度和准确性3）知觉速度，即测量迅速而正确地观察和辨别事物异同点的能力4）词语流畅，即测量词义联想迅速和正确的能力5）记忆，即测量机械记忆的能力，包括强记单词、数字、字母等方面6）归纳推理，即测量根据已知条件进行推理判断的能力7）空间知觉，即测量运用感官及知觉经验以正确判断空间方向及关系的能力例如：小学自然常识测验的编题计划行为目标教材内容获得基本知识理解基本原理原则应用原理原则分析因果关系综合成系统见解建立评价标准合计生物世界35632120资源利用23311010动力和机械23420112物质、物性与能量56832125气象24322013宇宙25410012地球2221108合计1828301383100三　设计测试项目（一）搜集有关资料１、资料要丰富２、资料要有普通性３、资料要有趣味性（二）选择项目形式在选择项目形式时，要考虑以下几点：１、测验的目的和材料的性质２、接受测验的团体的特点３、各种实际因素。

（三）编写和修订项目编写项目要注意以下几个问题：１、项目的范围要与测验计划相一致２、项目的数量要比最后所需的数目多一倍或几倍，以备筛选和编制复本３、测验项目的取样应当对欲测量的心理品质具有代表性４、项目的难度应有一定的分布范围，必须符合测验目的的需要５、项目的说明必须清楚６、编写测验项目的用语要力求精练简短、浅显明了四　项目的试测和分析（一）试测预测应注意以下几个问题：１、预测对象应取自将来正式测验准备应用的群体虽然人数不必太多，但要具有代表性２、预测的实施过程欲情境应力求与将来正式测试时的情况相近似３、预测是时限可稍宽一些，最好使每个被试都能将项目做完，以搜集较充分的反应资料，使统计分析的结果更为可靠４、在预测过程中，应随时记录被试的反应情形（二）项目分析质的分析是从内容取样的适当性、题目的思想性以及表达是否清楚等方面加以分析量的分析是对预测结果进行统计分析，确定项目的难度、区分度、备选答案的适宜性等五　合成测验（一）项目的选择选择测验项目的指标有三：（１）测验的性质，即要选择那些能够测量所要测量的东西的项目２）项目的难度３）项目的区分度（二）项目的编排（１）并列直进式２）混合螺旋式。

（三）编造复本复本的关键是等值所谓等值就是要符合下列条件：（1）复本测量的是同一种心理特质；（2）复本测题的内容范围相同，但题目不应有重复；（3）复本测验题型相同，题目的数量相等，并且有大体相同的难度和区分度结构4）复本测验的分数分布（平均数和标准差）大致相同两个等值的测验复本A本：1、4、5、8、9、12……B本：2、3、6、7、10、11……三个等值的测验复本A本：1、6、7、12、13、18……B本：2、5、8、11、14、17……C本：3、4、9、10、15、16……六　测验使用的标准化（1）确保测验实施过程的规范性与统一性，包括测验指导语、测验时间、测验情境等2）制定客观的评分标准与解释分数的常模3）务必使测验的效度与信度达到一定的要求（三）分数解释１、常模团体常模团体是由具有某种共同特征的人所组成的一个群体或是该群体的一个样本确定常模群体的注意事项：（１）群体构成的界限必须明确２）常模团体必须是所测群体的一个代表性样本３）取样的过程必须明确且有详尽的描述４）样本大小要适当５）常模团体必须是近时的６）注意一般常模与特殊常模相结合２、常模（１）年龄常模：这是以不同年级测验平均分数为常模的，它通常用在学科或学力测验中。

２）年龄常模：这是以不同年龄的测验平均分数为常模的，它一般用在智力测验中，有时也用在教育测验中以表示学生的教育年龄３）百分等级常模：当常模样本组的测验分数的分布偏离正态分布时，可以百分等级表作为测验的常模表４）Ｔ分数常模：这是以标准差为单位的标准分数转换所得的常模七　搜集信度、效度资料八　编写测验手册测验手册的内容有：（1）测验的名称、作者、发行单位2）测验的目的和功用3）测验编制的理论背景和选择题目的依据4）测验的实施方法、时限及注意事项5）测验的标准答案和计分方法6）常模资料7）测验的信度资料和效度资料良好的测验应符合以下一些要求：１、试题的类型应与测量的目的相适应２、所拟定试题应具有代表性３、试题要有适宜的难度和区分度４、试题的表述要明晰、准确，不会引起被试者对试题的误解５、测验的结果具有可靠性和有效性６、测验要易于实施，易于评分，便于统计检验，在人力、物力和时间方面，符合经济性原则第二节　构制心理测验的具体方法及实例－　强调实证效度的经验效标法所谓强调实证效度的经验效标法，是指测验编制者凭借丰富的实践经验来编拟测验题目，并把这些题目分别施测于两个组内同质、组间异质的效标组，依此来筛选题目，构建测验的方法。

1．武德沃斯个人资料调查表2、明尼苏达多相人格调查表二　基于因素分析技术的编制方法 (1)塞斯顿基本心理能力成套测验及其后续研究 (2)卡特尔的十六种人格因素测验三　基于某一人格理论或概念系统的构思方法 (1)爱德华个人偏好量表 (2)吉尔福特的创造力测验四　综合法1、杰克逊人格问卷2、考夫曼儿童成套评鉴测验第三节　标准化测验的应用一　怎样选择适用的标准测验（一）根据测验的目的选择适宜的测验二）尽量使用曾经多次修订的量表三）尽量选用具有较高学术水平的专家们编制的量表四）尽量选用我国自己编制或修订的量表五）选用具有效度、信度资料，提供常模的量表，评分客观、方面，易于实施的测验二　使用标准化测验的条件和注意事项（一）使用标准化测验的条件Ａ水平：可使用实施方法较为简便的标准化测验Ｂ水平：可使用性向测验或一般适应测验Ｃ水平：可实施个别测验或投射测验（二）使用标准化测验的注意事项１、与被试者建立融洽的关系，减轻被试者的紧张与焦虑２、创造良好的测验环境３、宣读测验指导语要清晰、缓慢，务使被试者准确理解指导语的含义４、严格按测验说明书的程序记分，务使评分客观、准确５、被试者的测验成绩应适当保密。

第三章　测量误差及其来源一　测量误差的含义测量误差指的是在测量过程中由那些与测量目的无关的变化因素所产生的一种不准确或不一致的测量效应．理解：（１）测量误差是由那些与测量目的无关的变因所致２）测量误差表现为不准确或不一致两种方式二　测量误差的种类（一）随机误差是由那些与测量目的无关的、偶然因素引起的、而又不易控制的误差二）系统误差是那种由测量目的无关的变因引起的一种恒定而有规律的效应系统误差只影响测量的准确性，不影响稳定性，而随机误差既影响稳定性又影响准确性三　测量误差的来源（一）测验自身引起的误差（二）施测过程引起的误差１、测试环境２、测试时间３、主试因素４、意外干扰５、评分记分（三）被试引起的误差１、应试动机２、测验焦虑３、测验经验４、练习效应５、反应倾向６、生理变因第四章　信度第一节　信度的意义一　信度及其统计学原理信度指可靠性或可靠的程度一）信度指实测值和真值相差的程度实测值是实际测量某种事物时所获得的测定值，也称实得分数或观察分数真值是被测量的事物的真实规模的取值，也称真分数实得分数和真分数之差称为测量误差或误差分数可以称为绝对误差 X=T+E实得分数的相对误差是误差分数（Ｅ）对于真分数（Ｔ）所占的百分数。

即相对误差＝E/T×100%可以用最大绝对误差（Ｅ）对于实得分数（Ｘ）所占的百分数来作为这个这个实得分数（Ｘ）的最大相对误差，即最大相对误差＝E/X×100%信度可定义为真分数方差与实得分数方差的比率rxx=ST2/SX2（二）信度指统计量（如样本平均数）与参数（如总体平均数）的接近程度三）信度指一种测验对相同的应试者再次测验时引起同样反应的程度第二节　信度系数的计算信度指标常用相关系数表示，也称信度系数，表示实得分数的变异数中有多少比例是由真分数的变异决定的，例如信度系数为0.9意指变异的90％来自真分数的差异一　稳定性系数（再测信度）稳定性系数是用同一量表对相同被试者在不同时间测验两次的实得分数的相关系数重测法测验Ａ1 适　当　时　距测验A2皮尔逊积差相关公式：计算再测信度应满足以下几个假设：（１）所测得的特质必须是稳定的２）遗忘与练习的效果相同３）两次施测期间被试的学习效果没有差别在使用重测法计算稳定性系数时，要注意下列问题：（１）两次测验之间的时间间隔要适当时间间隔过短易夸大稳定性，时间间隔过长，易降低稳定性２）重测法适用于速度测验而不适用于难度测验３）应注意提高被试者的积极性。

二　等值性系数等值性系数是以两个等值（题型、题数、难度、区分度相等），但具体内容不同的量表，在最短时距内，对相同的应试者先后施测两次测验所获得的两组对应分数的相关系数复份法测验Ａ１最　短　时　距　测验Ｂ１计算复本信度的条件：（１）要构造出两份或两份以上真正平行的测验２）被试要有条件接受两个测验使用复份法计算等值性系数要注意下列几点：（１）复份法的关键在于两个量表必须等值２）两次测验的时距宜尽可能短促，以避免知识积累、练习效应等因素的影响３）由于量表的两个复份再许多方面近似，所以信度系数有稍微偏高的倾向４）标准化测验一般均有复份，若没有说明等值信度，或等值性系数较低，则使用复本应持慎重态度三　等值稳定性系数等值稳定性系数是合估等值性与稳定性而得到的信度系数复份法测验Ａ２适　当　时　距　测验Ｂ１四内部一致性系数（同质性信度）内部一致性系数是用同一测验量表的两个部分得分的相关系数１、分半法(1)斯皮尔曼－布郎公式校正公式 rxx＝2rhh/（1+rhh）rhh为两半分数的相关系数，rxx为测验在原长度时的信度估计斯皮尔曼－布郎通用校正公式:rkk=Krij/(1+(K－1)rij) K为可能测验长度与原测验长度的比率 rij为原测验信度系数rkk为测验增长成原来的K倍时的信度估计值缺陷：该公式假设两半测验分数的变异相等，如不等值时可采用下两个公式：(2)弗郎那根（Flanagan）公式:rxx＝2（1－（Sa2+Sb2)/Sx2）Sa2、Sb2 和分别为两半测验分数的变异数，Sx2为测验总分的变异数。

3)卢伦（Lulon）公式： rxx＝1－Sd2/Sx2Sd2 为两半测验分数之差的变异数，Sx2为整个测验分数的变异数２、基于项目协方差的方法库得尔—理查森公式法（1）ＫＲ20的用法rkk=（K/（K－1））(1－(∑piqi)/Sx2) K为题数pi为通过第i个题目的人数比例qi为未通过第i个题目的人数比Sx2 为测验总分的变异数注：适用答对一题得一分，答错无分的测验 (2)ＫＲ21 用法rkk=（K/（K－1)）(（1－Kpiqi）/Sx2) ＝（K Sx2 －X(K－X)）/(K－1)Sx2 pi为题目的平均通过率 qi为1－pi X为测验总分的平均数 Sx2 为测验总分的变异数适用各题难度相近的情况当题目难度相差大时，所求信度系数有低估倾向计算内部一致性系数，需注意下列问题：（1）若用分半法时，以按奇数题和偶数题分为两半为宜2）若速率是测验的重要因素，则不宜用分半法3）如果答案只有正确和错误两种，得分也有两种，可用库得尔——理查森公式法计算信度系数；若答案多种多样，得分也多种多样时（如论文式考试），则不能用上列公式计算一致性系数。

五论文式测验的信度系数克龙巴赫α系数公式：α＝（K/（K－1））（1－∑Si2/ Sx2 ） Si2 为某项目分数的变异数，其它字母意义同k－R20公式，当题目以二分法记分时，∑ Si2 ＝∑piqi，所以K－R20公式为α系数的特例适用多重记分的测验上述公式不适用速度测验库德－理查逊公式和克伦巴赫α系数所求得的信度通常比分半信度低六阅卷者评分的信度系数（一）斯皮尔曼等级相关公式两个评分者一致性计算：计算每份试卷两个分数的相关系数二）肯德尔和谐系数（W）W＝( ∑Ri2－(∑Ri)2/N)/（K2(N3-N)/12） K为评分者人数 N为被评对象数 Ri是每个对象被评等级假设有三位专家给六篇论文评等级，结果如表所示，试计算此次评分者的评分者信度专家123456124156323415623351462Ri813314187七目标参照测验的信度系数（一）方法一：举行一次测验，确定一个决断分数，假定测验成绩超过决断分数的学生已具备学习下一阶段教材的条件，那么达到目标的可能性较大经过下一阶段的学习和训练后，举行第二次测验，若上次测验成绩超过决断分数的应试者在第二次测验中的成绩确已达到所规定的目标，则说明上一次测验的信度高；反之，若上次测验成绩超过决断分数的许多人在第二次测验中成绩低下，并未达到预期目标，则说明上次测验的信度低。

（二）方法二：采用复本法，以等值的两个量表测验相同的应试者，但不计算各应试者两次得分的相关系数，而是根据两次测验都在决断分数（假定这个分数是应试者是否达到目标的临界分）以上和以下的人数的百分比，来判断测验结果的信度八速度测验的信度系数重测验法和复本法分半法的依据必须是时间而非试题有两种方法：（1）把测验时间分为两半（2）把全部测验时间分为四段各种信度系数相应误差变异的来源信度系数类型误差变异来源再测信度时间取样复本信度（连续施测）内容取样复本信度（间隔施测）时间内容取样分半信度内容取样同质信度内容异质性评分者信度评分者间差异第三节　提高测验信度的方法一　测验信度以多大为宜二　影响测验信度的因素（一）系统误差系统误差不影响信度二）抽样误差抽样误差是影响信度的一个因素三）随机误差随机误差是影响信度的最主要的一种误差三　提高测验信度的方法（一）延长测验的长度（１）新增加测验题与原有的测验题应有相同的统计性质，即应有相同的平均难度和相同的组间相关２）加大测验长度应当不影响被试者回答问题的方法题数与原测验题数之比信度系数效度系数1010.3000.4002020.4620.4963030.5620.5486060.7200.619120120.8370.668240240.9110.679480480.9540.713（二）测验的难度要适中难度在0.40—0.70之间是合适的。

三）测验的内容应尽量同质（四）测验的时间要充分（五）测验的程序应统一（六）评分要客观（七）加大应试者之间的差异第五章测验的效度第一节效度的意义一效度的含义效度是量表能实际测量出其所要测量的特性或功能的程度理解：（1）测量的效度始终是对一定的测量的目的而言的2）测量的效度也是对测量的结果而言的3）一种测验结果的效度只是高或低的问题二效度的统计学原理潜在真分数方差SV2 系统误差方差SI2真分数的变异数可以分为：与测量目的有关的变异和与测量目的无关的变异系统误差的变异包含在真分数的变异中ST2=SV2 +SI2SX2=SV2 +SI2 +SE2 可以把效度定义为潜在真分数方差与实得分数方差之比效度＝SV2/SX2 ＝rxy2 式中：SV2 代表有效变异数，SX2 代表总变异数，rxy2代表测量的效度系数一个测验的效度表明，在一组测验分数中，有多少比例的变异数是由测验所要测量的变因引起的，结果用效度系数表示三效度与信度的关系1、效度高的测验，信度也一定高，高信度是高效度的必要条件2、信度高的测验，其效度不一定高，高信度并非高效度的充分条件第二节效度的估计逻辑效度：效度的高低根据教育学或心理学的原理推论和判断，如内容效度和结构效度；统计效度：效度的高低可以通过统计计算而用数量指标描述，如目标关联效度。

一内容效度内容效度是指测验目的代表所欲测量的内容和引起预期反应所达到的程度比如，教师为了解学生在某一学科知识掌握的情况，要进行一个全面的考试考试不可能包含所有学科内容于是，就从学科知识范围可能的题目中取样来编成测验，根据测验分数推论学生学科知识掌握的情况如果测验题目的取样代表性好，则推论将有效；如果题目取样有偏差，则推论将无效（一）逻辑分析的方法专家判断专家判断内容效度比（内容效度比（CVRCVR）＝）＝内容效度比低的题目就应该被淘汰内容效度比低的题目就应该被淘汰. .然后计算全部测题然后计算全部测题的内容效度比的平均数的内容效度比的平均数, ,作为内容效度的指标作为内容效度的指标. .缺点缺点: : 1) 1) 没有量化指标没有量化指标; ; 2) 2) 对内容效度的判断不一致对内容效度的判断不一致; ; 3) 3) 教育思想或心理学观点不同教育思想或心理学观点不同, ,所以对内容范围所以对内容范围的理解也不同的理解也不同. .（二）测验题目与教材内容比较的方法1、克龙巴赫方法2、在传授某种知识之前先对应试者进行一次测验，这时应试者对测验的内容当然知之甚少；然后正式传授这种知识，一定时间后测验所学内容，比较两次测验结果，也可以看出是否测量了课堂上所教的内容。

提高内容效度的方法之一：提高内容效度的方法之一：编制命题的双向细目表编制命题的双向细目表记忆记忆了解了解应用应用分析分析综合综合评价评价合计合计第一章第一章8210第二章第二章12621030第三章第三章 4422618第四章第四章 2101284642合计合计6262814206100二结构效度结构效度是指测验分数能够说明心理学理论的某种结构或特征的程度，也可以理解为测验实际测量了所欲测量的结构和特性所达到的程度1、分析某种结构和特征与测验题目的联系，看这些题目是否能测量该种结构和特征2、比较两组被试者进行同一测验的结果3、把自己所编制的测验的施测结果，与另一性质相同而被公认具有较高结构效度的测验结果比较4、比较先后两次测验的结果5、用因素分析法判断结构效度6、用计算聚敛效度与区分效度的方法估计结构效度聚敛效度就是测量某种心理结构的测验分数，要与测量相同结构的其他测量的分数具有高相关区分效度是测量某种心理结构的分数要和测量不同结构的测验分数具有低相关某一智力理论的四项假设某一智力理论的四项假设: :1.1.智力随年龄而增长智力随年龄而增长; ;2.2.智商是稳定的智商是稳定的; ;3.3.智力与学业成绩有密切关系智力与学业成绩有密切关系; ;4.4.智力受遗传的影响智力受遗传的影响. .某注意力的理论某注意力的理论, ,注意有如下特征注意有如下特征: :1.1.稳定性稳定性2.2.集中性集中性3.3.转移性转移性4.4.分配分配5.5.范围范围例如构想：考试焦虑是当考试结果对个人有重大意义时的一种害怕失败的紧张情绪”。

有一个焦虑测验，考察这测验是否有构想效度设计几种试验情境：设计1：比较不同重要性考试时该测验的分数按照构想，重要考试时焦虑分数高平时考试中实施此焦虑测验重要考试之前施该焦虑测验比较两次分数，如重要考试前的焦虑分数显著提高，就说明这个测验对测量考试焦虑是有效的设计2：举行两场考试，使被试相信一场考试关系重大，一场考试无关要紧挑选两组被试，高焦虑组和低焦虑组比较考试成绩，出现下述情况，说明测验有构想效度：焦虑分数高组学生，如在第一场考试中成绩比平时有所下降，在第二场考试中却能正常发挥焦虑分数低组学生，无论在哪场考试都发挥正常设计3：收集被试在经历一场重大考试时的生理心理参数作为焦虑的指标将其同焦虑测验分数比较相关高证明焦虑测验测量了焦虑这个特质三效标关联效度效标关联效度是指测量分数与作为效标的另一独立测验结果之间的一致程度一个好的效标必须具备以下条件：（１）有效性２）可靠性３）可操作性４）实用性被预测的行为是检验测验效度的标准，简称效标因为效标效度需要实际证据，所以也叫实证效度例如：用大学入学成绩预测大学生的学习成绩用职业测验预测工作能力用人格测验预测哪种人容易得精神病等1、效标、效标所谓效标就是衡量测验有效性的参照标准，指的是可以直接而且独立测量的我们所感兴趣的行为。

常见的效标有：学业成就：如在校成绩、学业测验分数、学历等可以作为智力和学习能力测验的效标等级评定：如对学习成绩、智力、人格、工作等表现可以通过判断评定一个量数，用来作为各有关测验的效标临床诊断：临床观察诊断的结果可以作为智力、人格等测验的效标 2、、效标测量：将观念上的效标用可操作的测量确定下来例如：对于大学入学测验来说，我们感兴趣的或要预测的行为是“大学的成功”，即入大学后能否学得好大学的成功”就是观念效标，我们必须要数量化或操作化比如大学的成绩常常就用来作为对“大学的成功”的测量，所以，大学成就就是效标测量效标关联效度分成两种：（一）同时效度同时效度是一种测验的结果与另一大约同时获得的测验结果（即效标）之间的一致程度（二）预测效度预测效度时指测验结果对未来的行为或测验成绩（效标）能够准确预测的程度估计预测效度的主要方法有：1、用计算积差相关系数的方法估计预测效度，并以积差相关数作为效度系数2、利用回归方程估计效标分数及计算其置信区间3、用计算点二列相关系数的方法估计预测效度，并以点二列先观系数作为效度系数1 1、相关法、相关法1) 1) 积差相关积差相关在两组数据都是连续变量在两组数据都是连续变量, ,且两者存且两者存性关系时使用性关系时使用公式公式: :被被试试12345678910测验测验(x)20343247202427252216销售额销售额(y)2.53.8 340.712.23.52.81.22) 2) 二列相关二列相关在测验分数和效标这两个变量中一在测验分数和效标这两个变量中一个是连续变量个是连续变量, ,另一个是二分变量时使用另一个是二分变量时使用. .公式公式: :例例: : 智商与学校类型的关系智商与学校类型的关系p p 重点中学被试百分比重点中学被试百分比 66/302 = 0.187566/302 = 0.1875q q 普通中学被试百分比普通中学被试百分比 286/302 = 0.8125286/302 = 0.8125 重点中学被试智商均数重点中学被试智商均数 114114 普通中学被试智商均数普通中学被试智商均数 9696S St t 总体标准差总体标准差 14.5314.53y y 常态曲线下，常态曲线下，p p 所对应的纵轴高度所对应的纵轴高度 0.26850.26853) 3) 多元相关多元相关在测验分数和效标变量中有一个是连续变在测验分数和效标变量中有一个是连续变量量, ,另一个是二分以上的变量时使用另一个是二分以上的变量时使用. . 用用JuspenJuspen公式公式4) 4) 四格相关四格相关在两组变量都是二分变量时使用在两组变量都是二分变量时使用用皮尔逊余弦用皮尔逊余弦   法法. . 相关法求效度的优缺点优点：优点：提供一个统计指标以总结预测源与效标间的关系。

可利用回归方程式来预测每个人的期望效标成绩效度系数为大家广泛接受，便于比较研究缺点：缺点：假如预测源与效标的关系不是直线的，则必须采用特殊的相关法测验结果不能提供有关取舍正确性的指标 2、分组法（区分度）预测源分数能否区分由效标测量所定义的团体检验平均数测验录取一批工人，工作一段后，根据工作成绩（产品数量、质量）分成称职和不称职两组，然后再检查当初的测验分数，用t检验看两组在测验的平均分数上有无显著的差异，如果有，说明测验有预测作用，否则就没效当团体数量大时，很小的一点平均数的差异都会有显著意义，此时测验区分这些团体的实际价值就很小为了避免上述问题，必须把两组的平均分数、标准差、重叠量以及平均分数的差异在统计学上的显著性一并报告3、命中率当测验用来作取舍的根据时，其有效性的指标就是正确决定的比例预测源分数确定一个临界分数（分数线），高于分数线者接受，低于分数线拒绝在效标方面根据情况确定一个标准，高于标准为成功，低于标准为失败此时可以得到预测命中表效标成绩测验预测失败（-）成功（+）成功（+）A（失误）B（命中）失败（-）C（命中）D（失误） 4、功利率使用测验所花费的费用与得到的利益的比较，看利弊大小如何，这种效度就是功利率。

U=B(NS)－C(NU)－S (6.5)U代表功利率B代表录用一个成功的工人所产生的平均利润C代表录用一个不合格工作造成的损失NS和NU分别代表录用的人中成功和不成功人数S代表整个选人程序的费用四表面效度表面效度时指从外表直观地看来这个两标可以测量所想测量的特性和功能的程度内容效度与表面效度的区别表面效度是指测验看起来所要测量的东西,是被试或外行看来是有效的测验.表面效度与内容效度并不总是一致的.表面效度能间接影响测验的效度,所以测验编制时也要适当关注表面效度.表面效度是由外行对测验作表面上的检查所确定的内容效度是由够资格的专家详尽地、系统的对测验作评价而建立的前者只考虑题目与测量目的之间明显的、直接的关系后者则同时考虑题目与测量目的和内容总体之间的逻辑的微妙关系最高行为测验（如能力测验）要求有较高的表面效度，以使受测验者具有较强的动机，尽最大的努力完成典型行为测验（如人格测验）却要求较低的表面效度，如果受试者很容易就从题目上看出测题的目的，就可能作出假的反应第三节提高测验效度的方法一多种效度系数的要求二提高效度的方法（一）控制系统误差（二）精心编制量表１、测验内容要确实能适应测验目的。

２、题目表述必须清楚、简明，所用字、词、句能为学生理解，内容应能引起应试者的兴趣，排列由易到难，但前面的题目不应暗示后面的答案３、题目难度合适，有足够的区分度４、试卷印刷清楚，无错误和遗漏，并力求精美（三）妥善组织测验（四）扩大样本的容量代表性（五）合理处理效度与信度的关系（六）适当增加测验的长度第六章测验的难度与区分度第一节难度及其计算一难度的意义(一)难度 P=R/N（二）难度对测验的影响1 、测验难度影响测验分数的分布形态2、测验难度影响测验测验分数的离散程度3 、测验难度影响测验的鉴别能力越是接近中等难度的题目越具有区分的作用,也就是越是靠近0.50的题目越好,其区分程度越高.如: 1 × 99 = 99 2 × 98 = 196 30× 70 = 210050 × 50 = 2500（三）测验的适宜难度0.50是测验的适宜难度测验难度影响测验分数的分布形态§ 难度大，正偏态 § 难度低，负偏态二难度的计算（一）计算难度的基本公式1、以试题通过率计算难度（1）二分法记分项目的直接计算法 P＝R/N×100％ P代表难度，N代表全体被试人数，R为答对或通过该题的人数。

2）多项选择项目的校正计算法 CP＝(KP－1)/ (K－1) CP是校正后的通过率 P为实得通过率 K为备选答案的数目比如P为75％，5个备选时，CP为69％；4个备选时，CP为67％；3个备选时， CP为63％；2个备选时， CP为54％2、非二分法计分项目的平均分计算法 P＝X/Xmax×100％ X为全体受试者在该题目上的平均分数，Xmax为该题的满分校正难度的作用检验实际难度例: 某题通过率为75%,是一个五选一的题目.（二）用极端分组法计算客观性试题难度（上下27%） P=（PH+PL）/2PH、PL分别为高分组与低分组的通过率步骤：A、按测验总分由高到低排序B、从高分段向下选出全部试卷的27％作为高分组C、从低分段向上选出全部试卷的27％作为低分组D、按照上述公式计算项目难度值例：100人参加某测验，高分组与低分组各取27人，其中第一题高分组20人答对，低分组10人答对这道题的难度系数是多少？(三) 用极端分组计算法计算论文试题难度XH：高分组所得总分；XL：低分组所得总分；H：该题最高分；L：该题最低分；N：考生总人数的25％步骤：A、按测验总分由高到低排序B、从高分段向下选出全部试卷的25％作为高分组C、从低分段向上选出全部试卷的25％作为低分组D、按照上述公式计算项目难度值三、难度水平的确定根据测验的目的、项目的形式和测验的性质来确定。

1、学业考试：目的是教学内容掌握的情况，所以只要认为内容是重要的，就可以选择，而不论难度2、人员选择：采用难度值接近录取率的项目录取率为40％，则理想的难度在0.40左右0.50左右难度的题目，可以对全体被试作最大程度的区分3、对于选择题难度值要大于概率如难度值等于或小于概率，如鉴别力好，通过者都是水平最高的，也可保留4、对于人格测验人格测验的项目不存在难度问题，与此相应的指标叫通俗性，即同一类人在答案方向上回答的人数，计算方法同难度计算方法第二节区分度及其计算一区分度的意义（一）区分度区分度是指测验对考生实际水平的区分程度也叫鉴别力当效标测量是一个连续变量时，可从分布的两端选出高分组（H）和低分组（L），然后将高分组和低分组通过每个项目的人数用百分比来表示，这两个百分数之间的差异就提供了题目区分度的指标D=PH－PL D为鉴别指数 PH为高分组某项目通过人数百分比 PL低分组某项目通过人数百分比D值越大，项目区分度越高，项目越有效二）区分度与测验信度、难度的关系区分度与测验信度的关系 D的最大值与试题难度的关系区分度（D）信度难度区分度（D的最大值）0．12250.001.000.000.160.420.900.200.200.630.700.660.300.840.501.000.400.9150.300.600.500.9490.100.200.000.00鉴别指数与测题的评价 D测题评价0.40以上非常优良0.30-0.39良好,如能修改更好0.20-0.29尚可,但必须修改0.20以下劣,淘汰二区分度的计算（一）用极端分组法计算区分度１、客观性试题的区分度计算按测验总分从高到低排序确定测验总分最高的27％的被试作为高分组，最低的27％的被试为低分组分别求出这两组被试通过试题的百分比按下列公式计算试题区分度。

D=PH—PL 其中，D为区分度符号；PH为高分组通过试题的人数比例；PL为低分组通过试题的人数比例 2、论文试题区分度的计算（１）按测验总分由高到低依次排列试卷；（２）确定高分组低分组；分别确定测验总分的25％、25％作为高低分组（3）列试题分析表；（4）按下列公式计算区分度D为区分度指数；XH 为高分组得分总数；XL为低分得分总数；N为应试总人数的25%，H为这道题的最低得分，L为这道题的最低得分（二）用内部一致性系数计算区分度1、用点二列相关计算区分度公式: = 答对该题的被试在总分上的平均分 = 答错该题的被试在总分上的平均分 p = 该题的难度 q = 1-p St = 全体被试的总分标准差15个学生某测题的得分与总分情况学生123456789101112131415总分908180787770696555504942353110某题101111100010100 2、用二列相关计算区分度适用于两个连续测量的变量，但其中有一个由于某种原因被分成两个类别1）项目分数连续，效标或测验总分，分为高低或及格不及格。

2）效标连续，项目分数分为对、错或通过、不通过Xp为二分变量中高级组x值的平均数Xq二分变量低级组x指的平均数Xt为所有x的平均数St所有x的标准差p为高分组人数与总人数之比q为低分组人数与总人数之比y是p与q交界处正态曲线的高度rb=((Xp－Xq)×pq)/(St×y) rb=((Xp－Xt)×p)/(St×y)例题：20个学生语文测验总分和一个作文题、一个选择题上的得分情况如果作文分37分以上（包括37）算通过，计算作文分与总分的相关学生1234567891011121314151617181920总分8652947265227683807576736291477481886258作文4737552722103542463940413852213942482927选题10011001111011011000Xp=(86+52+83...＋74＋81＋88)/13=78.08)Xq=(72+65+22+76+47+62+58)/7=57.43p=13/20=0.65q=1-0.65(7/20)=0.35 X=1417  X2= 105947St2 = ( X2/N)－( X/N)2=105947/20－(1417/20)2=277.63St=16.66当p=0.65时，查常态曲线表得y＝0.3704rb＝((78.08－57.43)/16.66)×(0.65×0.35)/0.3704＝0.76Z 0.00 0.05... 0.08 0.39 1.0 2.0 3.0p 0.00 0.019 0.0318 0.15 0.3413 0.4772 0.4986y 0.3989 0.3984 0.39767 0.3704 0.2419 0.0539 0.0043 二列相关系数rb的显著性考验用下面公式：Z＝rb/((1/y)× pq/N ) (7.8)代入公式（7.8）得：Z＝0.76/(1/0.37) 0.65×0.35/20 ＝2.6查正态曲线表，如果Z值大于1.96，即为相关显著。

作文与测验总分有显著相关注意：计算二列相关系数时，要求二分变量的分布在连续测量时必须是正态的，即使样本分布不太正态，总体分布也应是正态连续变量的分布虽不要求是正态，但须是单峰和相当对称当两个变量均为连续变量时，计算积差相关更好二列相关可靠性较积差相关差，并要求大样本当一个连续变量分布不够规则，如在量表值的某一极限外没有个案或组别甚少，而它们在量表上的分布距离是否相等值得怀疑时，不能计算积差相关此时可以将这个变量分为两个类别计算二列相关作积差相关的估计值第三节选项分析选项设置不当会降低题目的难度,所以也要对选项作分析,看有无异常情况.通常判断选项好坏有以下几点:1) 正确答案无人选或少于其它选项的人数.2) 错误答案选的人太多.3) 正确选项高分组选择人数少于低分组.4) 错误选项上高分组选择人数多于低分组.5) 选项无人选择.6) 未答人数较多.题号组别选答人数正确答案ABCD未答1高分组 592120B低分组 2250121602高分组 581015161A低分组 2621153623高分组 1715282812D低分组 25111934114高分组 14414365C低分组 15610285也可以用高分组的反应情况来判断选项选择是否得当. 1) 选项 A B C D* 高分组 1 1 9 2 2) 选项 A B C* D 高分组 4 3 3 3 3) 选项 A* B C D 6 0 1 6项目分析步骤1.选取有代表性的样组实施测验.2.计算每个人的总分,然后按总分分组.3.计算高分组和低分组通过每一题的比率.4.分别求出每一测题的难度和鉴别指数.5.选项分析.6.修改测题或选项. 第七章　测验的编制与实施第一节　试题的编制一　试题类型及其选择（一）试题的类型１、客观性试题２、非客观性试题（二）试题选择的原则１、根据测验目的选择题型。

２、在同一测验中，试题类型不宜太多３、选择题型应考虑经济性原则（三）命题的一般原则 1) 测题的内容要有代表性 2) 测题的难度要有一定的分布范围 3) 测题的文字要简明扼要,要避免使用深奥的字词;一句话最好说明一个概念;意义要明确. 4) 各测题间最好是独立的. 5) 正确答案只能有一个. 6) 测题的内容不能超出被试团体的知识和能力范围. 7) 所提问题尽量避免涉及社会禁忌和个人隐私. 8) 测题的数量要多一点.二　多重选择题的编制（一）多重选择题的特点多重选择题一般是由题干和选择项两部分组成二）多重选择题的优点与缺点１、优点（１）多重选择题可适用于各种不同层次的认知目标２）多重选择题可降低由随机猜测对测验成绩的影响，提高测验的信度３）多重选择题具有诊断学习困难的功能，有利于改进教学，提高教学效果（４）多重选择题富有结构性，故可避免题意不清的缺点５）采用最佳选择式试题可以处理不属于或对或错，非此即彼之类的问题，而其他客观性试题却不适用于测量这类知识２、缺点多重选择题不适用于测量学生组织材料及表达观点的能力，且难于编制确有诱答作用的干扰项（三）多重选择题的编制原则１、题干意义要完整。

２、题干的陈述要简单、明确，避免使用不必要的修饰词及过分复杂的句子结构３、选择项中的干扰必须具有似真性，确能起到对不具备相应知识的学生的诱答、干扰作用４、多重选择题的选择项中，不宜使用重复的词语５、多重选择题应注意题干与选择项之间的逻辑与语法上的联系，避免提供选择正确答案的线索；在配成的试卷中，正确选择项应无规则地排列在所有可能的位置上三　论文式试题的编制在编制论文式试题时需注意以下几点：１、应限定论述题包含的范围，不使试题过于广泛笼统２、论述题的数量要尽可能多一些３、论述题测验不应给学生提供选择试题作答的机会４、编制论述题时要尽量选用适当的行为动词来陈述试题内容，以保证对复杂的认知目标的测量四　其他类型试题的编制（一）是非题１、是非题的特点是非题通常是提供一个陈述句，让学生判断是、非或正误，也叫正误题２、是非题的优点与缺点（１）优点取样广泛，可在限定的测验时间内，回答许多是非题；评分客观；较多重选择题易于编制２）缺点①是非题仅能测量最低层次的认知目标②是非题评分受随机猜测影响较大３、是非题的编制原则（１）是非题的叙述必须含义单一，否则难以判断对错２）是非题的答案必须是明确的，且是无争议的。

３）是非题叙述应简单、明了，避免使用复杂的语言结构４）应避免使用否定词（５）避免使用具有暗示作用的词６）在全部是非题中，答案为对与答案为错错的比例应大体相等，并应无规则地排列在试卷中７）是非题不应直录教材原文（二）简答题１、简答题的特点２、简答题的优点与缺点（１）优点①可以测量术语的知识、特定知识的知识、原则的知识、方法和程序的知识等各种层次的知识目标，也可测量解决问题的能力②简答题在各类客观性试题中是最易于编制的一种２）缺点难于测量综合、评价等高级认知目标；评分较封闭性试题费时，也不及封闭性试题客观，难于用计算机阅卷３、简答题的编制原则（１）一个简答题只能用一个答案，并且答案必须简短而具体２）应先以直接疑问句编制试题，只有在改为不完全陈述句以后可使题意更加明确时，才使用不完全陈述式简答题３）不应以简答题来测量零散、琐碎的知识，要尽量用简答题测量学生关于学科知识的重要概念４）在试题中避免提供正确答案的线索５）不可直接从教科书或其他参考书上原文抄写试题６）如果以数据填写答案，试题中应规定所需要的精确程度以及单位名称（三）填空题１、填空题只能有唯一的正确答案，而且需能用一个词、词组或短语提供答案。

２、除非语法测验或为某种特殊目的进行的语文测验，不宜省略连词、介词、冠词等让学生填写３、不应从教材或教学参考书中照抄原句，留下空格要学生填答４、填空题的空格不宜过多，不应因留下空格而丧失题意的完整性（四）匹配题１、匹配项与选择项不应是一对一的，选择项的数量应多于匹配项，以使学生从众多的选项中做出正确的匹配２、匹配题应允许同一答案多次使用，而且每个项目都不能有少于一个的正确选择３、匹配题可利用图形对知识进行测量４、匹配项目一般不要超过十个（五）排列题依据时间、大小或其他原则，排列事物的顺序六）情景性试题１、选择的情境性材料与确定的教学目标相等２、提供的情境性材料必须适合学生已有的知识经验与阅读能力３、情境性材料应该是学生从未学过的４、情境性材料应是简短而有意义的５、情境性材料的长短要与试题的数量保持适当的比率第二节　试题的评分一　评分误差评分可靠是指不同人评定同一份试卷或同一个人在不同时间评定同一份试卷所评定的分数都应是一致的这就叫评分信度表　ＸＸ省各科不同阅卷组对同一份考卷评分差异科目语文政治数学物理化学生物地理历史英语最高分85 77 78 58 86 28.673 56.759.5最低分62 70 67 56 79 18.269 50 58最大差异23 711 2710.446.71.5评分者本人的某些特点也能影响评定分数的客观性。

这些特点是：１、评分者知识水平的影响２、评分者心理状况的影响３、评分者个性倾向的影响４、各种“效应”的影响１）名片效应２）光环效应３）对比效应４）先后效应５、评分者工作态度的影响二　论文式试题的评分（一）论文式试题的评分方法１、相对评分法２、分析评分法（二）控制影响评分因素的方法１、遮盖试卷上能辨认考生的所有标记，使评分尽可能地只依考生的答卷内容为依据２、一段时间内，评阅所有试卷的同一道题，而不要一次评完所有的试题３、评分若需要依据一系列不同因素，在评分时，每次只能考虑一个因素，并只给这单一因素评分，待所有因素评分结素后，再合计总分４、学生再测验中书写潦草，标点、字词、语法方面的错误，除非与测验目的有关，不应作为评分的依据，不应影响学生所得的分数５、评分结束后，要进行试卷的复评三　客观性试题的评分（一）客观性试题的分数矫正猜测误差来源有二：（１）是猜与不猜引起的误差一种是采用“倒扣分”的方法矫正分数，其公式为Ｙ＝Ｘ／（Ｍ－１）（其中，Ｘ为答对一题应得的分数，Ｍ为选择项的个数，Ｙ为答错一题应扣分数）另一种方法是鼓励所有考生对自己不能肯定回答的试题做出选择或规定考生必须回答全部试题（２）是由是否猜得对引起的误差。

（二）客观性试题评分的注意事项１、必须再测验前编制标准答案，再测验时应使考生了解评分标准２、客观性试题应给每题计１分３、客观性试题的所有试题的分数值应尽量相同，若要强调某部分内容的重要性，可以适当增加试题数量，以增加该项内容再测验总分中所占的比例４、为便于记分，可制作记分卡或空心模板，提高阅卷效率也可借助计算机评阅试卷第三节　试卷编辑与测验实施一　试卷编辑（一）试题的审查检查试题的题意是否完整；试题叙述是否简单、明确；试题内容有无知识性、科学性的错误；试题是否从教科书或教学参考书中直接转录来的；试题是否向考生提供了正确答案的线索等（二）试题的编辑在编辑试卷时，要注意以下几个问题：１、配搭在试卷里的试题对欲测量的学科知识是否有足够的覆盖率，能否涵盖双项细目表所开列的认知目标２、对照双项细目表中内容欲目标是权重，考虑试题数量是否适宜；试题分数分配能否保证已确定的权重３、考虑试题的难度和测验的长度是否适宜，应试者能否在限定的时间内完成测验４、试题的编排是否恰当（三）编写答题说明答题说明一般包括以下一些内容：测验的目的、测验的时间限制、回答的方法、记分的方法等二　试卷的印刷（一）试卷种类１、分离式试卷。

２、传统的综合式试卷（二）试卷印刷的注意事项１、试题的编号应从头至尾依次排列题号２、多重选择题的题干与选择项不能印在同一行中，每个选择项应单独占一行３、试题与试题之间应留两行的间距，以达到易读的效果４、一道试题不可分开来印在两页上，以避免学生来回翻动试卷，耽误时间，分散精力，发生错误５、试卷应按统一格式印制，并力求达到美观、经济三　测验的实施在测验实施过程中，应注意以下几点：１、测验前不应讲与测验无关的话２、当学生回答问题时，应尽可能排除一切外界干扰３、测验实施过程中，不能给学生提供暗示４、妥善安排学生座次，防止学生作弊。

点击阅读更多内容