好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

心理测验学PPT课件 第3章 测验的信度.ppt

83页
  • 卖家[上传人]:新****
  • 文档编号:210925566
  • 上传时间:2021-11-15
  • 文档格式:PPT
  • 文档大小:1.43MB
  • / 83 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • w信度概念w信度的评估方法w信度与测验分数的解释w影响信度的因素成熟标志20世纪50年代古利科逊心理测验理论三大支柱基本假设信度效度第一单元信度的概念一、经典测验理论w ClassicalTestTheory(CTT)(一)测量误差1、定义与测量目的无关不准确测量效应测量因素测量结果或不一致2、误差的种类系统误差随机误差随机误差与系统误差的比较类类型产产生原因结结果表现现(结结果不一致)特点指标标同异随机误误差偶然因素不易控制方向和大小上完全随机稳稳定性准确性信度系统统误误差因素恒定、规规律稳稳定地存在于每次测测量中正确性效度3、误差来源三层面模式测量工具测试对象施测过程(二)基本假设与真分数1、分数观测分数误差分数真分数测验所得未加工无误差理论上真正特质水平操作上多个平等测验的平均数2、基本假设w 例2-1:某一物理测量结果(单位:微)物质编质编 号实测实测 重量X真正重量T误误差EA12102B19201C27303D41401E515011501500S203.22003.2SE1.8M30300w 可见:w 实测重量=真实重量+误差w 误差之和为零w 实测重量的平均值=真实重量的平均值定义T与X关系数学模型X=TET=XE二、信度的概念S2T,S2E,S2X的关系与信度S2XS2XS2TS2ES2TS2E(一)信度的定义1、理论定义真分数方差与观测分数方差的比值或2、操作定义两组测验分数之间的相关系数测量工具或结果的一致性(稳定性)程度3、rXX值与测验误差的关系r=0.50r=0.75r=0.90S2ESTSTSTSESE(二)信度的指标1、信度系数与信度指数信度系数同一群人几次测验结果一致性信度系数的平方根信度指数w 缘由:rXXn只反映X与T的符合程度n未反映个体测验分数的变异2、测验标准误w 测验中个体真分数的指标n理论上:一个个体多次测验结果分布的变异n实际上:一组个体两次测验结果分布的变异w 测量标准误n测量误差分数分布的标准差w 用途n衡量测量值(X)与测量对象真值(T)的偏离程度的一种指标n用来估计个人的真分数w 个人分数的误差n个体测验分数重测时的变化w 公式实得分数标准差w 个人分数的误差nrXX越大:变化的可能性越小nrXX=1:完全不变化第二单元信度评估的方法信度重测信度复本信度内部一致性信度评分者信度分半信度同质性信度重测复本信度一、重测信度含义同一测验同组对象前后测2次相关系数稳定性程序误差时间太短练习效应记忆效应A卷一定时距A卷太长身心变化优点省力、省时测量属性相同提供随时间变化的资料不足适用范围异质性运动技能速度时间间隔长短评价二、复本信度含义两等值测验最短时间内对同组对象施测结果r等值性程序误差内容取样A卷最短时距B卷优点代表性增强,信度更准确避免练习、记忆效应不足编制复本难影响积极性触类旁通评价三、重测复本信度含义两等值测验一定时间内对同组对象施测结果r等值性稳定性程序误差内容取样时间A卷一定时距B卷重测信度与复本信度有何异同?重测复本信度与重测、复本信度谁得估计更严格,为何?三、内部一致性信度含义测验各题间一致性题目一致性行为变量异质性分半信度类型内容取样同质性信度(一)分半信度1、分半条件与程序分半方法奇偶题分半分析程序两半相关:rhh校正:rnn难易:低高分半条件两半相似:M、S项目组间相关分布形态内容2、校正方法斯皮尔曼-布朗公式方差相等时弗拉南根公式卢尤公式方差不等时(二)同质信度同质性题目间的内部一致性类型库-理信度克龙巴赫系数0、1题型K-R20难度不同k-R21难度相近各类题型小结与问题重测信度复本信度内部一致性跨时间一致性跨形式一致性试题之间有何关系四、评分者信度(一)含义与方法含义评分者评分的一致性方法2评分者2个以上者rXYr肯德尔和谐系数(二)肯德尔和谐系数K个评价者评N个被评者或作品1、应用范围和W系数应用1个评价者先后K次评N个被评者或作品W范围01第三单元信度与测验分数的解释w 真分数与实得分数相关的解释n信度系数和信度指数n测量标准误w 信度的评价直接解释一、真分数与实得分数相关的解释rXX间接解释信度系数决定系数 r2XT = ST/SX =rXX rXX为各方差的百分比S2X分为各S2E和S2T误差源不同信度估计法不同rXX=0.90(一)信度系数和指数例2-13:设有两平等的创造力测验(A和B)。

      现:1)间隔两月施测100人,其信度为0.70;2)两卷分半信度校正值为0.80;3)第2个评分者随机抽50份,信度0.92;试问:1)真分数的方差是多少?2)各种信度的误差是多少?间接解释范例信度类类型rXX重测测复本0.70分半信度0.80评评分者信度0.92总误总误 差方差真分数方差分析结果误误差源时间时间 、内容内容取样样评评分者差异两者之差误误差的方差时间取样1-0.70=0.31-0.80=0.20.3-0.2=0.10.2+0.1+0.08=0.381-0.38=0.621-0.92=0.08X与T的接近程度信度指数rXX=0.90(二)测量标准误w 用途n衡量测量值(X)与测量对象真值(T)的偏离程度的一种指标n用来估计个人的真分数w 个人分数的误差nrXX越大:变化的可能性越小nrXX=1:完全不变化例2-14:某测验信度0.89,S为15,其测量标准误是多少? 表2-12用rXX与SX估计测量标准误信度S0.950.900.850.800.750.70306.79.511.613.415.016.4286.38.910.812.514.015.8265.88.210.111.613.014.2245.47.89.310.712.013.1224.97.08.59.811.012.0204.56.37.78.910.011.0184.05.77.08.09.09.9163.65.16.27.28.08.8143.14.45.46.37.07.7122.73.84.65.46.06.6102.23.23.94.55.05.581.82.53.13.64.04.461.31.92.32.73.03.340.91.31.51.82.02.220.40.60.80.91.01.1w 优点n解释个人分数时,可指出其误差的范围n不受群体异质性的影响w 局限n不同测验间的信度无法比较n标准误因信度计算法不同而不同n“不论高低分,SE相等”的假设不完全成立二、确定信度可接受水平测验类测验类 型最低标标准标标准化测验测验人格测验测验 非标标准化测测验验0.900.80-0.850.60-0.85w 典型测验的一般标准w 典型测验的信度高低水平测验类测验类 型低中高成套成就测验测验 学术术能力测验测验 成套倾倾向性测验测验 客观观人格测验测验 兴兴趣问问卷态态度量表.66.92.98.56.90.97.26.88.96.46.85.97.42.84.93.47.79.98三、解释个人分数的意义w 公式个体真分数估计例如:某班一次标准化成就测验(rxx=0.80)中的SE为5,某生的测验分80。

      试问该生测验的真分数是多少?置信度D=.95置信区间分析结果表2-9某生测验真分数的信度区间SEe数目置信水平置信区间间168.26805(7585)295.458010(7090)399.938015(8595)1.9695809.8(70.289.8)2.58998012.9(67.192.9)四、比较不同测验分数的差异例如,某生在韦氏成人智测中,语言IQ为102,操作IQ为106且知言语与操作的分半信度各为0.96和0.93问该生操作能力是否显著优于言语能力?分析结果w 结论n差异未达1个标准误n操作IQ并不高于语言IQw 差异显著性:nn本例:(106-102=4)第四单元影响信度的因素w测验长度w样本特征w测验难度w时间间隔 一、测验长度w 含义n测验试题的数量w 特点n测验越长,试题取样越恰当,n测验越长,猜测性越小w 长度与信度的关系例2-16:某测验有40题,信度0.65,若增至120题,信度会是多少?例2-17:某测验有30题,信度0.75,试问要达到多少题才能使信度达到0.90?w 特点n样本越异质,分数分布越广,S,r,测验越可靠二、样本特征(一)样本团体异质性的影响w 分析n信度n相关n散布图n计算散布图整段范围低高(二)样本团体平均能力水平的影响例如,SB量表,不同年龄和难度水平信度值从0.830.98。

      显然,每个信度都要求对建立信度的团体进行描述w 选择测验时应注意n取样团体的变异性和能力水平n建立信度的团体与欲测团体是否一致w 趋势n分别对非常同质团体建立标准化样本n考虑年龄、性别、年级、职业和相似性等,选择适合其所在测验团体性质的信度系数和测验w 一般趋势n难度分布越广,信度越高w 难度与题型n简答题:P=0.5时,X为0100,信度最高n选择题的理想难度三、测验难度满分值理论概率例2-22:在100个正误题测验中,满分为100,其理想难度是多少?例2-23:在100个五择一测验中,满分为100,其理想难度是多少?分析结果例2-22例2-23w 学绩测验选择题的理想平均难度(洛德)n五择一:0.70n四择一:0.74n三择一:0.77n是非题:0.85智力的时间变化间间隔期信度系数同日或次日0.900.951年0.8522.5年0.805年0.750.809年0.78四、时间间隔 S-B隔六年,rXX的变化年龄的时间变化年龄越低,信度越低第一次第二次rXX4100.739150.8711170.92w 理论假设:T=XE;ST=SXSEw 信度:测量结果的稳定性w 类型n重测、复本、重测复本n内部一致性:分半、同质性n评分者本章小结w 测验条件、样本性质及估计方法不同信度不同w 只对测验分数不一致大小作估计,未指出原因二级真题w 76公式和公式表明信度指数的()就是信度系数。

      w A一半B平方w C倍数D本身w 81一般要求在成对的受过训练的评分者之间,其平均一致性达到()以上,才认为评分是客观的w A0.7B0.8w C0.9D1.00w 2005年11月w 82“大约有95的可能性真分数落在所得分数1.96SE的范围内,或有5的可能性落在范围之外”的描述,其置信区间为()w AX-1.96SEX+1.96SEBX-1.96SEw CX+1.96SEDX-1.96SEX+1.96SEw 2005年11月w 59复本信度又称等值性系数它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数复本信度反映的是测验在()上的等值性w A时间B题目C评分D内容w 60对于不同平均能力水平的团体,题目的()会影响信度系数w A难度B表达方式C代表性D效度w 61以再测法或复本法求信度,两次测验相隔时间越短,其信度系数越()w A大B低C小D不变w 2006年5月w 53斯皮尔曼-布朗公式:式中为()的相关系数,为测验在原长度时的信度估计值w A全测验B原测验C两半测验间D全部分数w 54一般而言,若获得信度的取样团体较为异质的话,往往会()测验的信度。

      w A高估B低估C忽略D不清楚w 2006年11w 104公式中为测量的标准误,是所得分数的标准差,为测验的信度系数从公式中可以看出,测量的标准误与信度之间的关系是()w A信度越低,标准误越小w B信度越低,标准误越大w C信度越高,标准误越大w D信度越高,标准误越小w 2006年11多项选择题w 52对于不同平均能力水平的团体,题目的()会影响信度系数w A难度B长度C信度D效度w 2007年11月w 108信度系数在解释个人分数的意义时的作用是()w A估计误差分数的范围B估计真实分数的范围w C了解实得分数再测时可能的变化情形D了解误差分数的大小w 2008年5月多项选择题w 60、一个包括40个题目的测验的信度为0.80,欲将信度提高到0.90,通过斯皮尔曼-布朗公式的导出公式计算出至少应增加()个。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.