
工程科技]体育测量评价科学性.ppt
80页体 育 测 量 的 科学性,北 京 体 育 大 学 统计测量教研室 任 弘 博士、副教授,本科程主要内容: 1 体育测量的科学性理论 2 评价理论与方法 3 人体形态测量 4、体质研究,—— 身体综合能力,形态结构 生理机能 身体素质及基础运动能力,心理素质 智力水平 专项技术水平 专项战术水平,,体 育 测 量 内 容,形态结构 是身体各种能力的基础,体格:身体各环节的长度、宽度、围度和厚度 体型:对人体某个阶段形态结构及组成成分的描述 身体成分:身体中的脂肪含量 体姿:身体各部在空间的相对位置 骨龄:人体的生理年龄 生长发育成熟度:第二性征发育水平,生理机能:是指人的整体及其组成的各器 官、系统所表现的生命活力,呼吸机能:肺活量、最大摄氧量 、 循环机能:安静状态、定量负荷状态、最大负 荷状态下心血管系统的机能反应 代谢机能:有氧代谢和无氧代谢 感觉机能:肌肉用力感觉 平衡机能:静态平衡和动态平衡,身体素质:人体在运动中所表现出的速度、 力量、耐力、灵敏及柔韧等方 面的机能能力,速度:位移速度、动作速度和反应速度 力量:等张性力量和等长性力量 耐力:一般耐力、速度耐力、力量耐力 和静力性耐力 柔韧:关节活动范围,受关节结构、跨过关节的肌肉、肌腱和韧带等因素的影响 灵敏:人体在各种复杂条件下快速、准确、协调地改变身体姿势、运动方向和随机应变的能力,精神、心理因素,认识:包括感觉、知觉、记忆、想象及思维; 情感:是满意、愉快、愤怒及烦恼等态度体验 意志:在认识和情感体验的基础上,人类为了满足某种需要,自觉地确定目的,指定计划,克服困难而努力达到目的,这是人类的意志过程。
智力 智力是各种认识能力的总和是获得知识的能力,是认识、理解事物和运用知识与经验解决问题的能力 包括:观察力、注意力、记忆力、想象力、思维力、创造力运动技术 ——与专项密切结合,运动技术测量内容:技术容量 技术全面性 技术效果 运动技术测量方法: 技术测量(直观测量和仪器设备测量) 理论测量,战术水平,理论测验 教练员评定 比赛观察,数值 记号,身体综合 能力,结果,,,测量,评价,收集信息,处理信息,,,,解释与反馈,测量与评价的关系,测量的可能性 只有当某种特征能够清楚地加以确定,并对拟测个体的特性加以明确辨别,以至足以观测出其间差异时,才具有测量的意义和现实性体育测量评价的发展趋势: 1、多学科、多部门协作; 2、与运动专项紧密结合; 3、应用领域广泛 运动员竞技能力评定 运动员选材 体质研究,测量的科学性—可靠性、有效性、客观性 ( 三性理论 ),测量值,指标真值,属性真值,,,,,,,,客观性,信度:可靠性,效度:有效性,,测量三性的讲解内容,定义 分类 估价方法 影响因素,测量的可靠性(信度—Reliability),一、可靠性的定义: 1、狭义的操作定义:在相同条件下对同一批受试对象使用相同的测量手段,重复测量结果的一致程度。
用可靠性系数 r 表示r值越接近1,越可靠) 2、一般定义:测验结果的一贯性、一致性、再现性、稳定性张力为),,r =,2T,, 2X,=,, 2X - 2E, 2X,= 1 -,, 2E,2x,3、理论定义:真实值方差与实测值方差的比值 X=T+E,信度反映的是测量结果受到随机误差影响的程度,是评价测量质量的最基本的指标它是一个相对概念,并非绝对的有无,而是一个程度上或多或少的问题没有一个测量是绝对可靠的,只有测量结果可信程度的高和低可靠与不可靠?,测量的信度,分半信度,重测信度,复本信度,可靠性(信度)分类,同质性信度,评分者信度,,,,,,内部一致性信度,,,1、稳定可靠性 (重测信度) :间隔一定时间,使用相同测量手段,对同一批受试者重复测量,结果的一致性程度是估价可靠性最简单的方法 注意事项(1)信度系数受测验间隔时间影响: (2)不适用于考察难度的测验 (3)被试在第二次测试时容易觉得枯燥 (4)费时、费力,二、可靠性的分类:,当同一测验的一种形式不适合实施两次时,就需要采用该测验的另一平行测验(复本)复本在测量内容、难度、平均数、标准差等方面应与原测验一样,否则估计的可靠性系数就会出现较大误差。
注意事项 (1)两次测验的题目要基本等值——同质测验 (2)两次测验要尽可能在较短时间内进行 (3)实际工作中,完全等值的测验很难找到,2、等价可靠性 (复本信度):,同质测验、复本(问卷调查) 测验的目的相同 难度相似 方式(题目)不同,前两种信度都需要两次测验,较烦琐根据一次测验估价测验的信度称为内部一致信度 (1)裂半法—分半信度 (2)克隆巴赫 系数法—同质性信度,3、内部一致可靠性 (内部一致信度 ) :,,4、评分者信度—客观性,定义:多个评分者给同一批受试者评分时结果的一致程度对于无法定量测量只能定性评分的项目来说,评定结果的信度受评价者主观因素的影响,故也称测量的客观性5、同质性信度,定义:测验内部所有测题之间的一致程度 并非所有的测验都要求有较高的同质性信度 分半信度与同质性信度有时也和称为内部一致性信度,,三、可靠性的估价方法:,积差相关法适用于: (1)适用于两组变量可靠性的计算 (2)无系统误差,Pearson 积差相关法:重测信度和复本信度的 估价可以使用本方法系统误差:由于测量工具不准确,或测试人员 知识技术水平不同,致使测量结 果呈规律性偏大或偏小。
重复测量时任何一次测量中有系统误差,都会使估价出来的信度系数偏高补充知识:,例1:对10名学生实施间隔一周的两次跳高测量,结果如下,试估价测量的可靠性编号 1 2 3 4 5 6 7 8 9 10 X1 1.49 1.41 1.60 1.40 1.42 1.51 1.58 1.43 1.53 1.48 X2 1.51 1.48 1.64 1.39 1.47 1.55 1.61 1.41 1.57 1.54,r = 0.938,可靠吗?,如何判断两次测验中有无系统误差?,成对数据T检验,如果t t(n)则两组数据间无显著性差异,无系统误差,,,,计算信度系数,2、 裂半法(分半信度),,将一个测验分成奇数题与偶数题两半,两部分结果的一致程度 适用于没有复本且只能进行一次测验的情况下受试者 测量题目 成绩总和 N=4 1 2 3 4 奇数次 偶数次 A 10 12 12 13 22 25 B 12 13 11 10 23 23 C 12 13 12 11 24 24 D 18 12 13 12 19 22 E 16 15 17 15 33 30,,,,例:对五名受试者进行四个问题的测验,估价测试数据可靠性。
分半后计算相关系数的测量次数(题目数)只有实际的一半,这就降低了信度,为了得到整个测验的信度系数,需要用斯皮尔曼-布朗公式修正两半测验之间的相关系数 :整个测验的信度系数,3、 抽样复测法 — 适用于大样本群体测量,步骤:1、确定抽样比例及人数; 2、随机抽样,做好标记; 3、发给参加复测的受试对象测试卡片; 4、请受试者返回原测地点,在相同条件下重测; 5、对比原测卡片和复测卡片,计算超出允许误差范围 的误差次数N; 6、计算误差发生率 PP = N/测量次数100% 如果P 5% ,可靠性较差,4、 方差分析法(评分者信度),MSB — 组间方差 MSW — 组内方差,例:2000年奥运会男子10米跳台决赛裁判员评分一致性检验,,5、Spearman 等级相关—两组变量 (重测信度、复本信度、评分者信度),如果测量数据不精准,只是定性评分或排名,可使用等级相关 实际上等级相关对于定量测量的数据或定性评分的数据都可以使用,但对于定量数据计算结果不如积差相关法准确 遗憾的是Excel中不能直接计算等级相关,需要用Rank函数先对数据进行排名,然后再用积差相关法计算,例:两名教师给10名学生的考试卷进行评分,估价其评分者信度,6、肯德尔和谐系数法—多人评分信度,由多人进行评分时评分者信度的估价方法 适用于:多组顺序型数据 缺点:Excel、SPSS中没有现成计算公式,较少使用,7、克隆巴赫系数——内部一致性信度 (同质性信度),用于估价多个项目或多个分测验所构成的测验合成得分的信度系数。
需用SPSS统计软件计算 Analyze Scale Reliability Analysis Reliability Coefficients 10 items Alpha = .7205 Standardized item alpha = .7377,,,信度估价方法总结,重测信度:积差相关法、等级相关法、方差分析法、 抽样复测法 复本信度:积差相关法、等级相关法、方差分析法 评分者信度:等级相关法、方差分析法、和谐系数法 分半信度:裂半法 同质性信度:克隆巴赫系数,0.95 ~ 0.99 非常可靠 0.90 ~ 0.94 可靠 0.80 ~ 0.89 可靠性可以接受 0.70 ~ 0.79 可靠性较差 0.70 以下 一般认为不能使用,可靠性程度的判断标准:,、测量误差 (1)测试者 (2)受试者 (3)测试仪器 (4)测试方法 (5)测试环境 (6)抽样误差: 抽样方法、样本量、样本代表性,四、影响可靠性的因素:,同一种测量手段,用于个体差异不同的群体时,个体差异较大的群体,估价出的信度系数较高,个体差异较小的群体信度系数较低。
2、受试者个体差异,3、受试群体的能力水平,在某种能力水平上信度高的测验,对于其它能力水平的群体信度未必就高 例如:适应能力问卷在本科文化程度人群中使用重测信度可以,但用于小学文化程度的人群信度未必够,重测信度、复本信度中,重复测量间隔时间越长,估价出的信度系数越低,重复测量的间隔时间,重测信度、复本信度中重复测量的次数,评分者信度中的评分者人数,内部一致性信度中的题目数统称为测验的长度,长度越长信度越高,但长度增加的同时测量工作量增加,其它影响影响测量结果的因素也增加测量的长度,5 测量指标的类型,稳定性高、不易变化的指标重测信度高; 定性评分项目中,受主观因素影响小的指标评分者信度高;,6、测试细则,测试细则详细准确的测量重测信度高; 评分规则详细准确的评分者信度高,7 估价可靠性时使用的方法,如果同时可以使用几种方法估价信度系数,可能计算结果会稍有不同8、测试人员的人数、水平、责任心等,对评分者信度影响较大,五、提高可靠性的方法:,(一)严格实施标准化的测量程序包括测量仪器设备的标准化,测量方法的标准化,测量实施的标准化这样可以减少随机误差和系统误差 (二)适当增加测量的长度在运动技术测量当中,增加测量或测验的次数,在体育社会、教育心理测量中,适当增加题目的数量。
(三)适当地增加平行测验项目,可以增加对信度的检验,获得更丰富的信息四)适当增加样本含量,并提高抽样的科学性(使样本具有代表性),这样可以减少抽样误差 (五)测验的难度要适中,使受试者表现出应有的成绩差异 (六)在选取受试者群体时,要兼顾他们的水平差异(最好接近正态) (七)提高测试人员的责任。












