
首师大教育统计学课件06相关分析.pptx
69页第六章 相关分析问问 题题 儿童品行与家庭教育的关系如何?儿童品行与家庭教育的关系如何?一个人智力高低与成绩的关系怎样?一个人智力高低与成绩的关系怎样?学生的兴趣与学科成绩的关系如何?学生的兴趣与学科成绩的关系如何?经费投入与工作效率的关系?经费投入与工作效率的关系?人的身高与体重有关吗?人的身高与体重有关吗?主要内容概述概述 积差相关积差相关 等级相关等级相关 质与量的相关质与量的相关 品质相关品质相关一、相关概述 1 1、事物的关系、事物的关系因果关系因果关系共变关系共变关系相关关系相关关系2 2、相关的概念、相关的概念 两个变量之间不精确、不稳定的变化关系,称为相关关系两个变量之间不精确、不稳定的变化关系,称为相关关系两个变量之间的变化关系,既表现在变化方向上,又表现在两个变量之间的变化关系,既表现在变化方向上,又表现在密切程度上密切程度上相关量数 单变量单变量两个以两个以上变量上变量相关量相关量集中量集中量差异量差异量两个变量之间的变化方向有:正相关:两个变量的变化方向相同正相关:两个变量的变化方向相同负相关:两个变量的变化方向相反负相关:两个变量的变化方向相反零相关:两个变量的变化方向无一定规律。
零相关:两个变量的变化方向无一定规律形状上曲线相关曲线相关直线相关直线相关 从关系密切程度来看,两个变量的变化程度可大致分为 完全相关:两个变量的变化程度完全一致完全相关:两个变量的变化程度完全一致强相关:两个变量变化的一致性比较强强相关:两个变量变化的一致性比较强中等相关:两个变量变化的一致程度中等中等相关:两个变量变化的一致程度中等弱相关:两个变量变化的一致性比较差弱相关:两个变量变化的一致性比较差完全不相关:两个变量变化程度没有一致性完全不相关:两个变量变化程度没有一致性变量个数上变量个数上 简相关:两个变量简相关:两个变量复相关:三个或以上变量复相关:三个或以上变量3 相关的分析方法计算法计算法分析方法图示法图示法相关系数相关系数图示法图示法散点图散点图含义:利用散点图描述相关的紧密程度含义:利用散点图描述相关的紧密程度散点图:成对变量值在坐标上描点所形成的图形散点图:成对变量值在坐标上描点所形成的图形信息信息 相关的方向:正、负、无?相关的方向:正、负、无?相关的形态:直线、曲线?相关的形态:直线、曲线?相关的大体程度:强、弱、完全?相关的大体程度:强、弱、完全?4相关系数用来描述两个变量相互之间变化方向及密切用来描述两个变量相互之间变化方向及密切程度的统计指标称为相关系数,一般样本的相程度的统计指标称为相关系数,一般样本的相关系数用关系数用r r表示,总体的相关系数用表示,总体的相关系数用表示。
表示相关系数的取值:相关系数的取值:-1 r+1-1 r+10r10r1相关系数的符号:相关系数的符号:“”表示正相关,表示正相关,“”表示负相关表示负相关5、使用相关的注意事项 相关量数不是等距的度量值,因此只相关量数不是等距的度量值,因此只能比较大小,不能做任何加、减、乘、除能比较大小,不能做任何加、减、乘、除运算不同群组的相关量,一般不直接比较;不同群组的相关量,一般不直接比较;用样本推总体时,须作假设检验;用样本推总体时,须作假设检验;不同类型数据,相关方法不同不同类型数据,相关方法不同二、积差相关1、积差相关及其适用条件积差相关是英国统计学家皮尔逊积差相关是英国统计学家皮尔逊(pearson)于)于2020世纪初提出的一种计算相关的世纪初提出的一种计算相关的方法,因而被称为皮尔逊积差相关方法,因而被称为皮尔逊积差相关,也称为积矩也称为积矩相关(相关(product moment correlation)积差相关适用于:两个变量都是积差相关适用于:两个变量都是连连续数据续数据;两变量总体都为;两变量总体都为正态分布正态分布;两;两变量之间为变量之间为线性关系线性关系成对数据,样本容量要大。
成对数据,样本容量要大2、积差相关条件的判断方法连续变量:连续变量:根据得到数据的方式判断,测量数据根据得到数据的方式判断,测量数据正态分布正态分布一般情况下,正常人群的身高、体重、智力水平、心理一般情况下,正常人群的身高、体重、智力水平、心理与教育测验的结果,都可按总体正态分布对待;如果要求比与教育测验的结果,都可按总体正态分布对待;如果要求比较高,则需要对数据进行正态性检验较高,则需要对数据进行正态性检验线性关系线性关系根据相关散根据相关散点点图可判断两个变量之间是否线性关系图可判断两个变量之间是否线性关系图图18-1 18-1 正相关正相关图图18-2 18-2 负相关负相关散点的分布形状为椭圆形,可认为两变散点的分布形状为椭圆形,可认为两变量之间具有线性关系量之间具有线性关系图图18-4 18-4 完全负相关完全负相关图图18-3 18-3 完全正相关完全正相关当所有的点都分布在一条直线上时,两变量之间的关系为完全相关两个变量之间是否相关,要有充分的理论依据,并排除共变因素的影响图图18-5 18-5 零相关零相关散点的分布没有明显集中在某一方向的趋势,形成圆形区域时,两变量之间的关系为零相关。
3、积差相关系数的计算公式积差相关系数的定义公式积差相关系数的定义公式协方差协方差积差相关系数为积差相关系数为(181)公式中:公式中:为变量为变量X的平均数,的平均数,为变量为变量Y的平均数,的平均数,为变量为变量X的标准差,的标准差,为变量为变量Y的标准差,的标准差,n 为数据的对数为数据的对数或计算得到了相关系数,计算得到了相关系数,还不能确定这两个变量一定还不能确定这两个变量一定具有相关关系,需要对相关具有相关关系,需要对相关系数进行显著性检验之后,系数进行显著性检验之后,才能做出判断才能做出判断表18-1 10个学生初一与初二数学成绩积差相关系数计算表序号序号X XY Y1 174747676 3 3 3.7 3.711.111.1 9 9 13.69 13.692 271717575 0 0 2.7 2.70 0 0 0 7.29 7.293 372727171 1 1-1.3-1.3-1.3-1.3 1 1 1.69 1.694 468687070-3-3-2.3-2.3 6.9 6.9 9 9 5.29 5.295 576767676 5 5 3.7 3.718.518.52525 13.69 13.696 673737979 2 2 6.7 6.713.413.4 4 4 44.89 44.897 767676565-4-4-7.3-7.329.229.21616 53.29 53.298 870707777-1-1 4.7 4.7-4.7-4.7 1 1 22.09 22.099 954546262-6-6-10.3-10.361.861.83636106.09106.09101074747272 3 3-0.3-0.3-0.9-0.9 9 9 0.09 0.09合计合计710710723723134134110110268.10268.10计 算先计算变量先计算变量 X X 和和 Y Y 的标准差的标准差:再将数据代入公式计算积差相关系数再将数据代入公式计算积差相关系数:积差相关系数的原始数据计算公式(182a)(182b)表18-2 10个学生初一与初二数学成绩积差相关系数计算表序号序号X XY YXYXY1 1747476765476547657765776562456242 2717175758041804156265626532553253 3727271715184518450415041511251124 4686870704624462449004900476047605 5767676765776577657765776577657766 6737379795329532962416241576757677 7676765654489448942254225435543558 8707077774900490059295929539053909 954546262422542253844384440304030101074747272547654765184518453285328合计合计710710723723505205052052541525415146751467代入公式计算代入公式计算:两种公式计算结果相同,两种公式计算结果相同,但以原始数据的计算公式更但以原始数据的计算公式更为简捷和准确。
为简捷和准确三斯皮尔曼等级相关等级相关(等级相关(rank correlation)是指以等级)是指以等级次序排列或以等级次序表示的变量之间的相关次序排列或以等级次序表示的变量之间的相关主要包括斯皮尔曼(主要包括斯皮尔曼(spearman)二列等级)二列等级相关和肯德尔和谐系数(相关和肯德尔和谐系数(the kandall coefficient of concordance)多列等级相关多列等级相关斯皮尔曼等级相关的概念及适用条件斯皮尔曼等级相关是等级相关的一种它斯皮尔曼等级相关是等级相关的一种它适用于两个以等级次序表示的变量,适用于两个以等级次序表示的变量,并不要求并不要求两个变量总体呈正态分布,也不要求样本的容两个变量总体呈正态分布,也不要求样本的容量必须大于量必须大于3030当连续数据不能满足计算积差相关的条件当连续数据不能满足计算积差相关的条件时,可以转换成等级数据从而计算斯皮尔曼等时,可以转换成等级数据从而计算斯皮尔曼等级相关系数级相关系数2、斯皮尔曼等级相关系数的计算斯皮尔曼等级相关系数表示为斯皮尔曼等级相关系数表示为r rR R,其计算公式为:,其计算公式为:(183)公式中:公式中:R RX X为变量为变量X X的等级数,的等级数,R RY Y为变量为变量Y Y的等级数,的等级数,D D为两变量的等级数之差,即为两变量的等级数之差,即D=RD=RX X-R-RY Y n n为样本的容量为样本的容量表表18-18-1010个高三学生学习潜在能力测验个高三学生学习潜在能力测验(X)(X)与自学能力测验与自学能力测验(Y)(Y)成绩成绩斯皮尔曼等级相关系数计算表斯皮尔曼等级相关系数计算表序号序号X XY YX XY Y=R=RX X-R-RY Y1 190902 21 12 2-1-11 12 284841 12 21 11 11 13 376764 43 34 4-1-11 14 475755 54 45 5-1-11 15 573736 65 56 6-1-11 16 671717 76 67 7-1-11 17 769698 87 78 8-1-11 18 868683 38 86 62 24 49 9666610109 91010-1-11 1101064649 910109 91 11 1合计合计1313如果有相同等级时如果有相同等级时,可用它们所占可用它们所占等级位置的平均数作为它们的等级。
等级位置的平均数作为它们的等级同时,要对相关系数的计算公式进同时,要对相关系数的计算公式进行校正表表18-4 1018-4 10个学生初一与初二数学成绩斯皮尔曼等级相关系数计算表个学生初一与初二数学成绩斯皮尔曼等级相关系数计算表序号序号X XY YR RX XR RY YD=RD=RX X-R-RY Y1 1747476762.52.53.53.5-1.0-1.01 12 2717175756 65 51 11 13 3727271715 57 7-2-24 44 4686870708 88 80 00 05 5767676761 13.53.5-2.5-2.56.256.256 6737379794 41 13 39 97 7676765659 99 90 00 08 8707077777 72 25 525259 95454626210101。












