
直线相关与回归.ppt
39页直线相关与回归直线相关与回归第十一章第十一章1卫生学(第7版) · 第十二章 直线相关与回归主要内容主要内容• 直线相关直线相关• 直线回归直线回归• 直线相关与回归的区别与联系直线相关与回归的区别与联系• 等级相关等级相关2卫生学(第7版) · 第十二章 直线相关与回归一、直线相关的一、直线相关的概念概念二、二、相关系数的计算相关系数的计算三、相关系数的三、相关系数的假设检验假设检验第一节第一节 直线相关直线相关3卫生学(第7版) · 第十二章 直线相关与回归一、直线相关的概念一、直线相关的概念直线相关直线相关(linear correlation)::•又又称称简简单单相相关关,,是是探探讨讨服服从从正正态态分分布布的的两两个个随随机机变量变量X和和Y有无线性相关关系的一种统计分析方法有无线性相关关系的一种统计分析方法 如,研究血糖和胰岛素之间的线性关系如,研究血糖和胰岛素之间的线性关系 4卫生学(第7版) · 第十二章 直线相关与回归线线性性相相关关系系数数(linear correlation coefficient)::又又称称积积差差相相关关系系数数,,简简称称相相关关系系数数,,是是描描述述两两个个变变量量间间线线性性相相关关关关系系的的密密切切程程度度与与方方向向的的统统计计指指标标。
样样本本相相关关系系数数用用r表表示示,,总总体体相相关关系数用系数用 表示 相相关关系系数数没没有有单单位位,,其其取取值值在在-1和和1之之间间波波动动r值值为为正正表表示示正正相相关关,,r值值为为负负表表示示负负相相关关,,r值值为为零零为为零零相相关关r值值等等于于1为完全正相关为完全正相关r值等于值等于-1表示完全负相关表示完全负相关 相关系数相关系数5卫生学(第7版) · 第十二章 直线相关与回归6卫生学(第7版) · 第十二章 直线相关与回归其中其中二、相关系数的计算二、相关系数的计算7卫生学(第7版) · 第十二章 直线相关与回归例例12-1 某某医医生生随随机机抽抽查查了了12名名糖糖尿尿病病患患者者的的空空腹腹血血糖及胰岛素值,数据见下表,试做相关分析糖及胰岛素值,数据见下表,试做相关分析 8卫生学(第7版) · 第十二章 直线相关与回归9卫生学(第7版) · 第十二章 直线相关与回归本例,本例,代入公式,得代入公式,得10卫生学(第7版) · 第十二章 直线相关与回归三、三、相关系数相关系数的假设检验的假设检验 v t 检验检验 11卫生学(第7版) · 第十二章 直线相关与回归1.建立检验假设.建立检验假设 H0: =0 H1: 0 =0.052.计算统计量.计算统计量 3.确定.确定P值和判断结果值和判断结果 =12-2=10,,查查t值值表表,,t0.01(10)=3.169,本本例例的的tr=3.092 t0.01(10),,P 0.01,,按按 =0.05的的水水准准,,拒拒绝绝H0,,接接受受H1,,认认为为糖糖尿尿病病患患者血糖和胰岛素之间存在相关关系,是负相关者血糖和胰岛素之间存在相关关系,是负相关 。
例例12-1::t t 检验法检验法12卫生学(第7版) · 第十二章 直线相关与回归 因因为为 =12-2=10,,查查r界界值值表表,,r0.05(10)=0.576,,r0.01(10)=0.708,,本本例例r=|-0.8115|> r0.01(10),,P<0.01, 按按 =0.05的的水水准准,,拒拒绝绝H0 ,接接受受H1 ,,结结论论同同 t 检检验例例12-1::*查表法查表法13卫生学(第7版) · 第十二章 直线相关与回归第二节第二节 直线回归直线回归一、一、直线回归的概念直线回归的概念二、二、直线回归方程的求法直线回归方程的求法三、三、回归系数的假设检验回归系数的假设检验四、四、回归方程的应用回归方程的应用五、五、注意事项注意事项14卫生学(第7版) · 第十二章 直线相关与回归 直直线线回回归归(linear regression),,又又称称简简单单回回归归,,是是探探讨讨两两个个连连续续性性变变量量X和和Y间间依依存存关系的一种统计分析方法关系的一种统计分析方法 一、直线回归的概念一、直线回归的概念 15卫生学(第7版) · 第十二章 直线相关与回归直线回归方程的一般表达式:直线回归方程的一般表达式: :为为X X 取某固定值时应变量取某固定值时应变量Y Y 总体均数的估计值。
总体均数的估计值a::截距截距b::回归系数,即斜率回归系数,即斜率注意:注意:直线回归方程与函数方程直线回归方程与函数方程的不同的不同 Y= a + bX16卫生学(第7版) · 第十二章 直线相关与回归例例12-2 就就例例12-1的的资资料料,,现现已已计计算算得得糖糖尿尿病病患患者者的的血血糖糖与与胰胰岛岛素素之之间间存存在在负负相相关关关关系,试继续进行直线回归分析系,试继续进行直线回归分析 17卫生学(第7版) · 第十二章 直线相关与回归二、直线回归方程的求法二、直线回归方程的求法•步骤步骤1:绘制:绘制散点图散点图•步骤步骤2::计算回归系数计算回归系数b和截距和截距a•步骤步骤3:建立:建立直线回归方程直线回归方程18卫生学(第7版) · 第十二章 直线相关与回归绘制绘制散点图散点图19卫生学(第7版) · 第十二章 直线相关与回归直线回归方程的求解:最小二乘原理直线回归方程的求解:最小二乘原理yx保保证证各各实实测测点点距距回回归归直直线线的的纵向纵向距离平方和最小距离平方和最小计算回归系数计算回归系数b和截距和截距a20卫生学(第7版) · 第十二章 直线相关与回归根据最小二乘估计原理根据最小二乘估计原理: :得:得:b=-0.3256,,a=16.090721卫生学(第7版) · 第十二章 直线相关与回归根据:根据: b=-0.3256 a=16.0907写出直线回归方程:写出直线回归方程:有意义吗?有意义吗?--> --> 假设检验假设检验建立建立直线回归方程直线回归方程22卫生学(第7版) · 第十二章 直线相关与回归回归系数也有抽样误差!回归系数也有抽样误差!总体总体β==0总体总体β ≠0样本样本b≠0两变量两变量有有直线关直线关系系两变量无两变量无直线关系直线关系????23卫生学(第7版) · 第十二章 直线相关与回归v t 检验检验 回归系数的假设检验与相关系数的假设检验等价回归系数的假设检验与相关系数的假设检验等价 三、回归系数的假设检验三、回归系数的假设检验24卫生学(第7版) · 第十二章 直线相关与回归 称称剩剩余余标标准准差差((residual standard deviation)),,为为各各实实际际值值Y与与估估计计值值之之间间的的误误差差,,反反映映了了扣扣除除X的的影影响响后后,,Y对对回回归归直直线的离散程度。
线的离散程度25卫生学(第7版) · 第十二章 直线相关与回归1.检验假设.检验假设 H0: =0 H1: 0 =0.05 2.计算统计量.计算统计量 26卫生学(第7版) · 第十二章 直线相关与回归3.确定.确定P值,判断结果值,判断结果 查查t值值表表,,t0.01(10)=3.169,,tb> t0.01(10) ,,P<0.01,,按按α=0.05水水准准,,拒拒绝绝H0,,接接受受H1,,认认为为糖糖尿尿病病患患者者血血糖糖和和胰岛素之间存在直线回归关系胰岛素之间存在直线回归关系27卫生学(第7版) · 第十二章 直线相关与回归1.描述两个变量之间的数量依存关系.描述两个变量之间的数量依存关系 2.利用回归方程进行预测.利用回归方程进行预测3.利用回归方程进行统计控制.利用回归方程进行统计控制四、回归方程的应用四、回归方程的应用28卫生学(第7版) · 第十二章 直线相关与回归1 1..要要求求应应变变量量Y Y服服从从正正态态分分布布,,通通常常自自变变量量X X为为可可以以精精确确测量或严格控制的因素测量或严格控制的因素。
2 2..作作回回归归分分析析时时要要有有实实际际意意义义,,不不能能把把毫毫无无关关联联的的两两事事物或现象进行回归分析物或现象进行回归分析3 3.分析前,应绘制散点图.分析前,应绘制散点图4 4.回归方程在实际回归范围内应用.回归方程在实际回归范围内应用五、注意事项五、注意事项29卫生学(第7版) · 第十二章 直线相关与回归 某地有风俗,每当小孩出生,某地有风俗,每当小孩出生,均在自家庭院中种上一棵树,随均在自家庭院中种上一棵树,随着树的生长,小孩也在长高你着树的生长,小孩也在长高你认为两者是什么关系?认为两者是什么关系?伴随关系伴随关系30卫生学(第7版) · 第十二章 直线相关与回归第三节第三节 直线相关与回归分析的关系直线相关与回归分析的关系 (一)(一)区别区别(二)(二)联系联系31卫生学(第7版) · 第十二章 直线相关与回归 1.在应用上不同.在应用上不同 分分析析变变量量间间关关系系的的密密切切程程度度和和方方向向时时用用相相关关,,描描述述变量间在数量上依存关系时用回归变量间在数量上依存关系时用回归 2.在资料要求上不同.在资料要求上不同 相相关关分分析析要要求求X、、Y均均要要服服从从正正态态分分布布,,即即双双变变量量正正态态分分布布资资料料。
回回归归分分析析时时,,要要求求应应变变量量Y服服从从正正态态分分布布,,X是可以精确测量或严格控制的变量是可以精确测量或严格控制的变量一)区(一)区 别别32卫生学(第7版) · 第十二章 直线相关与回归(二)联(二)联 系系1 1.相关系数与回归系数的.相关系数与回归系数的正负号相同正负号相同2 2.回归系数与相关系数的.回归系数与相关系数的假设检验等价假设检验等价3 3..可以用回归解释相关可以用回归解释相关33卫生学(第7版) · 第十二章 直线相关与回归r 的平方称为决定系数的平方称为决定系数((coefficient of determination)) 回回归归平平方方和和是是由由于于引引入入了了相相关关变变量量而而使使总总平平方方和和减减少少的的部部分分回回归归平平方方和和越越接接近近总总平平方方和和,,则则r2越越接接近近1,,剩剩余余平平方方和越小,相关和回归分析的效果越好和越小,相关和回归分析的效果越好 34卫生学(第7版) · 第十二章 直线相关与回归第四节第四节 SpearmanSpearman等级相关等级相关①①不不服服从从双双变变量量正正态态分分布布而而不不宜宜作作积积差差相相关分析;关分析;②②总体分布类型未知;总体分布类型未知;③③等级资料。
等级资料适用情况:适用情况:35卫生学(第7版) · 第十二章 直线相关与回归 Spearman等等级级相相关关::是是用用等等级级相相关关系系数数rs来来描描述述两两变变量量间间相相关关关关系系的的密密切切程程度度与与相关方向的一种统计分析方法相关方向的一种统计分析方法 36卫生学(第7版) · 第十二章 直线相关与回归计算方法:计算方法: 将将成成对对的的两两组组变变量量的的观观察察值值分分别别由由小小到到大大编编秩秩次次,,当当观观察察值值相相同同时时,,取取平平均均秩秩次次,,然然后后对对秩秩次次进进行积差相关分析行积差相关分析式中式中X X’’、、Y Y’’分别为每对观察值分别为每对观察值X X、、Y Y的秩次 37卫生学(第7版) · 第十二章 直线相关与回归例例12-3 12-3 某医师测得一组患者血小板数及出血程度的资料如某医师测得一组患者血小板数及出血程度的资料如下表下表12-212-2,试分析二者之间的关系试分析二者之间的关系 表表12-2 10名某病患者血小板数及出血程度数据名某病患者血小板数及出血程度数据 38卫生学(第7版) · 第十二章 直线相关与回归等级相关系数的假设检验等级相关系数的假设检验 H0:ρS=0,,H1: ρS ≠0,, =0.05 本例本例n=10=10,查,查r rs s界值表得:界值表得: r rs s(0(0, , 0.02)0.02)=0.745=0.745,,r rs s> >r rs s(10(10, , 0.02)0.02),则,则P<0.02P<0.02,按,按αα=0.05=0.05水准,拒绝水准,拒绝H H0 0,接受,接受H H1 1,认,认为为r rs s有统计学意义。
有统计学意义 39卫生学(第7版) · 第十二章 直线相关与回归。
