
第九章相关与回归分析ppt课件.ppt
29页第九章第九章 相关与回归分析相关与回归分析第一节第一节 相关关系的概念和种类相关关系的概念和种类第二节第二节 相关表、相关图与相关系相关表、相关图与相关系数数第三节第三节 回归分析回归分析第四节第四节 估计规范误差估计规范误差前往到目录前往到目录第九章第九章 相关与回归分析相关与回归分析一一、、教教学学目目的的::经经过过对对本本章章的的学学习习,,使使学学生生掌掌握握相相关关关关系系的的概概念念和和种种类类,,相相关关表表、、相相关关图图、、相相关关系系数数的的概概念念和和作作用用,,回回归归分分析析的的概概念念和和方方法法,,估估计规范误差的概念和计算计规范误差的概念和计算二二、、重重点点和和难难点点::相相关关关关系系的的概概念念和和种种类类,,相相关关系系数数的的概概念念、、计计算算和和作作用用,,回回归归分分析析的的概概念念和和方方法三、教学方法:课堂讲授三、教学方法:课堂讲授四、课时安排:四、课时安排:4课时课时五、教学内容:五、教学内容:前往到第九章前往到第九章 第一节第一节 相关关系的概念和种类相关关系的概念和种类 二、相关关系的种类二、相关关系的种类 一、相关关系的概念一、相关关系的概念 三、相关分析的主要内容三、相关分析的主要内容 前往到第九章前往到第九章 一、相关关系的概念一、相关关系的概念 相关关系是指景象之间确实存在的,但关系值不相关关系是指景象之间确实存在的,但关系值不固定的相互依存关系。
固定的相互依存关系 例如,例如,圆面面积 s=πr2 s=πr2 ,,ππ是一个常数,是一个常数,r r是是圆的的半径r r的的值发生生变化,那么有一个确定的化,那么有一个确定的圆面面积的的值和它相和它相对应 例如身高例如身高 与体重的关系,施肥量与亩产量的关系与体重的关系,施肥量与亩产量的关系函数关系也是指两个变量之间存在的相互依存函数关系也是指两个变量之间存在的相互依存关系,但是它们之间的详细关系值是固定的关系,但是它们之间的详细关系值是固定的 在研讨相关关系时,经常借助函数关系的方式在研讨相关关系时,经常借助函数关系的方式 前往到第一节前往到第一节二、相关关系的种类二、相关关系的种类 相关关系相关关系按表按表现形状分形状分按相关按相关变化方向分化方向分单相相关关复复相相关关按涉及要按涉及要素多少分素多少分按相关按相关程度分程度分正正相相关关负相相关关完完全全相相关关不不完完全全相相关关直直线相相关关曲曲线相相关关无无相相关关二、相关关系的种类二、相关关系的种类完全正完全正完全正完全正完全正完全正线线线性相关性相关性相关性相关性相关性相关完全完全完全完全完全完全负线负线负线性相关性相关性相关性相关性相关性相关非非非非非非线线线性相关性相关性相关性相关性相关性相关正正正正正正线线线性相关性相关性相关性相关性相关性相关 负线负线负线性相关性相关性相关性相关性相关性相关不相关不相关不相关不相关不相关不相关前往到第一节前往到第一节三、相关分析的主要内容三、相关分析的主要内容 (一一) 定性判别景象间有无相关关系定性判别景象间有无相关关系 根据有关的经济实际、专业知识、实践阅历根据有关的经济实际、专业知识、实践阅历 和分析研讨才干,对被研讨景象在性质上作和分析研讨才干,对被研讨景象在性质上作 出定性判别。
出定性判别 (四四)配合回配合回归方程式方程式 即建立函数关系式来近似地描画景象即建立函数关系式来近似地描画景象间相关关相关关 系的普通方式系的普通方式(二二)编制相关表、相关图编制相关表、相关图 ,明确景象间相关关系的明确景象间相关关系的 表现方式表现方式 ( (三三) )确定景象间相互关系的亲密程度确定景象间相互关系的亲密程度 ( (五五) )测算回归方程式的可靠性测算回归方程式的可靠性 前往到第一节前往到第一节第二节第二节 相关表、相关图与相关系相关表、相关图与相关系数数 二、相关图二、相关图 一、相关表一、相关表 三、相关系数三、相关系数 前往到第九章前往到第九章 一、相关表一、相关表 相关表就是根据被研讨景象间一定数量的相关表就是根据被研讨景象间一定数量的原始对应资料编制的统计表原始对应资料编制的统计表 根据它可以对景象间相关关系进展初步分析,根据它可以对景象间相关关系进展初步分析,还可以进一步绘制相关图,为更深化的分还可以进一步绘制相关图,为更深化的分析研讨提供根据析研讨提供根据 例例:机床运用年限与维修费相关表机床运用年限与维修费相关表序号序号机床使用年限(年)机床使用年限(年) (x)年维修费(元)年维修费(元)(y)1240022540335204464054740656007580086700967601069001188401291080从表中可以看出,随着从表中可以看出,随着机床运用年限的添加,机床运用年限的添加,维修费也相应添加。
维修费也相应添加因此,可以得出结论:因此,可以得出结论:〔〔1 1〕机床运用年限与〕机床运用年限与维修费在数量上存在着维修费在数量上存在着一定的相关关系一定的相关关系〔〔2 2〕这种相关关系属〕这种相关关系属于正相关于正相关 前往到第二节前往到第二节二、相关图二、相关图 相关图又称散点图,是根据景象间相关关系一定相关图又称散点图,是根据景象间相关关系一定数量的实践对应资料数量的实践对应资料( (即相关表中所列资料即相关表中所列资料) )绘绘制而成的统计图制而成的统计图 详细做法:以直角坐标系中的横轴代表一个变量详细做法:以直角坐标系中的横轴代表一个变量( (通常是作为影响要素的那个变量通常是作为影响要素的那个变量) ),以纵轴代,以纵轴代表另一个变量表另一个变量( (通常是作为被影响要素的那个变通常是作为被影响要素的那个变量量) ),将相关表中的每个数值在坐标系中画成坐,将相关表中的每个数值在坐标系中画成坐标点,坐标点对称为相关点,一切的相关点组标点,坐标点对称为相关点,一切的相关点组成的图形就是相关图成的图形就是相关图 例:将上表中的资料绘制成相关图如图例:将上表中的资料绘制成相关图如图。
1维修修费用用 〔〔元元〕〕0机床运用年限〔年〕机床运用年限〔年〕 12345678910111211001000900800700600500400300200100前往到第二节前往到第二节三、相关系数三、相关系数 相关系数是反映两个景象在直线相关条件下,相关关系相关系数是反映两个景象在直线相关条件下,相关关系亲密程度的统计分析目的亲密程度的统计分析目的 第二,因变量数列的规范差第二,因变量数列的规范差: : 计算相关系数,首先要计算三个目的:计算相关系数,首先要计算三个目的: 第一,自变量数列的规范差第一,自变量数列的规范差: : 第三,两个数列的协方差第三,两个数列的协方差: : 那么相关系数根本公式为:那么相关系数根本公式为: 在实践任务中,都要求原始数据不少于在实践任务中,都要求原始数据不少于50对三、相关系数计算例如三、相关系数计算例如 以机床运用年限与维修费用资料为例以机床运用年限与维修费用资料为例设:机床运用年限为设:机床运用年限为x x,维修费为,维修费为y y,计算得:,计算得: 那么:那么:相关系数的运用相关系数的运用 当相关系数为正值时,景象间为正相关关系;当相关系数为正值时,景象间为正相关关系;当相关系数为负值时,景象间为负相关关系。
当相关系数为负值时,景象间为负相关关系 相关系数的数相关系数的数值在在-1-1和和+1+1之之间,即,即-1≤r≤+1-1≤r≤+1普通根据相关系数的绝对值大小,将其分为四个等级:普通根据相关系数的绝对值大小,将其分为四个等级:当当r的绝对值在的绝对值在0.3以下时,视为不相关以下时,视为不相关当当r的绝对值在的绝对值在0.3~~0.5之间时,为低度相关之间时,为低度相关当当r的绝对值在的绝对值在0.5~~0.8之间时,为显著相关之间时,为显著相关当当r的绝对值在的绝对值在0.8~~1之间时,为高度相关之间时,为高度相关相关系数用于判别两个景象间线性相关关系的亲相关系数用于判别两个景象间线性相关关系的亲密程度 前往到第二节前往到第二节第三节第三节 回归分析回归分析 二、回归分析的种类二、回归分析的种类 一、回归分析的概念一、回归分析的概念 三、一元直线回归三、一元直线回归 四、曲线回归四、曲线回归 前往到第九章前往到第九章 一、回归分析的概念一、回归分析的概念回归分析就是对具有相关关系的变量之间变化的回归分析就是对具有相关关系的变量之间变化的关系进展测定与描画,确定一定的数学表达式,关系进展测定与描画,确定一定的数学表达式,以便进展估计或预测的方法。
以便进展估计或预测的方法 回归分析具有以下特点:回归分析具有以下特点: 1.1.两个变量之间不是对等关系,一个是自变量,两个变量之间不是对等关系,一个是自变量, 一个是因变量一个是因变量2.2.回归方程是据以利用自变量的给定值来推算回归方程是据以利用自变量的给定值来推算 或估计因变量的值,反映其变量值之间详细或估计因变量的值,反映其变量值之间详细 的变动关系的变动关系前往到第三节前往到第三节二、回归分析的种类二、回归分析的种类 ( (一一) )从回归变量的个数划分为:从回归变量的个数划分为:多元回多元回归————三个或三个以上三个或三个以上变量的回量的回归,即,即包含了两个或两个以上自包含了两个或两个以上自变量的回量的回归 ( (二二) )从回归的方式划分为:从回归的方式划分为:一元回一元回归————一元回一元回归是指只研是指只研讨两个两个变量之量之 间的回的回归分析,即只需一个自分析,即只需一个自变量的回量的回归非直非直线回回归————曲曲线来代表景象之来代表景象之间的普通的普通数量关系数量关系直直线回回归〔〔线性回性回归〕〕————变量之量之间的的变化化趋势大体呈直大体呈直线趋势。
前往到第三节前往到第三节三、一元直线回归三、一元直线回归 一元直线回归也称简单直线回归,是指两个变量一元直线回归也称简单直线回归,是指两个变量之间的回归,并且这两个变量之间的变化趋势之间的回归,并且这两个变量之间的变化趋势近似于一条直线近似于一条直线 简单直线回归方程的普通公式为:简单直线回归方程的普通公式为: yc yc==a + bx a + bx 式中:式中: yc为因变量的估计值,或是推算出来的直线上的趋势值;为因变量的估计值,或是推算出来的直线上的趋势值; x为自变量;为自变量; a为直线的截距,即当自变量为零时,因变量的数值;为直线的截距,即当自变量为零时,因变量的数值; b为斜率,即自变量每添加一单位时,因变量平均添加值为斜率,即自变量每添加一单位时,因变量平均添加值求解求解a、、b两个参数要用的规范方程组为:两个参数要用的规范方程组为:Y == na + b∑x ∑x·y = ax + b∑x2 ∑x·y = ax + b∑x2 三、一元直线回归三、一元直线回归 例:根据机床运用年限与维修费用资料建立回归方程式。
例:根据机床运用年限与维修费用资料建立回归方程式 解:经过前面的相关分析,机床运用年限和维修费解:经过前面的相关分析,机床运用年限和维修费用间存在着高度直线相关关系因此,可以为它用间存在着高度直线相关关系因此,可以为它们配合回归直线,即:们配合回归直线,即:yc = a + bxyc = a + bx将前面的计算结果代入方程组:将前面的计算结果代入方程组:得得:∑ Y ∑ Y == na + na + b∑x b∑x ∑x·y = ax + ∑x·y = ax + b∑x2 b∑x2 8520=12a+60b 46560=60a+352b 求解得:求解得: a = 329.25 a = 329.25b = b = 76.15 76.15 得出反映自变量和因变量之间普通数量关系的方程式,得出反映自变量和因变量之间普通数量关系的方程式, 即:即: yc= 329.25 + 76.15 x yc= 329.25 + 76.15 x前往到第三节前往到第三节四、曲线回归四、曲线回归 在对经济变量进展配合回归方程时,常遇到的问在对经济变量进展配合回归方程时,常遇到的问题是自变量和因变量的关系是曲线型。
题是自变量和因变量的关系是曲线型 ( (一一) )双曲线双曲线 设双曲线回归方程为:设双曲线回归方程为:根据最小平方法,求解方程中参数根据最小平方法,求解方程中参数a a和和b b,即:,即: ( (二二) )指数曲线指数曲线设指数曲线方程为:设指数曲线方程为:上式中,上式中,b b>>0 0,,a a、、b b是待定参数是待定参数 当当b b>>1 1时,为递增曲线;当时,为递增曲线;当0 0<<b b<<1 1时,为递减曲线时,为递减曲线求求a、、b两个参数时,可将指数曲线方程两边取对数,转换两个参数时,可将指数曲线方程两边取对数,转换为直线的对数方式,即:为直线的对数方式,即:假设令假设令那么方程可变为:那么方程可变为:Y=A+BxY=A+Bx这样,就可以按照求解直线方程中参数的方法来计这样,就可以按照求解直线方程中参数的方法来计算算A A和和B B,最后再前往去查反对数表得出,最后再前往去查反对数表得出a a和和b b来( (三三) )二次抛物线二次抛物线 设二次抛物线方程为:设二次抛物线方程为:yc=a+bx+cx2 yc=a+bx+cx2 根据最小二乘法求解未知参数根据最小二乘法求解未知参数a a、、b b、、c c的方程组为:的方程组为: ∑y = na + b∑x + c∑x2∑xy = a∑x + b∑x2 + c∑x3∑x2y = a∑x2 + b∑x3 + c∑x4 用此方程组解出用此方程组解出a a、、b b、、c c,,然然后后代代入入方方程程yc=a+bx+cx2yc=a+bx+cx2中中得得出出二二次次抛抛物物线方程式。
线方程式 前往到第三节前往到第三节第四节第四节 估计规范误差估计规范误差 二、估计规范误差的测定二、估计规范误差的测定 一、估计规范误差的概念一、估计规范误差的概念 三、相关系数和估计规范误差的关系三、相关系数和估计规范误差的关系 前往到第九章前往到第九章 一、估计规范误差的概念一、估计规范误差的概念 估计规范误差就是用来阐明回归方程推算估计规范误差就是用来阐明回归方程推算结果的准确程度的统计分析目的结果的准确程度的统计分析目的 根据直线回归方程,当知自变量的某个数根据直线回归方程,当知自变量的某个数值时,就可推算出因变量的数值值时,就可推算出因变量的数值统计上把这种差距叫做估计规范误差统计上把这种差距叫做估计规范误差 推算出来的因变量的数值并不是确定的推算出来的因变量的数值并不是确定的数值,是一个估计值,它和实践值有一数值,是一个估计值,它和实践值有一定的差距定的差距前往到第四节前往到第四节二、估计规范误差的测定二、估计规范误差的测定 估计规范误差又叫回归规范差根据掌握资料不同,它估计规范误差又叫回归规范差根据掌握资料不同,它有两种计算方法:有两种计算方法: ( (一一) )根据因变量实践值和估计值的离差计算根据因变量实践值和估计值的离差计算计算公式如下:计算公式如下: 式中:式中:Syx代表估计规范误差;代表估计规范误差;y代表因变量数列的实践值;代表因变量数列的实践值;yc代表根据回归方程推算出来的估计值;代表根据回归方程推算出来的估计值;n代表因变量的项数。
代表因变量的项数 (二二)根据根据a、、b两个参数值计算估计规范误差两个参数值计算估计规范误差计算公式如下:计算公式如下: 二、估计规范误差测定例如二、估计规范误差测定例如 例:根据机床运用年限与维修费用资料计算估例:根据机床运用年限与维修费用资料计算估计规范误差,见下表:计规范误差,见下表: 机床使用年限机床使用年限(x)维修费维修费(元元)yc(yc=329.25+76.15x)y-yc(y-yc) 22(y)481.55--88.556650.402400481.5558.453416.403540557.70--37.71421.294520633.856.1537.824640633.85106.1511267.825740710.00--110121005600710.009081006800786.15--86.157121.826700786.15-26.15683.826760786.15113.8512961.828900938.45--98.459692.498401014.6065.404377.16合计合计10808520——78030.75将上表计算结果代入公式即得:将上表计算结果代入公式即得:计算结果,估计规范误差为计算结果,估计规范误差为80.4680.46元,阐明维修费的元,阐明维修费的实践值和估计值间的差距。
实践值和估计值间的差距 前往到第四节前往到第四节三、相关系数和估计规范误差的关系三、相关系数和估计规范误差的关系 相关系数与估计规范误差在数量上有以下关系:相关系数与估计规范误差在数量上有以下关系: 或或S2yxS2yx=σ2y(1 - r2) =σ2y(1 - r2) r是相关系数是相关系数 ;;σ2y是因是因变量数列的方差;量数列的方差;S2yx是估是估计规范范误差的平方差的平方 相关系数和估计规范误差在数值上的大小表现为相关系数和估计规范误差在数值上的大小表现为相反的关系相反的关系1. r值越大,那么值越大,那么Syx值越小,阐明相关程度越亲值越小,阐明相关程度越亲密2.r值越小,那么值越小,那么Syx值越大,阐明相关程度不亲密值越大,阐明相关程度不亲密 四、运用相关与回归分析时四、运用相关与回归分析时应留意的问题应留意的问题 1.1.必需以景象间客观存在的数量依存关必需以景象间客观存在的数量依存关系为分析的根底和前提系为分析的根底和前提 2.将相关系数、回归方程和回归规范差将相关系数、回归方程和回归规范差 结合起来运用结合起来运用 3.在回归分析时,要留意变量的计量单位在回归分析时,要留意变量的计量单位 。
前往到第四节前往到第四节 本章作业本章作业一、完成一、完成<统计学习指点书统计学习指点书>本章一切本章一切习题二、了解利用二、了解利用Excel建立直线方程的步建立直线方程的步骤 前往到第九章前往到第九章 。












