
第八章相关与回归分析 (1)讲义.ppt
80页第8章 回归分析,1,第八章 相关与回归分析,下一页,返回目录,第8章 回归分析,2,主要内容,相关分析 回归分析,第8章 回归分析,3,第一节、相关分析的意义和任务,一、相关分析的概念 二、相关分析的种类,上一页,下一页,返回本章首页,第8章 回归分析,4,一、相关分析的概念,现实世界中现象之间存在着两种关系 ㈠函数关系 它反映现象之间存在着严格的依存关系,在这种关系中,对于某一变量的每一个数值,都有另一个变量的确定值与之相对应,并且这种关系可以用一个数学表达式反映出来上一页,下一页,返回本节首页,第8章 回归分析,5,上一页,下一页,返回本节首页, 函数关系的例子 圆的面积(S)与半径之间的关系可表示为S = R2,第8章 回归分析,6,㈡相关关系 它反映现象之间确实存在的,但关系数值不固定的相互依存关系 这一概念表明: (1)相关关系是指现象之间确实存在数量上的相互依存关系 (2)现象之间数量依存关系的具体关系值不是固定的上一页,下一页,返回本节首页,第8章 回归分析,7, 相关关系的例子 商品的消费量(y)与居民收入(x)之间的关系 商品销售额(y)与广告费支出(x)之间的关系,第8章 回归分析,8,㈢相关关系与函数关系的联系和区别 ⒈由于有观察或测量误差等原因,函数关系在实际中往往通过相关关系表现出来。
在研究相关关系时,又常常要使用函数关系的形式来表现,以便找到相关关系的一般数量表现形式 2、相关关系是统计学的研究范围; 函数关系是数学的研究范围第8章 回归分析,9,二、相关分析的种类,㈠根据相关因素的多少划分 ⒈单相关:只涉及两个变量 ⒉复相关:涉及三个或三个以上的变量 3.偏相关:在涉及到三个或三个以上的变量时,假定其它变量维持不变,只研究其中两个变量的相关关系,这种相关关系叫偏相关,上一页,下一页,返回本节首页,第8章 回归分析,10,㈡根据相关的形式不同划分 ⒈线性相关(直线相关):当一个变量变动时,另一个变量也相应地成比例地变动 ⒉非线性相关(曲线相关):当一个变量变动时,另一个变量也相应发生变动,但这种变动不是成比例的第8章 回归分析,11,㈢根据相关关系的方向划分 ⒈正相关:两个变量之间的变化方向一致,都是增长趋势或下降趋势 ⒉负相关:两个变量变化趋势相反,一个下降而另一个上升,或一个上升而另一个下降上一页,下一页,返回本节首页,第8章 回归分析,12,各类相关关系的表现形态图,,第8章 回归分析,13,第二节相关分析方法,一、散点图和相关表 二、相关系数,上一页,下一页,返回本章首页,第8章 回归分析,14,一、散点图和相关表,例 近年来国家教育部决定将各高校的后勤社会化。
某从事饮食业的企业家认为这是一 个很好的投资机会,他得到十组高校人数与周边饭店的季销售额的数据资料,并想 据此决策其投资规模上一页,下一页,返回本节首页,第8章 回归分析,15,操作过程:,上一页,下一页,返回本节首页,①输入数据,如下图所示相关表是一种反映变量之间相关关系的统计表第8章 回归分析,16,②从“插入”菜单中选择“图表”选项,打开“图表向导”对话框如下图所示在“图表类型”列表中选择XY散点图,单击“下一步”按钮上一页,下一页,返回本节首页,第8章 回归分析,17,③在数据区域中输入B2:C11,选择“系列产生在—列”,如下图所示,单击“下一步”按钮上一页,下一页,返回本节首页,第8章 回归分析,18,④打开“图例”页面,取消图例,省略标题,如下图所示上一页,下一页,返回本节首页,第8章 回归分析,19,⑤单击“完成”按钮,便得到XY散点图如下图所示上一页,下一页,返回本节首页,第8章 回归分析,20,相关关系的测度 (相关系数),对变量之间关系密切程度的度量 对两个变量之间线性相关程度的度量称为简单相关系数 若相关系数是根据总体全部数据计算的,称为总体相关系数,记为 若是根据样本数据计算的,则称为样本相关系数,记为 r,第8章 回归分析,21,第8章 回归分析,22,上一页,下一页,返回本节首页,相关系数的涵义: 相关系数是用来说明变量之间在直线相关条件下相关关系密切程度和方向的统计分析指标。
第8章 回归分析,23,相关系数公式的涵义理解,(1)两个变量之间的相关程度和方向,取决于两个变量离差乘积之和 ,当它为0时,为0;当它为正时,为正;当它为负时, 为负 (2)相关程度的大小与计量单位无关为了消除积差中两个变量原有计量单位的影响,将各变量的离差除以该变量数列的标准差,使之成为相对积差,即 ,所以相关系数是无量纲的数量第8章 回归分析,24,第8章 回归分析,25,第8章 回归分析,26,相关系数的意义,(1)r的取值在-1到+1之间 (2)r=+1,为完全正相关;r=-1为完全负相关表明变量之间为完全线性相关,即函数关系 (3)r=0,表明两变量无线性相关关系 (4)r0,表明变量之间为正相关;r0,表明变量之间为负相关 (5)r的绝对值越接近于1,表明线性相关关系越密切;r越接近于0,表明线性相关关系越不密切第8章 回归分析,27,相关程度可分为以下几种情况:,① ,为无线性相关; ②0.3≤ <0.5,为低度线性相关; ③0.5≤ <0.8,为显著线性相关; ④ ≥0.8,一般称为高度线性相关 以上说明必须建立在相关系数通过显著性检验的基础之上。
相关系数的显著性检验,相关系数是根据样本数据计算的,具有一定随机性,能否真实地表现变量总体的相关情况受到随机因素和样本容量大小的影响故需要对其进行检验 样本相关系数的检验包括两类检验: (1)对总体相关系数是否等于0进行检验; (2)对总体相关系数是否等于某一给定的不为0的数值进行检验对总体相关系数是否等于0的检验,总体相关系数的检验统计上用t检验其步骤如下: 第一步,提出原假设和备择假设假设样本相关系数r是抽自具有零相关的总体,即 第二步,规定显著性水平,并依据自由度(n-2)确定临界值 ; 第三步,计算检验的统计量:,,第四步,做出判断将计算的统计量与临界值对比,若统计量大于或等于临界值,表明变量间线性相关在统计上是显著的,若统计量小于临界值,则说明相关关系在统计上并不显著第8章 回归分析,31,例题:相关系数的计算与检验: ㈠用计算器计算相关系数 例,上一页,下一页,返回本节首页,第8章 回归分析,32,㈡用计算机计算相关系数 ⒈选取“工具”-“数据分析” ⒉选“相关系数” ⒊选“确定” ⒋输入“输入区域” ⒌输入“输出区域” ⒍在“分组方式”中选“逐列” ⒎选“标志位于第一行” ⒏确定 出现结果如下:,上一页,下一页,返回本节首页,(三)相关系数检验,①提出原假设和备择假设。
②取显著性水平 ,根据自由度 查 分布表得 =2.4469 ③计算检验的统计量: =9.7236,,,,,,,,④由于 ,则拒绝 ,表明变量间线性相关在统计上是显著的即产品产量与生产费用之间的相关系数是显著的第8章 回归分析,35,第三节回归分析,一、回归分析的概念 二、直线回归 三、曲线回归,上一页,下一页,返回本章首页,第8章 回归分析,36,一、 回归分析的概念,㈠回归分析:回归分析就是对具有相关关系的变量之间数量变化的一般关系进行测定,确定一个相关的数学表达式,以便于进行估计或预测的统计方法 ㈡回归分析的种类: ⒈按自变量x的多少,可以分为一元回归和多元回归; ⒉按y与x曲线的形式,可以分为直线回归和曲线回归上一页,下一页,返回本节首页,第8章 回归分析,38,二、直线回归,㈠简单直线回归方程的确定 ⒈简单直线回归分析的特点 (1)在变量之间,必须根据研究目的具体确定哪些是自变量,哪个是因变量 (2)回归方程的作用在于,在给定自变量的数值情况下来估计因变量的可能值一个回归方程只能做一种推算推算的结果表明变量之间具体的变动关系。
上一页,下一页,返回本节首页,第8章 回归分析,39,(3)直线回归方程中,自变量的系数为回归系数回归系数的符号为正时,表示正相关;回归系数的符号为负时,表示负相关 (4)确定回归方程时,只要求因变量是随机的,而自变量是给定的数值上一页,下一页,返回本节首页,第8章 回归分析,40,⒉简单直线回归方程的确定 设(x,y)为实际值,yc为估计值,采用普通最小二乘法,设拟合的直线为: 根据最小二乘原理:,上一页,下一页,返回本节首页,第8章 回归分析,41,上一页,下一页,返回本节首页,第8章 回归分析,42,上一页,下一页,返回本节首页,第8章 回归分析,43,上述资料可绘制如下折线图:,图1,上一页,下一页,返回本节首页,第8章 回归分析,44,解:方法一:用计算器计算:,故直线方程为yc=51.31+12.9x,第8章 回归分析,45,方法二:用Excel计算: 先作散点图,然后添加趋势线 ① 用鼠标激活散点图,把鼠标放在任一数据点上,单击鼠标右键,打开菜单,在菜单栏里选择“添加趋势线”选项上一页,下一页,返回本节首页,第8章 回归分析,46,图2,上一页,下一页,返回本节首页,第8章 回归分析,47,②打开“类型”页面,选择“线性”选项,Excel将显示一条拟合数据点的直线。
③打开“选项”页面如下图所示,在对话框下部选择“显示公式”和“显示R平方根”选项,单击“确定”按钮,便得到回归图如下图所示上一页,下一页,返回本节首页,第8章 回归分析,48,㈡多元线性回归 回归方程为,要估计参数a、b1 、 b2手工计算较繁,可以用EXCEL 数据分析功能完成上一页,下一页,返回本节首页,第8章 回归分析,49,例 某地区玻璃销售 量与汽车产量、建 筑业产值资料如左, 试建立回归模型上一页,下一页,返回本节首页,第8章 回归分析,50,⒈操作过程 ①在Excel中输入数据 ②在“工具”菜单中选择“数据分析”选项,打开“数据分析”对话框如下图所示上一页,下一页,返回本节首页,第8章 回归分析,51,③在“分析工具”列表中选择“回归”选项,单击“确定”按钮,打开“回归”对话框如下图所示上一页,下一页,返回本节首页,第8章 回归分析,52,④在Y值输入区域中输入B1:B19 ⑤在X值输入区域中输入C1:D19 ⑥选择“标志”,置信度选择95% ⑦在“输出选项”中选择“输出区域”,在其右边的位置输入“E1”,单击 “确定”按钮输出结果如下图所示上一页,下一页,返回本节首页,第8章 回归分析,53,上一页,下一页,返回本节首页,回归方程的显著性检验,对于回归方程进行显著性检验基于以下两点: 第一,在根据样本数据拟合回归方程时,我们首先假设变量 与 变量之间存在着线性关系,但这种假设是否成立?就必须通过检验才能证实;,第二,样本回归方程 中的参数是对总体回归方程中参数 的最小二乘估计值,样本回归系数 能否作为总体回归系数 的估计值,还需要对总体回归系数的显著性进行检验。
回归方程的检验一般包括两个方面的内容: 一是线性关系的检验; 二是回归系数的检验第8章 回归分析,56,一、离差平方和的分解,因变量 y 的取值是不同的,y 取值的这种波动称为变差变差来源于两个方面 由于自变量 x 的取值不同造成的 除 x 以外的其他因素(如x对y的非线性影响、测量误差等)的影响 对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差 来表示,第8章 回归分析,57,离差平方和的分解 (图示),第8章 回归分析,58,离差平方和的分解 (三个平方和的关系),2. 两端平方后求和有,从图上看有,TSS = RSS+ ESS,第8章 回归分析,59,离差平方和的分解 (三个平方和的意义),总平方和(TSS) 反映因变量的 n 。












