
考研统计学多元回归知识要点.doc
4页考研统计学多元回归知识要点 应用统计硕士考研需要掌握统计学先关知识点考研总结了一些统计学要点方便大家进行学习下面是有关多元回归的知识点具体内容如下 1.多重共线性 回归模型中两个或两个以上的自变量彼此相关 多重共线性带来的问题有 可能会使回归的结果造成混乱甚至会把分析引入歧途 可能对参数估计值的正负号产生影响特别是各回归系数的正负号有可能同我们预期的正负号相反 2.多重共线性的识别 检测多重共线性的最简单的一种办法是计算模型中各对自变量之间的相关系数并对各相关系数进行显著性检验 若有一个或多个相关系数显著就表示模型中所用的自变量之间相关存在着多重共线性 如果出现下列情况暗示存在多重共线性 模型中各对自变量之间显著相关 当模型的线性关系检验(F检验)显著时几乎所有回归系数的t检验却不显著 回归系数的正负号与预期的相反 3.变量选则过程 在建立回归模型时对自变量进行筛选 选择自变量的原则是对统计量进行显著性检验 将一个或一个以上的自变量引入到回归模型中时是否使得残差平方和(SSE)有显著地减少如果增加一个自变量使SSE的减少是显著的则说明有必要将这个自变量引入回归模型否则就没有必要将这个自变量引入回归模型 确定引入自变量是否使SSE有显著减少的方法就是使用F统计量的值作为一个标准以此来确定是在模型中增加一个自变量还是从模型中剔除一个自变量 变量选择的方法主要有:向前选择、向后剔除、逐步回归、最优子集等 4.向前选择 从模型中没有自变量开始 对k个自变量分别拟合对因变量的一元线性回归模型共有k个然后找出F统计量的值最高的模型及其自变量(P值最小的)并将其首先引入模型 分别拟合引入模型外的k1个自变量的线性回归模型 如此反复进行直至模型外的自变量均无统计显著性为止 5.向后剔除 先对因变量拟合包括所有k个自变量的回归模型然后考察p(p 考察p1个再去掉一个自变量的模型(这些模型中每一个都有k2个的自变量)使模型的SSE值减小最少的自变量被挑选出来并从模型中剔除 如此反复进行一直将自变量从模型中剔除直至剔除一个自变量不会使SSE显著减小为止 6.逐步回归 将向前选择和向后剔除两种方法结合起来筛选自变量 在增加了一个自变量后它会对模型中所有的变量进行考察看看有没有可能剔除某个自变量如果在增加了一个自变量后前面增加的某个自变量对模型的贡献变得不显著这个变量就会被剔除 按照方法不停地增加变量并考虑剔除以前增加的变量的可能性直至增加变量已经不能导致SSE显著减少 在前面步骤中增加的自变量在后面的步骤中有可能被剔除而在前面步骤中剔除的自变量在后面的步骤中也可能重新进入到模型中 7.虚拟自变量 用数字代码表示的定性自变量 虚拟自变量可有不同的水平 只有两个水平的虚拟自变量比如性别(男女) 有两个以上水平的虚拟自变量贷款企业的类型(家电医药其他) 虚拟变量的取值为01 回归模型中使用虚拟自变量时称为虚拟自变量的回归 当虚拟自变量只有两个水平时可在回归中引入一个虚拟变量比如性别 一般而言如果定性自变量有k个水平需要在回归中模型中引进k1个虚拟变量 例:引进虚拟变量时回归方程可写: E(y)=b0+b1x1+b2x2 女(x2=0):E(y|女性)=b0+b1x1 男(x2=1):E(y|男性)=(b0+b2)+b1x1 b0的含义表示:女性职工的期望月工资收入 (b0+b2)的含义表示:男性职工的期望月工资收入 b1含义表示:工作年限每增加1年男性或女性工资的平均增加值 b2含义表示:男性职工的期望月工资收入与女性职工的期望月工资收入之间的差值(b0+b2)b0=b2 已经进入10月份了距离考试的时间越来越近了正处于考研复习的关键时刻考生们保持良好的心态全身心的投入到考研复习中去 。
