
应用回归分析第6章课后习题参考答案.docx
8页本文格式为Word版,下载可任意编辑应用回归分析,第6章课后习题参考答案 第6章 多重共线性的情形及其处理 斟酌与练习参考答案 6.1 试举一个产生多重共线性的经济实例 答: 例如有人建立某地区粮食产量回归模型,以粮食产量为因变量Y,化肥用量为X1,水浇地面积为X2,农业投入资金为X3由于农业投入资金X3与化肥用量X1,水浇地面积X2有很强的相关性,所以回归方程效果会很差再例如根据某行业企业数据资料拟合此行业的生产函数时,资本投入、劳动力投入、资金投入与能源供给都与企业的生产规模有关,往往展现高度相关处境,大企业二者都大,小企业都小 6.2多重共线性对回归参数的估计有何影响? 答:1、完全共线性下参数估计量不存在; 2、近似共线性下OLS估计量非有效; 3、参数估计量经济含义不合理; 4、变量的显著性检验失去意义; 5、模型的预料功能失效 6.3 具有严重多重共线性的回归方程能不能用来做经济预料? 答:虽然参数估计值方差的变大轻易使区间预料的“区间”变大,使预料失去意义但假设利用模型去做经济预料,只要保证自变量的相关类型在未来期中一向保持不变,即使回归模型中包含严重多重共线性的变量,也可以得到较好预料结果;否那么会对经济预料产生严重的影响。
6.4多重共线性的产生于样本容量的个数n、自变量的个数p有无关系? 答:有关系,增加样本容量不能消释模型中的多重共线性,但能适当消释多重共线性造成的后果当自变量的个数p较大时,一般多重共线性轻易发生,所以自变量应选择少而精 6.5 自己找一个经济问题来建立多元线性回归模型,怎样选择变量和构造设计矩阵X才可能制止多重共线性的展现? 答:请参考第三次上机测验题——机场吞吐量的多元线性回归模型,留神利用二手数据很难制止多重共线性的展现,所以一般利用逐步回归和主成分回归消释多重共线性假设举行自己举行试验设计如正交试验设计,并收集数据,选择向量 使设计矩阵X的列向量(即X1,X2, Xp)不相关 6.6对第5章习题9财政收入的数据分析多重共线性,并根据多重共线性剔除变量将所得结果与逐步回归法所得的选元结果相对比 附5.9 在研究国家财政收入时,我们把财政收入按收入形式分为:各项税收收入、企业收入、债务收入、国家能源交通重点创办收入、根本创办贷款归还收入、国家预算调理基金收入、其他收入等为了建立国家财政收入回归模型,我们以财政收入y(亿元)为因变量,自变量如下:x1为农业增加值(亿元), x2为工业增加值(亿元),x3为建筑业增加值(亿元),x4为人口数(万人),x5为社会消费总额(亿元),x6为受灾面积(万公顷)。
据《中国统计年鉴》获得1978—1998年共21个年份的统计数据,见表5.4(P167)由定性分析知,全体自变量都与y有较强的相关性,分别用后退法和逐步回归法作自变量选元 解:逐步回归法 CoefficientsaUnstandardizedCoefficientsBStd. Error715.30990.574.179.0041010.840136.027.308.048-.405.152865.929103.725.639.086-.601.119-.361.086StandardizedCoefficientsBeta.9941.706-.7143.541-1.059-1.493Model123(Constant)x5(Constant)x5x1(Constant)x5x1x2t7.89840.7397.4316.367-2.6658.3487.439-5.057-4.216Sig..000.000.000.000.016.000.000.000.001a. Dependent Variable: y 回归方程为: y=865.929—0.601x1-0.361x2+0.639x5 但是回归系数的解释不合理。
解:(1)分析数据的多重共线性直接举行Y与四个变量的线性回归方程,并做多重共线性的诊断,由SPSS分析得相应输出结果如下: a方差扩大因子法, 由表1中VIF值, 可知x1,x2,x3,x5的方差扩大因子远大于10,这几个自变量之间存在很高的线性相关性,即回归方程存在严重的多重共线性 b.特征根和条件数判定法输出结果如表2: 表1 表2 其中最大的条件数k7=290.443,说明自变量间存在严重的多重共线性,这与方差扩大因子法的结果一致其中x0,x2,x4,x5在第五行同时较大,说明其间存在多重共线性 (2)消释多重共线性 下面根据多重共线性剔除变量先剔除VIF值最大的自变量x2,得: CoefficientsaUnstandardizedCoefficientsBStd. Error-1503.1751546.931-.717.163-.801.467.029.017.487.078-.010.008StandardizedCoefficientsBeta-1.264-.526.1022.701-.026Collinearity StatisticsToleranceVIF.004.003.085.002.616268.990305.76911.701609.0671.624Model1(Constant)x1x3x4x5x6t-.972-4.391-1.7131.6956.238-1.177Sig..347.001.107.111.000.258a. Dependent Variable: y 从上表可以看出,VIF的值中,除了x6以外,其余的均大于10,故回归方程照旧存在严重的多重共线性。
持续剔除VIF值最大的自变量x5,得: CoefficientsaUnstandardizedCoefficientsBStd. Error-3011.2042804.617-.075.2331.515.521.040.031.002.015StandardizedCoefficientsBeta-.131.995.141.007Collinearity StatisticsToleranceVIF.006.009.086.652161.988112.77711.5731.533Model1(Constant)x1x3x4x6t-1.074-.3212.9091.286.167Sig..299.753.010.217.869a. Dependent Variable: y 从上表可以看出,VIF的值中,除了x6以外,其余的均大于10,故回归方程还存在严重的多重共线性持续剔除VIF值最大的自变量x1,得: CoefficientsaUnstandardizedCoefficientsBStd. Error-2349.3381848.3401.351.096.032.019.003.014StandardizedCoefficientsBeta.887.113.009Collinearity StatisticsToleranceVIF.249.222.6734.0184.5091.485Model1(Constant)x3x4x6t-1.27114.1191.705.234Sig..221.000.106.818a. Dependent Variable: y 由上表可以看出,全体自变量的VIF值都小于10,故回归方程的多重共线性已经被消释。
但自变量x6没有通过T检验,说明不显著,剔除x6后再做回归分析得: CoefficientsaUnstandardizedCoefficientsBStd. Error-2358.8091798.7221.351.093.034.017StandardizedCoefficientsBeta.887.119Collinearity StatisticsToleranceVIF.249.2494.0184.018Model1(Constant)x3x4t-1.31114.5051.939Sig..206.000.068a. Dependent Variable: y从上表可以看出,得到的回归方程为 ??1.351x3?0.034x4?2358.809 y回归方程的多重共线性虽然被消释,但是模型的自变量x4的t检验P值为0.068>0.05,说明在95%的置信度下x4对y的线性影响不显著 模型只剩下x3, CoefficientsaUnstandardizedCoefficientsBStd. Error1123.404112.0171.508.050StandardizedCoefficientsBeta.990Model1(Constant)x3t10.02930.316Sig..000.000a. Dependent Variable: y (3)所得结果与逐步回归结果对比。
对逐步回归选出的三个自变量做多重共线性的分析,得到: CoefficientsaUnstandardizedCoefficientsBStd. Error865.929103.725-.601.119-.361.086.639.086StandardizedCoefficientsBeta-1.059-1.4933.541Collinearity StatisticsToleranceVIF.005.002.001188.019537.151971.012Model1(Constant)x1x2x5t8.348-5.057-4.2167.439Sig..000.000.001.000a. Dependent Variable: y 从上表可以看出,尽管用逐步回归的方法选出的自变量为x1,x2,x5,但是回归方程还是存在多重共线性 但是根据多重共线性剔除变量后,模型只剩下x3,损失了好多信息,得到的模型 国家财政收入只与x3建筑业增加值有关,鲜明不符合建模的初衷 (4)主成分回归法 标准化全体自变量,做主成分分析得输出结果如下: 由上表,第一个主成分包含有原始6个变量近85.546%的信息量,故只选此一个主成分。
Component Matrix(a) 主成分 Zscore(x1) Zscore(x2) Zscore(x3) Zscore(x4) Zscore(x5) Zscore(x6) Component1 .991 .985 .983 .929 .990 .610 由上表得第一个主成分表达式为: Z1=(0.991x1*+0.983x3*+0.929x4*+0.990x5*+0.610x6*+0.985x5*)/5.133,即: Z1?0.193064x1*?0.191896x2*?0.191506x3*?0.180986x4*?0.192870x5*?0.118839x6*作Y*与Z1的最小二乘估计,输出结果如下: Coefficientsa,bUnstandardizedCoefficientsBStd. ErrorREGR factor score1 for analysis 1.984.040StandardizedCoefficientsBeta.984Model1t24.325Sig..000a. Dependent Variable: Zscore(y)b. Linear Regression through the Origin 得主成分回归的回归方程为: Y*。
