好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

应用回归分析结课论文正稿.doc

15页
  • 卖家[上传人]:xmg****18
  • 文档编号:241856489
  • 上传时间:2022-01-17
  • 文档格式:DOC
  • 文档大小:281.50KB
  • / 15 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 可编辑版《应用回归分析结课论文》影响财政收入的相关因素的分析班级:姓名:学号:目录1.问题的提出42.数据来源43.回归分析的模型方法介绍和总结53.1多元线性回归模型5多元线性回归模型的一般形式5多元线性回归模型的基本假定63.2.多元线性回归参数的最小二乘估计74.SAS程序及结果输出84.1.建立数据集,进行相关分析84.2.将数据做标准化处理,建立回归方程104.3.异方差检验114.4自相关检验134.5.多重共线性检验14方差扩大因子法14特征根判定法144.6消除多重共线性15后退法154.6.2.逐步回归194.7最佳子集回归224.8岭回归224.9主成分回归254.10偏最小二乘回归265.结论27参考文献28摘要本文选1985-20XX的农业增加值,工业增加值,建筑业增加值,社会消费总额,人口数,受灾面积六个因素通过多元线性回归分析和岭回归对国家财政收入行分析,主要分析分析影响财政收入的主要原因,并联系实际进行分析,以供参考关键词:财政收入 多元线性回归 多重共线性 岭回归1.问题的提出财政参与分配社会产品,在一国经济发展和分配体系中占有重要地位和作用。

      可以有力地促进经济的发展促进科学、教育、文化、卫生事业的发展,促进人民生活水平的提高,为巩固国防提供可靠的物质保障且可调节资源配置,促进社会公平,改善人民生活促进经济机构的优化和经济发展方式的转变在我国,财政收入的主体是税收收入,因此在税收体制及政策不变的条件下,财政收入会随着经济繁荣而增加,随着经济衰退而下降本文利用回归分析,确定影响我国财政收入主要因素2.数据来源在研究国家收入时,我们把财政收入按形式分为:各项税收收入,企业收入,债务收入,国家能源交通重点建设基金收入,基本建设贷款归还收入,国家调节基金收入,其他收入等为了建立国家财政收入回归模型,我们以财政收入y<亿元>为因变量,自变量如下:x1为农业增加值<亿元>;x2为工业增加值<亿元>;x3为建筑业增加值<亿元>;x4为人口数〔万人;X5为社会消费总额<亿元>;x6为 受灾面积<万公顷>根据中国统计年鉴,得到1985-20XX数据,如图:3.回归分析的模型方法介绍和总结3.1多元线性回归模型3.1.1多元线性回归模型的一般形式 设随机变量与一般变量,,… ,的线性回归模型为: 〔3.1式中,,,…,是个未知参数,称为回归常数,,…,称为回归系数。

      称为被解释变量〔因变量,是个可以精确测量并控制的一般变量称为解释变量〔自变量时,式〔3.1为一元线性回归模型;时,我们就称式〔3.1为多元线性回归模型是随机误差,与一元线性回归一样,对随机误差项我们常假定 〔3.2称 〔3.3为理论回归方程 对一个实际问题,如果我们获得组观测数,则线性回归模型式〔3.1可表示为: 〔3.4写成矩阵形式为:〔3.5是一个阶矩阵,称为回归设计矩阵或资料矩阵在实验设计中,的元素是预先设定并可以控制的,人的主观因素可作用其中,因而称为设计矩阵3.1.2多元线性回归模型的基本假定 为了方便地进行模型的参数估计,对回归方程式〔3.4有如下一些基本假定 〔1解释变量,,… ,是确定性变量,不是随机变量,且要求这里的,表明设计矩阵中的自变量列之间不相关,样本量的个数应大于解释变量的个数,是一满秩矩阵 〔2随机误差性具有零均值和等方差,即,, 这个假定通常称为高斯—马尔柯夫条件即假设观测值没有系统误差,随机误差项的平均值为零,随机误差项的协方差为零,表明随机误差项在不同的样本点之间是不相关的〔在正态假定下即为独立的,不存在序列相关,并且有相同的精度。

      〔3正态分布的假定条件为:相互独立对于多元线性回归的矩阵模型式〔3.5,这个条件便可表示为: 由上述假定和多元正态分布的性质可知,随机变量服从维正态分布,回归模型式〔3.5的期望向量 因此3.2.多元线性回归参数的最小二乘估计多元线性回归模型未知参数,,…,,的估计与一元线性回归方程的参数估计原理一样,仍可采用最小二乘估计对于,所谓最小二乘法,就是寻找参数,,…,的估计值,使离差平方和Q<,,…,>极小,即:4.SAS程序及结果输出4.1.建立数据集,进行相关分析程序1data a;input year y x1-x6@@;cards;1985 2004.82 3619.5 9716 675.1 1058.51 3801.4 443.651986 2122.01 4013 11194 808.07 1075.07 4374 471.41987 2199.35 4675.7 13813 954.65 1093 5115 420.91988 2357.24 5865.3 18225 1131.65 1110.26 6534.6 508.71989 2664.9 6534.7 22017 1282.98 1127.04 7074.2 469.911990 2937.1 7662.1 23924 1345.01 1143.33 7250.3 384.741991 3149.48 8157 26625 1564.33 1158.23 8245.7 554.721992 3483.37 9084.7 34599 2174.44 1171.71 9704.8 513.331993 4348.95 10995.5 48402 3253.5 1185.17 12462.1 488.291994 5218.1 15750.5 70176 4653.32 1198.5 16264.7 550.431995 6242.2 20340.9 91894 5793.75 1267.43 20620 546.881996 7407.99 22353.7 99595 8282.25 1211.21 24774.1 458.211997 8651.14 23788.4 113733 9126.48 1223.89 27298.9 469.891998 9875.95 24542.9 119048 10061.99 1276.27 29152.5 521.551999 11444.08 24519.1 126111 11152.86 1236.26 31134.7 534.292000 13395.23 24915.8 85673.7 12497.6 1284.53 334152.6 471.192001 16386.04 26179.6 9548.98 15361.56 1247.61 37595.2 501.452002 18903.64 27390.8 11076.5 18527.18 1257.86 42027.1 499.812003 21715.25 29691.8 14771.2 23083.87 1292.27 45842 545.06;run;procprint;run;proccorrdata=a noprob;var y x1-x6;run;结果:表一分析:从相关阵看出,y与x2的相关系数偏小,x2是工业增加值,这说明工业增加值对财政收入无显著影响。

      4.2.将数据做标准化处理,建立回归方程程序2:procstandarddata=amean=0std=1out=out1;var y x1-x6;run;procprintdata=out1;run;procregdata=out1;model y=x1-x6;run;结果:表二因为数据为标准化数据,所以方程中不含有常数项所以有回归方程为:Yx1-0.11696x2+0.87288x3+0.01659x+0.04690x5+0.01022x6由决定系数R方=0.9957,调整R方=0.9936,得回归方程高度显著又有F=463.63,P<0.0001,表明回归方程高度显著,说明x1,x2,x3,x4,x5,x6整体上对y高度显著在显著性水平时只有x2,x3通过了显著性检验,模型需要进一步检验4.3.异方差检验采用等级相关系数法程序3:procregdata=out1;model y=x1-x6/r;outputout=z1 r=residual;run;procgplotdata=z1;plot residual*y;run;data z2;set z1;absr=abs;run;proccorrdata=z2 spearman; var absr x1-x6 ;run; 图一从残差图可看出,误差项没有呈现任何趋势以及规律初步判断不存在异方差。

      表三程序4data z3;n=19 ;do rs=0.0072,0.3910,0.0053,0.0372,0.0174 ,0.3364;T=sqrt*rs/sqrt<1-rs*rs>;t1=tinv<0.975,n-2>;output;end;run;procprintdata=z3;run;表4可知模型存在异方差问题.4.4自相关检验程序5:procregdata=out1;model y=x1-x6/dw;run;结果:表5DW值为1.521 查表不能判断是否存在自相关4.5. 多重共线性检验4.5.1方差扩大因子法程序6procregdata=out1;model y=x1-x6/vif ;run;结果:表6可以看到x1 x3 x4的方差扩大因子很大,分别为67.41892 34.00697 14.54580,超过10,说明财政收入回归方程存在多重共线性4.5.2特征根判定法程序7procregdata=out1;model y=x1-x6/collinoint;run;表7由上图可知,条件数19.45707在x1 x2和x3上的方差比率分别为0.99279 0.71723和0.90472,远超过50%,说明两变量高度共线。

      4.6消除多重共线性4.6.1后退法程序8procregdata=a;model y=x1-x6/selection=backward;run;结果向后消除: 第 0 步所有变量已输入: R 方 = 0.9957 和 C = 7.0000方差分析源自由度平方和均方F 值Pr > F模型6674884516112480753463.63<.0001误差122911275242606  校正合计18677795792   变量参数估计值标准误差II 型 SSF 值Pr > FIntercept-733.030475750.126543942.677580.020.9007x。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.