SPSS教程-经典案例分析-影响粮食产量的因素
目录摘要:1一前言1二理论背景12.1多元线性回归模型的基本理论12.1.1多元线性回归模型一般形式12.1.2多元线性回归模型的基本假定:1三模型的建立及求解23.1 一些基本的符号说明23.2 多元回归模型的初步建立与初步检验23.2.1 多元回归模型的初步建立23.2.2 模型的初步检验33.3 模型的优化33.3.1多重共线性的诊断与模型的建立33.3.1.1 多重共线性的诊断方差扩大因子法33.3.1.2 多重共线性的处理与检验43.3.2 异方性差检验及处理63.3.2.1 异方差检验63.3.3 自相关性检验及处理63.3.3.1 自相关检验63.4 最终模型的确定7四模型评价7参考文献7附录712影响我国粮食产量因素的分析摘要: 本文主要对我国粮食产量的变动进行多因素分析,选取1990年-2007年18年的数据,利用SPSS软件,建立以粮食产量为被解释变量,以有效灌溉面积、粮食作物播种面积、化肥使用量、受灾面积、农用机械总动力、农业基本建设投资为解释变量的多元线性回归模型,通过对模型进行异方差检验,自相关检验,自变量的选择以及多重共线性诊断,最后建立了合乎经济意义的粮食生产函数,从而通过对我国粮食生产的影响因素分析粮食产量的决定因素。关键词:最小二乘估计 多元线性回归分析 异方差 自相关 多重共线性 残差图 怀特检验 迭代法,差分法 逐步回归 方差扩大因子。一前言粮食是人类最基本的生活消费品,一个国家的粮食问题是关系到本国的国计民生的头等大事。人们都知道,农业是国民经济发展的基础,粮食是基础的基础,因此粮食生产是关系到一个国家生产与发展的一个永恒的主题。根据理论和经验分析,影响粮食生产的主要因素有有效灌溉面积、粮食作物播种面积、化肥使用量、受灾面积、农用机械总动力、农业基本建设投资。为此,本文收集了我国自1990年至2007年有效灌溉面积、粮食作物播种面积、化肥使用量、受灾面积、农用机械总动力、农业基本建设投资的相关数据。数据资料均来源于中国统计年鉴,见附录一。粮食的产量随着投入生产要素的变化而变化,反映出一种投入与产出之间存在着一种数量关系,这种关系可以用一种数学表达式表现出来,这种表达式常称作生产函数。多元线性函数就是用于表示农业生产投入产出的一种生产函数。本文首先用最小二乘估计,建立多元线性回归模型,对参数进行估计,然后进行参数检验,方程显著性检验,经济意义的检验。通过建立数学模型来研究我国粮食投入与产出的生产函数,找出影响粮食产量的关键指标加以改善,确保粮食产量稳步增长,建立粮食生产模型,且对此模型进行评估。二理论背景 2.1多元线性回归模型的基本理论2.1.1多元线性回归模型一般形式设随机变量与一般变量的理论线性回归模型为:.(1),其中是个未知参数,称为回归常数,称为回归系数。y称为被解释变量(因变量),是个可以精确测量并可控制的一般变量,称为解释变量(自变量),是随机误差。对一个实际问题,如果我们获得n组观测数据(),则线性回归模型(1)式可表示为:写成矩阵的形式为:,是一个阶矩阵,称为回归设计矩阵或资料矩阵。2.1.2多元线性回归模型的基本假定:为了方便地进行模型的参数估计,对回归方程(2)式有如下一些基本的假定:(1)解释变量是确定性变量,不是随机变量,且要求,这里的,表明设计矩阵中的自变量列之间不相关,样本量的个数应大于解释变量的个数,是以个满秩矩阵。(2)高斯-马尔科夫条件:随机误差项具有零均值和同方差性,即:;即假设观测值没有系统误差,随机误差项的平均值为零。随机误差项的协方差为零,表明随机误差项在不同的样本之间是不相关的,不存在序列相关,并且有相同的精度。(3)正态分布的假定条件为:对于多元线性回归的矩阵模型(3)式,这个条件还可以表示为:,由上述假定和多元正态分布的性质可知,随机向量服从维正态分布,回归模型(3)式的期望向量,因此三模型的建立及求解3.1 一些基本的符号说明用表示粮食产量(万吨);表示有效灌溉面积(千公顷);表示播种面积(千公顷);表示化肥施用量(万吨);表示是受灾面积(千公顷);表示农用机械总动力(万千瓦时);表示农业基本建设投资(亿元)。3.2 多元回归模型的初步建立与初步检验3.2.1 多元回归模型的初步建立(1)建立粮食产量与有效灌溉面积、播种面积化肥施用量,受灾面积,农业机械总动力,农业基本建设投资的一个6元线性回归模型: 其中:是待定参数. (2)利用SPSS软件,通过最小二乘估计得到系数的估计值,结果如表5-1所示:表5-1系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)-47279.74611670.296-4.051.002有效灌溉面积.885.411.9762.151.055播种面积.464.056.7608.260.000化肥施用量7.395.6902.02910.724.000受灾面积-.144.024-.318-6.004.000农业机械总动力-.576.159-3.342-3.629.004农业基本建设投资3.582.9991.3423.587.004a. 因变量: 粮食产量表5-2模型汇总模型RR 方调整 R 方标准 估计的误差1.992a.985.976417.705661814464900a. 预测变量: (常量), 农业基本建设投资, 受灾面积, 播种面积, 化肥施用量, 有效灌溉面积, 农业机械总动力。表5-3Anovab模型平方和df均方FSig.1回归1.223E8620386377.595116.842.000a残差1919258.21911174478.020总计1.242E817a. 预测变量: (常量), x6, x4, x2, x3, x1, x5。b. 因变量: y3.2.2 模型的初步检验(1)由输出结果我们可以清楚的看到此多元回归的经验方程为: (2) 从coefficient系数表(表5-1)中可以看到,回归系数检验的t值分别为-4.051、2.151、8.260、10.724、-6.004、-3.629、3.587,自变量t检验的临界值均大于,且从收尾率也可以看出回归系数通过检验,即自变量对被解释变量有显著影响;我们