
关于水稻产量影响因素的多元回归分析.docx
16页目录摘要1、研究背景及意义2、问题的提出3、模型的建立和求解3.1 相关分析一简单散点图3.2 多元回归分析一参数估计3.3 三种检验3.3.1 回归方程的拟合优度检验3.3.2 回归方程的显著性检验一F检验3.3.3 参数显著Ii检验一t检验4、多重共线性检验分析5、自相关分析6、模型的修正6.1逐步修正法关于水稻产量影响因素的多元线性回归分析摘要本文的主要目的是对影响水稻产量的因素进展分析,主要运用了SPSS18,采用多元线性回归分析的方法对我国最近 18年影响水稻产量的主要因素进展了 分析,建立了以水稻产量为因变量,水稻播种面积、化肥施用量、生猪存栏量和 降水量四种影响因素为自变量的多元线性回归模型,利用模型对各个因素进展了统计分析,并且对模型进展了修正检验,在此根底上提出一些提高水稻产量的合 理化建议关键词:SPSS18水稻产量 多元回归线性分析1、研究背景及意义我国是一个人口大国,众所周知,很多偏远地方的人们仍然处在饥饿的边缘,水稻产量的提高首先可以很好的改善局部地区的粮食紧问题,为我国经济的开展和社会的稳定提供有效的保障,其次,水稻产量的提高有利于稳定粮食的价格 因此,对影响水稻产量的因素进展多元回归线性分析可以得出各个因素的影响程 度,从而采取正确的措施,以最少的投入得到最大的产量,这对于农业的科学开 展是十分必要的。
2、问题的提出下面的表格给出了我国最近 18年来水稻产量与影响和制约水稻产量的主要 因素的有关数据表1 18年来水稻产量和相关影响数据水稻播种面化肥施用量〔万生猪存栏量〔万降水量水稻总产量〔万积〔万亩〕公斤〕口〕〔10mm〕公斤〕147.002.0015.0027.00154.50148.003.0026.0038.00200.00154.005.0033.0020.00227.50157.009.0038.0099.00260.00153.006.5041.0043.00208.00151.005.0039.0033.00229.50151.007.5037.0046.00265.50154.008.0038.0078.00229.00155.0013.5044.0052.00303.50155.0018.0051.0022.00270.50156.0023.0053.0039.00298.50155.0023.5051.0028.00229.00157.0024.0051.0046.00309.50156.0030.0052.0059.00309.00159.0048.0052.0070.00371.00164.0095.5057.0052.00402.50164.0093.0068.0038.00429.50156.0097.5074.0032.00427.50数据来源:中国国家统计局,?中国统计年鉴?在现实生活中,影响水稻产量的因素有很多,但是不能一一列举,我们只是选择了水稻播种面积、化肥施用量、生猪存栏量和降水量4个影响因素作为解释 变量进展了回归分析。
变量的定义如下:Y:水稻总产量〔万公斤〕X1:水稻播种面积〔万亩〕X2:化肥施用量〔万公斤〕X3:生猪存栏量〔万口〕X4:降水量〔10mm〕下面利用SPSS18对变量间的关系进展求解3、模型的建立和求解3.1 相关分析一简单散点图按:”图形一旧对话框一散点/点状图〃顺序做,做数据散点图,观测因变量 和自变量之间关系是否存性关系水稻总产出万畲450.00-4OT.D0- 35OW 3<»00-250.00200 00- 15aoe-145 00 150 00 155 00 160 00 165.M水楣播种面积(力亩)图1水稻产量与水稻播种面积之间的简单散点图水楞6产量万公斤4 眈 OCT-100 DC-364),00-300M-250.00-2M(X>150. ao即叩100.00水楞6产量万公斤woo图4 水稻产量与降水量之间的简单散点图从上面四个散点图可以看出,水稻种植面积、化肥施用量、生猪存栏量和水稻产量存在明显的相关关系,降水量与水稻产量的相关关系不是那么的明显这样的话,我们就可以建立水稻产量与水稻播种面积、化肥施用量、生猪存栏量、降水量之间建立线性回归模型3.2 多元回归线性分析一参数估计以水稻产量Y为因变量,X1:水稻播种面积〔万亩〕,X2:化肥施用量〔万 公斤〕,X3:生猪存栏量〔万口〕,X4:降水量〔10mm〕为自变量,用”分析 一回归一线性一进入〃方法进展参数的最小二乘估计,得到回归系数的表格, 结果如表2所示:表2系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量)-160.312410.391-.391.702水稻播种面积〔万亩〕1.8782.836.105.662.519化肥施用量〔万公斤〕1.284.379.5293.391.005生猪存栏量〔万口〕2.090.885.3702.361.034降水量〔10mm〕.483.359.1241.343.202a.因变量:水稻总产量〔万公斤〕初步得到该问题的多元回归线性分析模型:Y=-160.312+1.878X1+1.284X2+2.090X3+0.483X4从经济意义上讲,水稻的播种面积增大,化肥施用量加大,生猪存栏量变多,, 降水量变大,水稻的产量会变大,因变量与4个自变量之间成正相关的关系,得 到的模型符合现实的经济意义。 3.3 三种检验3.3. 1回归方程的拟合优度检验表3显示了相关系数R、相关系数的平方、调整的相关系数的平方和估计值误 差和DW,这些数据反映了因变量与自变量之间的线性相关强度表3模型汇总b模型RR方调整R方标准估计的误差Durbin-Watso n1.958 a.918.89326.127802.705a.预测变量:(常量),降水量〔10mm〕,生猪存栏量〔万口〕,化肥施用量〔万公斤〕 水稻播种面积〔万亩〕b.因变量:水稻总产量〔万公斤〕由表3可以看出,R的平方=0.918 调整后的R的平方=0.893样本决定系数和调整样本系数都很接近于1,拟合度很高,故通过拟合优度检验,认为解释变量应该对被解释变量有显著解释能力3.3.2 回归方程的显著性检验一F检验表4显示因变量的方差来源、方差平方和、自由度、均方、F检验统计量的观测值和显著性水平方差来源有回归、残差、和总和从表中可以看出, F=36.355,回归的自由度是4,残差的自由度是13,总计的自由度是17.显著性 水平是0.05.表4 Anova b模型平方和df均方FSig.1回归99271.465424817.86636.355.000 a残差8874.60513682.662总计108146.06917a.预测变量:(常量),降水量〔10mm〕,生猪存栏量〔万口〕,化肥施用量〔万公斤〕,水 稻播种面积〔万亩〕。 b.因变量:水稻总产量〔万公斤〕此模型中样本数是18,自由变量是4个,故该模型的F统计量服从F(4,13),由此查表得到临界值F〔4, 13〕=3.18 ,由上表可知本模型的F值是36.355.大于临界值,故拒绝原假设,认为回归方程显著,即模型通过方程的显著性检验3.3.3 参数的显著性检验一T检验,显著性水平为0.05表5系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量)-160.312410.391-.391.702水稻播种面积〔万亩〕1.8782.836.105.662.519化肥施用量〔万公斤〕1.284.379.5293.391.005生猪存栏量〔万口〕2.090.885.3702.361.034降水量〔10mm〕.483.359.1241.343.202a.因变量:水稻总产量〔万公斤〕此模型中样本是18,自变量个数是4,那么该模型各回归系数的T统计量应服 从T(13)的分布,查询临界值为1.77,由上表得到的5个回归系数的T的值分别是 -0.391、0.662、3.391、2.361、1.343 ,水稻播种面积降水量T的绝对值小于临 界值,化肥施用量和生猪存栏量大雨临界值, 这些模型可能存在多重共线性,下 面将进展该模型是否存在多重共线性检验。 4、多重共线性分析由以下三种方法均能看出该模型是否存在多重共线性A、变量间的相关分析表6相关性相关性水稻播种面 积〔万亩〕化肥施用量〔万 公斤〕生猪存栏量〔万口〕降水量〔10mm〕水稻总产量 〔万公斤〕水稻播种面积Pearson相关1 **.774**.782.280**.839〔万亩〕性显著性〔双侧〕.000.000.260.000N1818181818化肥施用量Pearson相关 **.7741**.826-.026_ _ ** .913〔万公斤〕性显著性〔双侧〕.000.000.917.000N1818181818生猪存栏量Pearson相关**.782**.8261-.008**.889〔万口〕性显著性〔双侧〕.000.000.974.000N1818181818降水量Pearson 相关.280-.026-.0081.1。












