
线性模型-案例分析要点.doc
16页1 案例案例 1 1:用回归模型预测木材剩余物:用回归模型预测木材剩余物 (一元线性回归模型(file:b1c3) ) 伊春林区位于黑龙江省东北部全区有森林面积 2189732 公顷,木材蓄积量为 23246.02 万 m3森林覆盖率为 62.5%,是我国主要的木材工业基地之一1999 年伊春林区 木材采伐量为 532 万 m3按此速度 44 年之后,1999 年的蓄积量将被采伐一空所以目前 亟待调整木材采伐规划与方式,保护森林生态环境为缓解森林资源危机,并解决部分职 工就业问题,除了做好木材的深加工外,还要充分利用木材剩余物生产林业产品,如纸浆、 纸袋、纸板等因此预测林区的年木材剩余物是安排木材剩余物加工生产的一个关键环节 下面,利用简单线性回归模型预测林区每年的木材剩余物显然引起木材剩余物变化的关 键因素是年木材采伐量 伊春林区 16 个林业局 1999 年木材剩余物和年木材采伐量数据见附表散点图见图 2.14观测点近似服从线性关系建立一元线性回归模型如下: yt = 0 + 1 xt + ut 5 10 15 20 25 30 10203040506070 X Y 图 2.14 年剩余物 yt和年木材采伐量 xt散点图 图 2.15 Eviews 输出结果 Eviews 估计结果见图 2.15。
下面分析 Eviews 输出结果先看图 2.15 的最上部分LS 表示本次回归是最小二乘回 归被解释变量是 yt本次估计用了 16 对样本观测值输出格式的中间部分给出 5 列第 2 1 列给出截距项(C)和解释变量 xt第 2 列给出相应项的回归参数估计值(和) 第 0 ˆ 1 ˆ 根据 Eviews 输出结果(图 2.15) ,写出 OLS 估计式如下: = -0.7629 + 0.4043 xt (2.64) t y ˆ (-0.6) (12.1) R2 = 0.91, s. e. = 2.04 其中括号内数字是相应 t 统计量的值s.e.是回归函数的标准误差,即 =R2是可决系数R 2 = 0.91 说明上式的拟合情况较好yt变差的 91%由ˆ)216(ˆ 2 t u 变量 xt解释检验回归系数显著性的原假设和备择假设是(给定 = 0.05) H0:1 = 0; H1:1 0 图 2.16 残差图 因为 t = 12.1 t0.05 (14) = 2.15,所以检验结果是拒绝1 = 0,即认为年木材剩余物和年木材采 伐量之间存在回归关系。
上述模型的经济解释是,对于伊春林区每采伐 1 m3木材,将平均 产生 0.4 m3的剩余物 图 2.16 给出相应的残差图Actual 表示 yt的实际观测值,Fitted 表示 yt的拟合值, t y ˆ Residual 表示残差残差图中的两条虚线与中心线的距离表示残差的一个标准差,即 t u ˆ s.e.通过残差图可以看到,大部分残差值都落在了正、负一个标准差之内 估计1的置信区间由 t = P { t0.05 (14) } = 0.95 ) ˆ ( 11 1 ˆ s 得 t0.05 (14) 11 ˆ ) ˆ ( 1 s 1的置信区间是 [- t0.05 (14) , + t0.05 (14) ] 1 ˆ ) ˆ ( 1 s 1 ˆ ) ˆ ( 1 s [0.4043 - 2.15 0.0334, 0.4043 + 2.15 0.0334] [0.3325, 0.4761] (2.65) 3 以 95%的置信度认为,1的真值范围应在[0.3325, 0.4761 ]范围中 下面求 yt的点预测和置信区间预测。
假设乌伊岭林业局 2000 年计划采伐木材 20 万 m3,求木材剩余物的点预测值 2000 = - 0.7629 + 0.4043 x2000 y ˆ = -0.7629 + 0.4043 20 = 7.3231 万 m3 (2.66) s2( 2000) = (+ ) y ˆ 2 ˆ T 1 2 2 )( )( xx xxF = 4.1453 (+) = 0.4546 16 1 2606.3722 )25.3320( 2 s( 2000) = = 0.6742 y ˆ 4546 . 0 因为 E( 2000) = E( +x2000 ) = 0 + 1 x2000 = E(y2000) y ˆ 0 ˆ 1 ˆ t = t (T-2) )ˆ( )(ˆ 2000 20002000 ys yEy 则置信度为 0.95 的 2000 年平均木材剩余物 E(y2000)的置信区间是 2000 t0.05 (14) s(2000) = 7.3231 2.15 0.6742 y ˆ y ˆ = 5.8736, 8.7726 (2.67) 从而得出预测结果,2000 年若采伐木材 20 万 m3,产生木材剩余物的点估计值是 7.3231 万 m3。
平均木材剩余物产出量的置信区间估计是在 [5.8736, 8.7726] 万 m3之间从而为 恰当安排 2000 年木材剩余物的加工生产提供依据 附数据如下: 林业局名年木材剩余物 yt(万 m3) 年木材采伐量 xt(万 m3) 乌伊岭26.1361.4 东风23.4948.3 新青21.9751.8 红星11.5335.9 五营7.1817.8 6.8017.0 友好18.4355.0 翠峦11.6932.7 乌马河6.8017.0 美溪9.6927.3 大丰7.9921.5 南岔12.1535.5 带岭6.8017.0 朗乡17.2050.0 桃山9.5030.0 双丰5.5213.8 合计202.87532.00 4 例例 2: 刻卜勒(刻卜勒(J. Kepler)行星运行第三定律)行星运行第三定律 ((file:kepler3)) 把地球与太阳的距离定为 1 个单位地球绕太阳公转一周的时间为 1 个单位(年) 那 么太阳系 9 个行星与太阳的距离(D)和绕太阳各公转一周所需时间(T)的数据(第谷 (B. Tycho)的观测数据)如下: obs水星金星地球火星木星土星天王星 海王星冥王星 DISTANCE0.3870.72311.525.29.5419.230.139.5 Time0.240.61511.8811.929.584165248 9 个行星与太阳的距离和绕太阳公转一周的时间之间有什么规律?刻卜勒(Johannes Kepler, 1571-1630,德国人)坚信 9 个行星绕太阳运行,一定有规律可循。
经过艰苦的努 力,他终于发现了行星运行第三定律, T2 = D3 obs水星金星地球火星木星土星天王星 海王星冥王星 DISTANCE0.3870.72311.525.29.5419.230.139.5 Time0.240.61511.8811.929.584165248 D30.0570.37713.512140.6868.370782727161630 T20.0570.37813.534141.6870.270562722561504 0 100 200 300 010203040 DISTANCE TIME -2 0 2 4 6 -101234 LOG(DISTANCE) LOG(TIME) 5 log(T) = 1.5 log(D) + t u ˆ (4492) R2 = 0.999999, s.e.= 0.002 log(T) = (3/2) log(D), 2 log(T) = 3 log(D), log(T2) = log(D3) T2 = D3 案例案例 3 中国宏观消费分析(中国宏观消费分析(file:china)) 摘自经济蓝皮书摘自经济蓝皮书《2004《2004 年:中国经济形势分析与预测年:中国经济形势分析与预测》》和第和第 1 1 章案例章案例 按照我国现行国民经济核算体系,国内生产总值(按支出法计算)是由最终消费、资 本形成总额和货物与服务的净出口之和三部分组成。
前两部分占绝大多数其中最终消费 又分为居民消费和政府消费两类而居民消费又可分为农村居民消费和城镇居民消费 在这种核算体系下,居民消费包括居民个人日常生活中衣、食、住、用等物质消费以 及在文化生活服务性支出中属于物质产品的消费 政府消费包括国家机关、国防、治安、文教、卫生、科研事业单位,经济建设部门的 事业单位,人民团体等非生产机构使用的燃料、电力、办公用品、图书、设备等物质消费 国内生产总值中最终消费与资本形成总额的比例关系,即旧核算体系下国民收入中消 费与积累的比例关系是国民经济正常运行的最基本的比例关系如果这一比例关系发生严 6 重失调,最终会成为制约经济正常运行的严重障碍 下面分析中国的消费问题为消除物价变动因素以及异方差的影响,以下分析所用的 数据均为不变价格数据(1952 = 1)以及分别取自然对数后的数据 图 1.1 给出不变价格的国内生产总值与消费曲线,图 1.2 和图 1.3 分别给出国内生产总 值与消费的年增长率曲线 0 5000 10000 15000 20000 25000 55606570758085909500 CONSPGDPP -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 55606570758085909500 growth of consumptiongrowth of GDP 图 1.1 国内生产总值与消费(不变价格)曲线 图 1.2 国内生产总值与消费年增长率曲线 由图 1.1、1.2 可以看出国内生产总值与消费的增长都很快。
国内生产总值曲线的波动 幅度相比较大消费曲线的波动幅度相对较小这与宏观消费行为具有“惯性”有关他 既不可能随时间突然大幅增加,也不可能随时间突然大幅减少 1952-19781979-2002 平均增长率年增长率的标准差平均增长率年增长率的标准差 GDP5.76%0.109.15%0.044 消费4.79%0.059.18%0.040 首先结合图 1.3 对国内生产总值序列的增长率变化做进一步分析1952-1957 年国民收 入呈较稳步发展以不变价格计算,平均年增长率为 7.97%1958 年开始的大跃进使经济 发展速度突然加快在计划经济体制下,这种人为的提高经济发展速度超出了国家物质基 础所能承受的限度,所以在维持了短短两年超高速增长(1958 年的年增长率为 16.9%,1959 年的年增长率为 11.4%)之后,经济发展便出现了大倒退1960 年几乎为零 增长1961 和 1962 年连续 2 年出现建国以来从未有过的负增长(分别为-27.2% 和 -11.1%) 由于国家及时采取了一系列经济调整措施,1963-1966 年国民经济迅速得到恢复,并出现 持续高增长态势上述 4 年的增长率分别为 17.8%, 15.8%, 16.1% 和 12.5%。
1966 年开始 的文化革命使中国经济进入一个很不稳定的发展阶段1967 和 1968 年国民经济再度出现 负增长,随后经济发展出现“振荡”现象自 1978 年实行改革开放政策以来,在由计划经 济向市场经济转变过程中,经济发展突飞猛进1952-1978 年国民收入年平均增长率为 5.76%1978-2002 年的年平均增长率为 9.15%后一时期是前一时期的 1.6 倍(不变价格) 在后一时期里,经济增长速度如此之高,持续时间如此之长,发展趋势如此之稳定,在我 国的经济发展史上是没有先例的 7 0.55 0.60 0.65 0.70 0.75 0.80。












