
第13章回归分析.docx
13页第13章 回归分析 第六章 回归分析 第一节 一元线性回归 一、模型建立 1、问题提出: (1)设yx为小麦的亩产量,它与肥料x有关,这种关系可以表示为 yx (x) x. (2) 由于观看(或试验)中总存在随机因素的影响, 即使x固定,小麦的亩产量yx也不完全相同, 因而yx是一个随机变量,从而 x也是一个随机变量. 可以认为 x~N(0, 2). (3) (x)经常可以近似表示为ax b,因此可以认为 yx ax b x. 2、回归的概念 (1) 回归:设x为一般的实变量, x R,都对应着一个随机变量yx, 若Eyx总存在,称Eyx为y关于x的回归,记作 (x). 即 (x) Eyx. (2)一元线性回归:若 (x) ax b,称 (x)为y关于x的一元线性回归. (3) 一元线性回归方程: , ,b通过样本得到 (x) ax b中未知参数a,b的估量值a 为y关于x的一元线性回归方程. a x b称方程y 二、一元线性回归方程 1、Sxx、Syy与Sxy 1 n 2222 Sxx (xi ) xi n xi xi . n i 1 i 1i 1i 1 证明:Sxx nnn 2 (x i 1 n 2 i 2xi ) x 2 xi n xi2 n2. 2 2i 2 i 1 i 1 i 1 nnn 1 n 2222 (2) Syy (yi ) yi n yi yi . n i 1 i 1i 1i 1 n 1n (3) Sxy (xi )(yi ) xiyi n xiyi xi yi. ni 1i 1i 1i 1i 1 n n n nnn 2 证明: Sxy n (x )(y ) xy x y i i ii i i i 1 i 1 i 1 i 1 i 1 n i ii i 1 nnnnn xy n n n( ) xy n . ii 1 2、a,b的估量 设yx ax b x, x~N(0, 2). 样本为:(x1,y1),(x2,y2), ,(xn,yn),x1,x2, ,xn不全为零.则有 a SxySxx n a . , b 证明:(1)已知yx~N(ax b, 2). 1 (2)作L (yi;a,b) e 2 i 1 n n 12 (yi axi b)2 i 1 n , 欲使L达到最大,只需R (y ax b) i i i 1 2 取得最小. n M(3)令 2 xi(yi axi b) 0, ai 1 n M 2 (yi axi b) 0. bi 1 即 xy a x ii i 1 i 1 nn 2 i bn 0, 或 a x bn xiyi, 2ii 1 i 1 nn n nb 0. an2 n . 于是:a xy ii 1 n i n n2 SxySxx x i 1 n a . , b 2 i 3、一元线性回归方程: S a , 其中:a . a x b xy, by Sxx 例1 以家庭为单位,某种商品年需求量y与该商品价格x之间的一组调查数据如表 求解: xx(2) 29 2.9, 21 2.1, 1010 n 2 1 n 12 Sxx xi xi 91.28 292 7.18, n i 1 10i 1 nn 1n1 Sxy xiyi xi yi 54.97 29 21 5.93. ni 1i 110i 1 S 5.93 xy (3) a 0.8259, Sxx7.18 a 2.1 ( 0.8259 b) 2.9 4.4951. 于是y关于x的一元线性回归方程为 0.8259x 4.4951. y 4、 2的估量 (1) 残差平方和:Q (y i 1 n i )2 i) (yi a xi b yi 2 i 1 n Sxy. (2) Q的分解式:Q Syy a 证明: 因 a n SxySxx a .所以 ,b n )2 (y a xi b )2 Q (yi a i xi a (xi )]2 Syy 2a Sxy a 2Sxx [(yi ) a i 1i 1 n i 1 Sxy a Syy 2a (3) SxySxx Sxy. Sxx Syy a Q 2 ~ 2(n 2). (证明略) Q1 Sxy). (Syy a n 2n 2 Q Q 证明:因 2~ 2(n 2),所以E 2 n 2, 2 2 (4) 的无偏估量: 22 Q Q ) E E( E 2 (n 2) 2. n 2 n 2 n 2 2 2. 例2 同例1,求 2的无偏估量 解:(1)由例1列表知 1 n 12 Syy yi yi 50.68 212 6.58. n i 1 10i 1 Sxy 6.58 ( 0.8259(2)Q Syy a) ( 5.93) 1.6824. Q1 2 1.6824 0.2103. (3)于是 n 28 n 2 其次节 线性回归假设检验与系数估量 一、线性假设检验 1、一元线性回归显著性检验的思路 若 (x) ax b,那么a 0. 否则,若a 0,有yx b x,可见y基本上不依靠与x. 2、检验统计量:U aa Sxx~t(n 2) (证明略) 3、线性假设检验的步骤 (1)假设 H0:a 0, H1:a 0. (2)检验统计量:U (3)检验值:u0 a Sxx~t(n 2) a s xx (4)临界值:b t (n 2) 2 (5)拒绝域B:|U| b (6)检验:检查是否有|u0| b 推断:拒绝H0、接受H0或其他 (8)结论:据检验结果认为一元线性回归是否显著. 例1 检验第一节例1中的一元线性回归是否显著?( 0.05) 0.8259, 2 0.2103,Sxx 7.18. 解:已知n 10,a (1)假设 H0:a 0, H1:a 0. (2)检验统计量:U (3)检验值:u0 a Sxx~t(n 2) a 0.8259Sxx 7.18 4.8258 0.2103 (4)临界值:b t (n 2) t0.025(8) 2.306 2 (5)拒绝域B:|U| b (6)检验:由于 |u0| 4.8258 2.306 b (7)推断:拒绝H0 (8)结论:可以认为一元线性回归效果显著. 二、系数a的1 置信区间 t (n 2) Sxx2 a aT aaa 证明:取Z Sxx~t(n 2)即证. V /Sxx a 例2 求第一节例1中a的0.95置信区间. 0.8259, 2 0.2103,Sxx 7.18,b t (n 2) 2.306. 解:已知a 2 于是,a的0.95置信区间为 a t (n 2) Sxx2 0.2103 ( 1.2206 0.8259 2.306, 0.4312). 7.18 预祝同学们取得优异成果! 联系: 7912 E_mail: q58@ 13Word版本。
