
应用回归分析讲义_十三 岭回归.doc
12页应用回归分析讲义---十三岭回归一、岭回归的引入二、岭回归的SPSS程序三、岭回归参数K的选取,参数粗估计,参数精估计,确定参数模型四、岭回归模型的应用1962年由A.E.Feorl提出,R.W.Kennard在1970年发展的岭回归(Ridge regression),回归系数的有偏估计—岭回归K称为岭参数K=0时为最小二乘估计,K>0,小于1K从0到1逐渐增大,选择一个最合适的K值岭回归用于解决模型的自变量共线性问题 P92YEARYX1X2X3X4X5 1987 231.00 3010.00 1888.0081491.00 14.89 180.92 1979 298.00 3350.00 2195.0086389.00 16.00 420.39 1980 343.00 3688.00 2531.0092204.00 19.53 570.25 1981 401.00 3941.00 2799.0095300.00 21.82 776.71 1982 445.00 4258.00 3054.0099922.00 23.27 792.43 1983 391.00 4736.00 3358.00106044.0 22.91 947.70 1984 554.00 5652.00 3905.00110353.0 26.02 1285.22 1985 744.00 7020.00 4879.00112110.0 27.72 1783.30 1986 997.00 7859.00 5552.00108579.0 32.43 2281.49 1987 1310.00 9313.00 6386.00112429.0 38.91 2690.23 1988 1442.0011738.00 8038.00122645.0 37.38 3169.48 1989 1283.0013176.00 9005.00113807.0 47.19 2450.14 1990 1660.0014384.00 9663.0095712.00 50.68 2746.20 1991 2178.0016557.0010969.0095081.00 55.91 3335.65 1992 2886.0020223.0012985.0099693.00 83.66 3311.50 1993 3383.0024882.0015949.00105458.0 96.08 4152.70建立回归模型,共线性诊断1、VIF,容忍度,条件指数,2、变量X2的系数为负值,经济理论认为应为正相关。
说明共线性造成后果进行岭回归分析一、 岭迹模型系数随参数K变化的曲线岭迹图根据岭迹确定KK=0时表示古典回归二、 岭回归根据岭迹图确定 参数KP193图A,系数趋于0,变量不重要图B.系数由正变负,变化大,对Y有显著影响图C. 古典模型时系数为正,岭回归时系数为负.图D. 两个系数不稳定,一个增大时另一个减少, 但其和稳定,可以考虑保留一个变量.图E. 变量对Y不显著图F. 变量对Y的影响趋于稳定选择标准:1、 各回归系数基本稳定2、 用最小二乘法时不合理的系数用岭回归变得合理3、残差平方和增长不大例岭回归SPSS程序和岭回归模型应用P199变量标准化1、参数K粗估计INCLUDE c:/program files/SPSS/Ridge regression.sps.RIDGEREG DEP=zy /ENTER = zx1,zx2,zx3,zx4,zx5.默认参数K从0 开始,到1,步长为0.052、参数K精估计INCLUDE c:/program files/SPSS/Ridge regression.sps.RIDGEREG DEP=zy /ENTER = zx1,zx2,zx3,zx4,zx5 /START=0.0 /STOP=0.5/INC=0.01.3、确定参数K=0.08时,建立模型INCLUDE c:/program files/SPSS/Ridge regression.sps.RIDGEREG DEP=zy /ENTER = zx1,zx2,zx3,zx4,zx5 /k=0.08 .岭回归选择变量1. 删除系数趋于0的变量2. 删除不稳定的变量例省市区地方财政支 出(亿元)城镇居民年人均可支配收入(元)城镇居民年人均消费性支出(元)农民人均现金收入(元)农民人均生活消费支出(元)社会消费品零售总额(亿元) x1x2x3x4x5y北 京1058.31765313244872453162902.8天 津442.1126399653703230361190.1河 北979.291076700431821662952.9山 西668.889146343305318781401.2内蒙古681.991376929423524461344.1辽 宁1204.491087369549128062999吉 林631.186916795445123061460.8黑龙江787.882736178532125451760.1上 海1646.31864513773872472782973江 苏1673.4123198622603535675699.9浙 江1265.51629412254844554334631.7安 徽713.184716368304321961765福 建593.4123218794496332932345.8江 西56486206109346024841236.2山 东1466.2107457457511427366126.4河 南111686686038301618923358.4湖 北778.787866737345424302964.6湖 南873.495247505369327562459.1广 东2289.11477011810538237087882.6广 西611.592877033299423501397海 南151.28124592936041969268.6重 庆487.4102438623265321421215.8四 川1082.283866891308722742981.4贵 州520.78151615919541552606.9云 南766.392666997217517891034.4西 藏185.5943186171925172473.1陕 西63982726656257618961322.4甘 肃429.38087652922171820632.8青 海169.88058624522881976160.5宁 夏160.38094640434632094174.3新 疆5197990620839211924637.8例1INCLUDE c:/program files/SPSS/Ridge regression.sps.RIDGEREG DEP=y /ENTER = x1,x2,x3,x4,x5.默认参数K从0 开始,到1,步长为0.05例2INCLUDE c:/program files/SPSS/Ridge regression.sps.RIDGEREG DEP=y /ENTER = x1,x2,x3,x4,x5 /START=0.01 /STOP=0.8/INC=0.01.例3例2确定系数为0.35时,INCLUDE c:/program files/SPSS/Ridge regression.sps.RIDGEREG DEP=y /ENTER = x1,x2,x3,x4,x5 /k=0.35 .SPSS宏ridge regression macro,ridge regression macro,ridge regression macroINCLUDE [SPSS installdir]\Ridge regression.sps.RIDGEREG DEP=varname /ENTER = varlist [/START={0**}] [/STOP={1**}] [/INC={0.05**}] {value} {value} {value } [ /K=value] .[SPSS installdir] is the directory in which SPSS is installed.。
