电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本
换一换
首页 金锄头文库 > 资源分类 > DOC文档下载
分享到微信 分享到微博 分享到QQ空间

分位数回归

  • 资源ID:476897397       资源大小:1.12MB        全文页数:27页
  • 资源格式: DOC        下载积分:20金贝
快捷下载 游客一键下载
账号登录下载
微信登录下载
三方登录下载: 微信开放平台登录   支付宝登录   QQ登录  
二维码
微信扫一扫登录
下载资源需要20金贝
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
如填写123,账号就是123,密码也是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

 
账号:
密码:
验证码:   换一换
  忘记密码?
    
1、金锄头文库是“C2C”交易模式,即卖家上传的文档直接由买家下载,本站只是中间服务平台,本站所有文档下载所得的收益全部归上传人(卖家)所有,作为网络服务商,若您的权利被侵害请及时联系右侧客服;
2、如你看到网页展示的文档有jinchutou.com水印,是因预览和防盗链等技术需要对部份页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有jinchutou.com水印标识,下载后原文更清晰;
3、所有的PPT和DOC文档都被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;下载前须认真查看,确认无误后再购买;
4、文档大部份都是可以预览的,金锄头文库作为内容存储提供商,无法对各卖家所售文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;
5、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据;
6、如果您还有什么不清楚的或需要我们协助,可以点击右侧栏的客服。
下载须知 | 常见问题汇总

分位数回归

第15章 分位数回归模型15.1 总体分位数和总体中位数15.2 总体中位数的估计15.3 分位数回归15.4 分位数回归模型的估计15.5 分位数回归模型的检验15.6 分位数的计算与分位数回归的EViews操作15.7 分位数回归的案例分析以往介绍的回归模型实际上是研究被解释变量的条件期望。人们当然也关心解释变量与被解释变量分布的中位数,分位数呈何种关系。这就是分位数回归,它最早由Koenker和Bassett(1978)提出,是估计一组回归变量X与被解释变量Y的分位数之间线性关系的建模方法。正如普通最小二乘OLS回归估计量的计算是基于最小化残差平方和一样,分位数回归估计量的计算也是基于一种非对称形式的绝对值残差最小化,其中,中位数回归运用的是最小绝对值离差估计(LAD,least absolute deviations estimator)。它和OLS主要区别在于回归系数的估计方法和其渐近分布的估计。在残差检验、回归系数检验、模型设定、预测等方面则基本相同。 分位数回归的优点是,(1)能够更加全面的描述被解释变量条件分布的全貌,而不是仅仅分析被解释变量的条件期望(均值),也可以分析解释变量如何影响被解释变量的中位数、分位数等。不同分位数下的回归系数估计量常常不同,即解释变量对不同水平被解释变量的影响不同。 另外,中位数回归的估计方法与最小二乘法相比,估计结果对离群值则表现的更加稳健,而且,分位数回归对误差项并不要求很强的假设条件,因此对于非正态分布而言,分位数回归系数估计量则更加稳健。15.1 总体分位数和总体中位数在介绍分位数回归之前先介绍分位数和中位数概念。对于一个连续随机变量y,其总体第分位数是y()的定义是:y小于等于y()的概率是,即 = P( y y() = F(y()其中P(×)表示概率,F(y() 表示y的累积(概率)分布函数(cdf)。 比如y(0.25) = 3,则意味着y 3的概率是0.25。且有 y() = F-1(y()即F(y()的反函数是y()。当=0.5时,y() 是y的中位数。= 0.75时,y() 是y的第3/4分位数,= 0.25时,y() 是y的第1/4分位数。若y服从标准正态分布,y(0.5) = 0,y(0.95) =1.645,y(0.975) =1.960。另外,如果随机变量y的分布是对称的,那么其均值与中位数是相同的。当其中位数小于均值时,分布是右偏的。反之,分布是左偏的。对于回归模型,被解释变量yt对以X为条件的第分位数用函数y()t|X表示,其含义是:以X为条件的yt小于等于y()t|X的概率是。这里的概率是用yt对X的条件分布计算的。且有 y()t|X = F-1(y()t|X)其中F(y()t|X) 是yt在给定X条件下的累积概率分布函数(cdf)。则y()t|X称作被解释变量yt对X的条件分位数函数。而F '(y()t|X)= f (y()t|X)则称作分位数概率密度函数。其中F'(y()t|X)表示F(y()t|X)对y()t|X求导。15.2 总体中位数的估计 在介绍分位数回归之前,先来看中位数的估计和中位数回归。下面以连续变量为例介绍定理15.1。 定理15.1 连续变量用y表示,其概率密度函数用f(y)表示,累计概率密度函数用F(y)表示,y的中位数用y(0.5)表示,则y与任一值a的离差绝对值的期望以a = y(0.5) 时为最小。 证明: = = (15.1) 根据莱布尼兹公式,若,则有。令,则有。运用于式(15.1),得 = = 式(15.1)求极小的一阶条件是= 0,即=0,。这意味着a等于中位数y(0.5)。 a = y(0.5) 与定理15.1等价的表述是以a = y(0.5)(中位数)时为最小。因此,中位数回归估计量可以通过最小绝对离差法(least absolute deviation, LAD)估计。其中X和b分别为(k´1)阶列向量。 同理,对于线性回归模型yt = X ¢b + ut,通过求最小,估计b的中位数回归系数估计量,从而得到yt的中位数回归估计量。15.3 分位数回归 Koenker和Bassett(1978)证明,若用表示yt的分位数回归估计量,则对于以检查函数(check function)wt为权数,yt 对任意值a的加权离差绝对值和只有在a =时取得最小值。其中 = (15.2)tÎ(0, 1)。据此,分位数回归可以通过加权的最小绝对离差和法(weighted least absolute deviation, WLAD)进行估计。 根据式(15.2),对于线性回归模型yt = X ¢b + ut, 求第t分位数回归方程系数的估计量的方法是求下式(目标函数)最小, (15.3)其中表示第t分位数回归方程对应的残差。tÎ(0, 1)。第t分位数的回归方程表达式是 =其中X,b都是k´1阶列向量。称作分位数回归系数估计量,或最小绝对离差和估计量,估计方法称作最小绝对离差和估计法。 当t=0.5时,式(15.3)变为 =称作中位数回归方程,称作中位数回归系数估计量。 一旦得到估计的分位数回归方程,就可以计算分位数回归的残差。 - 对一个样本,估计的分位数回归式越多,对被解释变量yt条件分布的理解就越充分。以一元回归为例,如果用LAD法估计的中位数回归直线与用OLS法估计的均值回归直线有显著差别,则表明被解释变量yt的分布是非对称的。如果散点图上侧分位数回归直线之间与下侧分位数回归直线之间相比,相互比较接近,则说明被解释变量yt的分布是左偏倚的。反之是右偏倚的。对于不同分位数回归函数如果回归系数的差异很大,说明在不同分位数上解释变量对被解释变量的影响是不同的。15.4 分位数回归模型的估计由于目标函数(15.3)不可微,因此传统的对目标函数求导的方法不再适用。估计分位数回归方程参数的一种较好的方法是线性规划方法。基于Barrodale和Roberts (1973,以下简写为BR)提出的单纯形法(simplex algorithm),Koenker和DOrey(1987)提出一种估计分位数回归系数的方法。EViews中应用的是上述算法的改进形式。BR算法由于其非有效性和大样本下的一些非优良特性曾备受批评。Koenker和Hallock(2001) 以及Portnoy和Koenker(1997)通过模拟证实,与内点法(interior point method)等替代方法相比,BR算法的估计次数往往较多,大约是样本容量的平方次数。然而,改进的BR算法的估计次数在一定程度上是可以接受的,大约是样本容量的线性倍次数,在实际中是可以使用的。分位数回归方程的BR算法原理略。下面讨论分位数回归系数估计量的渐近分布。在弱条件下,分位数回归系数渐近服从正态分布(Koenker, 2005)。回归系数的方差协方差矩阵的计算在分位数回归的系数估计中占有重要位置。其方差协方差矩阵的估计方法根据分位数密度函数是否与解释变量相关分为三种方法:误差项独立同分布(i.i.d.)假设下的直接估计方法。由Koenker和Bassett(1978)提出。误差项独立但不同分布(i.n.i.d.)条件下的直接估计方法。误差项独立同分布(i.i.d.)和独立但不同分布(i.n.i.d.)条件下都可使用的自举法。(1)独立同分布假设下的参数渐近分布Koenker和Bassett(1978)在独立同分布假设下得出分位数回归系数渐近服从正态分布,可以表述为在弱条件下: (15.5)其中 (15.6) (15.7)其中s() 称为稀疏函数(Sparsity function)或分位数密度函数(quantile density function)。s()是分位数函数的导数,或在第分位数条件下概率密度函数的倒数(见Welsh,1988)。另外,模型误差项独立同分布假设意味着s()与解释变量X无关,因此,分位数方程只和X在局部期间相关,即所有的条件分位数平面互相平行。事实上,式(15.5)中的就是误差项独立同分布假设下解释变量的回归系数估计量的渐近方差协方差矩阵表达式,而代表的是一般回归方程中随机误差项的方差。误差项独立同分布假设下,分位数回归参数估计量的渐近方差协方差矩阵表达式中含有s(),但s() 是未知分布的函数,而且必须要估计。EViews提供了三种估计s()的方法。两种是基于Siddiqui(1960)的方法分别提出的差分商方法(Siddiqui Difference Quotient)(Koenker(1994)以及Bassett和Koenker(1982)),一种是核密度(Kernel Density)估计法。简述如下:Siddiqui差分商法:差分商方法是用实际的分位数函数构造一个简单的差分商,从而求得s()的估计量,表达式如下: (15.8)其中带宽hn随着样本容量n而趋向于0。要计算()需要做两件事,一是得到分位数函数在两个点上的值,二是确定带宽。EViews中提供了两种Siddiqui 差分商法。计算分位数密度函数的第一种方法由Bassett和Koenker (1982)提出,EViews将其称之为Siddiqui (mean fitted) 方法。这种方法需要重新估计两个分位数回归模型在 - hn和 + hn上的拟和值,进而用不同的估计参数计算分位数函数的拟和值。最终s()的估计量的数学表达式如下,对任意X*有: (15.9)独立同分布假设意味着X*可以取任何值,Bassett和Koenker建议取X的均值,其优点是:估计的精度在该点达到最大;且估计的分位数函数对是单调的,因此对一个恰当的hn,()的值总是正的。另一种Siddiqui 差分商法由Koenker(1994) 提出。其计算量相对较小,只需计算原分位数回归方程中残差的第 - hn和 + hn实际分位数,计算时排除在估计中设为零的k个残差,并插入新值以获得分位数的分段线性形式。EViews中把这种方法叫做Siddiqui (residual) 方法。上述两种Siddiqui方法都需要估计带宽hn。EViews 提供了三种估计带宽的方法:Bofinger (1975) 法,Hall-Sheather (1988) 法和Chamberlain (1994)方法。Bofinger(1975)提出的估计带宽的表达式为:

注意事项

本文(分位数回归)为本站会员(公****)主动上传,金锄头文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即阅读金锄头文库的“版权提示”【网址:https://www.jinchutou.com/h-59.html】,按提示上传提交保证函及证明材料,经审查核实后我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.