
极值理论在风险价值度量中.docx
21页极值理论在风险价值度量中的应用1、引言自20世纪70年代以来,金融市场的波动日益加剧,一些金融危机事件频繁发生,如1987年的“黑色周末”和亚洲金融危机,这使金融监管机构和广大的投资者对金融资产价值的暴跌变得尤为敏感金融资产收益率的尖峰、厚尾现象也使传统的正态分布假定受到严重的质疑,因此如何有效地刻画金融资产收益率的尾部特征,给出其渐进分布形式,及各种风险度量模型的准确估计方法和置信区间,依此制定投资策略,确定国家监管制度,成为风险度量和管理所面临的巨大挑战目前,对金融资产损失的估计方法主要包括历史模拟、参数方法和非参数方法历史模拟是一种最简单的方法,它利用损失的经验分布来近似真实分布,但是该方法不能对过去观察不到的数据进行外推,更不能捕获金融资产收益序列的波动率聚类现象,而受到大量的批评参数方法假设收益符合某种特定的分布如:正态分布、t分布等,再通过分布与样本的均值、方差的匹配对参数进行估计,或者是假设收益符合某种特定的过程如:模型、模型,该方法可以在一定程度上解释尖峰后尾现象和波动率聚类问题,具有比较好的整体拟和效果不过参数方法只能对已经到来的灾难信息给出准确的估计,对于即将到来的灾难信息无法给出准确的预测,因此对极端事件的估计缺乏准确性。
非参数方法则主要包括极值理论(EVT),该理论不研究序列的整体分布情况,只关心序列的极值分布情况,利用广义帕累托分布(generalized Pareto distribution)或者广义极值分布(generalized extreme value distribution)来逼近损失的尾部分布情况Danielsson and de Vries(1997)以7支美国股票构成的组合为样本比较各种模型的表现情况,发现EVT的表现比参数方法和历史模拟方法明显的好Longin(2000)认为极值理论的优点在于它的没有假设特定的模型,而是让数据自己去选择,而GARCH模型作为估计风险的一种方法,它只能反映当时的波动率情况,对于没有预期到的变化缺乏准确性不幸的是,Lee and Saltoglu(2003)把EVT模型应用到5个亚洲股票市场指数上,发现表现令人非常不满意,而传统的方法尽管没有一个在各个市场表现都是绝对优于其它模型的,但都比EVT模型的表现好本人认为EVT模型之所以在亚洲市场表现不好主要是因为亚洲金融市场的数据具有很强的序列相关和条件异方差现象,不能满足EVT模型要求的独立同分布假定。
另外,Jondeau and Rockinger(1999),Rootzen and Kluppelberg(1999),Neftci(2000),Gilli and Kellezi(2003)和Christoffersen and Goncalves(2004)也分别采用极值原理和其他模型对金融数据的尾部特征进行了分析和比较本章在传统单纯采用极值理论(假设被分析数据是独立同分布的)描述金融资产收益尾部特征的基础上,把ARMA-(Asymmetric)GARCH模型和极值理论有机的结合起来首先利用ARMA-(Asymmetric)GARCH模型捕获金融数据中的序列自相关(Correlation)和异方差(Heteroskedasticity)现象,利用GMM估计参数,获得近似独立同分布的残差序列,再采用传统的极值理论对经过ARMA-(Asymmetric)GARCH模型筛选处理过的残差进行极值分析,在一定程度上克服了传统单纯采用极值理论时,由于金融数据序列自相关和波动率聚类现象不能满足极值理论假设所造成的估计误差另外,本章还采用Bootstrap的方法给出了采用极值理论估计出的VaR和ES在某一置信水平下的置信区间改进了采用似然比率法估计置信区间时,由于极值事件的小样本所造成的误差。
最后,我们利用中国上证指数自1990年12月19到2004年9月30日的对数日收益率进行实证研究给出上证指数的VaR和ES值,及置信区间2、VaR和ES的概念:VaR(Value-at-Risk)是一种被广泛接受的风险度量工具,2001年的巴塞耳委员会指定VaR模型作为银行标准的风险度量工具它可以定义为在一定的置信水平下,某一资产或投资组合在未来特定时间内的最大损失,或者说是资产组合收益损失分布函数的分位数点假设代表某一金融资产的收益,其密度函数为,则VaR可以表示为: (1) 当密度函数为连续函数是也可以写作:,其中称为分为数函数,它被定义为损失分布的反函数该模型计算简单,在证券组合损失符合正态分布,组合中的证券数量不发生变化时,可以比较有效的控制组合的风险但是VaR模型只关心超过VaR值的频率,而不关心超过VaR值的损失分布情况,且在处理损失符合非正态分布(如后尾现象)及投资组合发生改变时表现不稳定,会出现 (2)的现象,不满足Artzner(1999)提出了一致性风险度量模型的次可加性Expected shortfull)满足Artzner(1999)提出的次可加性、齐次性、单调性、平移不变性条件,是一致性风险度量模型。
它的定义如下:在给定的置信水平下,设是描述证券组合损失的随机变量,是其概率分布函数,令,则可以表示为: (3)在损失的密度函数是连续时,可以简单的表示为: 本章将分别选用这两个模型来度量金融资产的风险,给出在修正过的极值模型下,其估计的方法和置信区间3. ARMA-(Asymmetric)GARCH模型3.1 ARMA-(Asymmetric)GARCH模型的性质模型: (4)其中,是期望为0,方差为常数的独立同分布随机变量,模型在可逆的情况下可以表示为该模型假设的条件期望是可得的,条件方差为常数,通常可以用来解释时间序列的相关性,并可以对时间序列进行的短期预测但是该模型条件方差为常数的假设,使其无法有效的解释在金融时间序列中经常被观察到的波动率聚类现象,为此,我们需要在模型中进一步引入模型我们令,其中是期望为0,方差为常数1,的独立同分布随机变量,是在时刻的条件方差这里我们采用通常使用的最简单的模型,则条件方差可以表示为:,模型也可以表示成平方误的形式: (5)其中,因此模型本质上是平方误的模型的引入不仅可以捕获到金融时间序列的波动率聚类现象,而且可以在一定程度上改善尖峰后尾现象,因为 (6)其中和分别表示和的峰度,的峰度明显大于等于的峰度。
另外,在金融序列中我们还可以明显的观察到,波动率正方向变动与收益率负方向变动的相关性大于与收益率正方向变动的相关性,一种可能的解释是收益率的负方向变动会加大波动幅度而模型认为收益的正方向变动和负方向变动对波动率变动幅度有着相同的影响,为了捕获金融序列波动率变动的这一不对称性,我们引入需要Glosten et al(1993)提出的非对称模型: (7)其中,在这个模型中我们通过项来捕获收益率的正负变动对波动率变动的不同影响,如果收益率的波动与收益率波动率的变动像我们上面所预期的那样,则这样我们就得到了ARMA-(Asymmetric)GARCH模型 (8)3.2、ARMA-(Asymmetric)GARCH模型的参数估计:我们知道在条件正态分布的假设下,可以很容易的利用ARMA-(Asymmetric)GARCH模型的似然函数,给出参数向量的估计值,其中,即使在金融收益率序列残差不满足条件正态分布的情况下,使用正态极大似然估计法,仍然可以得到参数的一致渐进正态非最小方差估计但是这样我们得到的残差将有很大的误差,而是我们下一步进行EVT尾部估计的输入变量,它的有效性将会直接影响我们整个的估计结果,为此我们必须寻找一个更有效的估计方法。
GMM(Generalized Method of Moments)广义矩估计恰好可以满足我们的要求,它不需要假设符合任何分布,只需要的条件矩在Skoglund(2001)“A simple efficient GMM estimator of GARCH models”给出了该估计方法的计算过程和收敛情况下面给去估计的步骤:首先,定义一个行向量 和广义向量 ,其中是工具变量,则参数的GMM估计可以通过下式得到: (9)其中是一个恰当的权重矩阵在Newey and McFadden(1994)中,我们可以知道,有效的GMM估计可以通过另,,其中,是Jacobian行列式把和带入上面的目标函数(9)得到: (10)其中,是一个含有参数的权重矩阵,它的元素可以表示为:其中,,,,,通过上面对目标函数(9)的变化,我们得到函数是恰好可识别的,即参数的最优估计是使函数等于0另外,我们要进行GMM估计还需要一个对参数的初始估计值和对的三阶矩和四阶矩的初始估计值,而这一初始值我们可以通过对ARMA-(Asymmetric)GARCH模型残差符合正态分布的情况进行最大似然估计得到。
这样我们就可以得到有效的参数估计值和残差序列4、极值理论极值理论是测量极端市场条件下风险损失的一种方法,它具有超越样本数据的估计能力,并可以准确地描述分布尾部的分位数它主要包括两类模型:BMM模型(Block Maxima Method)和POT模型(Peaks over Threshold),两类模型的主要区别有:1、极值数据的获取方法上的区别,BMM模型通过对数据进行分组,然后在每个小组中选取最大的一个构成新的极值数据组,并以该数据组进行建模;POT模型则通过事先设定一个阀值,把所有观测到的超过这一阀值的数据构成的数据组,以该数据组作为建模的对象,两个模型的共同点是只考虑尾部的近似表达,而不是对整个分布进行建模2、两个模型分别采用极值理论中的两个不同的定理作为其理论依据,同时也因为获取极值数据的不同方法导致两个模型分别采用不同的分布来拟合极值数据3、BMM模型是一种传统的极值分析方法,主要用于处理具有明显季节性数据的极值问题上,POT模型是一种新型的模型,对数据要求的数量比较少,是现在经常使用的一类极值模型4、BMM模型主要用于对未来一段较长的时间内的VaR和ES预测,而POT则可以进行单步预测,给出在未来一段小的时间内VaR和ES的估计值。
5、BMM模型的前提条件是样本独立同分布,POT模型的前提条件是超限发生的时间服从泊松分布,超限彼此相互独立,服从GPD(generalized Pareto distribution)分布,且超限与超限发生的时间相互独立样本独立同分布可以保证POT模型的前提条件4.1 BMM模型的理论基础假设表示我们采用BMM方法获得的极值数据组,其中n表示每个子样本的大小,则有下面的极限定理成立定理1:(Fisher and Tippett (1928), Gnedenko (1943))假设是一个独立同分布的随机变量序列,如果存在常数,,以及一个非退化的分布函数,使得 成立,则分布函数一定属于下面的三种标准的极值分布: Frechet: Weibull: Gumbel: 从图1可以清楚的Frechet分布用来描述那些极值无上界有下界的分布,Weibull分布用来描述极值分布有上界,无下界的分布,Gumbel分布用来描述极值无上界也无下界的分布我们通常见到的很多分布函数都可以根据他们尾部的状况划分到上面的三种极值分布分布中去,例如:学生分布、帕累托分布(Pareto distribution)、对数Gamma分布、Cauchy distributed根据尾部特征可以划分到Frechet分布中去;均匀分布和Beta分布的尾部分布可以收敛到Weibul。
