
基于协整理论的统计套利方法及实证.docx
11页基于协整理论的统计套利方法及实证 杜夏筠摘要:本文系统分析了统计套利的基本原理和以协整关系为基础的模型的建立方法,以及交易信号的制订,再将其应用到中国股票市场中航空运输业板块进行实证检验,通过协整方法验证了南方航空和东方航空股票之间存在长期稳定的关系,据此建立回归模型并制订交易信号,最终在样本外检测中得到了较好的收益,由此证实了套利空间的存在随着做空机制的完善,统计套利策略在中国市场上逐渐得到应用和发展,这种基于数据和模型的相对客观的交易策略越来越受到投资者的青睐关键词:统计套利;协整关系;信号机制一、引言统计套利作为一种投资策略,是通过对历史数据的分析建立模型来模拟未来证券价格的走势,然后将实际价格与理论价格相对比,利用实际价格与理论价格的暂时偏离挖掘套利机会在统计套利出现以前,市场上的投资者只能通过低买高卖获取收益,这种方式十分依赖于市场走势,风险高,收益率波动较大而统计套利策略不需要依靠市场走势,收益率稳定,且风险可控但统计套利策略需要依赖于融资融券等做空机制的建立和完善,原因在于套利机会的出现具有不确定性,当机会来临时,投资者需要立即拥有所需要的某种标的证券和资金,而融资融券机制使得这种需要成为可能。
我国证券市场前期缺乏做空机制,证券市场的情况又经常表现为牛市短熊市长,在熊市情况下,投资者无法通过做空规避系统风险2011年11月25日,融资融券交易由“试点”转为“常规”,中国迎来双向交易机制的同时,以此为基础的统计套利也在中国证券市场应运而生国内关于统计套利的第一篇研究论文是方昊于2005年6月发表的《统计套利的理论模式及应用分析——基于中国封闭式基金市场的检验》,作者在文中对统计套利策略的原理、模型和交易方法都进行了介绍和分析,然后应用于中国封闭式基金市场进行检验,得出统计套利在我国封闭式基金市场上有效的结论;2007年9月韩广哲和陈守东在《统计套利模型研究——基于上证50指数成分股的检验》中,采用了比协整方法限制更少的方法来建立套利模型,利用逐步回归法和方差比分析来构造资产组合和检测可预测性,并将其应用于上证50指数成分股中进行检验国内对于统计套利的实践起步过晚,理论方法也主要集中于传统的协整方法和主成分分析法等,而国外早在1996年就形成了统计套利的相关理论,到了2006年,在残差分析方面,Thomaidis富有创新意识地将神经网络应用于统计套利分析,利用GARCH自回归模型来寻找证券市场中的投资机会。
二、统计套利理论及交易策略1.统计套利的基本原理统计套利策略的理论基础是均值回复,均值回复是指如果一个资产的价格是平稳序列,那么它就存在一个长期的均值,当其在某个时期内受到干扰因素的影响暂时偏离均值后,其在下个时期会在均衡机制的作用下重新趋于均值统计套利的思路就是找出一对拥有趋同性的资产,趋同性决定着形成它们两者价格的因素中具有共同点,因此它们的价格之间会表现出高度的相关性,在长期内显示为同时上涨或同时下跌,这就使得它们价格的差值成为一个平稳的序列但短时期内由于两种资产各自存在不同的特征,这个差值很可能会受到多种随机因素的干扰而出现偏离,我们认为这个偏离只是临时的,在不存在破坏该均衡的内在机制的前提下,这一对资产价格的差值终将回到均衡状态,从而产生套利机会具体来说,有一对拥有长期均衡关系的股票,两支股票的价差存在一个均值,某一时刻开始出现偏离,当价差偏离到一定程度时开始建仓,卖出被高估的股票,同时买进被低估的股票,当价差回归到一定水平时进行平仓获取收益也就是说统计套利不再关注哪支股票价格的变动,而是关注两支股票价差的变动2.统计套利的交易策略(1)套利对象的选取趋同性原则、高流动性原则和高相关性原则是选取套利对象时需要遵守的三大原则。
趋同性原则是指选择的股票之间应该受到一些共同因素的影响,从而表现出相似的价格走势一般来说,同行业的股票之间具有趋同性,因为同行业间主营业务相似,提供的产品或服务也很相近而非关联性行业之间的共同作用因素相对较少,即使在统计上存在较高的相关性,也可能是样本区间选取的不够长导致的,不存在经济意义高流动性原则是为了降低交易成本,因为统计套利需要进行两个相反方向的操作,一是做多二是做空,如果股票的流动性较差,那么投资者就无法在套利机会出现时迅速以很低的交易成本买卖所需的股票,产生流动性风险高相关性原则是在统计上保证两支股票历史价格走势上的一致性,相关性较高的股票之间容易产生更多的套利机会2)检验协整关系及模型建立进行统计套利的前提是找出一对拥有长期稳定均衡关系的股票或其他证券,在实践中,很多股票的价格序列往往都是非平稳的,我们可以运用计量经济学方法中的协整技术检验这种非平稳时间序列之间的长期稳定的均衡关系在协整关系下,两支股票价格的非平稳序列可以通过一定的线性组合变成一个平稳的序列也就是说,我们以两支股票价格为变量可以建立一个线性的协整模型,其残差序列就会变成一个平稳序列假设具有协整关系的两支股票价格的线性方程为: (1)那么εt就是一个平稳的残差序列。
当两支股票的价格偏离它们的协整关系的时候,εt就偏离了它的均值,一旦偏离超过一定幅度,我们认为下一期存在很大的概率回复到均值3)套利信号机制的建立我们用残差序列偏离其均值的程度来构建交易信号,因此,首先要得到残差偏离序列假设利用协整检验的到的模型为:(2)本文将残差序列看作近似的正态分布,即,由此定义残差偏离序列: (3)下面制订交易信号:①当时,进行建仓操作具体来说,当时,表示Y代表的股票被高估,X代表的股票被低估,此时需要卖出Y股票,同时买入β倍的X股票;当时,表示Y代表的股票被低估,x代表的股票被高估,此时需要买入Y股票,同时卖出β倍的X股票②当时,进行平仓操作,即进行与建仓时相反的操作此时表明残差已经返回均衡状态③当时,为了控制风险,应进行平仓操作因为有时会出现外界因素对股票价格的影响并非暂时的,而是彻底改变了原来的均衡关系,这时为了防控风险,就需要设立一个止损界限这里,,三者的取值决定于投资者的风险偏好情况,这也说明统计套利的风险是可控的三、实证分析1.套利对象的选取根据趋同性原则,本文选取中国证券市场内按行业板块分类下的航空运输业共8支股票的日收盘价进行统计套利策略的应用8支股票包括:中国国航、海南航空、厦门空港、中信海直、南方航空、东方航空、外运发展和航空动力。
本文原始数据来源于锐思数据库,样本时间段选取2012年1月4日至2013年3月12日,其中2012年1月4日至2012年12月31日作为样本内数据,用于建立模型,2013年1月4日至2013年3月12日作为样本外数据,用来检测模型的效果8支股票中,中[来自www.lw5u.Com]国国航和航空动力分别在总样本时间段内存在三周和两个月左右的停牌时间,故剔除掉这两支股票在剩下的6支股票中,根据高流动性原则,使用样本内数据分别计算出它们的流通股平均日换手率,结果为:海南航空44.34%、厦门空港26.63%、中信海直156.32%、南方航空50.62%、东方航空50.62%、外运发展105.57%从中剔除平均日换手率在50%以下的海南航空和厦门空港,对余下4支股票进行分析2.相关性分析此阶段我们基于样本内数据对4支股票两两之间进行皮尔逊相关性分析,结果如表1:表1中显示,仅有南方航空和东方航空的相关系数89.96%接近90%,根据高相关性原则,本文选取南方航空和东方航空构建资产组合进行统计套利的应用分析3.协整检验南方航空和东方航空的日收盘价走势图如图1:根据3.2节的结果,南方航空和东方航空的日收盘价序列的相关系数接近90%,相对较高,图1中也显示两者在样本期间内长期走势基本一致,但这还不能说明两者存在长期稳定的均衡关系,因此需要进一步对两者的协整关系进行检验。
1)单整性检验根据协整理论,要保证南方航空和东方航空股票日收盘价序列之间存在协整关系,首先需要保证两个序列是同阶单整的我们运用ADF检验法先分别对两个序列进行单整性检验检验结果如表2:表2中,两个水平值序列的ADF检验值都大于临界值,不拒绝存在单位根的原假设,说明两个水平值序列都是非平稳的而两个一阶差分序列的ADF值均小于临界值,说明两个一阶差分序列是平稳的,也就是说南方航空和东方航空的日收盘价序列均为一阶单整序列2)残差序列的平稳性检验协整检验的第二步就是要对回归模型的残差序列进行平稳性检验首先,建立回归模型,以NANFANG和DONGFANG分别表示南方航空和东方航空的日收盘价序列,用最小二乘法进行回归,得到下式:NANFANG=-1.0716+1.4172*DONGFANG+εt(4)其中εt为残差序列,经计算其均值为εt=0,标准差为σ=0.2886再次用ADF检验法检验残差序列的平稳性,结果如表3:表3中显示,残差序列的ADF检验值小于10%临界值,也就是说,在0.1的置信水平下模型的残差序列是平稳的,从而认为南方航空和东方航空的日收盘价之间存在协整关系4.建立信号机制根据(4)式的回归模型,计算残差偏离序列:(5)根据2.2节的介绍,用于建立信号机制中的λ1、λ2、λ3满足0≤λ2<λ1<λ3,三者的取值决定于投资者的风险偏好情况。
本文对具体的取值方法不作深入探讨,仅取常用的三个值:λ2=0,λ1=0.5,λ3=1.5又有,因此具体的交易信号为:(1)当│spreadt│≥0.1443时,进行建仓操作即当spreadt≥0.1443时,要卖出南方航空的股票,同时买入1.4172倍的东方航空股票;当spreadt≤-0.1443时,要买入南方航空股票,同时卖出1.4172倍的东方航空股票2)当spreadt=0时,进行平仓操作3)当│spreadt│≥0.4329时,为了防止损失进一步扩大,应进行平仓操作5.套利交易(1)样本外检测下面用2013年1月4日至2013年3月12日样本外数据模拟套利交易,图2为将样本外数据代入(4)式回归模型中得到的spreadt序列随时间变化的走势图(由于样本中时间点并非连续天数,故横轴采用按时间顺序编排的样本序号为坐标)图2显示,2013年1月4日至2013年3月12日期间仅出现一次套利机会2013年1月17日,spread值超过0.5倍标准差,故进行建仓操作,卖出南方航空股票,同时买进1.4172倍的东方航空股票到了1月22日,spread回归均值,进行平仓操作假设每次套利的手续费为0.5%,不考虑融资融券的成本,计算得到此次套利的收益率为6.19%。
2)结果分析由于本文选取的样本外数据时期的限制,3个月内仅出现了一次套利机会,但实践中,套利交易的时间会适当增长,并且投资者可以选取更高频率的数据甚至选择其他的表示价格的数据(如开盘价,复权价等)来寻找更多的套利机会另外,实际操作中统计套利策略的应用可以不仅仅局限于一个行业内部,投资者可以选择分别在更多行业,在更大的股票备选池中挑选符合选取原则并且具有协整关系的股票对来进行套利操作四、总结本文经过对统计套利基本原理和以协整为基础的套利方法的分析论述,将统计套利策略具体地应用到航空运输业,验证了南方航空和东方航空两支股票之间存在长期稳定的均衡关系,并以此建立投资组合,构造协整模型,其后通过对残差偏离序列的分析制定交易信号,最终在样本外检验中得到了6.19%的收益率实证结果说明了套利空间的存在统计套利策略不依靠市场总体走势,这样就规避了市场出现高波动率时期的系统风险同时统计套利策略利用的是两支股票的相对价格,。












