电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本
换一换
首页 金锄头文库 > 资源分类 > DOCX文档下载
分享到微信 分享到微博 分享到QQ空间

回归大作业-基于多元线性回归的期权价格预测模型

  • 资源ID:470139027       资源大小:808.34KB        全文页数:18页
  • 资源格式: DOCX        下载积分:15金贝
快捷下载 游客一键下载
账号登录下载
微信登录下载
三方登录下载: 微信开放平台登录   支付宝登录   QQ登录  
二维码
微信扫一扫登录
下载资源需要15金贝
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
如填写123,账号就是123,密码也是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

 
账号:
密码:
验证码:   换一换
  忘记密码?
    
1、金锄头文库是“C2C”交易模式,即卖家上传的文档直接由买家下载,本站只是中间服务平台,本站所有文档下载所得的收益全部归上传人(卖家)所有,作为网络服务商,若您的权利被侵害请及时联系右侧客服;
2、如你看到网页展示的文档有jinchutou.com水印,是因预览和防盗链等技术需要对部份页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有jinchutou.com水印标识,下载后原文更清晰;
3、所有的PPT和DOC文档都被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;下载前须认真查看,确认无误后再购买;
4、文档大部份都是可以预览的,金锄头文库作为内容存储提供商,无法对各卖家所售文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;
5、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据;
6、如果您还有什么不清楚的或需要我们协助,可以点击右侧栏的客服。
下载须知 | 常见问题汇总

回归大作业-基于多元线性回归的期权价格预测模型

基于多元线性回归的期权价格预测模型王某某(北京航空航天大学 计算机学院 北京 100191)作者简介:王某某,北京航空航天大学研究生 邮箱:bnuwjx163.com。摘 要:期权是国际市场成熟、普遍的金融衍生品,是金融市场极为重要的金融工具。2015年2月9日,上海证券交易所正式推出了我国首支场内交易期权上证50ETF期权,翻开了境内场内期权市场的新篇章。50ETF期权上市以来,市场规模逐步扩大,其发展情况境外期权产品相同时期。本文以此为研究背景,以“50ETF购12月1.95”这支期权为研究对象,以今日开盘价、收盘价、最高价、最低价、结算价、成交量、成交额、持仓量、涨停价和跌停价为解释变量,通过多元线性回归模型,预测该期权的明日收盘价。本次研究以多元线性回归的全模型(模型1)为出发点,通过异方差检验、残差的独立性检验、误差的正太分布检验以及多重共线性检验,说明该模型不违反回归的基本假设条件。进而通过主成分回归(模型4)和逐步回归(模型5)进行降维,结果表明因变量与解释变量之间存在强烈的线性相关关系,且主成分回归和逐步回归相比全模型有更好的预测能力。关键词:期权价格 多元线性回归 50ETF 多重共线性 因子分析一、引言期权(option)是依据合约形态划分的一种衍生品,指赋予其购买方在规定期限内按买卖双方约定的价格(即协议价格或行权价格)购买或者出售一定数量某种金融资产(即标的资产)的权利的合约。期权购买方为了获得这个权利,必须支付给期权出售方一定的费用,称为权利金或期权价格1。2015年2月9日,上海证券交易所正式推出了我国首支场内交易期权上证50ETF,翻开了境内场内期权市场的新篇章。期权是与期货并列的基础衍生产品,是金融市场极为重要的金融工具之一。自50ETF上市以来,市场规模逐步扩大。2015年2月日均合约成交面值为5.45亿元,12月就达到了47.69亿元,增长了7.75倍;2月日均合约成交量为2.33万张,12月就达到了19.81万张,增长了7.5倍;2月权利金总成交额为2.48亿元,12月就达到了35.98亿元,增长了13.51倍1。我国股票市场有上亿的个人投资者,是一个较为典型的散户市场1。相较于专业投资机构讲,散户缺乏时间,精力以及专业分析,投资具有很大的投机行为。对于这些投资者来说,期权价格的变动则是他们最为关注的问题,其变化直接影响到自身的收益。在实际情况中,影响股票价格的因素很多,涉及到金融政策、利率政策以及国际市场等因素,其作用机制也相当复杂2。因此,对于期权价格预测的研究,则可以降低投资者的投资风险,及时调整投资结构,从而保障自身的收益。本文选择“50ETF购12月1.95(期权代码:10000629)”这支期权作为研究对象,根据过去一个月内期权的交易数据,以今日开盘价、收盘价、最高价、最低价、结算价、成交量、成交额、持仓量、涨停价和跌停价为解释变量,通过多元线性回归模型,预测该期权的明日收盘价。下文由如下几部分构成:第二部分介绍了本次研究的数据集,包括数据来源、和数据字段;第三部分重点介绍了各个多元线性回归模型,包括全模型及异方差检验,残差的独立性检验、误差的正太分布检验和多种共线性检验,在第4小节和第5小节分别采用主成分回归和逐步回归对模型加以改善;第四部分运用第三部分建立的各个模型对期权价格进行了预测;第五部分对本文研究进行了总结并未来的研究加以展望。二、数据说明本次研究的数据来源于Wind资讯金融终端,从上面获取了“50ETF购12月1.95”这支期权自2016年10月24日至2016年11月24日(只包含工作日)共计24日的交易数据。经过整理后得到最终的数据字段,见表1。表 1 期权交易数据字段收盘价开盘价最高价最低价结算价成交额成交量持仓量涨停价跌停价 期权交易数据见附录1。三、建模1 符号说明 各个变量及其符号说明见表2。表 2 各个变量及其符号说明变量符号明日收盘价Y今日开盘价X1今日收盘价X2今日最高价X3今日最低价X4今日结算价X5今日成交额X6今日成交量X7今日持仓量X8今日涨停价X9今日跌停价X102 解释变量与指标变量的散点图在建立模型之前,首先利用MATLAB绘制各个解释变量与指标变量(明日收盘价)之间的散点图,观察各个解释变量与指标变量之间的关系,散点图结果见图1。图 1 各个解释变量与指标变量(明日收盘价)的散点图通过图一中的散点图可以看出,明日收盘价与今日收盘价、今日开盘价、今日最高价、今日最低价、今日结算价、今日持仓量、今日涨停价以及今日跌停价之间有较为明显的线性关系;而与今日成交额以及今日成交量之间的线性关系并不明显。3 全模型 通过散点图我们观察到指标变量与各个解释变量之间大致上为线性关系,所以考虑多元线性回归模型进行建模。3.1 模型建立与求解首先建立各个解释变量与指标变量的全模型,即考虑如下模型:Y=0+1X1+10X10+ N0, 2 式中,0,1,10,2都是与解释变量无关的未知参数,其中0,1,10称为回归系数。在MATLAB中使用regress函数即可求解此多元线性回归模型,求解结果见表3.表 3 MATLAB求解全模型结果回归系数回归系数的估计值回归系数置信区间00.1555-0.1938 0.504911.8288-0.9212 4.578720.0586-1.5671 1.684330.6199-0.4249 1.66474-1.0532-1.9703 -0.13625-1.2208-3.8759 1.434260.0000-0.0000 0.00007-0.0000-0.0001 0.00008-0.0000-0.0000 0.000090.3233-1.0317 1.67831000 0R2 = 0.9489 F = 26.7989 p < 0.0001 s2 = 0.0001从上表容易看出模型(1)成立,此时指标变量与解释变量满足的回归模型为:Y=0.1555+1.8288X1+0.0586X2+0.6199X3-1.0532X4-1.2208X5+0.3233X9 (模型1)在MATLAB中画出模型1的残差分布,见图2。图 2 模型1的残差分布除第12个数据外其余残差的置信区间均包含零点,因此第12个点应当视为异常点,将其剔除后重新计算,得到模型2:Y=0.2484+1.5432X1+0.0291X2+0.7482X3-0.8726X4-1.1292X5+0.1584X9 (模型2)模型2的R2 = 0.9736,F = 49.1655,p < 0.0001,s2 = 0.0001。但同时我们发现,各个回归系数的置信区间仍然均包含零点。画出模型2的残差分布,发现又出现了异常点,按照上面的方法剔除异常点直至没有异常点产生。最终一共去掉了5个异常点(分别是2,12,15,22以及23),最终得到模型3:Y=0.3999+2.7664X1-0.5987X2+1.6607X3-1.3712X4- 3.1596X5-0.0001X7+0.6669X9 (模型3)模型3的R2 = 0.9969,F = 281.6079,p < 0.0001,s2 < 0.0001。可见模型2相当显著,各个回归系数的置信区间均不包含零点;但是去除的数据点有5个(总共23个),去除的异常点比较多,容易去除有用信息,所以我们只把模型3作为后期预测的一个对比模型,在之后的分析中,我们只考虑去除第12个异常点的数据。接下来进行异方差检验,残差的独立性检验以及多重共线性检验。3.2 异方差检验图 3 残差对预测值的散点图通过SPSS画出残差对预测值的散点图,见图3。根据图3可以认为数据基本不存在异方差性,即认为随机误差具有相同的方差。3.3 残差的独立性检验通过SPSS的Durbin-watson检验得到DW值为2.545,模型2中解释变量数量k(包括常数项)为7,样本数量n 为22,查DW分布表得到相应的dL= 0.510,dU= 2.015。由于dU<DW<4-dL,认为随机误差之间无自相关3。3.4 误差的正态分布检验通过SPSS画出正态P-P图以及回归标准化残差频率分布直方图,见图4。图 4 误差的正太分布检验图从上图可以认为误差服从均值为0的正态分布。3.5 多重共线性检验多元线性回归模型的基本假设中要求设计矩阵X的列向量之间不存在密切的线性关系3,如果存在,就称它们之间存在多重共线性。表 4 多重共线性诊断结果通过SPSS进行多重共线性诊断,结果如下表。从上表可以看出绝大部分变量的VIF值远远大于10,说明严重存在多重共线性,针对多重共线性的问题,接下来用主成分分析加以处理。4 主成分回归利用MATLAB对这个十个解释变量进行主成分分析,分析过程如下。1)对原始数据进行标准化处理xi= xi- isi即每个元素的值减去该列的均值,然后除以这一列的方差。2)计算相关系数矩阵R,结果见表表 5 解释变量的相关系数X1X2X3X4X5X6X7X8X9X10X11.000.920.980.961.000.610.50-0.880.920.92X20.921.000.900.960.910.430.31-0.880.990.99X30.980.901.000.940.980.680.58-0.880.910.91X40.960.960.941.000.950.460.34-0.840.960.96X51.000.910.980.951.000.640.54-0.880.910.91X60.610.430.680.460.641.000.99-0.540.460.46X70.500.310.580.340.540.991.00-0.450.340.34X8-0.88-0.88-0.88-0.84-0.88-0.54-0.451.00-0.86-0.86X90.920.990.910.960.910.460.34-0.861.001.00X100.920.990.910.960.910.460.34-0.861.001.003)计算特征值和

注意事项

本文(回归大作业-基于多元线性回归的期权价格预测模型)为本站会员(M****1)主动上传,金锄头文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即阅读金锄头文库的“版权提示”【网址:https://www.jinchutou.com/h-59.html】,按提示上传提交保证函及证明材料,经审查核实后我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.