动态时间弯曲算法在K线相似度计算中的应用
13页1、动态时间弯曲算法在K线相似度计算中的应用序言在证券交易数据中,股票K线图无疑是一种非常重要的数据它反映了股票在过去历史中基于开盘价与收盘价的交易价格的变动古有言,以史为鉴,历史往往存在相似性,对一支股过去历史波动的研究,往往可以对其自身,以及其他股票的未来价格变动作出一些合理预测而股票价格究其根本是一种时间序列对于时间序列,是一种以时间为轴,在一些特别规定的时间点上通过采样得到的一系列按照时间顺序排列的,从被观测对象获取到的观测值通过对时间序列的研究,找到两条时间序列相似程度的的度量方法就被称为时间序列相似性度量,这是时间序列聚类分析中一个不可缺少的步骤,同时也是分类、聚类、规律发现、模式识别等工作的子进程对于研究股票k线图相似性,是为了对未来进行合理预测,因此度量方法应该考虑其性能对于后期时间序列数据挖掘的效果的的直接影响程度时间序列的相似程度是由度量距离的大小所决定的而相似性度量方式的特性又决定了 相似性度量的效果在时间序列相似性度量中,我们最常用的方法就是动态时间弯曲(Dynamic Time Warping,DTW)这是由Berndt于1994年提出将其应用在时间序列数据挖掘领
2、域中,以此来发现时间序列中的模式而这刚好适用于股票k线图的相似程度的研究这是由于动态时间弯曲不仅可以消除欧式距离“点对点”的匹配缺陷,通过弯曲时间来达到时间序列数据点“一对多”的匹配,从而实现不等长时间序列的度量,还对时间序列的偏移,振幅变化等情况具有较强的鲁棒性(鲁棒是Robust的音译,也就是健壮和强壮的意思鲁棒性指的是遭遇外来干扰,性质保持不变的能力)这对于不同股票的k线图在不同的时间跨度而可能形成相同价格形态有着重要意义一、 DTW算法原理动态时间弯曲是一种在语音识别领域得到首次应用的,准确性高并且鲁棒性强的时间序列相似性度量方法它区别于传统的欧几里的距离,其不同在于动态时间弯曲可以通过弯曲时间序列的时间区域从而对时间序列的数据点进行匹配,这样我们不单单能够得到更好的形态度量的效果,更重要的是我们能够度量两条不等长的时间序列对于股票K线图的相似性,我们寻求的是价格形态的相似性例如威廉欧奈尔提到的一种最普遍的价格形态“带柄茶杯形态”,当我们找到与此形态相似的股票时就要做出准备,这可能是一支带动市场发展的“超级牛股”一如当年的微软与苹果要想实现股票K线图的这种相似度匹配,依靠欧式距
3、离在度量中讲时间序列进行“一对一“的数据匹配是不够的,尽管它具有高效性,但是它并未能准确的使波峰、波谷匹配起来而动态时间弯曲则能够通过弯曲时间轴来实现“一对多”的数据匹配通过这样,动态时间弯曲就能成功将两条不同的股票K线图的波峰和波谷匹配起来,从而有助于我们度量价格形态的相似程度,体现了动态时间弯曲在形态度量上的优势1.1动态时间弯曲距离【1】在介绍动态时间弯曲算法之前,先简单的介绍一下动态时间弯曲距离的定义定义1 给定两条时间序列x=x1,x2,xn和y=y1,y2,yn,计算它们之间的累积距离D(i,j)=d(xi.yj)+minD(i1,j)Di,j1D(i1,j1)其中 d(xi,yj)= | xi-y j| (1)为点xi到yj之间的距离,其中i=(1,2,n),j=(1,2,m),当=2时为欧式距离得到的累积最小距离就是动态弯曲距离,我们记为Dwarp()在这里我们需要特别注意一点,动态弯曲距离是不符合三角不等式的命题1 Dwarp()不满足三角不等式证明我们可以通过一个反例来证明这个论题,设x=0 y=1,2 和z=1,2,2, 那我们有: Dwarp(x,z)=5 Dw
4、arp(x,y)+Dwarp(y,z)=3+0=3如此命题得证1.2动态时间弯曲距离的计算 计算它的最终累积距离其实可以认为是在距离矩阵D中寻找一条最优的弯曲路径P,从而使得累积距离达到最小,其中距离矩阵可以表示为以任意两点之间的距离来确立nm的距离矩阵D D= d(x1,yn)d(xn,yn)d(x1,y1)d(xn,y1) 通过寻找弯曲路径Pbest=p1,p2,pK (max(n,m) Kn+m+1)来使得S和Q的累计距离的值达到最小其中pk表示的是弯曲路径元素在距离矩阵中的位置,即pk=(i,j)k表示si与hj之间的匹配关系则由此可以知道d(pk)=d(i,j)k通过观察距离矩阵,我们可以看出一般存在着多条弯曲路径,有效的弯曲路径P必须符合三个要求:(1) 边界性:p1=(1,1),pK=(n,m)即路线必须从距离矩阵的第一行第一列出发到达矩阵的第n行第n列(2) 单调性:给定pk=(i,j)和pk+1=(x,y),则xi,yj(3) 连续性: 给定pk=(i,j)和pk+1=(x,y),xi+1,yj+1 单调性和连续性的存在保证了弯曲路径中某个点的下一个点在当前点的上方、
《动态时间弯曲算法在K线相似度计算中的应用》由会员cn****1分享,可在线阅读,更多相关《动态时间弯曲算法在K线相似度计算中的应用》请在金锄头文库上搜索。
广告牌设计与安装协议书范本(2篇).doc
【最新】鲁科版选修四课时训练【7】化学反应的方向含答案
木龙骨隔墙施工报告
计件工资管理办法范本
塔吊基础施工方案最终版
赴美带薪实习项目常见问题解答
东营市危险化学品项目合作计划书(模板参考)
有效集体教学活动
社会转型期价值冲突及价值观重建
北京理工大学21秋《会计学》平时作业一参考答案78
英语教师工作总结范文(三篇).doc
高一下学期班主任周工作计划(6篇).doc
幼儿园中班数学教案《给图形做标记》
优质建筑公司专项项目部综合施工管理新版制度汇编
上海市房地产项目全过程审批环节告知汇总
塔吊起重吊装施工方案
RFID技术学习总结
2022学生军训日记感悟3篇(军训初体验日记)
燃气锅炉安全操作规程及注意事项
《廉颇蔺相如列传》打印教案
2022-09-03 48页
2022-10-19 6页
2023-01-30 3页
2024-01-01 34页
2022-11-16 1页
2023-12-06 21页
2024-01-19 3页
2023-01-01 2页
2023-07-19 4页
2022-09-19 4页