
金融高频数据是科学发现和理论创立的新源泉.doc
9页金融高频数据是科学发现和理论创立的新源泉——金融孤子(非欧几何)构造及其实验马金龙1,2,马非特2(1 中国科学院广州地球化学研究所 广州 510640;2 长沙非线性特别动力工作室 长沙 410013)摘 要:金融高频数据是金融市场内秉特性的表征,正在成为科学理论及发现的新源泉本文基于复杂系统理论和非线性动力学原理,通过对金融交易市场高频数据进行相空间重构、数据挖掘和数值分析获得非线性特别动力因子——金融孤子,发现其价格波动规律,建立与市场相适应的前瞻性的演化博弈模型,进而提出金融孤子的(非欧几何)构造新概念经实盘交易股票 G 广控和期货燃油实践,实现了在价格波动演化过程中的可重复性实验,达到了验证金融孤子理论及模型正确性的目的金融孤子(非欧几何)构造有可能成为有限理性主体的社会和经济演化行为范式关键词:金融高频数据;金融市场;金融孤子;非欧几何1 引言科学数据是自然界客观事物特性的表征现代科学领域的数据都开始以越来越精细的 时间刻度来收集,在频率上向可微分方向发展,在数量上正以指数级增长自上世纪90年 代以来,随着现代计算机科技手段在金融交易中的广泛使用,交易系统可以实时地提供市 场参与者的交易数据,包括股票、汇兑、期货及其金融衍生品等,并且全部交易过程被实 时的逐笔交易或逐秒记录(如中国证券市场交易系统具备每分钟出10个数据的能力)和储 存下来,这样就形成了金融高频数据(financial high frequency data),即达到可微程度,而 且金融高频数据具有海量性,如分钟数据,在十年内可以达到1 000 000数量级 [1]。
目前国内外高频数据研究主要是从统计物理学和数理统计学这两个途径展开的金融 物理学家基于非线性动力学(混沌、分形)原理取得了以下认识,在金融时间数据中建立 了确定性混沌动力学系统,金融市场价格的多变是多种因素非线性相互作用导致的,具有 混沌、分形的特性,提出了分形市场假说、偏离高斯分布的列维分布和渐近幂率以及标度 性等,揭示了金融市场现象中的普适性、规律[2]-[4]数学家和经济家基于线性的、完全理 性的均衡范式,建立了如自回归条件异方差(ARCH)类模型、自回归条件持续性 (ACD)模型等[5,6],但因假设这个系统是可计系统,相当于热力学第二类永动机[7],在 实际上无助于发现运动的机制尽管这些模型从不同角度和层面考虑了金融高频数据的基 本要素和主要特征,揭示了一些异常的市场微观现象,但仍处于描述和分析的基础层面 本文基于复杂系统理论,应用非线性动力学(混沌、分形、孤子)原理,采用问题导 向研究方法(数据→模型→概念→实践),让数据说话,并不事先假设数据的模型,而是 通过对金融交易市场高频数据进行相空间重构、数据挖掘和数值分析获得非线性特别动力 因子——金融孤子[8],发现其价格波动规律,建立与市场相适应的前瞻性的演化博弈模型, 进而提出金融孤子的(非欧几何)构造新概念,经实盘交易股票 G 广控和期货燃油实践, 实现价格波动演化过程中的可重复性实验,同时达到验证金融孤子理论及模型正确性的目 的。
2 金融高频数据-建模-波动演化过程的重复再现性在信息社会中,面临浩渺无际的金融高频数据, 如何才能不被信息的汪洋大海所淹没, 并将数据转换成有用的知识,大多数数据挖掘工具目前仍无法提供必备的功能来“有效” 支持海量数据的探索,人类期望着有一些能从数据汪洋中提取各种知识的理论和技术社会科学经济系统的金融市场交易系统提供的各种高频数据与物理学研究体系在时空 结构上具有相当程度的严格对称性,不仅可反应出系统的演化过程和行为特征,包括所有 的非线性效应,而且能够有效地描述参与者的行动过程,这些交易活动就是群体的高阶逻 辑思考过程(信息)的反映[8]同时,为应用数学和物理学方法研究金融市场提供了切入 途径,为开展金融市场复杂介质结构及其动力学响应奠定了前所未有的技术基础事实上, 金融高频数据为验证或推翻任何相关理论提供了手段和直接证据,并正在成为科学发现及 理论创建的新源泉建模基本思想是:各类市场参与者及其策略结构共同构成了开放的市场生态环境,且 在混沌的市场状况下不断调整彼此关系及局部的非线性相互作用,而自发地涌现出的系统 总体性状、结构与动力学行为支配金融市场体系的相互作用力又是相对稳定的——交易 体系的供大于求和供不应求产生一个指向该体系均衡价格方向的驱动力。
因此,正确地解 决金融交易市场是个力学应用问题:金融市场的涨落的物理本质是在某一区域的构成介质 (市场参与者和策略结构)发生失稳,并伴随有应变能的加速释放(价格波动、暴涨、暴 跌) 从力学角度,金融市场的涨落的孕育过程实质上是市场中参与者和策略结构发生相互 作用,导致失稳的演化过程,即发生对称破缺过程,这个过程是一个力学过程但是,解 决金融市场演化有关的力学问题与工程中的力学问题有许多不同之处,通常力学问题的解 决需要知道:本构关系、边界条件、初始条件以及某些物理量的变化历史但是,金融市 场的涨落的孕育过程中它们却是未知的或者不完全知道的我们知道的只是市场中某些物 理量的变化根据这一思路我们提出了一个定量地表征金融市场涨落的孕育过程的动力因 子——金融孤子对现代金融市场交易数据(包括历史的和实时的所有盘面数据),如价 格、成交量、时间区间等,进行多种特定的相空间重构和时间序列处理,在重构的高维空 间中,构造非线性算子(因其追随价格波动的特性,此处被称为非线性特别动力因子,即 金融孤子) ,并以连续数据不断支持着建模,实际上这是一种演化博弈模型将无规则可寻 的锯齿状价格波动映射成较光滑的函数曲线,运用鞅方法和不动点理论,以动力因子处理 连续时间的市场价格波动(即所谓布朗运动) ,随机逼近股票、期货价格波动的相应低或高 点,结合资金头寸管理的动态规划,最优化建仓、出货时机,最终实现在市场博弈中通过 学习进化争当少数获胜者[8]。
金融市场是一个演化着的复杂系统,具有每时每刻都进行信息(data)、能量(多空力量) 与物质(信用、资金)的转换的属性因此,该系统可以看成是由能量流、物质流、信息 流所构成,这种结构具有演化的特性,它要靠消化能量、信息和物质来维持,可以说是更 高层次的自然现象而每一个事件的涨落(波动)从孕育到发生,就是能量、信息和物质 三要素的相互变化、协调和统一的结果,其演化过程的一种表示形式就是价格波动作为 一个事物,金融市场在运动形式上表现出的波动性是永恒不变的,而波动是可以重复再现 的且波动过程中存在一个守恒量——孤波(孤子) ,这是复杂系统体系下,相互作用之 中的涌现(emergence) 作为非线性动力学三个主体(混沌、分形及孤子)之一,孤子具 有宏观的波动-粒子两重性由于现代金融市场具有典型的非线性动力学属性,显然,对 其价格进行描述只能是一个非线性方程组,而非线性科学研究表明,孤波正是非线性方程 的解可积系统的孤波是非线性方程的行波解又由于孤子有保持能量、动量不变而运动 过一个宏观距离的特性,从而使它能把所吸收的能量和信息无损耗地传递下去,因此,金融市场中存在着一种新的物质与能量——孤子。
不管金融市场怎么变化,只要找到孤子, 并应用鞅方法和不动点理论,就可对价格波动进行有效跟踪由此,可以应用与自然科学 研究同样的方法和标准来研究金融市场价格波动(社会现象) ,绕开金融市场在时间的演 化过程中可重复性实验的困难问题,实现在波动的演化过程中可重复性实验的目的当然 这一切是在弯曲的金融时空结构层面上来认识和实现的3 弯曲的金融时空3.13.1 丘成桐紧致空间理想丘成桐紧致空间理想“我相信非线性微分方程,几何稳定性和几何结构的交汇是一个很基本的问题,在未 来的几十年里将会有深入的互动,更可以想象的是它跟物理学上的 renormalization flow 会 有密切关系当结构稳定后,我们希望将全部完成一个紧致空间,因此要引进半稳定结构 的观念,而这些结构可以看做模空间的边界,也因此一般来说它们有奇异点,这种自然产 生的奇异点是微分几何学里重要的奇异点,在这些空间上,研究它们的几何结构,规范场 和子流形是很有意思的事情,往往经过 singular perturbation 后,我们对原来光滑的几何结 构会有更深入的了解[9]3.23.2 流形的金融市场流形的金融市场市场参与者的有限理性、羊群效应以及策略结构的改变等因素导致了金融市场价格变 化的时滞、过反应现象,实质上是微观部分的交互作用和变化导致了宏观系统的演变。
Robert J. Aumann 建立了完全经济状态下参与者连续统模型(Continuum Model) ,证明了价 格的瓦尔拉斯竞争均衡(Walrasian Competitive Equilibrium)的存在[10]我们根据金融交 易市场数据记录中的其他变量分析某个连续变量的值,即建立物理问题的数学模型对流形 的金融市场系统的演变过程作出定量化的结论 3.2.1 主纤维丛上的联络由流形上复向量丛酉群上丛,定出上的联络,联络引出其曲率形式,M)(nUPP表示为陈示性类,该示性类是上同调代数的生成元,上同调类kc)),((,*ZCGHmnm模是微分流形的示性类拓扑不变性存在的充分必要条件)),((,2ZCGHcmnmk kP设是维光滑流形上的-主丛,李群是自由地右作),,,(GMBmMGrG dimG用在丛空间上的李氏变换群,而且,在上的这种右作用保持的纤维不变是BGBBH 丛空间上的一个维光滑分布,即是上的一个光滑的维切子空间场在一定条BmHBm件下,则是-主丛上的一个联络HGMB : 主丛上的一个联络就是在丛空间上在李群的右作用下保持不变的一MB :BG 个水平分布。
3.2.2 发现金融市场的 Yang-Mills 泛函设是紧致黎曼流形上的主纤维丛,是它的伴随),,,(GMB),(gMMBAd)(:~丛,是结构群的李代数在上取定一个不变内积,则有向量丛gGg)(GAdg ,上的黎曼结构,使得对于任意的的任意的)0)((rBAdMTr ,MP,)(~)(,1MTpr, (1)rrr iiiibiibgeeeer,,11111)),,(()),,,((!1,LLL其中,是上的单位正交标架场,由于是不变的, (1) ieM)(1pbg ,)(GAd式右端与的取法无关于是,对于任意的,它们)(1pb))((,BAdMTr的(整体)内积可以定义如下:, (2)MMdV,),(同时,如果令,则有),(2)(2MC现设是由主丛上的所有联络构成的空间,是联络的)(BCMB :),(BCHH曲率形式,则是主丛上的型 2 次张量形式,因而可以视为向量丛),,,(GMB)(GAd的光滑截面。
)(2BAdMT定义,则由确定了一个映射(泛函)对2 21)(HJ)(HJH )(:BCJ于给定的,若是 Yang-Mills 泛函的临界点,则是主丛上的)(BCH HJHMB :Yang-Mills 联络的曲率形式即为黎曼流形上的一个 Yang-Mills 场,且众所周H),(gM知,其满足泛函所对应的 Euler-Laglange 方程 设定存在某些卡拉比-丘空间形式及其间的特殊超弦振动,且其对应相互间的长程作用力场;运用鞅方法、上同调理论及倒向随机微分方程等数学技巧,求解杨-米尔斯)(K泛函孤波解4 金融高频数据的应用上述研究是通过对海量的金融高频数据的数量关系,进行有效的数据挖掘;在重构的 高维空间形式中应用了微分流形的描述语言;构筑了由连续数据不断支持的演化博弈模型; 并基于广义庞加莱猜想和 Yang-Mills 规范理论,求得了梦寐以求的、极具穿透力。
