丁晓蔚
内容提要 量化投资大致可分为五个环节,每一个环节都有赖于大数据情报分析。大数据情报分析可以帮助投资主体发现和挖掘盈利机会,进行投资决策,执行交易操作,预测预警交易风险,助力管控风险。金融大数据情报分析是情报学中相关性原理的延伸。借助基于可信大数据和可信人工智能的新型情报分析,人类有望在获得金融经济发展繁荣、防控金融风险、预警金融危机和维护金融安全等方面做得更好。在量化投资领域,大数据情报分析能充分发挥作用和体现其价值,对金融大数据情报分析的研究亟待加强。
据“Global Algorithmic Trading Market 2016—2020”的报告统计:美国约90%的公开交易市场都采用了量化交易技术;采用量化交易获得的收益比传统交易获得的收益多出10.3%;量化金融大约有1万亿美金市场;近年来表现前10的对冲基金中有6个是量化基金;虽各量化基金量化策略不同,但绩优的几个量化基金都在大宗商品范畴内交易[1]见《量化投资之崛起》,http://fintechgl.com/articles/83,2019年12月1日。。无疑,在美国,量化投资已占很大比重。2017年,随着中证500期货贴水的变小,量化2.0时代正式开始了;2019年6月25日,证监会为了配合科创板推动了公募基金转融通业务指引,券商纷纷跳起来拥抱这个新业务,直接把量化推入3.0 时代[2]《量化投资3.0时代已经来临,你准备好了吗?》,https://baijiahao.baidu.com/s?id=16417411526413 60373&wfr=spi⁃der&for=pc,2019年12月2日。。由此可见,在我国,量化投资已在金融业的版图中崭露头角。
“情报学是研究如何将信息转变为情报,以及研究所产生情报的具体用途。”[1]苏新宁:《大数据时代情报学学科崛起之思考》,〔北京〕《情报学报》2018年第5期。在情报学中,金融情报学应成为重要分支学科;量化投资情报研究应在其中占有一定位置。此前,情报学包括情报分析很少被应用于量化投资。截至2019年12月底,在中国知网以“情报”为主题、关键词、篇名进行检索,分别得到45214、39232、36485条论文信息;以“量化投资”为主题、关键词、篇名进行检索,分别得到48、26、8条论文信息;以“量化投资”“情报”为主题、关键词、篇名进行搜索,结果均为0。可见关于情报的研究成果已有很多,但量化投资尚未引起研究者们的充分关注,基于情报学探索量化投资的研究尚未展开,这也正是本文研究的重点所在。
在此之前,须先厘清一些基础性问题。
一是情报分析与数据分析存在的差别。“从数据对象维度来看,数据分析方法以处理单源数据为主,情报分析方法以处理关联的全源数据为主;从产出结果来看,数据分析产出的是新信息、新知识,情报分析产出的是新智能;从分析起点维度来看,数据分析主要是数据驱动,情报分析主要是目标驱动;从分析方法维度来看,数据分析以定量分析为主,定性分析、归纳推理、演绎推理为辅,情报分析在产出新信息、新知识阶段以定量分析为主,在智能产出阶段以归纳推理、演绎推理为主。”[2]杨建林、李品:《基于情报过程视角辨析情报分析与数据分析的关系》,〔北京〕《情报理论与实践》2019年第3期。数据分析是基于数据所做分析,结果是可能形成情报也可能并不能形成情报。形成情报需要具备一定的要件:以相应数据为基础,融入特定主体的经验、智慧、洞见,结合相应的社会背景、生态环境、方针政策及政治、经济等相关因素进行综合分析。情报分析是使分析对象能形成情报并体现情报价值或提升情报价值的分析。
二是金融情报分析的目标指向为优化决策(政府监管部门的决策,从事量化投资的金融企业的决策,其他相关投资者的决策),以为金融安全和金融发展提供可靠保障。
三是情报学为特定主体的投资提供智力支持。情报学通过对全源数据、海量信息进行搜集、挖掘、分析、综合、评估,在上述处理过程中融入相应的智慧,使之转化成情报,以满足显在或潜在的用户的需求。
四是金融大数据情报分析对量化投资颇有裨益。量化投资是在计算机技术和人工智能融入金融投资领域后发展起来的。量化投资要提高预测的成功率,提高投资回报和赢利率,降低和防控投资风险,有赖于从大数据情报分析中获得智力支持。这是因为:首先,过去的金融分析,较多的是基于相关经济逻辑、行业态势、统计报表、财务资料等进行的分析;而金融大数据情报分析,则涵括了对宏观背景、金融环境、社会心理、监管政策、博弈对手及金融交易本身等多源异构的大数据进行分析。传统的金融分析中虽也包含了以上所列的一些内容并被称为基本面分析,但并不依靠大数据技术作为分析对象,数据并不是全源数据,信息也不是海量信息。金融分析如果离开大数据,不太可能产出有较高价值含量的金融情报。其次,量化投资是建立在全源数据基础上的,通过大数据技术进行的实际操作。在此基础上,量化投资按事先设定的程序进行智能化自动化交易选择最佳交易品种、投资时机、投资数量,以实现赢利最大化。最后,由金融数据到金融情报的转化,是依靠专门人才的智慧加工完成的。专门人才的智慧包括:投资赢利的成功经验,防范风险的得力措施,金融交易的真知灼见,盈利机会的瞬间捕捉。特定主体以这样的智慧用于对金融情报的基础——原材料和准情报进行分析和加工,使之具有金融情报的价值,或使金融情报的价值有所提升。
以量化投资为例研究金融大数据情报分析,有必要先对量化投资概念进行界定,因为这是本研究的逻辑起点;然后再对量化投资进行要点列述及本质探析,以此为整个研究奠定基础。
量化投资是一种采用数理方法和计算机技术从数据中挖掘盈利机会、进行投资决策、执行交易、预测预警和管理控制风险,以获得超额收益和长期稳定盈利的投资方法,其要点有:
1.投资方法。从本质上说,量化投资是一种投资方法。
2.依凭技术。即“采用数理方法和计算机技术”。量化投资所采用的手段,有别于其他投资方法和交易方法。传统的投资方法多凭有关人员的经验、直觉、洞察甚至灵感来预测和捕捉投资机会,做出决策并执行交易、操盘下单。盈亏的原因相当复杂。投资者/操盘者可能因瞬间做出的判断而获重大利好,也可能因“一念之差”甚至情绪偏差、发挥失常而错失赢利良机甚至遭受巨大损失;由于缺乏正确的、系统性的情报,因而或侥幸取胜而获利,或造成误判而受损。“采用数理方法或计算机技术”,构成了量化投资和非量化投资之间的重要区别。这是量化投资定义的“种差”之一。
3.具体操作。即“从数据中挖掘盈利机会、进行投资决策、执行交易、预测预警风险、管理控制风险”。基于大数据和对大数据所作的分析(实际上就是大数据情报分析),进行上述一系列操作(所列操作顺序同时也是运作的逻辑顺序)。在这里,捕捉盈利机会(争取盈利不亏和多多盈利)和规避投资风险(降低或消除风险)是并行不悖的,不允许出现任何偏废。这是“种差”之二。
4.目标追求。量化投资的目标很明确:获得超额收益及长期稳定盈利。量化投资过程中的情报分析须为此目标服务,不能获得超额收益的量化投资是不可取的;不能长期稳定盈利的量化投资,称不上是优化的量化投资(须按优化的要求不断改进投资软件和投资策略、模型和算法)。这是“种差”之三。
量化投资研究是基于海量数据所作的分析研究,其实质为基于大数据的情报分析(只是分析内容有别于军事情报、科技情报、图书情报等而已),是经对金融大数据的分析而形成了有关量化投资的金融情报,特定主体的投资决策是依据情报和情报分析做出的,经实践检验以后对投资软件系统及投资策略、模型和算法进行改进和优化,这是在基于大数据的情报分析的基础上进行的;传统上,量化投资也可以基于小数据分析,但基于尽可能多数据的大数据超集所作的情报分析理论上优于基于小数据子集所作的情报分析。遗憾的是许多人并没有认识到这一点。
量化投资与金融分析和情报分析关系密切。不能说此前的量化投资中只有金融分析而全无情报分析,但确实存在着如下缺憾:其一,不少量化投资机构尚缺乏进行大数据金融情报分析的自觉意识,也少有研究者和实际操作者按情报学的专业要求进行量化投资中的大数据情报分析;其二,作为分析对象的数据并不是大数据,而分析也并非大数据情报分析,而基于大数据的情报分析可以更多更好地为量化投资提供服务。
量化投资大致可分为五个环节,每一个环节都有赖于大数据情报分析。进行量化投资者在获得相关情报后,可在此基础上进行精准投资。反之,则可能因缺乏大数据情报分析而遭遇亏损。
量化投资的目标是获得超额收益alpha和长期稳定盈利,这里alpha代表的是不随大盘起伏而波动的投资能力。alpha和长期稳定盈利是投资界不懈探索的圣杯。从数量上,一种简化的指标可以是收益率/风险(如夏普比值Sharpe Ratio),投资系统优化的目标是尽可能在减少和控制风险的基础上提升收益率。要实现上述目标,大数据情报分析大有可为,因为它涉及对投资盈利的障碍因素的分析。投资标的交易价格的起落是构成情报的重要信息和数据来源之一,对情报分析而言弥足珍贵。大数据情报分析须深入分析以下问题:造成交易价格“起”的相关因素有哪些?“落”又和哪些因素有关?“起落”有无规律可循?量化投资要做到不受大盘起落影响,抓手和关键在哪里?在以上诸多方面,大数据情报分析都有发挥作用的空间。
量化投资从大数据和大数据分析中发现和挖掘盈利机会。此处的大数据覆盖面宽、数据量大:既可能直接涉及金融交易,也可能看似无直接关联。以股票/期货二级市场为例,直接涉及金融交易的大数据有:股票/期货开、高、低、收大数据,买入卖出价大数据,成交量大数据,上市公司经营和财务大数据、季报大数据、年报大数据等,分析师对上市公司前景进行分析时所用大数据。看似无直接关联的大数据则有:投资者对股票/期货及相关企业的情绪大数据(情绪属于舆情层面),公司与公司之间关系的大数据,公司及公司群内幕信息大数据等。这些都可能是进行金融大数据情报分析时有用的数据。
金融市场上进行的是一种负和游戏,在追求alpha和长期稳定盈利过程中,需要尽可能比竞争对手掌握更全面、更准确、更真实、更有价值的数据。对量化分析师和量化投资经理而言,越是全面的、准确的、真实的、稀有的、新鲜的、竞争对手还没有想到和掌握的数据,据此加工成金融情报,就越可能通过量化投资带来超额收益。近年来,量化分析师和投资经理们将目光投向一些看起来与投资并不直接相关的大数据。如,中证百度百发策略100指数将搜索量数据作为投资者情绪的一个方面的反映,对样本空间的股票分别计算最近一个月的搜索总量和搜索增量并构建搜索因子,综合财务因子、综合动量因子和搜索因子计算个股内在价值,选取排序靠前的100只股票[1]《百度百发100指数介绍》,http://www.licaishouyi.com/news/230.html,2019年11月17日。。从貌似“不直接相关的(大)数据”中尽可能探寻与量化投资相关、对实现量化投资目标有用的情报,其实质是按“耳目、尖兵、参谋”[2]沈固朝:《“耳目、尖兵、参谋”——在情报服务和情报研究中引入intelligence studies的一些思考》,〔北京〕《医学信息学杂志》2009年第4期。的情报分析要义进行探索,探索一系列相关因子的内涵和隐意,探索各种因子之间的相互关系,探索各因子及其相互关系可能对量化投资产生的影响,这是金融情报分析的主要内容。
从流程上说,量化投资包括五个阶段:挖掘盈利机会、进行投资决策、具体执行交易、预测预警风险、管理/控制风险。现按流程对量化投资中的大数据情报分析进行分阶段考察。
1.挖掘盈利机会过程中的大数据情报分析
从道理上讲,在股市即使是处于熊市的情况下,投资者也并非绝对没有盈利的机会。无论是在牛市中还是在熊市中,关键的问题是从哪里和怎么样去发现、发掘盈利机会。依靠人工去发现和发掘盈利机会,视阈有限(只能关注一个很小的范围)、精力有限(投资标的品种之多和个人精力相对有限之间构成难以克服的结构性矛盾)、经验有限(成功经验只限于一部分投资标的),因而难免捉襟见肘。量化投资则不然。它拥有获得全源数据的技术、渠道和科学处理方法,使个人及团队视阈、精力、经验的有限性不再成为不可逾越的障碍。在发现、发掘盈利机会方面,大数据情报分析的重点至少包含以下几个方面:一是通过对基本面的分析,把握国际国内政治、经济、文化等方面的大事件对金融市场产生的影响;二是分析特定产业/行业的发展走向和存在的盈利空间;三是分析诸多上市公司的财务报表及经营状况;四是分析特定上市公司的业绩和前景及相关重要节点;五是市场中博弈对手的情况以及资金流动的态势。以上分析均有赖于定性分析与量化分析的结合。在这一阶段上,基于大数据的情报分析可以做的事情很多,且内容极为丰富。可做的重要工作之一,是探寻事物之间的因果联系。正如迟玉琢所论述的:“当前全球各领域、各层面都存在紧密联系,一件事情的发生可能与两三件事甚至更多件事都有关联。但是仅发现关联并不够,而是要从数据关联中推导出深层的因果关系。”[1]迟玉琢:《大数据背景下的情报分析》,〔西安〕《情报杂志》2015年第1期。这也正是大数据情报分析的强项。
2.进行投资决策时的大数据情报分析
上述几个方面的分析,也将贯穿于投资决策的全程。投资决策必须就以下问题做出决断:买进/卖出哪个或哪些投资标的,买进/卖出特定投资标的的数量,买进/卖出特定投资标的的时间、价位等。关键时刻的关键性实时决策,其依据的大数据情报分析,可形成相应的预测、预警或决策曲线;曲线上每一个时间节点对应的情况可得到实时反映,这既是前置大数据情报分析的输出和结果,同时也是后续大数据情报分析的输入和依据。
3.执行交易阶段的大数据情报分析
以股票/期货为投资对象的金融交易,在量化投资中的执行交易环节,主要是由计算机按事先开发的软件程序中的指令自动进行。在此环节的大数据情报分析应结合对交易的实时监测进行(对瞬息万变的市场中异动及时分析并做出决策,且应在极短时间内完成)。进行大数据情报分析,应事先就做好充分准备(对基本面、特定标的近况深有了解,对其走势有所预判,对可能遭遇的风险有应对预案),辅之以高性能实时大数据情报分析,对价格、成交量、盘面(订单簿)等进行实时跟踪分析。
在上述过程中存在人工执行、自动执行、半自动执行等三种交易情况。在量化投资过程中,应有人工执行交易的一席之地:在慢速交易领域,可由计算机模型发现投资机会,由模型进行投资决策,但真正下单交易,可交由经验丰富的交易员执行。凭借经验、直觉、洞察和智慧,交易员或许能发现一种尽可能减少执行成本并有望增加盈利比率的最优执行方法。在高速交易领域,特别是西方的微秒级、纳秒级高速交易市场,须更多采用自动执行交易即“算法交易(Algo-Trading)”方法。但即使是这样,也仍需量化投资经理和分析师及团队成员在交易时不断进行实时监控,一旦发现异常,就及时果断地调整程序中的算法或关闭交易程序。在万不得已时应通过手动操盘对计算机程序进行必要的干预,以遏制大幅亏损。在很多场景中,也可采用人机结合的半自动执行交易的方法,即“计算机辅助交易”(Computer-Aided Trading)。在后两种交易中,基于大数据的情报分析发挥功能的空间相对较大,也更易见出成效。
4.通过大数据情报分析预测预警投资风险
在情报分析中,风险预测预警是情报分析的一项重要功能。“预测性情报问题通常包含诸多相互作用的影响变量,识别变量、明确变量间交互作用是分析研判的基础,因此情报分析过程中进行有效的变量管理是提高情报分析质量、为情报用户提供有力支持的重要路径。”[2]陈烨、马晓娟、董庆安:《情报分析中的变量管理——基于结构化分析方法的思考》,〔北京〕《情报理论与实践》2019年第1期。这一论述指明了对变量的优质管理是提高情报分析质量的实践路径。对变量的异常之变进行即时跟踪性的监测、分析,是风险情报分析的重要工作职责之一,量化投资中的风险预测,是依靠大数据、人工智能、金融工程、金融统计等技术进行的,是在概率、统计和算法的基础上进行的。因此,较之基于经验的、直觉的以及主观推断的传统投资方法所做出的预测更为科学,更能体现和把握情报预测预警的规律性。
对于金融投资交易风险的预测预警,其难度较之自然界风险预测和一般社会风险预测的难度要大得多。预测预警社会风险与预测预警自然风险相比,因受人为因素影响,难度较大。而金融投资交易中的风险预测预警则尤为困难。上市公司和进入市场进行股票/期货交易的人员、机构,情况各异,具有相当的复杂性。投资者是人或是由人所形成的机构,都受到利益的驱动。每个人都有其独立的内心世界和复杂的心理活动(心理活动既有独立性,又很容易受他人感染和进行相互感染)。在特定情况下,投资者的群体性的心理活动和交易行为,会对量化投资的计算机程序加以抵制,从而对量化投资效果产生影响。在某些时候,投资者迟疑不决、互相观望,一有投资者出头,就会形成“羊群效应”,相互影响、相互感染。“在股市上,我们最常听到的一些话,比如‘追涨杀跌’、‘顺势而为’、‘在别人恐惧时贪婪,在别人贪婪时恐惧’,其背后都有‘羊群效应’的作用。”[1]《“羊群效应”不是你听说的那么简单》,https://xw.qq.com/amphtml/20180731A0RGF000,2019年11月17日。与量化投资相关的因素中,还包含了舆情因素。舆情一旦成为风险,它往往与金融风险形成共振,本质是人们通过情绪相互影响。目前,研究者还只能对人的外在行为进行建模,尚不能就人性、动机、心理和情绪建立较完备的模型。金融交易市场上暗含着各种力量的博弈,而金融市场瞬息万变。在量化投资过程中进行风险预测预警,需在作大数据情报分析时将数据以外的上述因素一并予以考虑。
5.管理/控制风险中的大数据情报分析
将风险预测预警和风险管理控制也都纳入量化投资的流程之中,这是因为只管投资交易而不管防范风险、控制风险的做法与量化投资的目标背道而驰,是极其危险的。因此,既要进行投资交易,又要管控投资风险,这样才能卓有成效地达到量化投资的目标,即获得alpha超额收益和长期稳定盈利。
在管理/控制风险这一阶段中,大数据情报分析同样不可少。用于进行量化投资的计算机软件在程序设计中已包含规避风险的考虑,且得到算法和一系列技术的有力支撑。这为该阶段中的大数据情报分析提供了有利条件。在此阶段,大数据情报分析应包括:第一,对风险管理/控制中干扰性因素的发现和分析。这项工作依靠已设定的交易软件中的程序无法全部覆盖,须由人工通过大数据情报分析去完成。况且,干扰性因素是动态变化的;对此,应在进行实时捕捉、监测的基础上及时挖掘、分析。如有必要,可对量化交易软件和程序做出调整,以加强风控和实现优化。第二,对风险管理/控制成功经验的分析。在金融交易市场上,有许多成功进行风险管理/控制的机构和个人,其经验值得分析借鉴,这是量化投资中一项重要的情报分析工作。第三,中外量化投资风险控制的比较分析。着重比较正面经验中的同异,以从中获得相应启示。
在五个阶段中,完全的、绝对的自动量化投资和交易是很少的。量化投资经理和分析师的日常工作:一是要连续监控金融市场,预警和防控风险,尤其是要关注“灰犀牛事件”和“黑天鹅事件”(这是大数据情报分析的题中应有之义);二是要不断改进和提升模型和算法,使之更好地防范风险,并提高获得alpha的效率(这也是大数据情报分析所要实现的目标)。量化投资中使用的,应当是以机器智能与人类智慧有机融合为特征的大数据金融情报分析。
将大数据情报分析应用于量化投资之中,这不仅仅是简单的操作问题,而且其间也还包含了许多学理的内容,就此进行理性思考是十分必要的。
马费成教授提出,情报学与其他学科一样总有一些带普遍意义的、基础性的原则和思想在主导其各领域的研究和发展,这些原则和思想就是情报学的基本原理,包括:情报的离散分布原理、相关性原理、有序性原理以及情报交流获取的省力原理、小世界原理和对数透视原理[1]马费成:《论情报学的基本原理及理论体系构建》,〔北京〕《情报学报》2007年第1期。。相关性原理是文献检索乃至情报学中的一条重要原理。
在将大数据情报分析应用于量化投资实践的过程中,相关性原理得以再次延伸、拓展。这是因为:一是在应用场景中,已不光是文献检索了,而已转换成了金融投资、量化交易、风险防范。场景的不同、场景中内容的不同,使相关性的主体有所更动、变换。二是量化投资所涉相关方面更趋丰富、复杂。文献检索的对象相对处于静态,以股票/期货为投资对象的金融交易处于动态变化中。金融活动中各个因素之间的相关,是处于动态之中的相关。
黄河燕等指出:“情报学研究的重点始终关注数据的处理、分析及深层次挖掘,探索从复杂的数据中找到知识之间有效关联及知识发现的最佳方法,大数据情报分析作为其中的一种发展范式也不能例外。”[2]黄河燕、曹朝、冯冲:《大数据情报分析发展机遇及其挑战》,〔哈尔滨〕《智能系统学报》2016年第6期。这指明了大数据情报分析注重数据与知识的相关性、数据与知识发现的相关性。量化投资是知识和知识发现的富矿,为大数据情报分析提供了施展才能的广阔天地。
在量化投资中的大数据金融分析,应当是多维度的情报分析。
一是对金融信息和金融数据本身进行的分析。离开了对这些金融信息和金融数据的分析,就无法进行卓有成效的量化投资。二是对社会政治、经济(包括实体经济)大势的分析。量化投资中的大数据金融分析如果只是就金融分析金融、就情报分析情报,那是不可取的。三是对量化投资产生影响作用的其他因素的分析。在金融市场上,投资者的投资行为是由其主观动机、内在心理、情绪念想等共同驱动的。就如同海上的冰山一样,冰山显露于水上的部分是投资者的显行为。而其动机、心理、情绪等则隐藏在水下,是潜藏的部分。在进行大数据金融情报分析时,应将上述因素纳入分析的范围之中。金融大数据情报分析显然应为尽可能推演或探知潜藏的情报做出贡献。四是对市场上相关企业的经营行为的分析。金融市场中的参与机构(比如上市公司等)有行为、有画像,被称为企业行为和画像。上市公司通过定期发布经营及财务数据和信息,向市场公开透露其内部经营和财务情况。然而,这些数据和信息往往是经过浓缩的、提炼的。对某些上市公司披露数据和信息的真实性、准确性、完整性、充分性、及时性须审慎判断。国家定期发布经济数据和信息,上市公司定期发布经营和财务数据和信息,各金融市场的交易数据被留存和公布(称为历史交易数据),这些数据和信息合起来,都是金融市场的公开数据和信息。不过,这些都只是冰山的一角。有两点值得关注:一是,绝大多数公司和经济实体不上市,不公开其内部数据和信息。这样就使得整个国民经济运行的一部分情况无法为人们所广为知晓,这便成为海上巨型冰山的庞大的水下部分。二是,即使是上述公开信息,对其真实性、准确性、完整性、充分性、及时性,也都需要进行仔细验证。
以上情况的存在使得大数据情报分析在量化投资中大有可为。其一,投资者的动机、心理、情绪等隐藏在水下的冰山部分有待采用情报分析技术来探析。其二,为数不少的经济实体的非公开的内部经营和财务信息,也有待采用情报分析技术来探析。其三,即使是公开的数据和信息,其真实性、准确性、完整性、充分性、及时性,也需要情报分析技术来进行分析、推演。以上需求可归结为:通过大数据情报分析技术,从投资者外部探析其内部的动机、心理、情绪等情报;用大数据情报分析技术,从企业外部探析其内部的经营和财务情报。在实践方面,“冒烟指数”[3]李崇纲、许会泉:《冒烟指数:大数据监测互联网金融风险》,〔北京〕《大数据》2018年第4期。“红警”[4]曾途:《大数据框架下的金融风险管理》,〔北京〕《软件和集成电路》2016年第8期。等即为上述大数据情报分析的成功应用案例。
一般认为,金融大数据情报分析,就是要探析或者推演以前大数据分析在外部所不能获得的内部的、非公开的情报,亦即人、投资者、机构、组织的内在的、非公开的情报,即冰山的水下部分。即使是对先前部分存在的公开信息,也需要借助于情报分析技术来进行探析和推演,解决其真实性、准确性、完整性、充分性、及时性的问题。“情报学在探索金融运行规律时,注重探讨各种重要的本质的关系或本质之间的关系:数据与数据之间的关系、信息与信息之间的关系、数据与信息之间的关系、金融创新与实体经济之间的关系、金融合规与金融创新的关系、金融风险与社会心理及舆论舆情的关系、金融业界与外部环境的关系、中国金融与外国金融的关系,等等。”[1]丁晓蔚、苏新宁:《金融情报学:情报学的重要分支学科》,〔北京〕《情报学报》2020年第2期。进行这方面的探索,有利于对市场上投资主体的投资行为、经济实体的经营行为进行精准的大数据情报分析。
金融理论中有“有效市场假说”,大意是:在半强有效的金融市场,需要采用内幕信息(如设法获得企业内部的非公开商业机密等)才能获得超额收益。蓝海平评价说:“‘有效市场假说’是理解、认知真实市场的标尺与基准,对其实证检验有助于揭示市场的风险溢价或行为错价特征,对于市场各类参与主体如投资者、监管者等均具有重要现实意义。”[2]蓝海平:《“有效市场假说”之惑》,http://opinion.caixin.com/2014-08-07/100714115.html,2019年11月19日。从情报学的角度,采用情报分析技术(大数据情报、竞争情报、经济情报、信号情报、风险情报、预测预警情报、情报工程、计算型情报等),从公开的全源数据中提炼出合法获得的内幕情报,就是获得超额收益的可能来源。随着人们的目光逐渐投向此领域,获得超额收益alpha会越来越难,情报分析方法会越来越讲究,大数据会趋于数据量更大、覆盖面更宽。随着人类活动和人类社会的日趋数字化,很多原先不曾采集到、或不纳入研究范畴的数据和信息,都将作为多源异构、高维高频大数据被逐渐纳入情报分析的研究范畴。金融市场中的量化投资专家的制胜关键是持续力争比自己的竞争对手获得更多情报、构建比较优势,重要抓手是进行大数据情报分析。
可以预见,随着大数据的不断增多,数据质量和信息孤岛等问题将凸显。倘能引入区块链,引入可信的大数据和可信的人工智能,构建新型可信金融信息基础设施架构,则将会对整个金融交易市场产生重大影响,并实现如下提升:“从技术架构的提升,到风险管理理论与实践的提升(在价值和信任传输的网络上,风险将被重新定义和计量),再到投资者交易行为的提升以及监管水平和施策水平的提升”,“基于可信大数据和可信人工智能的新型情报分析,人类有望在防控金融风险、预警金融危机和维护金融安全等方面做得更好”[3]丁晓蔚、苏新宁:《基于区块链可信大数据人工智能的金融安全情报分析》,〔北京〕《情报学报》2019年第12期。。这是金融大数据情报分析的愿景,也是在量化投资中进行大数据情报分析的愿景。
量化投资与大数据和大数据技术的关系特别密切,此领域是一个大数据情报分析能充分发挥作用和体现其价值的领域。在大数据技术已相当成熟的今天,在量化投资领域展开基于大数据的金融情报分析,已具备既充分又必要的条件。在量化投资全过程中,大数据情报分析都可深度介入,就“耳目、尖兵、参谋”等情报分析要义进行探索。有没有大数据情报分析深度介入量化投资之中,差别甚大。大数据金融情报分析,有赖于人类智慧与人工智能的深度融合。围绕量化投资展开的大数据情报分析,包含了情报学的诸多学理内涵。