大数据视域下金融学研究趋势分析

2020-08-25 01:50文程罗长青
教师·中 2020年5期
关键词:互联网金融大数据

文程 罗长青

摘 要:大数据是一种极其重要的国家战略资源,对金融理论及实践的影响既广且深,文章梳理了大数据及相关技术对金融学的系统影响。在放松理论假设、革新研究工具、升华既有内容与拓展新兴领域四个方面,大数据将引起理性经济人假设再厘定、引入全样本数据及相关性分析、设计高频程式化交易规划与强化互联网金融风险控制,从而重塑金融学。

关键词:大数据;理性经济人;计算金融;高频程式化交易;互联网金融

中图分类号:G642 文献标识码:A 收稿日期:2020-01-30 文章编号:1674-120X(2020)14-0105-04

追根溯源,Apache.org的开源项目Nutch中最早出现“大数据“一词,意指在更新网络搜索索引的同时需要分析和处理大量数据集。其后,随着计算机网络、云计算与数据挖掘的进一步发展,大数据技术应运而生,在数据体量、结构类型与处理速度上均获得了质的飞跃,并以数据驱动的思维方式深刻地重塑着行业已高度数字化的世界,促进了自然科学与社会科学的交互,促进了定量分析与定性分析的融合,使数据真正成了一项足以与资本、劳动力及自然资源不分伯仲,甚至有过之而无不及的战略资源。在现代金融理论的框架下,各类金融主体在不同程度的有效市场中,收集定性与定量数据,缓解市场信息不对称问题,并通过设计交易策略和风控模式来实现资金的跨期最优配置。因此,市场假设、信息处理、交易行为和风控模式是现代金融体系的核心要素。其中,市场假设是金融活动的前提,信息处理是缓解信息不对称问题的重要手段,交易行为和风险控制是金融主体两类最频繁且主要的活动,是“硬币的两面”。

大数据在金融领域的广泛运用,深化了金融学的基本理论,革新了金融学的分析工具,丰富了金融学的重要内容,拓展了金融学的领域边界,深刻改变了现代金融体系的核心要素。基于这一理解,文章拟从理论假设到研究工具,从既有内容到新兴领域,从样本数量到结构类型,紧密结合当前金融市场新兴的高频交易模式以及互联网金融方兴未艾的发展趋势,依次探讨有效市场假说中理性经济人的再厘定、计算金融的全样本数据及相关性挖掘、高频程式化交易的策略时序规划与互联网金融的风险控制四个问题,最后指明大数据金融的局限性。

一、有效市场假说中理性经济人的再厘定

众所周知,金融研究由定性向定量的决定性转变,进而涵盖资产组合、资本资产定价、套利定价与期权定价等诸多主流模型与方法,实肇始于现代资本理论的产生,而有效市场假说则是奠定整个现代资本市场理论的基石,是金融学中最为重要的七个理念之一。Kendall(1953年)发现股价时序类似于随机漫步,认为所有已知信息一定已经反映于股价之中,股价只对不可预测的新信息做出上涨或下跌反应,是随机且不可预测的。Fama(1970年)将之深化为有效市场假说(EMH),并将其分为三类:股价反映了全部可从市场交易数据中获得信息的弱式有效市场、股价反映了所有公开信息的半强有效市场、股价反映了全部与公司有关的公开或内部信息的强有效市场。

这一重要理论的建立依赖于一个基本而关键的假设,即资本市场中所有投资者均为“理性经济人”。这是一种新古典宏观经济学假设,意指所有投资者为风险厌恶者,要求的高收益与其承担的高风险一致,利益最大化的投资者可根据其获取的信息对证券进行合理与最优的定价。然而,近年来的研究屡屡发现现实中存在着越来越多与“理性经济人”假设不符的案例。一方面,这促使有效市場假说自身不断演进,并逐渐放松理性经济人假定。比如,投资者一般是理性的,能对证券价值做出较合理的评估;有些投资者在某种程度上并非理性,但其随机性交易使非理性相互抵消而不影响证券价格;也许非理性投资者会犯同样的错误,但市场中的理性套利者会消除他们对价格的影响等。另一方面,促使金融市场微观结构、行为金融以及分形市场等新理论不断产生,从新的假设条件与角度出发,更贴近现实地解释各种市场现象,特别是有效市场假说的种种异象。尽管这些新理论在某一方面更具实用性与说服力,但尚未成熟,亦无法取代有效市场假说。况且经典理论是完美条件下的标准化理论,假设放松后依然是新理论的参照标准。

目前,上述理论基本上各有所长,仅适于从某一特定视角对某些资本市场现象加以解释。其未来趋势必将是相互联系与借鉴,而大数据的出现则为这种融合提供了以往无可比拟的实证之源:基于大数据分析,可精准识别所有投资者的风险偏好。哪些是理性经济人认定的风险厌恶者,哪些是风险中性者,哪些又是风险喜好者?在遭受重大损失时,会采取何种冒险行动,会导致哪些形式的非理性行为?基于大数据分析,可精准描述所有投资者对新信息的反应速度。哪一些或者哪一类投资者对新信息做出了迅速反应?哪一些或哪一类投资者是在获取信息以后,先观察新信息出现时证券的最新变化趋势,再对信息做出反应?哪些反应是线性的,哪些又是非线性的?其整体性状与统计规律如何?基于大数据分析,可精准刻画所有投资者对新信息的反应程度。考察所有投资者的主观判断,可对正确与错误的判断加以区分,而后重点研究对新信息做出的错误反应,以及由此在市场中引起的非理性波动。

毋庸置疑,通过大数据实证分析对理性经济人的再厘定,有望使各理论融会贯通,形成一个以有效市场假说为主的统一理论体系,重塑现代资本理论,进而重塑金融学。

二、计算金融的全样本数据及相关性挖掘

大多数学科的科学化与精确化,都需要采用数学语言加以描述,金融学亦是如此。正是由于可运用金融学数学语言定量地描述和预测交易行为,金融机构才得以较高效地收集市场信息,缓解市场的信息不对称问题,从而实现资金的优化配置。金融的定量分析不仅需要运用数学语言,还需要借助计算机科学的相关方法。虽然都是金融学、数学与计算机科学互相融合的产物,但分支流派各有侧重,不尽相同,如数理金融侧重于随机过程与微积分,较多地表现为方程求解与数值分析;计量金融侧重于概率统计,较多地表现为参数估计与假设检验;计算金融则侧重于人工智能,较多地表现为机器学习与数据挖掘。

一般而言,数理金融以模型为驱动,但往往因现代金融建模中存在诸如多尺度、高维度、不适定、非线性与奇异性等复杂因素,不仅可能让方程无解,而且数值分析也可能面临计算规模大得难以承受或者失去时效、计算不稳定、数值结果不可信、包含奇异性、计算非正常终止等问题;计量金融面向数据,以样本数目趋于无穷大时的渐近理论为基础,然而现实中样本数目通常有限,故尽管理论预期较好,其类似于自然科学实验的计量结果却往往不尽如人意,且预先知道样本分布形式这一要求十分苛刻也代价不菲;计算金融同样以数据为驱动,但以专门研究小样本情况下的机器学习规律的统计学理论为基础,该全新理论体系中的统计推理规则不但考虑了对渐近性能的要求,而且追求在现有有限信息条件下获得最优结果,计算金融所彰显的良好的适用性与有效性使其在金融研究与实务中无处不在。

就样本数量而言,计量金融虽然基于样本数目趋于无穷的渐进理论,但实际检验却仅采用十分有限的样本;经典计算金融虽然基于小样本的统计学习理论,但实际处理的样本数却很多,而且通常比计量金融的数量级要高。不过两者的样本性质仍然没有实质性区别,均为随机样本——一种经由抽取典型特征数据而形成的数据集。目前,唯有金融大数据分析技术这一计算金融发展中的最新理论所处理的才是真正的全样本,即涵盖相关数据的整个历史,囊括已经发生的全部数据。显然,超高频股价时间序列包含了市场交易的每一个价格信息,可跳出以往假设检验与统计推断的研究窠臼,超越时间尺度上秒、分、时、日、月、季与年股价采样的样本代表性及误差。其接近于完全归纳所获得的市场微观结构方面的相关结论,无疑具有更高的普适性与必然性。

就相互关系而言,因果关系无疑揭示了事物内部各要素之间的本质属性,是事物之间的本质关系。只有把握因果关系才能真正把握事物,因而因果分析是科学研究的基本任务与终极目标。然而,如上所述,数理金融以因果分析为归依的模型构建与方程求解殊为不易,即使获得也与计量金融的因果检验类似,是基于有限样本支持的相对真理,还可能存在模型过度拟合的问题。加之实际决策所涉及的因素较多,在不同时间与地点的运用,其结果通常出入较大,即模型也不一定稳定有效。

尽管相关分析永远是因果分析的基础与起点,但放松条件的覆盖面将更宽广,亦不失为一种低成本与高效率的手段。大数据便是通过描述事物全数据在数量之间的关联特征来寻找事物之间的关联关系,用数据挖掘、模式提取与机器学习的知识进行决策,而不必明确训练学习中所获黑箱内部结构的准确含义。例如,对一个交易策略进行全数据分析,只要研究结果是能长期稳定盈利,就可被投资者采纳。而具体哪笔交易赚钱与哪笔交易赔钱,虽然投资者会好奇,但交易策略无须给出精确答案,从某种程度上讲也是无意义的。又如,当基于大数据的投资策略预测某个模式出现后某股票很大概率会上涨,若执迷于股价上涨背后的基本面缘由则成本过高,且确实无法得出准确的原因。

显而易见,脱胎于机器学习与数据挖掘,结合了云计算的金融大数据分析技术,通过采用全样本数据集与分析相关性来革新计算金融这一重要工具,能提高信息处理的效率,并且大幅度地提高信息处理效率,进而重塑金融学。

三、高频程式化交易的策略时序规划

交易活动是金融市场最主要的微观行为,伴随着大数据技术的发展,高频程式化逐渐成为金融市场主流交易方式之一。Tian等(2015年)指出大數据技术带来了更智能的交易(More intelligent trading)。高频程式化交易是智能交易的一种形式,它是指运用计算机从极为短暂的市场变化中寻求获利的高频率交易。其中,极为短暂的市场变化一般指某种证券买入价与卖出价之间的微小价差,或者不同交易所之间某只股票的微小价差。这种变化如此之快,以至于交易者不借助先进的计算机设备与交易程序软件,就无法提升其获取数据与分析处理的速度,也就无法快速生成并发送交易指令从而凭借速度上的优势获得高额利润。为此,有些交易机构甚至将自己的“服务器群组”(server farms)安置在离交易所计算机物理位置很近的地方,以进一步缩短交易指令在光缆中传输的距离。也正是因为有如此高的速度,交易者才能以较高频率在短时间内完成多次交易,以达到在交易结束时间到来之前身上尽量少持头寸的目的,高频交易因此得名。

所谓程式化交易是指把一切都交给高性能计算机自动完成。这既有利于在瞬息万变的市场中捕捉稍纵即逝的套利机会,又有利于规避投资者趋利避害心理所产生的强大干扰。因为机器是没有感情的,一千块与一千万对它而言都只是一个数字,它不会因为标的大小变化而产生情绪波动从而影响投资决策的科学性与合理性。量化投资大师詹姆斯·西蒙斯教授创立了文艺复兴公司,管理的大奖章基金在1989年—2007年平均年收益率高达35%,若考虑44%的提成,则实际收益更高达60%,比人尽皆知的股神巴菲特同期收益率高十几个百分点,也比传奇投资大师布鲁斯·科夫勒、保罗·都铎·钟斯、乔治·索罗斯、路易斯·培根与马克·金顿都要高出十几个百分点,取得这一惊人神话的秘籍就是程式化交易。

美国《华尔街日报》的统计数据表明,正是基于速度与自动化方面的显著优势,高频程式化交易在美国的各金融市场均占据了相当高的比例,为40%~80%。然而,成也萧何,败也萧何,速度这一突出优点反过来又成为高频程式化交易获利无法一而再,再而三突破的瓶颈。随着采用高频交易的交易者与日俱增,进入该行业的门槛自然水涨船高。激烈的竞争使得诸多算法与模型都处于公开或半公开状态,最终的胜利则取决于硬件配置,包括计算速度与宽带接口速度。于是,大家进入了一场穷兵黩武的军备竞赛,争先恐后地投资于计算机与网络领域,使得小公司倒闭而大公司减利。Rosenblatt证券咨询公司研究调查显示,与2009年相比,2012年全行业采用高频交易所获得的利润大幅缩水,下降幅度为74%。从2013年开始,高频程式化交易便逐渐萎缩。

为了阻止利润下滑并使之反弹,交易者开始借助金融大数据进行分析,以识别市场特定参与者的历史足迹,进行策略时序规划。这为高频程式化交易规避花费巨资提高速度的恶性竞争开辟了一个新的可行途径。例如,如果一支共同基金经常在每分钟的第一秒发出大单交易指令,那么采用金融大数据分析技术的交易者就可以识别这种模式,并据此分析与预测该共同基金在剩余交易时间内的相关动向,以调整自己的策略。而建立在共同基金已知模式下的剩余交易,知情方有较大概率获得超额利润,这将明显地改变市场竞争格局。

由此观之,大数据以丰富高频程式化交易这一经典内容的方式重塑了金融学。

四、互联网金融的风险控制

大数据技术客观上推动了互联网金融的产生与发展,并且深刻地改变了传统金融风险管理的范式。互联网金融(ITFIN)是指以移动支付、云服务、社交网络及搜索引擎等互联网技术为依托,实现资金融通、支付与信息中介等业务的一种新兴金融。它不是金融业与互联网的简单拼凑,而是新需求与新技术的深度融合,是一种建立在移动与安全架构上的金融新模式与新形态。

《互联网金融报告2015》指出,截至2014年底,中国网贷行业总体贷款金额为1036亿元人民币,预计2024年中国P2P(Peer-to-Peer Lending)市場规模将跃升至 2万亿元人民币,约占剔除股票与债券后社会融资存量的0.9%。届时的互联网金融行业利润将跃升至400亿美元,其年均复合增长率约为41%,预计与2024年银行整体盈利的8%相当。可见,互联网金融极具生命力与成长空间,很有可能在未来二十年成为主流金融。

然而,作为新兴事物,依托网络近乎无限张力而迅猛发展起来的互联网金融实际上也暗藏巨大隐忧:面对数量庞大的群体,龙蛇混杂、鱼目混珠,其信用如何评估?集腋成裘、聚沙成塔,但来得快去得也急,是否有迹可循?这两个问题解决不好,互联网金融的风险就难以控制,其健康发展也就缘木求鱼。罗长青等(2016年)通过实证研究表明,互联网金融行业提供的数据有利于金融机构的风险管理,能产生正的外部效应。

文章认为,互联网金融发展的核心在风控,而风控的核心在大数据分析。大数据技术使得风险评估突破空间、时间和行业的限制,使风险评估模式由静态滞后模式转变为实时在线模式,因此风控效率和准确性大为提高。且不说互联网金融时刻产生海量非结构化及半结构化的数据,并且线上线下相结合的模式非用大数据技术不可,其信用评价与舆情分析也必须借助大数据分析。

就信用评估而言,用传统方法评估贷款人信用来源,单一、种类贫乏、耗时冗长与成本高,无法大面积推广,给风险控制带来很大困扰。而大数据分析则可调用数据仓库中已经存在的与在线实时产生的交易数据、消费数据及日常行为数据,以真实、全面、快速与有效地评估其信用。随着网贷用户群的扩大,管理过程中出现越来越多有价值的行为信息,评估准确率将不断提高。例如,阿里小贷每天积累海量数据,通过分析商户近百天的历史记录,将其划分为资金匮乏与资金充裕两类。接着,与存在资金问题的商户即潜在贷款对象沟通,并针对性地调用更多该小微企业在网络平台上产生的历史数据,借以评估其还款意愿与能力,据此制定惩罚措施与力度,提高其违约成本从而控制其违约行为,实现安全风险下的盈利。

就舆情分析而言,传统问卷调查类指标受人力、物力、财力等客观因素限制,无法获得大规模数据,也难以进行精细化操作。而基于大数据技术的舆情分析则可通过搜索引擎、网络爬虫、语言处理、文本分类与社交分析等机器学习与数据挖掘方法,对日发消息过5亿的Twitter与日均用户过10亿的Facebook等著名社交网站进行采样分析,研究其与互联网金融相关的聊天记录、博客与评论,获取客观真实的市场情绪,以进行产品设计与风险管理。精神病专家理查德·彼得森建立的MarketPsy Capital对冲基金经过长时间追踪与舆情分析,所确定的投资策略获得了40%的惊人回报率。此外,巴黎的IIBremans机构与伦敦的小型对冲基金DCM在这方面也取得了不俗的业绩。事实上,大数据舆情分析的确能较好地了解客户对互联网金融产品的真实态度,有利于预测其行为,从而有效降低不告而别的风险。

不言自明,互联网金融离不开大数据,大数据正以促进风控的方式推动互联网金融这一新兴事物蓬勃发展,有力地拓展着金融学边界,从而重塑着金融学。

五、结语

大数据及其相关技术的发展方兴未艾,它通过逐步渗入与系统颠覆等多种方式全面改变了金融市场与金融机构的运行模式。理论来源于实践,与大数据金融实践相对应的是,大数据技术也创新了传统金融学的理论,目前至少在市场假说、金融计算、高频交易与网络金融四个方面重塑着金融学。随着创新驱动发展等一系列战略的实施,大数据对金融实践和理论的影响仍将持续,如何更好地运用大数据技术,对金融市场投资者行为和心理、市场微观结构、风险资产定价、风险预测与管理、金融市场监管、金融危机预警与处置等问题展开更深入、系统的研究,是今后金融学应重点研究的方向之一,也是我国金融学界与业界后来居上,赶超西方的重要方式。

虽如此,但也必须清醒认识到,大数据不是万能的,其自身固有的大量噪音有可能将我们引向错误的方向,获得错误的结论,采取错误的决策。毕竟全样本不是总体,相关性分析只是因果关系的有益补充,大数据也只能辅助而不能取代人。互联网金融与大数据技术相辅相成,大数据技术的发展迅速推动了互联网金融的发展,传统的线下金融模式虽然也在积极运用大数据技术,但是否能均衡成本与收益,是否能取得预期收效还有待观察,传统线下金融所蕴含的专家经验优势与金融危机处置过程中的应变能力,也是大数据技术目前难以实现的。

参考文献:

[1]维克托·迈尔-舍恩伯格,肯尼斯·库克耶.大数据时代[M].杭州:浙江人民出版社,2013.

[2]孟小峰,慈 祥.大数据管理:概念、技术与挑战[J]. 计算机研究与发展,2013(1):146-169.

[3]王元卓,靳小龙,程学旗.网络大数据:现状与展望[J]. 计算机学报,2013(6):1125-1138.

[4]程学旗,靳小龙,王元卓,等.大数据系统和分析技术综述[J].软件学报,2014(9): 1889-1908.

[5]Kendall M.The Analysis of Economic Time Series - Part 1:Prices. Journal of the Royal Statistical Society, 1953(96):11-25.

[6]Fama E F.Efficient Capital Markets: A Review of Theory and Empirical Work. The Journal of Finance, 1970(25):383-417.

[7]郭建军,鲁万波,焦 鹏.金融统计与金融计量的新进展——2009金融统计与金融计量国际研讨会会议综述[J].统计研究,2009(26):107-112.

[8]Tian X H,Han R,Wang L,Lu G,Zhan J F.Latency critical big data computing in finance. The Journal of Finance and Data Science,2015,1(1):33-41.

[9]朱建平,魏 瑾,謝邦昌.金融高频数据挖掘研究评述与展望[J].经济学动态,2011(6): 59-62.

[10]燕汝贞,李 平,曾 勇.一种面向高频交易的算法交易策略[J].管理科学学报,2014(3): 88-96.

[11]王 丹,向修海.高频交易的最优执行策略研究[J]. 经济学动态,2013(2):81-87.

[12]谢 平,邹传伟.互联网金融模式研究[J].金融研究, 2012(12):11-22.

[13]刘澜飚,沈 鑫,郭步超.互联网金融发展及其对传统金融模式的影响探讨[J].经济学动态,2013(8): 73-83.

[14]程 鑫.互联网金融背景下征信体系完善所面临的机遇与挑战[J].上海金融,2014(11):109-110.

[15]Moat,Helen Susannah,Adam Avakian,Dror Y. Kenett,H. Eugene Stanley,TobiasPreis.Quantifying Wikipedia usage patterns before stock market,Scientific Reports 2013,No.1801.

[16]罗长青,李梦真,杨彩林,等.互联网金融对商业银行信用卡业务影响的实证研究[J].财经理论与实践, 2016,37(1): 54-58.

[17]翟伟丽.大数据时代的金融体系重构与资本市场变革[J].证券市场导报,2014(2):47-50,60.

[18]Bollen,Johan,Huina Mao,Xiao-Jun Zeng.Twitter mood predicts the stock market[J].Journal of Computational Science,2011(2):1-8.

[19]耿 直.大数据时代统计学面临的机遇与挑战[J].统计研究,2014(1):5-9.

[20]李 倩,吴 昊.大数据背景下投资者行为研究的趋势分析:基于“内涵-思路-方法”的三重视角[J].中央财经大学学报,2017(2):52-62.

[21]云立坤.大数据思维在金融学研究中的运用[J].智富时代,2019(10):12-13.

[22]程春莉.大数据思维在金融学研究中的应用研究[J].环球市场,2017(28):1-2.

[23]孙博洋.论大数据在金融学中的作用[J].中国经贸,2017(19):130.

[24]孙 钧.金融学研究中大数据思维的运用探究[J].中国市场,2016(50):107,119.

[25]王玉华,石美燕,赵 平.大数据应用背景下我国国际金融学本科课程教学改革研究——基于贵州花溪大学城高校的问卷调查[J].教育观察,2019,8(23):112-115.

[26]朱佳琦.大数据思维在金融学研究中的运用策略浅议[J].纳税,2017(7):83.

[27]史雅静.大数据思维在金融学研究中的运用[J].时代金融(下旬刊),2017(9):17,20.

[28]陈加旭,唐元琦.大数据背景下的金融学课程教学改革研究[J].长江丛刊,2018(35):182,184.

[29]陈宇昕.大数据思维在金融学研究中的运用[J].中国民商,2017(12):50-51.

[30]蔡庆丰,郭春松,陈诣之.大数据思维在金融学研究中的运用[J].经济学动态,2015(3):104-114.

[31]梁昕妍.浅谈大数据时代对金融学的几点思考[J].中华少年,2018(2):282.

猜你喜欢
互联网金融大数据
大数据环境下基于移动客户端的传统媒体转型思路