何大安
大数据在各行各业广泛运用的背景是互联网扩张,信息互联网由PC互联网发展到了移动互联网,物体互联网由物联网和人工智能两大块构筑,价值互联网通过区块链开始崭露头角。互联网扩张的直接后果产生了以互联网为平台、以大数据为基本要素、以云计算和机器学习等人工智能为手段的数字经济。数字经济涉猎范围很广,大数据金融便在其中,换言之,互联网扩张是大数据金融的实施背景。
互联网扩张为大数据金融提供平台,大数据金融会借助这个平台得以纵深发展
在数字经济开始渗透宏观和微观经济领域的当今世界,厂商与厂商、厂商与政府、厂商与消费者之间的行为互动,已充分反映出互联网扩张态势。随着5G通讯、社交媒体、传感器、定位系统等的覆盖面越来越宽广,信息互联网、物体互联网和价值互联网会提供海量数据,这些海量数据为从事大数据金融的金融机构、政府当局、厂商和个人提供了操作依据,这主要体现在以下几方面:
(1)利用新科技手段对大数据进行搜集、整合、分类、加工和处理,以获取用于决策的准确信息;(2)利用互联网与5G通讯、社交媒体、传感器、定位系统等的关联,建立金融大数据平台;(3)通过金融大数据平台实现数据智能化和网络协同化。就互联网扩张与数据智能化、网络协同化的联系而论,大数据金融在要求极高的数据智能化的同时,也要求协同交易的网络协同化,但这两项要求都离不开互联网扩张。
从金融交易行为互动看,从事大数据金融的各主体借助互联网扩张,能否取得效用函数的满意值,主要看能不能实现数据智能化和网络协同化,以及能不能实现网络协同效应。以上表述或许夹带着经济和技术参半之意境的“形而上”,但不管怎么说,从事大数据金融的各主体要取得满意的效用函数,必须提升对金融大数据的挖掘、加工和处理的技术层级,必须在面对投资、储蓄、利率、股票、期货、债券、资金拆借、法定准备率、期票贴现率和再贴现率、货币发行量等金融大数据时,能够甄别和判断出扭曲信息和虚假信息,从而在较高数据智能化水平上实现网络协同效应。事实上,如果从事大数据金融的主体能实现网络协同效应,不仅意味着他们的数据智能化能力达到了与客户协同的知己知彼水准,而且也意味着他们借助互联网扩张取得了很大的成功。但在现实中,不同主体的数据智能化和网络协同化水平是不同的,追溯其源,是因为他们具有的技术条件配置不同。互联网扩张为大数据金融提供了数据智能化平台是一回事,各决策主体能在多大程度上利用这个平台从而达到一定的技术层级却是另一回事。
大数据金融要求一定水准的技术条件配置,各金融主体达到这一水准后,才有可能实现网络协同效应
这里所说的技术条件配置,是指挖掘、搜集、加工和处理大数据的云平台、云计算、机器学习等人工智能技术及其组合。为分析方便计,我们把能够搜集、整理和分类大数据,但不独立拥有云平台和不具有云计算能力的金融运作者,界定为低技术条件配置者;把既能够搜集、整理和分类大数据也能够加工和处理大数据,并且拥有云平台和具有云计算能力的金融运作者,界定为中等技术条件配置者;把完全具备以上技术条件配置并且还能够挖掘大数据的金融运作者,界定为高技术条件配置者。显然,这样的划分主要是针對未来情形而言的,这样的划分对大数据金融的运行有以下推论:不同技术条件配置者由于技术层级的差异,他们对金融大数据及其构成的加工和处理能力便存在差异,高技术条件配置者要比中低技术条件配置者能更加准确地开发、设置和运营金融品种,能够在高层级数据智能化基础上达到网络协同化,能够在取得满意效用函数值的同时实现网络协同效应。
网络协同效应是以网络协同化为基础的。与实体经济中厂商之间以及厂商与消费者之间的网络协同化一样,大数据金融中的网络协同化所面临的经营场景,也可划分为简单和复杂两种类型;对于具备新科技条件配置的金融运作者来讲,要实现网络协同效应,只是具备驾驭简单运营场景是不够的,而是必须具有驾驭复杂运营场景的实力。例如,一个从事多元化经营的金融机构通常要比单一经营国债或单一经营股票或单一经营期货的金融机构,具有应对复杂场景的网络协同化能力。联系技术条件配置看问题,由于高技术条件配置的金融机构可以通过云平台搜集、整合和分类诸如投资、储蓄、利率、股票、期货、债券、资金拆借、法定准备率、期票贴现率和再贴现率、货币发行量等的大数据构成及其变动,他们在加工、处理和匹配这些大数据时可得到高水准的云计算和机器学习等人工智能技术的支持,因此,这样的金融机构一定会远超低技术条件配置的金融机构而取得网络协同化,从而实现网络协同效应。
当我们再此论及网络协同效应时,问题的分析画面开始转向清晰。高技术条件配置的金融机构之所以能够在网络交易平台上对复杂金融产品有协同效应,是因为高层级的数据智能化给他们提供了加工、处理和匹配金融大数据的支持,对于那些受政策或制度安排变化干扰的金融产品,他们利用云计算、机器学习、物联网、区块链等人工智能技术匹配金融大数据的优势就显示出来。例如,像债券、资金拆借、期票贴现及股市或期市等衍生金融产品,往往会成为高技术条件配置金融机构的经营专利,而那些中低技术条件配置的金融机构,便很难通过匹配金融大数据将这些金融产品作为经营对象。于是,在高技术条件配置的金融机构经营这类属性的金融产品的过程中,大数据金融会形成因网络协同效应而引发的进入壁垒。大数据金融引发进入壁垒这种现象,现阶段还只是处于端倪状态,它何时会成为常态呢?这个问题仍然可以从技术条件配置的变化得到说明。
新科技条件配置的顶级状态是人工智能可以匹配现期数据和未来数据,这种状态预示着大数据金融的未来
如上所述,金融大数据主要是正在发生事件的现期数据与尚未发生事件的未来数据之和,这两类数据的共同特征是它们都具有极强的不确定性,都需要挖掘才能获得。然则,挖掘大数据与搜集大数据不是一回事。大数据的搜集,是以发生了的历史数据为对象的,它可以通过互联网搜索引擎和程序的较成熟的人工智能来完成;大数据的挖掘,是以还没有发生的未来数据为对象的,现有的各种人工智能技术还没有发展到能成功地挖掘大数据的水平。大数据金融运行中尚未发生的待挖掘数据,是人类经济活动中最不确定性的数据。就人类挖掘和匹配金融大数据的新科技条件配置而论,如果能够挖掘和匹配还没有发生的金融大数据,应该说人类新科技条件配置达到了顶级状态。
在信息不完全的工业化时代,经济学从未停止对经济活动的假设和预测研究,经济学家从关注预测、估计和假设检验的统计学,到注重因果关系分析的计量经济学,再到几乎单一强调预测的机器学习,十分清楚地体现了经济学追求数据匹配以实现准确预测经济事件的思想轨迹。在大数据和互联网时代,随着机器学习方法正在逐步解决计量经济学因样本小和维度低之处理数据的局限,原先计量经济学和机器学习之间不相容甚或相悖的地方出现了交集, 并开始出现交集增大的融合。但是,机器学习等人工智能技术迄今的发展水准,充其量只能加工、处理和匹配历史数据,并不能加工、处理和匹配大数据金融亟需要解决的现期数据和未来数据;以机器学习为代表的人工智能技术的发展空间是巨大的,作为对问题深入研究的一种探讨,如果人类在将来能够运用机器学习方法解决现期数据和未来数据的加工、处理和匹配,那么,机器学习将有可能成为新科技顶级条件配置的标志。