何大安
推崇大数据的未来学家是科技人文主义的信奉者,他们认为将来一切都由大数据主宰,人类所有活动和自然界所有现象都将会成为一种“算法”。世界的未来大势果真如此吗?
金融大数据
事实上,大数据是自有人类就存在但直到工业化后期才出现的概念,该概念既包括数字化数据,也包括非数字化数据;既包括人类社会活动留下的所有痕迹,也包括自然界所有现象的痕迹。同时,它不仅包括已发生事件的历史数据,而且包括正在发生事件的现期数据和将会发生事件的未来数据。我们现今描述和论证的大数据,主要是针对人类活动而言的,如工业大数据、农业大数据、消费大数据、金融大数据、投资大数据、社交媒体大数据以及人们衣食住行各种分类的大数据等。就金融大数据而论,它主要由金融机构、厂商、个人和政府当局在投资、储蓄、利率、股票、期货、债券、资金拆借、货币发行量、期票贴现和再贴现等构成。
大数据构成的分类权重很复杂,需要我们利用云平台和云计算、人工智能技术来处理,而不是简单加总就可以作为决策依据的数据。换言之,理解金融大数据的构成并不难,困难主要发生在如何搜集、整合和分类大数据的分类权重,以及如何对这些经常变动的金融大数据进行挖掘、加工和处理。
金融大数据内涵,可以理解为大数据中蕴含的反映人们金融交易行为互动的基本信息,这是一种依据“信息来源于大数据”的认知而得出的理论考量。比较金融大数据内涵与金融大数据构成,两者之间存在关联;前者会在一定程度上规定后者,这主要体现在大数据分类构成及其权重变化会导致金融运行有可能出现的机遇、风险或危机等方面;金融大数据内涵并不等价于金融大数据构成,这是因为,金融大数据内涵在一定程度和范围内要受到政府宏观调控政策及其制度安排的影响,以至于人们难以依据金融大数据构成进行决策。这个问题会涉及金融大数据外延,以及人们根据金融大数据进行决策会不会出现偏差等的讨论。不过,我们在一般理论层面上讨论金融大数据内涵,把聚焦点放在金融大数据构成上,应该说抓住了问题分析的症结。
金融大数据内涵具有极大量、多维度和完备性等特征,人们根据金融大数据进行决策,需要有处理这些特征的新科技手段。在现已运用的新科技中,云平台是搜集和分类极大量和完备性之大数据的基础,集约化云计算是加工和处理极大量和完备性之大数据的主要技术手段,机器学习、物联网、区块链等其他人工智能技术则是对多维度大数据进行甄别、判断和预测的主要分析工具。人类运用新科技手段对金融大数据的挖掘、搜集、整合、分类、加工和处理,存在着效用函数的评估问题。从正确把握金融大数据内涵从而消除金融活动不确定性来考察,该效用函数要取得最大值,关键是人们不仅要能加工和处理历史数据,而且要能加工和处理现期数据和未来数据,并且能够从历史数据、现期数据和未来数据中获得准确信息。金融大数据内涵既可以从静态上理解,也可以从动态过程解释。显然,经济学家分析现期数据和未来数据是对金融大数据内涵的动态研究,它是我们解说金融大数据内涵的分析基点。
社会物理学认为人们面对未来决策存在“想法流”(彭特兰,2015),这个想法流与人们行为之间有着可靠数量关系,它会改变人的选择并能够推动创新。这个观点的启示是,我们可以把金融领域已经发生事件的行为数据,定义为金融机构、政府当局、厂商和个人的“行为数据流”,把金融领域尚未发生但即将会发生事件的行为数据,解说为金融机构、政府当局、厂商和个人的“想法数据流”。在结合金融大数据是数字化数据与非数字化数据之和的规定下,我们可得到以下等式:金融大数据 = 行为数据流 + 想法数据流 = 历史数据 + 现期数据 + 未来数据 = 数字化數据 + 非数字化数据。这个系列等式非常重要,它在很大程度和范围内揭示了金融大数据内涵。
大数据金融
大数据金融,主要是指运用大数据分析方法从事金融活动的方法和过程,即厂商、个人和政府通过云计算、机器学习、物联网、区块链等人工智能技术来匹配金融大数据的方法和过程。大数据金融反映的是,金融机构、政府当局、厂商和个人正在进行决策的具体过程。较之于金融大数据,大数据金融关注大数据工具的选择和运用,强调金融活动主体在互联网扩张过程中掌握和运用云平台、云计算、机器学习、物联网、区块链等人工智能手段的技术层级,注重金融活动的效用函数。从数字经济运行角度看,大数据金融的落地过程伴随着互联网、大数据和人工智能等相互融合的运行过程。
金融大数据是人类经济活动的一个最值得重点研究的领域。依据未来学家的观点,对金融大数据的分析和研究,还必须联系人类经济活动的其他数据进行,显然,这个观点是以人类一切活动和自然界一切现象都可以转化成“算法”为依据的。基于现阶段人类匹配大数据的能力还只是处于初期发展阶段,也基于大数据金融的运行和发展具有相对独立性,我们只是把金融大数据的挖掘、加工和处理放置在大数据金融运行的框架内进行分析。这个分析框架在体现它们之间相互关联的同时,重点是揭示它们之间的作用机理。
未来学家把一切都视为“算法”,是以互联网、大数据和人工智能等的融合达到顶级技术层次为前提的,当人类不能达到或距这个技术层次很远时,我们把金融大数据从社会大数据中抽象出来展开分析,仍然是大数据视野下直面问题研究的一种分析。
大数据金融的运行和发展是制度、主体和行为的综合,其内容极其宽泛。当我们将之作为一种“算法”来考察,问题的分析便聚焦于技术层面;当我们强调技术发展对大数据金融的影响,问题的探讨就集中于金融机构的选择行为;当我们关注金融机构的选择行为,问题的进一步研究就需要讨论效用函数。
这条逻辑分析链最显著的特点,是在关注新科技之于金融机构技术条件配置的前提上,把金融机构划分为低中高三种类型的技术层级,并通过这种划分来预估不同技术层级金融机构的效用函数。
金融大数据与大数据金融在内涵上的差异绝不是一种概念或范畴的玩味,前者是互联网、大数据和人工智能等融合的客观实在,后者是表征了大数据时代或互联网时代金融体系的运行和发展,它代表着金融体系未来发展的方向。以机器学习进步来解说金融机构挖掘、搜集、整合、分类、加工和处理大数据,目的是揭示大数据金融的运行机理,并通过这一机理的揭示来展现未来金融世界的发展图景。基于机器学习等人工智能发展的现状,我们把新科技层级作为推论金融机构处理和匹配大数据之能力的依据,跳越了对新科技运用过程的具体分析。客观地讲,这样的分析程序和框架对大数据金融运行的论证所得出的认知,同样适合对其他经济领域的分析。不过,这种推论性分析是粗线条的,至于机器学习等人工智能技术对金融机构处理和匹配大数据的具体过程,则需要等到新科技发展导致数据智能化和网络协同化的全面提升,再由经济学家来进行理论化和系统化。
现有的经济理论关于数字经济的分析进而关联于大数据匹配的研究,主要集中在通过互联网扩张对数字经济的概念界定、行业范围界定、行业属性界定以及规模测算等方面,很少有文献从理论角度对数字经济运行作出经济学解释。
其实,数字经济的核心永远是如何挖掘、搜集、整合、加工和处理大数据,永远是通过匹配大数据以获取准确信息来实现效用最大化。