大数据时代经济学方法论变革与发展研究

2019-09-16 03:00沈秋莲
云南财经大学学报 2019年9期
关键词:数据挖掘经济学预测

沈秋莲

(江西理工大学 马克思主义学院,南昌 330013)

一、引言

经济学是一门重要的学科,对于人们发现经济规律、指导经济实践、预测经济行为有重要作用。随着大数据时代的到来及其思维方式的影响,经济学方法论将发生巨大变革。目前已有少部分学者开始关注经济学方法论某一具体领域的研究,其研究的切入点主要集中在研究对象和研究方法上,少部分学者涉及大数据预测问题。关于大数据时代经济学的研究对象问题,俞立平教授认为,在大数据时代,经济学不仅要研究大数据的建模、管理和应用,更主要的任务是研究传统经济学如何应对大数据带来的挑战并不断地发展[1]。关于研究方法,有学者提出了大数据经济学研究方法的区别本质上是知识的发现的观点[2]。还有的学者提出了一些具体研究方法,比如将拓扑成分引入经济分析,同时考虑到经济网络中的高阶相互作用[3]。对于经济学的预测问题,汪毅霖教授认为大数据时代经济学预测基于的是归纳法,以数据为基础且止步于相关性。其预测的成功极度地依赖于未来情境与过往情境之间的相似性[4]。以上观点只是从某一切入点进行点到为止的说明,缺乏从思维方式认知高度对大数据引发的经济学方法论变革与发展问题进行系统的论述和研究。本文从大数据时代特征及其思维方式入手,重点分析了大数据时代经济学的思维方式变革以及数据挖掘与经济学研究对象、数据归纳与经济学研究方法、数据规律与经济学预测变革。

二、大数据时代经济学思维方式变革

大数据,也称海量数据,是使用传统手段难于处理的大规模数据集合[5]。笔者认为,数据量巨大、类型多样、复杂多变只是大数据的表面特征,大数据更重要的在于其所代表的一种新的世界观与思维方式。大数据时代,数据不仅可以用来记录日常生活、描述自然科学世界,而且能用于刻画人类精神世界[6]。也就是说,大数据时代的一切活动皆会留下数据足迹,世界的一切关系皆可用数据来表征,万物皆可被数据化,整个社会都以数据的形式呈现。这些数据通过人类的筛选、挖掘和分析,可以用来为人们的生产生活和科学研究服务。为了更好地进行论述,本文提出了小数据时代这一概念。所谓小数据时代就是在大数据时代出现之前的时代。小数据时代,数据量有限,科学研究对象为具体的实物,数据只是作为一种研究的辅助。

大数据时代产生了 “大数据思维”。关于思维,恩格斯曾说到:“每一个时代的思维,都是社会历史的产物,它在不同的时代具有完全不同的形式和完全不同的内容。”[7]大数据时代产生的大数据思维,是社会历史不断向前发展的产物。所谓的大数据思维指的是一种思维意识或思维方式——只要通过大量的数据并进行合理的分析、挖掘和利用就能为人类亟需解决的问题提供答案。大数据带来的三大思维变革,包括更多——不是随机样本,而是全体数据;更杂——不是精确性,而是混杂性;更好——不是因果关系,而是相关关系[8]28。大数据思维不仅影响了人们看待事物的角度、方式和看法,对人们日常生活产生了重大影响,也从一定程度上影响了经济学的思维方式。大数据时代经济学思维方式主要包括以下四点。

第一,整体性思维。舍恩伯格曾在《大数据时代》一书中说到“要分析与某事物相关的所有数据,而不是分析少量的数据样本。”[8]29在大数据时代,由于海量数据的存在,人们对研究对象样本的选择,不需要再采用随机抽样的方法通过少量精确的数据进行研究,而是直接通过对全体数据进行研究,更加全面深入地把握研究对象。在大数据时代,整体性思维是面对问题、解决问题时的首选。张义祯在《大数据带来的四种思维》中指出,在技术条件逐渐成熟的背景下,在取样调查时会有更多场景采取总体思维的办法。他强调:“思维方式也应该从样本思维转向总体思维。”[9]这种全数据思维模式代表着一种新的整体观,并且是一种可以描述和计算的整体全面思想观。

小数据时代经济学更多的是样本思维,或者叫局部思维。比如经济学注重还原方法,将一些复杂的外在因素舍弃掉,进而突出个体经济运行的主要现状及其特征。经济学试图以“经济人”作为基本假设,把个体从社会环境中抽离出来,注重个量分析。除了还原方法之外,抽样分析方法也是传统经济学常用的方法。所谓抽样分析方法,就是选取部分代表性样本作为分析对象的方法。抽样方法主要是用少量的抽样部分来代表整体,从本质上说仍然是还原方法。抽样调查的方法虽然能反映出经济参与者的某些因素或特征,但样本毕竟只是整体中的部分,这些部分不能全面反映整体的许多细节和过程[10]。反之,大数据时代,经济学的研究可以基于全体样本数据的基础之上而不再局限于少量抽样数据和假设。经济学的研究对象不再是被设定好的千篇一律的理性经济人,而是真实复杂的完整社会人。通过数据挖掘可以把握经济研究对象的方方面面,包括影响经济人行为的心理、环境、制度等关键因素,而不再需要对此设定过多的假设。人工智能设备的广泛运用、网络技术、云计算等技术的不断升级为数据的自动采集和分析提供了快捷、方便的技术手段,使人们能够全面真实地掌握复杂的人的心理活动,把握经济活动的全面和整体动态。

第二,多样性思维。大数据时代的数据种类繁多,形式多样。既有结构化数据、半结构化数据,还有大量的非结构化数据,数据总体呈现多样性特征。大数据技术能够对各种各样的数据(包括文档、 图片、视频、语音等)进行挖掘、处理,不再要求按照标准化的格式进行数据采样,不再要求必须符合某种模式或规律,也不再要求数据精确无误[8]60~66。小数据时代由于数据处理能力有限,经济学在研究过程中一方面把研究对象从复杂的社会经济环境中孤立出来,从经济活动时间变化中静止下来,通过孤立和静止的方式用固定的假设模式来分析研究对象;另一方面通过预设前提假设,再根据假设来进行有意识的抽样数据采集和处理,从而为了迎合结论而建立一种特定的模型或公式。其目的是为了突出经济学的科学性,强调的是固定化、标准化和程序化,要求像自然科学一样一致和精准。这就导致了经济学的结论和预测往往与现实结果大相径庭。大数据时代,随着数据处理技术的不断完善,虽然数据繁多,但是却可以通过数据挖掘和分析做出更好的预测。以日常消费为例,人们在消费活动之前,会有一番考察分析,对相关信息展开搜集整理和处理。而且消费主体没有注意到的是,他在考察的过程中,其在互联网上留下的蛛丝马迹会客观显示出他消费的原因、爱好等倾向。研究者就能通过综合运用大数据分析和机器学习等手段,完成对人们的购买力水平、消费偏好和倾向、喜欢的款式风格、常买的店铺等进行分析的工作,从而预测人们的消费行为。

第三,动态性思维。动态性思维是与静态思维相对应的,是指从原来只关注和研究某一范围或者时间点的静态数据,到现在自动分析和挖掘在线动态数据的思维方式。随着大数据的采集和存储技术不断完善,可以实时在线获取数据,进而无限接近变化和发展的事实。将动态性思维用于经济学的研究当中,研究者无需采用静止还原的方法,将某一时间段的经济活动或者经济研究对象的心理看作是静止不变的过程,而是看作变化发展的过程;无需使用抽象化方法去计量人的主观因素(价值观、爱好等),通过数据挖掘就可以得到较为精准的结果;无需提前采集数据样本,而是直接利用人们无意识创造的实时海量数据来更好地进行研究。比如在销售过程中,如果我们可以关注到对象的心理活动变化过程,知其想法,就可以针对性地进行销售攻关。

第四,相关性思维。相关性是指要关注数据间的关联关系,从原来关注“为什么”,到现在更加关注“是什么”。这种转变在于:一方面,在大数据时代,相关关系比因果关系更直接,且更容易掌握。从大数据中寻求事物相关性,通过这种相关思维对可能发生的事情进行预测,是大数据思维的最主要目的。另一方面,大数据时代,因果关系在经济学的研究中将被弱化。舍恩伯格在书中说到:“面对海量数据,难以确定数据之间的因果联系。”[8]83因此,在科学研究的过程中,从数据相关性着手,并通过对相关性的研究,进一步发掘其因果规律,实施更为精准有效的预测,是大数据时代科学研究的重要特征之一。

经济学本质上作为一门服务人类经济生活的学科,其最终目的在于解释经济现实和预测未来,为人类的经济活动提供方向上的指引。复杂的经济现象本身不能通过简单的因果关系来解释。而大数据时代纷繁复杂的数据样本也让追求因果关系成为难上加难的选择。甚至在大数据时代,因果关系无法验证。比如新产品会造成旧产品价格的短期上涨,而后才是逐步回落。通过大数据挖掘与分析,旧产品和新产品的购买数量一目了然,但是其中的原因未必能立刻发现。不过知道结果就已经足够提前采取相关手段进行调控,又何必急着找出原因呢?因此,转变经济学的研究思维,从重视因果性研究转向重视相关性研究,不过分强调其中的因果关系,并避免其影响了经济学的指导性功能,才更加有利于经济学的长远发展。当然,这并不意味着经济学的研究要放弃因果关系的找寻,反而是相关性为因果性的发现提供了新的思路和方法。当因果性无从获取时,研究者们就可以从大量相关性中发现是否存在因果性的可能,从而为因果性的获取提供了新的道路。

三、数据挖掘与经济学研究对象变革

经济学的研究对象,是指经济学研究的客体。在经济学的发展历程中,人们对经济学的研究对象长期未能达成统一共识,但是深入分析经济学的研究对象,就会发现小数据时代的经济学是一门关于人的学科,因为人是经济活动的主体、人的欲望或需要是经济学的逻辑起点、服务于人是经济活动的目的[11]。大数据时代,经济学的直接研究对象不再是基于假设的“理性经济人”,而是数据,其最终研究对象转变成基于数据分析基础的“全面社会人”。为什么大数据时代经济学的直接研究对象是数据呢?

出版类企业核心竞争力提升策略探析 ………………………………………………………………………………… 黄 晓(2/24)

首先,万物数据化是前提。舍恩伯格认为“万物皆数”“量化一切”“世界的本质是数据”。通过大数据技术,一切现象或行为皆可转化为数据,在万物数据化、智能无处不在的前提下,现象世界成为为一个名副其实的“数据世界”。也就是说,世界的存在变成了数据的存在。数据是大数据时代最重要的资源和财富,一切事物都可以用数据来描绘,所有数据都被当作财富被采集、挖掘、存储乃至交易,人类处于数字、数据的包围之中,实现了“数字化生存”。 因此,在万物数据化的前提下,无论研究什么都是研究数据,数据也将成为经济学研究的基础。前文说到经济学主要研究对象是人,是一门关于人的学说。经济学研究的逻辑起点是人的需要或欲望。所谓的欲望是指基于一定的需要而产生的对一定物质或精神事物的渴求。怎么知道人的欲望呢?大数据时代,通过分析和挖掘人们无意识的留下的真实数据,就可以探知人的欲望。比如通过发掘一个人浏览房价信息,可以大概判断此人或许有购房的欲望;通过一个人浏览旅游攻略的数据,可以知道此人有度假的打算……因此,在大数据时代我们所要了解的人的信息,都可以通过数据挖掘和数据分析来找到。这种方式的好处在于,所获得的数据是人们的无意识产生的数据,而不是带有主观预设的数据。

其次,大数据的动态性特征是关键。对于经济学来说,其主体是人。人类具有主体性、社会性和意识性,其思想和行为都是随时发生变化的,并非是线性的静态特征。而且人们不可能用极少的几个数据来全面描绘其复杂的行为和思想。经济学研究的是人类的偏好、价值、理性等因素,其思想和行为同样具有动态发展和主观性,随时都有可能发生改变。传统的调查和实验方法是基于静态分析基础上的,具有一定的滞后性。随着大数据时代的来临,人类快速地进入了智能时代。智能手机、智能穿戴设备、网络浏览、网络社交、GPS定位等各种智能感知技术,可以将人类的一切行为随时随地进行存储并转换为数据,形成无数的正在运动、变化和发展的人类行为数据轨迹。通过挖掘和分析这种与人的行为、思想和需求密切相关的动态化数据可以更加精确地认识经济学的研究对象。

最后,数据采集、存储和分析的自动化是保障。第一,数据采集和存储的自动化。小数据时代,数据的采集需要人们亲自参与,如问卷调查、观察测量等;数据的存储也需要人投入大量的精力进行分析和统计;数据分析和处理更是依赖人的大脑进行分析。大数据时代,数据实现了自动化采集和存储。一方面,电脑、APP、智能手环、监控摄像等都能够自动记录和存储相应的数据。所获得的数据不需要人的参与,完全是自动生成的,只要设备具备相应的存储空间,数据就能保留下来。另一方面,数据输送的在线化、数据存储的云端化以及数据处理智能化的实现,为经济学更好地研究数据、研究数据背后所反映的个人欲望和需求提供数据内容和方法论基础。第二,数据规模的海量化。在小数据时代,由于采集困难,人类能够获得和保存的数据非常少。然而,随着信息技术的不断进步,数据采集、存储和分析自动化、智能化的实现,数据呈现爆发式增长。海量的数据有助于人们更加深刻和全面地把握经济学的研究对象。比如要了解一个人的消费能力需要通过各种调查,要了解一个人的需求欲望需要各种采访,要了解一个人的诚信度更需要多方面打探。但是这些通过调查得来的数据未必准确,因为人在面对调查时会刻意隐瞒不利于自己的行为。大数据时代,由于海量数据的存在,各种格式的数据信息,包括图片、文本、视频、音频乃至方位等,都可以变成数据,是真正的“万物皆数据”,只要通过数据分析就能得到更加准确的预估和分析。如消费能力可根据其固定资产的登记情况数据,需求心理可分析其近期浏览信息的数据,诚信水平可看其每月的花销及信用卡还款情况数据等等。可见,数据量越多,可供分析的素材就越多,判断也就越准确。

综上所述,由于社会环境的差异和经济学发展水平的不同,小数据时代人们对经济学的具体研究对象未达成较为统一的意见,为了研究的方便,经济学家们将“理性经济人”作为经济学的研究对象和研究起点。这种假设的“理性经济人”虽然有利于经济学研究的开展和科学化水平提升,但是,作为一门人文社会科学,不符合人的复杂性和多变性特征,因而经济学在漫长的发展过程中虽然有大量的保护带理论来修正,但是其功能性不足也是显而易见的。大数据时代,由于技术的进步和社会的发展,人们真正实现了对复杂社会人的多维度掌控,只要能够充分的挖掘相关数据并进行分析,通过直接研究数据,然后进一步挖掘数据背后的规律进行预测,就能够实现经济学的解释和预测功能。

四、数据归纳与经济学研究方法的发展

研究方法,是指在研究过程中所采用的研究工具和手段[12]。大数据时代经济学的研究方法将进一步发展,在传统的数学、心理和制度三大分析方法基础上还将结合大数据研究方法。我们将其称之为“大数据经济研究方法”。大数据经济研究方法的本质是在数据归纳法的基础之上,通过相关性思维分析,结合经济学传统研究方法而形成的新的方法体系。其中,大数据归纳法是前提、相关法是辅助,而基于心理分析、制度分析、数学分析基础之上的演绎、实证、定量、定性等方法仍然是经济学研究的核心方法。

(一) 研究方法基础:小数据时代经济学三大研究方法

首先,心理分析方法。心理分析方法从经济学诞生以来就不断运用并贯穿经济学发展的始终。早在200年前,经济学家亚当·斯密就已经开始关注心理学对人的行为活动的影响。他在著作《道德情操论》中提出:人类的一切行为都是情感与理智斗争的产物。他认为人类是损失厌恶者。可见他已经初步注意到心理对个体行为的作用并将心理方面的知识运用到经济学研究当中。约翰·穆勒在《政治经济学定义及研究这门学问的哲学方法》中提出了“经济人假设”,把人看作是理性、自利、谋求利益最大化的生物,这也是后来西方主流经济学对“经济人”学说的基本内涵。动机分析其实也是对人活动一般心理规律的分析,约翰·穆勒把这种动机引申为人类一般的、普遍的经济活动规律,并且上升为经济学的一般规律法则。除此之外,还有大量的经济学理论利用了心理分析方法,比如微观经济学的效用理论、要素理论、剩余理论(生产者剩余和消费者剩余)都采用了心理分析方法,重点分析了人们的心理因素。凯恩斯利用三大心理规律(边际消费倾向递减规律、资本的边际效率递减规律和灵活性偏好)作为基础,构建了宏观经济学理论体系。包括在现代经济学中,将心理因素作为经济变量去分析现实经济的研究方法运用相当广泛,有关于金融市场的投资分析,有企业家、消费者的分析,还有关于劳动力市场的分析等等。

其次,制度分析方法。制度分析方法是制度学派、历史学派等众多经济学家常用的方法。自亚当·斯密以来,经济学家们就以经济人假设为前提,把制度做为变量,把集体主义和整体主义引入到经济理论的研究中,建立了更为接近现实经济活动的方法论。制度分析方法主要是指将结构分析法、历史分析法和社会文化分析法用来研究经济问题,揭示制度对社会经济发展的影响,以及去发现这些制度在经济体系中的地位和作用。比如斯密试图用比较制度分析方法证明一套特定的规则如何比另一套规则更有利于国民财富的增长;老制度学派的凡勃伦提出的阿里斯纲领理论,强调商业或金钱经济与实业经济的基本二分法;康芒斯—塞缪尔斯—施密德纲领,它关注法律、产权和组织,它们的演变及其对法律和经济权力、经济交易和收入分配的影响[13]。现代经济学家科斯对企业性质所作的开拓性研究以及运用制度分析方法形成了三大理论:一是契约经济学和公共选择理论,二是交易费用经济学,三是制度演化理论[14]。

最后,数学方法。主要是把数量概念和定量分析引入经济学,用数学思维、论证和语言形式探讨各种经济现象数量变化的内在联系和规律[15]。从亚当·斯密开始,到马歇尔时代,数学分析方法已经成为经济学的最主要研究方法之一,大量的经济学数学公式和模型是最好的证明。数学方法的运用,使经济学中表述的精确化和严格形式化程度大大提高,从而使已有的经济理论获得确切的范围,使经济分析增强定量化和实证化。但是作为一门解释现实的学科,却有大量晦涩难懂的数学模型和公理,这是经济学奇怪的数学化现象。这种数学化行为忽视了论证的因果性,导致了论证的片面性、简单化,不利于经济学目标的实现。

(二) 研究方法发展:大数据经济学研究方法

第一,数据挖掘法。大数据方法的核心是数据挖掘。所谓数据挖掘,是指从海量数据中依据相应的标准筛选出符合需要的数据并进行研究、形成知识的过程[16]。数据挖掘的基本目标有两个:描述与预测,即通过描述海量数据中的潜在模式,并根据这一潜在模式进行预测,从中发现数据中有价值的模型和规律[17]。数据挖掘的目标,在于运用信息技术对通过数据挖掘得出的相关性结论和结果进行分析、解释,找出事物之间潜藏的联系。

数据挖掘是一项综合性行为,需要运用数学、统计学、模型、人工智能等多方面、多学科的知识[18]。从操作者来看,数据挖掘技术更多是专业的数据分析师、业务分析师在使用,而不是传统的统计学家。而数据挖掘中的算法会自动寻找变量之间的关系,不需要再人为的去发掘和设定。因此,对于海量、杂乱的数据,数据挖掘技术有明显的应用优势。当然,数据挖掘也需要人的参与,不能随意挖掘无关的数据,而是在设定好关键词基础之上的有针对性的筛选和处理。

在经济学领域,数据挖掘与经济学传统研究方法之间也存在着密切的联系。首先,二者都重视数学方法的运用。经济学数理化是经济学的一大特点,从古典经济学派崇尚数学方法,到新凯恩斯主义学派大量运用数学分析,人们可以发现合理地运用数学分析方法,可以促进经济学的发展。而对于大数据挖掘和分析来说,数学方法也是数据挖掘方法过程中必须用到的方法。其次,数据挖掘方法和小数据时代调查研究都需要大量的历史材料、数据资料等。所参考的资料越多,样本越大,则解释与预测效果越好。最后,二者的目标一致。无论是传统的经济学研究方法,还是现在将数据挖掘方法运用于经济学研究,其根本目的都是为了更好地解释人类经济行为,发现经济规律,预测经济未来。因此,将数据挖掘方法与经济学传统方法相结合,有利于经济学的规范化和科学化。

第二,大数据相关法。大数据相关分析法是指建立在数据挖掘技术基础上的对海量数据的关联分析的方法。虽然经济领域的数据表面上看起来纷繁复杂且相关性极差,但是因为数量巨大,样本够多,如果将海量的数据汇集起来就会产生关联,产生可供研究和分析的价值。这里我们不再拘泥于因果分析,因为在大量混杂的数据当中,快速到找到因果关系则是几乎不可能实现的事情。这个时候如果使用相关关系进行分析,则可以提供新的方法,获得意想不到的效果。大数据相关分析法使经济学家们只要通过相关性的分析,就能为经济学的研究开阔一片新的天地,而在相关关系缕清之后,进一步从相关关系中找寻因果关系。这种相关分析方法为经济学的研究拓展了新的方法。

比如,在大数据时代,银行通过数据平台可以对贷款者的信用度、经济能力、消费水平、消费习惯等进行分析和判断,将这些看似闲散的信息整合利用发放贷款,而不再需要通过传统的问卷调查、信用评估、财产担保等手段,既简化了流程,提高了效率,也大大降低了贷款的风险。目前流行的网商银行,着眼于为国内中小企业和个人提供短期贷款。在小数据时代,这些群体由于没有担保物品,很难从银行得到贷款。因此,哪怕是路边的煎饼摊、菜市场的蔬菜铺,都可以通过移动互联的方式积累起自己的信用。依托于这些数据,以及云计算和大数据技术,网商银行通过不断的数据分析和处理,创立了大量与传统贷款银行不同的指标体系和风控策略。正是利用大数据的相关性分析方法,网商银行创立了一套方便双方、节省大量精力、操作方面的贷款体系——信用贷款;并且通过大数据分析,精准地判断对方的偿还能力,大大降低了各种不良贷款的风险[19]。现在许多借贷平台都采取类似模式来运作,都取得了不错的效果。以上案例说明,在大数据时代,即使人们不去深入挖掘背后的因果关系,也能通过相关性的分析来开展经济活动,开展经济学的研究,并且能取得比较好的效果。

第三,大数据归纳方法。大数据本质上就是一种新经验主义,是经验主义的重生[20]。在经济学的研究中,大数据方法的本质是类完全归纳法。归纳分为完全归纳和不完全归纳。完全归纳就是包含了所有样本的总结,具有很强的可靠性。不完全归纳虽然不是全体样本,但是随着样本的完善也会逐渐地接近科学,其结论具有实现的可能性。换言之,所有由不完全归纳总结出的规律都是概率性的[21]。大数据时代的经济学的研究,仍然是从数据中发现知识、总结规律、预测行为。但与小数据时代经济学研究不同的是,大数据无限包含整体,因此大数据归纳法接近完全归纳法却不等于完全归纳法,大大提升了经济学分析和预测的准确性。

总之,大数据时代经济学的研究方法形成了以数据挖掘法、数据相关分析法、大数据归纳法等大数据方法为基础,以数学方法、心理分析方法和制度分析方法为核心的综合研究方法。大数据时代,通过将大数据分析方法、大数据挖掘方法及大数据归纳法等一系列大数据方法与小数据时代经济学的研究方法相结合,经济学的研究方法将更多样化和有效,经济学的科学性和与人文性都将进一步深化。

五、数据规律与经济学预测

预测一直是经济学研究的重要的内容。弗里德曼指出,“经济学的最终目的,是要提出一种‘理论’或‘假说’,能对未来做出合理的预测”[22]。他认为检验经济学理论是否科学的惟一标志,是将其预测结果与实际情况加以比较,从而判断其能否准确的预测未来。小数据时代的经济学预测,指的是从提出前提性假设开始,通过逻辑推导,进而形成“理论”或者“假说”,然后根据约束条件的变化进行预测。这种预测方法虽然发挥了一定作用,但是预测的实效性却不尽人意。究其原因,一方面,是由于因经济学理论的传统预测是基于假设的基础之上,而不是基于现实数据基础之上,在预测过程中更多的是注重演绎与推理,关注因果关系;另一方面,是在预测过程中,由于经济活动的复杂性和发展性,又涉及到人的选择,如果仅仅是将人看作是简单的静止的人,而忽略了人是有自由意志的个体,那么随着约束条件的变化,预测显然会失败。

大数据时代的经济学预测不同于小数据时代经济学预测,其预测的核心在于大数据的相关性分析。也就是说只要找到一个恰当的关联物,相关关系可以帮助研究者进行预测。”[8]72、75具体来说,是在大数据研究方法的基础上,通过对大量数据的分析与挖掘找出数据之间的规律,再从规律中推测未来的行为,从而实现精准预测[21],其预测程序如图1。

图1 大数据预测方法程序图[4]

由图1可知,确定关键词,找出关联物是大数据预测的关键点。较之小数据时代的预测,大数据预测最大的改变在于在数据规律基础上,让数据自己发声,而不是有意识的让数据为预测服务。二者的具体区别主要体现在以下三点:首先,在数据采集方式上,传统的低效的数据采集方式逐渐退居次要地位,大数据的采集更多是靠互联网技术,在网络世界自然生成的各项数据都可以被挖掘处理,而生成有价值的信息,进而用于经济预测。其次,在数据产生媒介上,大数据时代的数据并不是全部依靠传统的抽样调查和经济普查。社会媒体数据、搜索数据等网络数据资源以及各种智能设备留下来的数据都能够随时用来进行经济学研究。最后,在预测方法上,大数据时代的经济预测对其所采用的方法、工具有了新的要求,大数据经济学在预测时,既采用传统的计量分析法,也包含新时代的数据技术支持下的各种方法。二者相互结合共同应对人类所需。

大数据预测方法对于经济学的检验和预测具有十分重要的作用。一方面,通过大数据预测方法能够较为显著地减少误差、提高预测精度。目前非常流行的、由著名经济学家哈尔·瓦里安引入到经济预测中的谷歌趋势数据,就是在传统的时间序列预测模型基础上,加入谷歌趋势生成的查询指数,以提高预测精度。瓦里安教授的预测实践表明,借助大数据预测,能够有助于提高即时预测精确度。Google的数据预测被不断地利用,发挥了更大的价值。比如德国劳工研究所的学者们利用Google的数据对住房贷款违约比例进行即时预测,发现预测的准确性远远高于传统的方式。爱尔兰中央银行的管理者将其用在对宏观经济的预测方面,也达到了同样的效果。在中国,百度推出了“百度指数”,这是一款类似于谷歌的软件。相关数据指标在这个软件中可以被用来进行经济预测。2014年,有研究者将他们开发的“中国股市预测模型”引入“百度关键指数”,从而将股票平均预测误差从3.8%降低到1.4%[23]。

另一方面,大数据预测进一步提高了预测的及时性。在网络在线数据的支持下,大数据预测解决了小数据时代数据样本滞后的问题,出现了几乎同步的高效预测。荷兰统计局的专家们将本无任何因果联系的社交媒体数据用来对消费者信心指数进行预测。具体做法是是:(1)收集包括Twitter、Facebook等社交媒体的数据,然后通过数据挖掘和分析,构造出“基于社交媒体数据的消费者信心指数”;(2)将官方统计和调查得到的“消费者信心指数”与社交媒体消费者信心指数之间进行对比和分析,找到其相关关系;(3)在两者相关关系的基础上,以社交媒体“消费者信心指数”对官方统计“消费者信心指数”进行预测。根据分析,社交媒体数据构造的指数与官方指数之间高度相关。

在大数据时代,我们主张将大数据的相关性预测方法与经济学传统方法相结合,充分发挥二者的优势。一方面,通过经济学方法和相关技术,进一步改变和完善大数据预测,借鉴经济学的小样本质量控制方法,减少数据偏差,通过经济学理论更好地找到关联物,在相关性分析的基础上进一步研究因果性;另一方面发挥大数据的优势,为经济学研究提供诸如个人消费习惯、偏好、性格特征等多样化的条件信息,使得经济学的前提约束无限接近现实。

六、结束语

大数据是正在兴起的一场数据革命,它给人类带来了认识世界的新视角和新方法。在大数据基础之上形成的大数据思维方式和大数据方法为经济学的研究对象、研究方法和预测带来了新的变革和发展契机。经济学的研究对象从以假设为基础的“理性经济人”转变为以数据为基础的“全面社会人”。经济学的研究方法将融入大数据方法,形成大数据时代经济学的研究方法,通过对经济活动主体在各种设备和智能终端所产生的数据足迹进行数据挖掘,相关性分析和全数据模式归纳,结合传统的制度、心理和数学研究方法,从而全面认识经济活动参与者的心理偏好、思想动态和行为特征。在此基础上,将大数据方法运用到经济学研究方法当中,利用大数据之间的数据规律准确预测经济行为。在大数据时代,经济学的研究者们必须充分利用大数据这一新技术利器来进行经济理论研究和预测,切实提高经济学研究的全面性、有效性和科学性。

猜你喜欢
数据挖掘经济学预测
移民与健康经济学
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
探讨人工智能与数据挖掘发展趋势
简明经济学
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
不必预测未来,只需把握现在
经济学
一种基于Hadoop的大数据挖掘云服务及应用