大数据预测与大数据时代的经济学预测〔*〕

2016-12-02 12:01汪毅霖
学术界 2016年11期
关键词:方法论经济学预测

○ 汪毅霖

(西南政法大学 经济学院, 重庆 401120)



大数据预测与大数据时代的经济学预测〔*〕

○ 汪毅霖

(西南政法大学 经济学院, 重庆 401120)

在大数据时代,经济学预测正在受到大数据预测的挑战。从方法论的角度说,经济学预测与大数据预测存在本质性差别,其中最重要的一点在于,经济学预测以理论为基础且关注因果性,而大数据预测以数据为基础且止步于相关性。两种预测方法都有各自的缺陷和边界,二者都无法保证预测的必然成功。为了提高人类认识世界和改造世界的能力,经济学预测和大数据预测应该达成互补。大数据时代的到来为经济学理论及其预测的发展带来了新的机遇,而经济学理论也可以为完善大数据预测提供思想线索和实践指导。

预测;大数据;方法论

一、引 言

相较于其模仿对象物理学,经济学在预测重要问题时的频频失准确实令人感到尴尬。〔1〕对于2008年金融危机,绝大多数经济学家都没有提前发出预警;而对于中国经济进入新常态,经济学家们也只能给出事后解释。或是羞于自曝其短,经济学界近年来对“预测”失准问题讨论寥寥。消极的意见从经验检验的方法论地位的角度分析了经济学预测所面临的困难和局限。〔2〕积极的声音把经济现象分为经济学可以解释和难以解释两类,认为对于前者,经济学具有充分的预测能力。〔3〕还有经济学家叩其两端而执中,认为经济学的预测有其自身的方法论基础,准确的预测需要经济学家观察约束条件变化的功力加上一些运气。〔4〕

之所以人们对于经济学预测方法的热情明显下降,很大程度上是因为他们被一种新的预测方法转移了注意力。近年来,大数据预测逐渐进入人们的视野,开始侵入经济学预测原本的专有属地。很多大数据预测都与经济问题有关,如对失业率、通货膨胀率等宏观指标的预测和对股票价格等金融指标的预测。当前,大数据预测大有后来居上取代传统的经济学预测的趋势。在实践领域,预测被认作是体现大数据价值的重要方面。2016年3月发布的《十三五规划纲要》提出要使用大数据技术“加强经济监测预测预警”,从而完善经济政策的决策机制。于是,我们需要从理论上回答以下问题:什么是大数据预测?大数据预测与传统的经济学预测有何种联系与区别?大数据时代的到来有望超越传统的经济学预测,改善对经济活动的预测能力吗?

国外学者利用大数据进行经济分析与预测的工作开展较早,目前已经取得了相当丰富的成果。从研究对象看,国外大数据研究主要关注失业、劳动力市场及房地产市场状况等领域。〔5〕国内的大数据预测研究也在很多应用领域取得了相当明显的进展,如宏观领域的经济增长(GDP)趋势波动预测和通货膨胀预测,以及微观领域的金融资产定价和企业代理成本等。〔6〕当进行大数据预测时,互联网通常是国内外学者最重要的数据来源。〔7〕

国内外目前的大数据预测研究有一个共通的趋向,就是主要关注应用而忽视了对大数据预测的理论问题,尤其是方法论问题的思考。少数理论性文献或者是对于计量或统计技术的分析,〔8〕或者是对于已有成果的综述性思考〔9〕。尤其是,当前关于大数据预测的文献忽视了其与传统的经济学预测方法的比较,使得我们无法知晓两种预测方法之间的关系是互补还是互替,是在同一研究纲领下的前后相继还是意味着范式革命。这类问题如果不加以确认,那么大数据时代的经济预测就可能陷入方法论的混乱,故经济学工作者必须回应其他领域学者对基于大数据的经济预测所提出的批评。〔10〕

综上,将大数据预测与传统经济学加以方法论视野的比较,起码有三点意义:第一,澄清大数据预测的方法论基础和其与传统经济学预测在方法论上的关系,以避免理论上的混乱。第二,界定大数据预测在经济社会生活中的适用边界,以便合理利用大数据预测。第三,在明确各自的方法论特质和适用边界的基础上,可探寻大数据预测与经济学预测是否有互为助益的可能。

二、经济学预测的方法论特征及预测失准的原因

牛顿有一个方法论原则——“不臆造假说(hypotheses non fingo)”,〔11〕因为任意凭空构造的假说在实验哲学中是没有位置的。牛顿的这一宣言是为了破除科学研究中的蒙昧:任何理论都必须通过实验证据加以检验,而不能只是停留在猜想性的假说阶段。当实验证据与理论假说不符时,后者必须被抛弃。

牛顿的方法论原则在20世纪被凝练为了哲学上的逻辑实证主义。按照这一哲学学派的观点,对假说性预测进行检验的目的在于克服学术研究中的形而上学。在同一种逻辑体系中,关于同一问题可能存在众多的假说,它们各自在逻辑上都是自洽的。例如在经济学领域,经济学家的争论多数时候并不是逻辑之争,而是事实之争。故“对经济政策的不同看法,主要产生于对所采取措施的经济结果的不同预测,这是一些可以由实证经济学的进步而消除的分歧”。〔12〕因此,自然科学和社会科学都要求假说不仅是逻辑可能的,而且是经验相符的,经验相符的假说的集合只是逻辑可能的假说的集合的一个非常小的子集。

由于以上的哲学原因和众多的科学史中的实践成就,〔13〕预测力在科学哲学中几乎是最重要的判断科学理论的优劣真伪的标准。预测力不仅对于自然科学,而且对于包括经济学在内的社会科学来说也是必不可少的,因为如没有任何经验可检验性,那么就无法区分科学与形而上学。

1953年,弗里德曼发表了《实证经济学方法论》这篇可能是经济思想史上最重要的方法论论文。弗里德曼指出,“实证经济学的最终目的,是要发展出一种‘理论’或‘假说’,能对尚未观察到的现象作出正确而有意义(即,不是老生常谈的)预测”。〔14〕就是说,实证经济学的任务是“对环境变化所产生的后果作出正确的预测”。〔15〕弗里德曼把理论工作的目标设定为给出正确的预测以有效地解决当下的政策问题,而不是通过发展新的理论来追求“真理”(truth)。故弗里德曼乐于被称为“工具主义者”(instrumentalist),〔16〕他“并不认为假设或理论是真理的体系,它们只是用以产生有用的(因为是成功的)语言的工具”〔17〕。

归结起来,新古典经济学的以预测—检验为核心的方法论框架如图1所示。

图1 经济学中的预测的产生和检验

由图1,经济学模型的构建需要首先提出前提性假设,典型的如“经济人”(homo economicus)假设。用拉卡托斯(Imre Lakatos)的科学研究纲领(Scientific Research Programmes)来解读,这类假设条件是理论的“硬核”(hard core)。第二步是逻辑推导,这实际上是逻辑或数学问题,本质上属于同义反复的结构,而“同义反复本身的有用性,说到底,还要依赖于实质性假说的可接受性”。〔18〕于是,第三步就是提出“理论”或曰“假说”,但这种“假说”太具有一般性而难以进行判决性检验。故第四步是根据约束条件的变化作出具体的特殊性“预测”。

前四步都属于模型化阶段,约束条件(constraint)在其中扮演了重要的角色。新古典经济学的基础模型就是在约束条件下追求目标函数的最优化。在模型的逻辑推导步骤中,约束条件属于“初始条件”(initial conditions) 或者“辅助性假设”(auxiliary assumption)。如果说硬核假设可被归类为一般性原则(大前提),那么约束条件就扮演了特殊化陈述(小前提)的角色,二者共同规定了作为演绎推理结论的假说。如果约束条件(如预算)在经验上有所变化,则理论预测也会随之调整,这是为什么理论可以被经验所检验的原因。

“作为一套实质性假说,理论应该用其对它旨在加以‘解释’(explain)的那类现象的预测能力(predictive power)来检验”,〔19〕故在做出预测后,任何科学理论都必须以相关的经验事实(既可以是观察和搜集的自然数据,也可以是实验室数据)来检验预测。这是实证经济学方法论的第五个步骤。在对检验原则的认识上,弗里德曼与波普尔(Karl Popper)的证伪主义(falsificationism)一致。弗里德曼也表示“我深信那次交往(指1947年与波普尔)……的确对我产生了很大的影响”。〔20〕按照弗里德曼的波普尔式话语,“事实证据从来不能‘证明’(prove)一种假说,而只能是无法否定(disprove)它”——这就是所谓的“假说已经被经验所‘确证’(confirm)”〔21〕的含义。

经验检验的结果必然有两类,一是预测被确证,二是预测被证伪。如果被确证,那么理论在出现更好的替代者之前可以被暂时接受。如果被证伪,则我们较多通过修改约束条件而极少通过调整前提假设来挽救理论。之所以如此,是因为作为硬核的前提假设是模型的基础,在科学研究纲领中要极力避免被质疑(否则就会发生范式转换);相反,约束条件被视为“保护带”(protective belt),接受被证伪的检验结果的责任通常被推诿到它的身上。

由图1可知,经济学得出预测并加以检验的程序遵循着严格的科学规范,其在方法论上与物理学并没有本质区别。那么问题来了,为什么经济学看似合理的研究方法会得出明显与经验事实不符的预测呢?对此问题的回答仍要追溯到经济学预测的方法论之上。

经济学的“预测”是来自于模型的逻辑演绎推导所得出的结论,故从方法论的角度说,“预测”(prediction)更适合被翻译为“推测”。“预测”或曰“推测”是基于理论的,按照逻辑推理,如果某些特定的验证条件(test condition)为真,某些现象在逻辑上就必定会发生。但对于“预测”来说,除了不发生逻辑推导错误,结论准确还要求约束条件的稳定。一旦约束条件发生了变化,再高明的经济学家的预测也会失准。〔22〕用科学哲学的语言可以表述为,当“其他条件不变”(ceteris puribus)的前提不存在时,任何科学理论的预测都难免失败。物理学可在实验室中保持环境的稳定,而经济学在真实世界中却无法避免外生冲击造成的约束条件变化。用一个微观经济学的例子来说,如果偏好不变,经济学可以通过弹性计算较为精确地预测某一消费者的行为。可一旦约束条件的稳定性被打破了,例如该消费者某天中了500万的彩票,则之前对此君的消费行为的预测几乎必然失准。换用一个宏观经济学的例子,几乎所有经济学家在2007年时对下一年度的中国经济都持乐观预期,但这一预测的约束条件是美国不爆发金融危机,于是经济学家们再一次在经济危机中成为了被揶揄的对象。可叹的是,经济学预测的成功之处大多是如日常消费这种家长里短,难免会被看淡;而容易预测失败的案例却都是经济危机这类在短期对所有人都有重大负面影响的显著性事件。成败相较,自然是预测失准让人印象更深。当然,经济学家自身在方法论上的不够谦逊也难辞其咎。包括弗里德曼在内的很多新古典经济学家,将预测的精确性(precision)作为经济理论性能的判断依据和对经济理论进行选择的外部标准。〔23〕这种自设陷阱的行为恰是哈耶克所批评的“知识的僭越”(pretence of knowledge),其后果就是由于精确预测的逻辑不可能性导致了经济学预测受到了无休止的批评,而经济学家的自我辩护又大多不着边际。

三、大数据预测的方法论特征及其与经济学预测的区别

预测被大数据专家们视为大数据的核心。〔24〕不同于物理学预测、经济学预测等以学科为名的预测,大数据预测以“数据”为标志。这意味着一个重大的方法论转向——让数据自己说话而非数据为理论服务。因此,大数据预测的方法论在更大程度上受到其所用的数据的时效性、统计特征和来源〔25〕的影响:

首先,在数据时效性上具有“现时预测”(nowcasting)的特点。所谓“现时预测”实际上就是利用大数据技术对经济数据进行及时的监测、归集和整理,在极限上缩小可用于预测的信息和需要被预测的内容之间的时间差。传统的经济学预测所使用的是常规统计或调查数据,由于此类数据具有滞后性,故经济学预测在为政策调整提供依据的及时性上不及大数据预测。

其次,在数据的统计特征上属于“全数据”(all data)。大数据预测中可使用的数据集是所谓的“全数据”,即与研究问题相关的总体样本数据(如全体的互联网搜索行为数据)而非小样本数据。经济学领域传统的统计智慧要求采用随机抽样的数据,欲从有限的数据集中获得最多的信息。现有技术支持大数据预测放弃这种走捷径的方式,直接利用“全数据”来避免抽样过程中的信息损失。

再次,在数据来源上更为丰富。传统的经济学预测使用的基本上是宏观的政府统计数据或微观的调查数据,大数据预测则利用了很多之前未被使用过的数据资源。例如,数据采集技术的进步使得我们可以使用Google或Baidu的互联网搜索行为、Twitter的“推文”(Tweet)内容、微博的文本信息等新型数据。此类数据都属于非结构化数据,在传统上是无法使用的,但大数据技术的进步可将它们都转换为结构化数据。这些新型数据虽然不如传统数据精确,但却是大数据预测最重要的资源。

那么,大数据预测在数据品质上的“优势”是否可转化为实践领域更好的预测力呢?目前对此问题的回答仍是模糊的。大数据预测近年来有很多具体的成功案例,但是失败之作也为数不少。为了理解大数据预测的方法论机理,我们采取“解剖麻雀”的办法,以大数据预测的典型代表Google流感趋势为例加以分析。〔26〕Google流感趋势是Google公司在2008年推出的一款产品。在使用之初,该系统成功预测了甲型H1N1流感病毒在美国的传播趋势。但从2011年开始,该系统的预测开始失准,其给出的发病率是实际发病率的二倍。Google流感趋势的预测原理并不复杂:第一步,Google搜索引擎统计了从2003年到2008年的5000万个关于流感的查询的时间序列数据。第二步,用一个线性回归模型计算医生实际接诊流感患者的历史数据(此数据来自美国疾病控制与预防中心)和当期的流感查询之间的对数发生机率(此步骤同时从大数据中筛选出对线性模型拟合程度最高的搜索关键词)。第三步,收集和整理各地近期使用Google搜索引擎查询了与流感有关的关键词的数据。第四步,根据用线性回归方程计算出的对数机率来预测流感传播情况。

不管Google使用何种关键词筛选规则和预测算法,我们从科学哲学的角度都可以给出一个直观的判断:大数据预测基于的是典型的归纳法——根据过去经验总结出一般规律,再将其延伸到样本外预测。Google流感趋势预测失准的原因也不难理解,当流感大爆发时,人们使用Google搜索引擎查询流感的频率会大为提高,但很多查询者是出于对此的新闻性关心,而不是因为怀疑自己真的得了流感;同时,流感大爆发会造成恐慌,很多不大可能染上流感者可能会庸人自扰地反复查询,这也将增加大数据中的信息噪音。于是,当大趋势发生了变化时,让历史告诉明天自然就行不通了。上述大数据预测的方法论程序见图2。

图2 大数据预测的程序

由图2可知,大数据预测的关键技术节点包括:确定关键词;得出相关系数;做出并检验预测。关键词的初选是一项主观性较强的工作,目前并没有可操作的客观选择标准,但可以通过计算不同关键词与预测目标的相关系数对初选的关键词集合进行考察,为最终确定关键词提供依据。得出相关系数纯粹是一个数学计算过程,相关系数依赖于大数据专家们外生设定的大数据预测方程(目前较为流行线性回归方程)的计算结果。对预测进行经验检验是必要的,但检验的目的并不是判断理论的正误(大数据预测排斥理论),而是为了改善预测效果。对比图1与图2,我们可得出经济学预测与大数据预测在方法论上的根本区别(见表1)。

表1 经济学预测与大数据预测的方法论比较

第一,经济学预测以经济学理论为构建模型的基础,大数据预测则没有依赖任何理论基础。第二,从建立模型的方式上看,二者有迥异的取向,经济学预测遵循演绎法,大数据预测则服膺归纳法。经济学家所熟悉的传统统计思路是“假说—检验”(hypothesis-test),大数据的统计思路则是“发现—总结”。〔27〕第三,经济学理论将模型与对现实的预测建立起联系(即沟通理论与经验)的渠道是确立约束条件,此约束条件要求贴近真实情况(如预算约束要真实反映企业的成本水平或消费者的收入水平);大数据系统的联系方式则是用回归方程计算大数据信息与常规统计信息之间的相关系数。第四,经济学预测所基于的理论中含有核心前提假设,〔28〕大数据预测不以任何理论假设为前提。第五,经济学预测是关于变量之间的因果性的预测,大数据预测则不关注因果问题,而只关注相关性。第六,唯一的共同之处可能是两类预测都寻求进行经验检验,但经济学预测的检验是为了在理论的正误之间划界,而大数据预测的检验主要是为修正预测系统提供参考依据。综上所述,经济学预测有比较温和的工具主义倾向,而大数据预测的工具主义倾向则更为极端,干脆不需要理论基础也不去深究因果问题。

四、对大数据预测的方法论视角下的反思

公平地说,传统经济学预测的准确性并没有人们印象中的那么差,大数据预测的效果也没有人们希望的那样好。通过方法论的梳理,我们可以较为清晰地辨析大数据预测的缺陷是什么,以及大数据预测的边界在哪里。〔29〕

首先,大数据预测所基于的归纳逻辑本身存在缺陷。大数据预测的关键步骤是要运用过往的数据计算变量之间的相关系数。从科学哲学的角度看,相关系数的计算基于的是典型的归纳逻辑(从大量的特殊到一般),从而必然无法避免所谓的“归纳问题”。

按照科学哲学的常识,逻辑只能传递已知的真理而无法创造新的真理(或者说逻辑无法证明陈述的真实性),所以当我们试图从单称命题(特殊陈述)获致所需的普遍命题(一般陈述)时,归纳法时刻面临着“黑天鹅”事件的威胁——一旦出现一个反例,整个一般陈述就会瞬间崩溃。〔30〕换句话说,归纳法只有在搜集了所有的特殊性案例后,才能保证(通过大数据预测所得出的)一般陈述的真实性。而即使有再强的大数据搜集技术,穷尽特殊性案例在实践上也接近幻想,因为唯一不变的就是变化本身。只要历史没有终结,新生事物就会不断出现,就永远不会有真正意义上的全样本数据。故可归纳之数据也有涯,而需探求之真理也无涯,以有涯随无涯,殆已。例如,Google翻译基于的原理也是文本的大数据,其在翻译日常用语时一般较为准确,但在翻译特定学科领域的文献时却往往令人啼笑皆非。这源于特定的专业领域的专有名词就相当于日常语言环境中的“黑天鹅”。类似的,大数据模型在面对2008年金融危机这种非常规经济事件时会给出过度乐观的常规经济预测〔31〕。这说明,与传统经济学预测面对外生冲击时的束手无策一样,基于大数据的经济预测也无法有效地应对外部环境的变化。所以,在反对归纳法的哲学家看来,大数据预测无疑是在科学哲学史上曾屡遭批判的归纳法的再次还魂,但模型在逻辑上的限制决定了其只能获得有限的成功,尤其是无法预测“转折点”(turning point)。

其次,即使大数据预测基于的是“全数据”,也需要克服数据的误差。数据误差的解决思路包括两种:一是抽样(sampling),以解决大数据的代表性问题;二是去噪,以解决大数据中的噪音问题。实际上,抽样与去噪都是为了降低数据误差——科学合理的抽样可以控制“抽样误差”,而去噪则针对“非抽样误差”。

先分析大数据的抽样,从抽样的基本诉求上看,大数据样本与传统的小数据样本所要面对的问题是同质的——大数据本身并没有避免样本选择的偏差。大数据的来源,Google搜索行为数据、Twitter数据、Facebook数据都只是自我选择的数据(只包括经常上网和使用智能手机的人,甚至需是乐于使用Google而不是Baidu的人),并不具有同随机抽样所获得的小样本一样的代表性。这类似于去医院就诊的肯定是存在有效需求的患者(看得起病且相信医院),而非所有的患者。再来分析去除大数据中的噪音,即并非由于样本缺乏代表性而造成的数据误差。在大数据时代,数据总量以几何级数增长,但增加的并不都是有用数据——噪音要比有用数据增长得快(例如,网络水军的“刷单”“刷好评”和“灌票”就会造成数据噪音)。所以,数据量大并不一定有效信息多,噪音会起到破坏作用,使计量方程产生错误的拟合。如果说小数据时代要做加法,以搜集有效数据做为开展工作的前提;那么,大数据时代则要做减法,以去除噪音即提高数据质量为第一要务。换句话说,大数据不等于会自动产生好的分析结果,如果不对数据进行合理的筛选,照样是“垃圾进,垃圾出”(garbage in,garbage out)。

再次,大数据预测在技术上并非纯粹从数据出发,而是含有一定的先验主观性。大数据分析主张让数据自己发声,但大数据预测的程序中的两个关键节点——确定关键词和计算相关性——都具有很强的主观性。于是,大数据预测不仅要克服数据误差或曰数据的不确定性,也需要解决模型设定的不确定性。

先看关键词,确定关键词是建立大数据和预测目标之间联系的先决步骤,但关键词的选择很大程度上依赖于专家的经验和判断,大体上可以视为是一个不断试错的人为过程。如果关键词选择不当,会产生大量数据噪音。例如,当我们为了考察国外股票市场的情况而搜索“Bull”和“Bear”两个单词时,Google将会给我们反馈大量的两种动物的信息。〔32〕再看算法,在进行大数据预测时,大数据专家们设计的算法内含有非常强的假设性的数学属性(典型的就是假设变量间存在线性关系),其并不能反映真实的微观过程,尤其是不能反映在社会活动网络化背景下新兴事物的大量“涌现”(emergency)。〔33〕既然在关键词和算法两个环节都具有经验数据之外的先验属性,我们就需要质疑某些大数据专家提出的可以不要理论的观点——关键词和算法模型的选择就是未来需要解决的重大理论问题。

最后,不关注因果关系是一柄双刃剑。不考虑因果性意味着大数据的应用可以不受理论的先验限制,但同时也降低了大数据模型的预测可靠性和实践可行性。

拥抱相关性,拒绝因果性的好处是系统设计者有充分的自由度,模型设定不受限制。由于大数据预测来源于数据本身,在某种意义上可以视为是数据间自发交互作用的副产品,而非理论推导的必然结果。又由于没有理论基础,大数据预测并不考虑事件发生背后的因果性,而是直接通过设定的算法来发现不同类型数据间的相关性,进而给出预测。故而,大数据预测更像是所谓的“预言”(forecasting)。〔34〕从哲学视角说,自我设限于相关性而有意忽视因果性,几乎可以视为是一种迷信式的而非科学化的思维。原始迷信的形成就是先偶然发现自然界中的相关性,再编造出一套因果解释(如天狗吃月亮)。但这种天然的相关性在预测上是不可靠的,就算萨满巫师跳大神的仪式与患者的病情缓解确实在概率上显著正相关,但由于二者之间不存在逻辑上必然的因果性,仪式对病情的影响实际上是不可预测的。并且,大数据预测毕竟也需要经世济用,而在很多生产生活领域,仅仅了解相关性是无法指导实践的。比如说,在炎热的夏天,冰淇淋的销售量和海边溺水身亡者的数量是显著正相关的,但这种相关性对我们来说能有什么指导意义?难道说要禁售冰淇淋?相关性只是因果性的前提,为了解决实际问题,我们还是需要在理论上分析事物之间的因果性,否则当我们面对宏观经济波动和微观市场失灵时,我们该如何在各种相关性之间进行抉择并采取有效行动呢?

综上所述,如果不对大数据及其预测的局限性保持足够的警惕,大数据并非没有可能沦落为“蠢数据”(pig data)。从方法论的角度说,由于大数据预测基于的是归纳法,所以其预测的成功极度地依赖于未来情境与过往情境之间的相似性(保证相关系数基本不变)。不同于经济学预测起码在理论上可以根据当前的约束条件的变化调整预测,大数据预测的方法决定了大数据系统无法根据外部环境的变化而符合逻辑地自动调整预测,只能在预测失败后对系统设计进行人工的事后调整。大数据预测所要克服的缺陷在于数据质量存疑,且对于关键词和算法的设定的主观性都太强。而大数据预测在功能上的边界其实就是相关性分析的功能的界限——仅仅知道相关性无法满足人类认识世界和改造世界的愿望,故不要理论的相关性不可能取代基于理论的因果性。

五、结论与展望

2012年诺贝尔经济学奖获得者罗斯(Alvin Roth)把经济学预测及其检验分为三类:一是“与理论经济学家对话”(Speaking to Theorists),即检验经济学家已经充分阐释过的经济理论的预测,这类工作是典型的理论驱动。二是“寻找事实”(Searching for Facts),这涉及检验方法的设计,以便把已发现的规律性事实中的因果关系更准确地抽离出来,此类工作通常并不源于理论,而是被异常现象所激发。“寻找事实”的成功将使得构建关于行为规律的新理论成为可能,从而升华为“寻找意义”(Searching for Meaning)。三是“在王子耳边低语”(Whispering in the Ears of Princes),即通过对政策制定者所关心的主题加以实证考察,实现学界与政界的直接对话,此类工作通常含有直接或间接的政策目的。〔35〕对预测的前两类经验检验与经济学的理论工作联系紧密,而第三类检验则更接近政策科学或者说是“经济学艺术”(art of economics)。〔36〕

按照上述分类,经济学预测及其检验兼有理论工作的成分和政策应用的追求,而大数据预测则几乎完全专注于政策应用领域,故后者的工具主义色彩要比前者浓厚得多。关注点的区别是由大数据预测和经济学预测的不同方法论取向所决定的。根据表1可知,二者最本质的方法论差异在于,经济学预测以经济学理论为基础,而大数据预测在方法上主张从数据本身出发。这一本质性方法论差异衍生出了二者在建模方式、沟通理论与经验的渠道、前提假设、因果性还是相关性、经验检验的功能定位等方面的一系列区隔。

虽然说经济学预测和大数据预测有着截然不同的方法论思路,且从预测效果上看二者也都是成败参半。但无论是基于经济学理论还是使用大数据方法所做的经济预测,在政策领域都有重要的功用,因为经济学的实证科学水平的提升——最关键的是预测与经验的一致性的提高——要同时依靠理论上的进步和经验数据资源的丰富。所以说,在预测科学进步的过程中,虽然经济学预测和大数据预测基于的是两套完全不同的方法论进路,但两类预测之间并不是互替关系,反而可以彼此互补。我们对此种互补的前景有如下展望:

一方面,经济学方法和技术可以改善大数据预测。

其一,在大数据预测模型中,实际上也有某些先验主观的建构。经济学理论在决定这些带有主观性质的内容时会起到指导作用,如为初步选择关键词和初步设定算法提供理论线索。人类是有文化传承和知识积累的高等动物,我们在认识世界时总是戴着一副理论的眼镜。同理,无论是关键词还是算法的选择,都会受到研究者的理论上的先验之见的影响。那种认为完全可以让数据自己发声,不需要任何理论的观点,或许可视之为大数据迷信了。

其二,大数据仍然需要被筛选,否则总体数据样本中就会存在有偏差的信息(数据抽样问题)和错误的信息(数据噪音问题)。大数据本身不能自动解决数据质量问题,反而可能令此问题更为严重。因此,大数据预测应该借鉴在经济学中已经很成熟的小样本数据质量控制方法,从而减少因数据偏差所引起的预测错误。一个或许可行的思路是,将官方统计或学界调查所得出的传统数据作为基准参照系来对大数据进行纠偏,以(主要来自网络的)大数据作为可实时更新传统数据的补充资源。若如此,就不仅是大数据影响了经济学的经验研究,且是经济学传统的经验研究方法会对大数据产生重要的反作用。

其三,为了解决经济问题,大数据预测不能仅仅满足于相关性而完全放弃因果性,而因果性正是经济学理论所要探究的。大数据预测已经证明了网络搜索中的负面关键词的出现频率与接下来的股市下跌有相关性,但仅知道这一相关性能够带给我们何种政策启示呢?难道要封掉发表悲观言论者的IP?为了掌握股民情绪,防止心理恐慌所导致的股价下跌,继续深究是何种原因影响了股民的预期才是要务,这是理论所关注的因果性问题。或许可以说,经济学理论能够帮助大数据预测找到真正有分析价值的问题且提供合理的解释。实际上,相当多的大数据研究者已经认识到了因果分析的重要性,并开始在大数据研究中引入经济学理论,从而在理论层面纠正模型设计的偏差。尤其是对于混合了常规统计指标的大数据预测模型来说,经济学理论更有可能起到显著的指导作用。

另一方面,大数据方法和技术也有助于改善经济学理论及其预测。

其一,大数据为确认经济学模型中的约束条件提供支持。当模型的预测被证伪时,多数经济学家所采取的常规应对方式是重新确认模型中的“约束条件”。无论是弗里德曼还是其批评者,都认为经济学模型中的约束条件应该贴近真实世界。〔37〕弗里德曼的老师暨芝加哥学派的创始人奈特(Frank Knight)就批评理论家们往往忽略了真实的经济制度的影响,从而在认识约束条件时会遗漏某些重要的经济社会因素。〔38〕所以,约束条件的真实性是加强经济学模型的预测能力的关键一环。大数据技术不仅能够为经济学家提供传统的物质性约束条件信息,如预算水平等;还可以为研究者提供新型的非物质性约束条件的信息,如个人消费习惯、周围人群的消费水平、成瘾偏好、性格特征、健康状况等等。大数据技术所广泛搜集的多类型数据,显然会为经济学家认识真实世界提供未曾有过的机会。

其二,大数据为完善经济学的理论提供了新的可能。完善经济学理论有两种路径,一是在原有的理论框架下对研究的内容加以丰富和深化,二是对研究纲领的“保护带”甚至是“硬核”加以改造。在实际研究工作中,这两种路径的努力往往是结合在一起的。比如说作为新兴学科的实验经济学,其即为新古典经济学理论提供了新的经验检验工具,也对传统理论的“保护带”乃至于“硬核”(经济人假设)提出了挑战。大数据时代的到来意味着,我们可以将大数据平台和实验经济学的方法相结合,这种大数据实验能够在理论的内部有效性(通过实验的可控性实现)和外部有效性(通过作为大数据来源的真实环境实现)之间实现平衡,且所获得的数据不仅在规模上更大,更重要的是能获得按照传统方法无法实证化的信息。例如在传统上,我们只能知道在市场均衡状态下消费者的实际支付价格,而无法掌握他们愿意支付的最高价格,故消费者剩余是无法计算的。然而,Cohen et al.利用Uber平台的大数据得到了完整的需求曲线,进而估算出了网约车服务所创造的消费者剩余。〔39〕并且,考虑到大数据实验的平台的真实性和规模化,在此类实验中发现的人类行为的“异象”(anomality)更具有统计意义上和经济意义上的显著性,从而可以为经济学家挑战传统理论“硬核”并构建基于人类真实主体行为的模型提供特征事实(stylized facts)。

其三,大数据可以帮助经济学家们提高经济学理论的预测质量。通过大数据提高经济学理论的预测质量有两条途径:一是大数据预测所发现的相关性可以为确认经济学模型中的因果链条提供启发,从而通过完善经济学的理论间接改善经济学的预测。虽然大数据预测一般来说并不关注理论,故大数据预测只能谈是否失准,而涉及不到被在理论上证伪的问题。但是,大数据预测却可以成为经济学预测的一种建设性的补充检验手段。大数据模型和经济学模型可以同时对宏观或微观经济问题作出预测,如果前者的预测精度优于后者,则前者所发现的变量间相关性有助于为构建和修正经济学理论中的因果分析提供启发。二是大数据平台可以消除一些影响因果检验有效性的因素,从而直接提高对经济学的理论预测进行经验检验的精确度。网络大数据平台相对来说易于对制度和环境等因素进行人为调整(且这种调整可以保证在受众间的完全随机化),故可以产生类似于自然实验条件下的数据,从而有效地解决因果分析中的内生性问题。例如,Facebook公司的分析师们通过在“点赞”和“回复”功能上的微小调整,就可以研究这种受控变化对于用户在社交媒体上活跃程度的影响,从而强化了我们对于社会网络的认识。

总之,大数据时代的到来为经济学理论及其预测的发展带来了新的机遇,而经济学理论也可以为完善大数据预测提供实践指导和思想线索。两种预测方法都有各自的缺陷和边界,为了提高人类认识世界和改造世界的能力,二者彼此间需要加以合理的互补性借鉴。了解世界从来不是只有一种方式,大数据预测为我们打开了一扇看世界的新窗口,而两种预测方法的互补将令我们看得更清晰更深远。

注释:

〔1〕经济学家一向对物理学家的方法颇为艳羡,这可追溯到经济学鼻祖亚当·斯密(Adam Smith),斯密在行文中时常流露出对牛顿的仰慕之情。

〔2〕汪毅霖:《为什么经验检验不应是经济学中的压倒性准则》,《社会科学战线》2015年第1期。

〔3〕邹至庄:《用经济学做预测的成功案例》,《人民论坛》2012年第1期。

〔4〕张五常:《经济解释(二〇一四增订本)》,中信出版社,2015年,第75页。

〔5〕Choi Hyunyoung,and Hal Varian,Predicting Initial Claim for Unemployment Benefits,Working Paper,2009.

〔6〕刘涛雄、徐晓飞:《互联网搜索行为能帮助我们预测宏观经济吗》,《经济研究》2015年第12期。

〔7〕Lazer,David,Ryan Kennedy,Gary King,and Alessandro Vespignani,The Parable of Google Flu:Traps in Big Data Analysis,Science,2014,Vol.343,No.6176,pp.1203-1205.

〔8〕Varian,Hal,Big Data:New Tricks for Econometrics,Journal of Economic Perspectives,2014,Vol.28,No.2,pp.3-28.

〔9〕刘涛雄、徐晓飞:《大数据与宏观经济分析研究综述》,《国外理论动态》2015年第1期。

〔10〕张晓强、杨君游、曾国屏:《大数据方法:科学方法的变革和哲学思考》,《哲学动态》2014年第8期。

〔11〕〔英〕伊萨克·牛顿:《自然哲学之数学原理·宇宙体系》,王克迪译,武汉出版社,1992年,第553页。

〔12〕〔14〕〔15〕〔18〕〔19〕〔21〕〔23〕〔美〕米尔顿·弗里德曼:《实证经济学方法论》,载《实证经济学论文集》,商务印书馆,2014年,第6、7、5、13、9、10、20页。

〔13〕在近代科学的革命性进步的过程中,对预测进行经验检验这一标准起过非常重大的作用。例如,伽利略用实验物理学打破亚里士多德的哲学思辨式物理学的统治地位,就是通过实验将亚里士多德的预测——重的铁球会比轻的铁球先着地——证伪实现的。另一个例子是爱因斯坦的相对论取代牛顿经典物理学。在得到经验数据的支持之前,爱因斯坦的相对论只能算是一种精致而大胆的假说。爱因斯坦的成功很大程度上归功于相对论能做出牛顿体系无法给出的预测,并且得到了验证。先是1919年爱丁顿在西非的普林西比岛观测到日全食,证明了相对论的预测——太阳的重力会使光线弯曲;接着在1924年,亚当斯测度了高密度白矮星伴星天狼星B的谱线波长的偏移,证明了相对论的预测——恒星光线由于引力场的作用会变红;两次对预测的经验上的确证(confirm)保证了相对论作为新范式被广泛接受。

〔16〕〔17〕〔20〕〔美〕劳伦斯·博兰:《批判的经济学方法论》,王铁生译,经济科学出版社,2000年,第8、37、81页。

〔22〕萨缪尔森(Paul Samuelson)就曾断言:“甚至一个好的经济学家或物理学家会是一个差的预测者(predictor),如果我们仅是简单地想要拥有预言(forecast)未来的能力”。参见Paul Samuelson,Economic Forecasting and Science,In Robert Merton ed.,The Collective Scientific Papers of Paul A.Samuelson,Cambridge,Massachusetts:MIT Press,1965/1972,p.775.

〔24〕〔英〕维克托·迈尔-舍恩伯格、肯尼思·库克耶:《大数据时代:生活、工作与思维的大变革》,盛杨燕、周涛译,浙江人民出版社,2014年。

〔25〕不同于从“4V”角度对大数据的外在特征所做的外延性定义,我们所介绍的是会对预测产生影响的三个大数据特点,因此是一种内涵式的定义。

〔26〕来自Google搜索引擎的互联网搜索行为数据是一种特定的大数据。总括说来,这类互联网大数据有很多有吸引力的特征:第一,包括了一个潜在的非常巨大数量的回应者样本(世界上多数国家中经常上网的人口比重都已经很高)。第二,相对于传统调查中受访者要在事件发生后回答特定问题,网络大数据属于日常的常规活动的副产品(避免了无回应或不准确回应的情况),故有更好的外部有效性。第三,互联网大数据信息在相当广的范围内可以连续收集,而非只能获得在某一时点对少数预先设定的问题的回应。但是,使用互联网大数据也会面临一些困境:第一,互联网大数据是一个相对很新的现象,所以无法如其他经济指标一样进行长历史的回溯比较。第二,网络用户有显著的年龄和收入等方面的人口学特征,所以互联网大数据可能不具有统计学上的样本代表性。第三,互联网搜索引擎的用法的无规律性(使用者感兴趣于相同的主题却可能输入不同的关键词,反之,使用者关注不同的主题也可能输入同一关键词)可能会制造出一些误导性的错误数据——信息噪音。第四,仍然有很多人类(经济)活动的重要领域较少使用互联网搜索引擎,如家庭内部的成员间资源分配和企业内部的职位调整。最后,使用互联网搜寻大数据需要面对一些技术和伦理上的限制。

〔27〕小样本数据是根据样本特征推断总体特征,其逻辑顺序是“分布理论—概率保证—总体推断”。大数据是全样本数据,其逻辑顺序是“实际分布—总体特征—概率判断”,概率不再是理论中的预先假设,而是从数据总体实际分布中得出的结果,这种概率结果就是大数据预测本身。

〔28〕弗里德曼的方法论中并不要求前提假设的真实性,这是弗里德曼1953年的论文中被反复批评的一个焦点。在为假设的非真实性辩解时,弗里德曼引入了“好像”(as if)概念。这个工具主义的概念意味着“如果我们试图解释某些个人假定行为的效果,则只要该效果事实上能被观察到,而且如果他们事实上如同我们假设那样行事时定会产生该效果,我们就能利用我们的行为假设,即使该假设是虚假的”。参见〔美〕劳伦斯·博兰:《批判的经济学方法论》,王铁生译,经济科学出版社,2000年,第30-31页。

〔29〕我们对大数据预测的缺陷和边界的讨论关注的是大数据预测的内在局限性——预测质量本身,我们将不涉及大数据预测的外在局限性——推广大数据预测可能造成的经济社会成本。很多人文学者将这种经济社会成本归结为“大数据暴政”。

〔30〕从哲学的视角看,对归纳问题的注意肯定是弗里德曼不在意假设是否真实的原因之一。由于无法解决归纳问题,所以理论工作者们需要假定其模型的前提假设是真实的,并且避免使用“真理”(truth)一词或者像约定主义者(conventionalist)那样视“真理”为一个约定俗成的概念。如果说约定主义者还会对理论的真实性时有怀疑的话,弗里德曼干脆把理论的关注点从前提假设的真实性转移到了预测性结论的真实性。对于弗里德曼似的工具主义者来说,发现唯一的真理并不是理论的目标,理论只是一种政策工具,故而“理论、前提或假设的真实状态,对任何目的都是无关紧要的,只要从它们当中合乎逻辑地推论出来的结论是成功的”。参见〔美〕劳伦斯·博兰:《批判的经济学方法论》,王铁生译,经济科学出版社,2000年,第23页。

〔31〕Choi Hyunyoung,and Hal Varian,Predicting the Present with Google Trends,Economic Record,2012,Vol.88,No.1,pp.2-9.

〔32〕Mao Huina,Scott Counts,and Johan Bollen,Quantifying the Effects of Online Bullishness on International Financial Markets,Working Paper,2015.

〔33〕从复杂科学的视阈看,很多宏观的经济社会现象都具有“涌现”的性质。所谓“涌现”,是指新的整体系统出现了不可还原和无法通过将个体简单加总来解释的性质,即整体大于各部分之和或整体出现了个体不具备的属性(例如,一男一女组成的家庭在经济效率上更高,并且具有二者是独立个体时不拥有的新的属性)。由于通过“涌现”而产生的性质是任何既往观察过的个体及其简单组合所无法涵盖的,故在逻辑上,当预测对象是如宏观经济危机之类(超越了个体及其简单组合的经验范畴的)具有“涌现”性质的复杂现象时,我们没有理由对基于归纳以往的经验事实(海量个体及其简单组合)而做出的大数据预测的效果抱以乐观态度。参见William Arthur,Complexity and the Economy,Science,New Series,1999,Vol.284,No.5411,pp.107-109.

〔34〕“预言”的例子包括相面先生根据你的面部特征占卜你的未来吉凶,这实际上也是一套数代间积累的大数据相关性判断。不过相面先生更愿意把相关性打扮成因果性,大数据专家则满足于相关性。

〔35〕〔美〕埃尔文·罗斯:《实验经济学概述》,载约翰·卡格尔、埃尔文·罗斯:《实验经济学手册》,贾拥民、陈叶烽译,人民大学出版社,2015年,第21-22页。亦可参见〔美〕埃尔文·罗斯:《导论与概述》,载埃尔文·罗斯:《经济学中的实验室实验——六种观点》,聂庆译,人民大学出版社,2007年,第2页。

〔36〕Keynes,John N.,The Scope and Method of Political Economy,Kitchener:Batoche Books,1890/1999,p.174.

〔37〕弗里德曼和其批评者们之间的差别在于,后者要求的不仅是辅助性假设(如“约束条件”)要与经验事实相符,且作为演绎推理前提的硬核假设也要与经验一致。

〔38〕Knight,Frank,Some Fallacies in the Interpretation of Social Cost,Quarterly Journal of Economics,1924,Vol.28,No.4,pp.582-606.

〔39〕Cohen,Peter,Robert Hahn,Jonathan Hall,Steven Levitt,and Robert Metcalfe,Using Big Data to Estimate Consumer Surplus:The Case of Uber,2016,NBER Working Paper No.22627.

〔责任编辑:刘 毅〕

汪毅霖(1981—),理论经济学博士,应用经济学博士后,西南政法大学经济学院副教授。

〔*〕本文系重庆市教委科学技术研究项目“基于大数据的经济分析方法在供给侧改革中的应用研究”(KJ1600107)和重庆市社会科学规划博士项目“社会选择的实证维度及对收入分配的启示”(2015BS039)的成果。

猜你喜欢
方法论经济学预测
移民与健康经济学
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
简明经济学
汉学方法论值得关注
送餐的巫术经济学 精读
UAF的方法论意义
抓改革落实,习近平的十大方法论
不必预测未来,只需把握现在