创新指数何以可能
——大数据时代的解决方案

2024-06-08 04:02常照强
洛阳师范学院学报 2024年1期
关键词:论者经济学建构

常照强

(太原科技大学 马克思主义学院,山西 太原 030024)

随着国际竞争环境的日趋复杂化,技术创新已成为提升生产力、增强国家竞争力的关键因素。科学评价并衡量区域、国家的创新能力,引导创新行为,能够促进各层面创新能力的提高,促进创新成果转化,推动创新绩效的提升,逐步实现创新战略目标,因此,对各层面的创新能力进行指数化评价具有重要意义[1]。

然而,对创新现象予以量化的话题,一直以来争议不断,且日益呈现一种两极化的态势。一方面,“不会量化就不会管理”已经成为知识界的共识。借助“一切皆可量化”技术背景和思维方式,创新现象的量化研究已经渗透到国家、行业和企业等各个层次,人们希冀政府和企业可以获得更多的精准的创新知识,实现更可靠的预测和更明智的决策。作为综合评价创新能力的指标体系,创新指数被视为一国或地区经济增长的风向标。另一方面,在当代社会建构论思想的冲击下,创新指数越发为人所诟病:创新现象研究在数学上的精练和专业化,与生产关于真实世界的正确知识这个目标几乎不相干,创新政策研究的进步依赖于论题、进路、视角的多样性。由此,对于一个连贯和封闭的分析工具(如创新指数),其重要性我们不可高估。

如果将上述争议一般化处理,争议的双方基本可划分为实在论一方与建构论一方。前者认为,创新指数的统计学视角预设着一个关于统计数字和实在的相互关系——实在论,而统计学家假定测量能够捕捉外在世界的某些特征,尽管准确程度不一。后者认为,许多人(特别是社会学家、人类学家和科学学家)将测量锁定的对象,理解为测量的产品或测量的约定,其是可以协商和变通的[2]。

争论的双方看似水火不容,没有调和的可能,从而将创新指数的可能性问题推到了风口浪尖。双方事实上都认识到创新指数的发展存在着一些问题,且都将问题的解决指向更多数据的获得。本文将具体阐述双方何以将问题的解决都归之于数据,并借由对事实与虚构两难悖论的经济学方法论反思,指出这种殊途同归的意趣所在。最终主张,应将创新指数的发展置于大数据时代背景下予以考察,揭示大数据技术进步之于创新指数研究的深意:创新指数可行性问题的最终解决,可寄望于大数据时代思维、技术与方法的颠覆性变革,更进一步说,仰赖于大数据技术与(计量)经济学的深度融合。

一、创新指数可行性问题的两极争论

在社会科学中,统计和形式化方法的扩张与反实证主义所秉持的立场之间产生了激烈冲撞。这种两极化的冲撞在创新指数问题的讨论中可见一斑。

创新指数问题,也就是如何对创新现象进行科学的量化问题。关于创新的大量统计学数据,被视为经济增长和繁荣的源泉。在过去的20年间,许多机构越来越热衷于构建一系列统计学的指标体系,旨在刻画创新系统的本质特征。受反实证主义进路的影响,建构论者(多是社会学、人类学或科学学领域的学者)愈发关注创新指标的作用评估,并对这类定量研究的弊端颇有微词。他们认为,对创新指标的讨论往往都是从纯技术的角度出发,狭隘的视野隐含着这样一种预设:指标作为一种政策工具,是现象的确切反映,不应受到质疑; 关于指标的讨论应该限定于方法论的层面,交由统计学家来进行。但是,创新指数往往使用封闭性的测量指标来评估复杂的现象,而忽视了现实中与社会规范或局部区域相关的一些重要的事实,视角显得极为褊狭和内视。为了确切地评估指标作为政策工具的价值,建构论者主张有必要从一个更广阔的视野来审视它,即从指标产生和使用的背景,对其予以考察。建构论者还发现,在建构创新指标的过程中,这种社会建构论的意蕴贯穿始终:无论是在建构指标时,还是在形成政策的过程中,所有的选择都是一种协商的产物。也就是说,在建构过程中,尽管主观因素一直在场,却以定量数据所期望的精确性之假象示人。在建构论者看来,如果创新指数的研究仍固守着实证主义的套路不放,注定是不合时宜的:将指数看作一个标准化的知识概括,误以为其应用于不同的情境,缺乏一种微观层面的对创新因素的地方性审查。因此,建构论者呼吁采用多维和开放的视角来研究创新现象,通过获取多样化的数据,来推动创新指标的定制化,甚至于促成新的测量工具的涌现,最终取代创新指数。

相较之下,在统计学家看来,在统计和现实之间,往往预设着一种实在论的立场。据此,他们大多尝试为创新指数做辩护:创新指数是面向现实的。因为从统计学的视角看,数据的收集和分析或多或少地准确捕捉了外在世界的某些特征。同时,他们注意到创新现象极具复杂性和多样性,极易突变,而且创新现象与特定的社会经济特征关系密切,是高度语境敏感的,描述诸如创新之类的现象颇为棘手。而现有的很多创新指数过于宏观,没有做到足够细致以满足特定地区和区域的需要。所以,诸如创新联盟计分牌(Innovation Union Scoreboard)等创新指数极易受到质疑,因为这类指数是基于创新的一般观念而构建的,很难设想其能够囊括众多的微观尺度的创新理论。

为此,统计学家主张,在设定创新指数时,要综合考虑多方面的因素,并注意创新不同区域的差异性。近年来,他们越发采用综合指数来评估创新表现,对次区域(sub-region)的创新评估表现出极大的热情,就是对这些主张的回应。这一回应面临着一个极大的挑战——数据的缺乏。如在对次区域的创新进行测量时,一个棘手的问题是,欲测量的理论范畴如何与可获得的统计数据相协调。内在和外在的关系构成了区域创新系统的基本元素。此外,许多其他的基本特征(诸如引入不同创新类型的企业的比例)只能通过原始数据的收集来反映。无论如何,对那些持实在论立场的统计学家而言,创新指数体系的创建,并非脱离了真实世界,只是在创建过程中,人们为数据所困扰而已。换言之,他们认为,创新指数的创建者缺乏相关数据,这也许会促使其更加追求(数学的)技巧,这里或许造成了一些问题,但这并不意味着创新指数已然沦为一种形式主义的、抽象的、忽略现实的虚构。

二、走出经济学两难悖论的方法论反思

关于创新指数,建构论者和实在论者各执一端,看似形成了一种两极化的态势。但是,无论是建构论者的指摘,还是实在论者的辩护,对于创新指数的问题,双方事实上都将解决方案的最终归宿指向了更多数据的获得。看似两极化的争论,为何在最终解决方案上却殊途同归呢?回应此疑问,不妨从经济学的事实与虚构两难悖论谈起。

早期的经济学更多地被称为政治经济学,往往由哲学家、政治家操刀,但是随着经济学科的独立,经济学日益专业化,严密的数学成为主要工具。尤其是过去四十多年来,现代经济学出现了新的范式革命——“实证革命”(empirical revolution),即经济学以数据作为基础,以计量经济学为主要方法研究并解释经济变量之间的逻辑关系。在现代经济学逻辑体系不断加强的同时,其方法论却备受质疑:“理论上好的经济模型应该与事实紧密联系,但是由于现实世界复杂多变,大部分模型不过是玩弄修辞。”[3]由此可见,经济学遭遇了一种事实与虚构的两难悖论。具体到创新指数问题,类似的两难悖论也如影随形。

创新是不同主体和组织间复杂相互作用的结果,技术变革不以一个完美的线性方式出现,而是系统内部各要素之间互相作用和反馈的结果。研究现象的复杂性因而给研究者带来极大的挑战:尽管他们试图理解现象的决定因素。然而,对于“以地理为中介的知识外溢是如何测量的”之类问题的阐述,往往变动不居。在不断变迁的创新观念的驱动下,理论不仅需要解释给定的数据,而且理论的发展也呼唤不同类型的数据[4]。

事实上,不少量化研究的新进展强调严格的数据分析的重要性以及理论和数据之间的相互依赖,而人们同时对无法提供事实分析工具和无法进行经验检验的理论越来越不满。这一状况进一步凸显出创新指数体系对数据的渴求。但是在创新指数的量化领域,一直以来存在理论多过数据的趋势,也就有了所谓“理论廉价,而数据昂贵”之说。不宁唯是,支撑创新指数的数据,也很是来之不易,这似乎使得“创新指数支持虚构而非事实”这一说辞愈演愈烈。

针对上述事实与虚构的两难悖论,胡佛(Kevin Hoover)从经济学方法论层面予以回应。他指出,对计量经济学的评价,与人们对经济学模型的理解密切相关,其中一个关键的问题是“经济学模型能否构造一个封闭系统”。实在论倾向的经济学者对此问题当然持肯定的态度,且他们往往推崇一种在经济学方法论中颇有影响力的实在论观念——巴斯卡(Roy Bhaskar)的先验实在论。根据该实在论观念,(休谟预期到的)那类事物的规律性难以发现,此类规律必是通过实验产生的,而实验是一种预先假定被操纵事物按照可靠方式发挥作用的人为操纵。对于一个开放的世界,自然科学家可以通过干预而产生封闭系统[5]。

按照上述实在论,应用于物理科学的分析也同样可应用于社会科学。不过,在某些经济学家看来,这样的看法值得商榷,因为经济学实证研究和自然科学实验研究有着重要差别。比方说,大规模的计量经济学模型以及更为一般的经验估算的总量关系可能并不稳定,因为其所反映的决策是由那些处于特定政策环境中的经济个体做出的,而那些政策环境也在发生变化。也就是说,社会科学具有不同于自然科学的一般本质:社会条件下并非能够常常建立实验封闭系统,因为社会不仅过于复杂和异质,而且存在法律和伦理障碍,操作上有困难,从而使得计量经济学模型无法合理地构建封闭系统。这也就是说,我们所观测到的经济现象是很多因素共同作用的结果,而这些因素,包括可观测因素和不可观测因素,有很多并没有包含在模型之中。这些被模型排除在外的因素所产生的效应,无法通过实验而分离开来。造成的结果是,经济模型在解释经济现实时,在绝大多数情况下不如自然科学解释或预测得那样精准[6]。

计量经济学乃至整个经济学科实证研究的上述局限性,似乎让我们陷入了开放性与封闭性相互拉扯的漩涡无法自拔。如何走出这一困境呢?胡佛的观念极具启发性。他认为,对待量化系统的研究(着眼于计量经济学)要秉持一种辩证的态度。一方面,开放性是相对的,不受控制的非实验条件(不仅仅是在天文学领域)可能是足够封闭的,引导出精确度和可靠度不尽相同的各种规则; 另一方面,封闭性也是相对的,没有实验是对外部影响绝对免疫的,而且,可以这么说,封闭性就是安全可靠的使用规则。

如此一来,若要突破事实与虚构的两难悖论,究其实质,就要把握好这两个方面的相互关系:一方面是准确性,另一方面是可靠性和应用范围。它们都是程度问题,而且相互抵消,更高准确度则意味着更低的可靠性和更窄的应用范围。基于上述分析,我们就可解开创新指数两极化争论何以能够殊途同归的奥秘。事实上,无论建构论者还是实在论者,都意图在创新指数的普遍性与准确性之间找到某种平衡,换言之,尽管两者在创新指数上有诸多分歧,但在确保研究结果具有一定的普遍性和准确度上,他们应该是共通的。准确度提高,适用性的范围将变窄; 而一旦要求规则有更大的普遍性,准确度就会降低。为平衡普遍性和准确度之间的紧张关系,数据可以起到关键作用。由此,我们不难理解实在论者和建构论者为何都把创新指数的可行性解决路径指向了获得更多数据。

换一种角度看,与其说创新指数脱离现实,是虚构的,不如说创新指数面临一些深层次问题,即研究结果的质量越来越依赖于所使用数据的质量和覆盖性。若理论与数据之间的矛盾可以极大地缓解,创新理论的普遍性和创新指数的准确与可靠性就能达到一定程度的和解。

三、创新指数的大数据解决之道

面对如此状况,我们不禁要问,创新指数何以能超然于上述深层次问题?不妨放眼温伯格(David Weinberger)为我们勾勒的关于事实的近代历史的演化过程,或可看出些端倪。

温伯格指出,政府制定政策需要基于数据,即一定的事实,但如此一来,就需要使用一个近年受到重视的工具——统计。“用事实说话”是统计科学产生的主要根源,这一点注定了指标的作用和科学事实的本质密切相关。温伯格关于事实的演化史的回顾,不难让人发现:获取知识的所有权意味着掌握了事实,也就意味着获取足够多的数据。但是,传统科学知识由于无法脱离纸本的限制,无法形成多样化的事实,造成了数据的缺乏。数据革命改变了人类文明,知识的结构也彻底改变,人们从经典事实阶段变迁到网络事实时代,由此揭开了解放事实的序幕。

对此,温伯格为我们描述了这样一个关于事实的演进历程:人类经历了从“经典事实时代”到“基于数据的事实时代”再到“网络化事实时代”。经典事实时代的代表性人物是达尔文,他用了7年时间解剖藤壶,以证明藤壶是甲壳纲动物。达尔文发现的事实相对稀缺,需要付出相当大的努力,而且在这一时期发表这样的事实也是极为困难的。其后,在20世纪50年代,我们进入了基于数据的事实时期,这一时期存储数据仍然代价不菲,比方说“存储现在一个200G笔记本硬盘的信息,我们需要大约20亿张卡——这些卡堆在一起大约有300英尺高”[7]60。因此,在基于数据的事实时代,数据库仍然要严格限制记录信息的数量。换言之,这一时代依然遵循我们认识世界的古老战略,即限制知识,由部分人为我们选择和组织部分领域的知识。而今,我们迈入大数据时代,网络化的事实大行其道。温伯格认为,如果经典事实和数据被看作从根本上孤立的知识单元,那么网络化的事实则被认为是网络的一部分。网络化的事实存在于一个相互连接的网络内,如此它们才变得有用,能被人们理解。温伯格举例说,在印刷时代,一篇科学文章里出现的数据表,只是众多没有被刊出的事实和数据的小部分摘录。而在互联网上,科学杂志越来越多地将文章中出现的数据超链接到它们的源数据库中。事实之所以能变得网络化,是因为我们新的信息基础设施恰好是一个超链接的出版系统[7]61。

温伯格眼中的网络化事实时代,是解放事实的时代,在以互联网、移动互联网和人工智能为代表的计算机信息技术基础上产生的大数据,提供了以往传统数据所没有的信息和更加丰富的素材,堪称“数据革命”。如今这场革命正逐渐涉入经济学,推动着经济学研究范式及其研究方法的深刻变革。

在历史长河中,一直以来,人们主要是依赖抽样数据、局部数据和片面数据,甚至在无法获得实证数据的时候纯粹依赖经验、理论、假设和价值观去发现未知领域的规律。例如,尽管人们承认经济学的规范在经验上有缺陷,但是缺乏相对充足的经验数据,使得人们无法放弃该规范。因此,人们对世界的认识往往是表面的、肤浅的、简单的、扭曲的或者是无知的[8]。然而,大数据时代的来临使人类第一次有机会和条件,在非常多的领域和非常深入的层次获得和使用全面数据、完整数据和系统数据,从而能够使用经验敏感的方法来研究更加广泛的经济问题。

同理,大数据技术的出现,使得创新现象的科学量化问题也获益良多,惠及一系列传统难题的解决。大数据技术就像显微镜,侧重于从极细小的微观层面去观察事物之间的联系; 借助该技术,计量经济学家可以在很多场景下直接用总体数据进行研究,即基于海量的整体性经济数据,挖掘、整理、分析出全部有效信息,对特定场景下的客观经济世界做全貌式描述和定位,进而对客观经济规律和经济变量之间的关系进行精准的预测和诠释。一旦将大数据技术融合进计量经济学,“就会打通微观基础和宏观现实之间的逻辑关联,建立微观、宏观一体化研究的传导机制,帮助人们更加全面地分析、认识现实经济世界”[9],从而有助于我们从整体上把握和平衡创新指数的普遍性与准确性。近年来,形形色色的基于大数据的创新发展指数研究呈井喷状态,在很大程度上印证了这一融合之趋势[10]。

四、结语

作为创新量化的一种技术手段,创新指数是创新现象研究的一个重要维度,已然成为分析判断世界各地创新态势和趋势的重要参考依据。然而,创新是一种复杂的现象,应以多维角度审视。在实践中,由于相关数据的缺乏,创新指标体系饱受质疑,该指标体系极易与现象脱节,沦为一种抽象的、形式化的数字游戏。尽管如此,我们却不能贬损创新指数的重要性,因为其对于变量之间的关系实现了较好的定性认识,相关决策的制定还需要更多的量化精确信息。鉴于此,提高创新指数的可靠性和准确度,为决策提供科学的依据,是人们共同的愿景,但一直以来囿于经济技术条件的限制,相关创新数据殊难获得,这往往造成创新理论与创新数据之间的紧张关系。

得益于计算机科学的飞速发展,强大的计算工具能够快速处理海量的信息数据,大数据技术愈发成为经济增长和夯实新研究基础的引擎。大数据时代,每个人的工作和生活都被数据化,甚至是那些非结构化的文字、方位信息、沟通信息,通过信息技术的发展,都转换为可处理的数据。与此同时,大数据及其技术正在改写或重构经济学所有领域,在增进计量经济学模型科学性和解释力等方面当然也会不负众望。科兹洛夫斯基(Jan Kozlowski)为我们所设想的创新指数研究的愿景,在大数据时代触手可及:经济学家需要深入理解信息时代的威力,分辨出哪些问题需要回答,并拥抱回答问题的新方式。新一代的有成效的创新指数,将不得不回答特定的、妥善定义的问题,这样的问题不是均码式的,而是多样化的。为此,创新指数必将是定制化的,其能顺应大数据时代的发展趋势,从而满足政府、商业、通信和个人等的特定需求。

猜你喜欢
论者经济学建构
移民与健康经济学
消解、建构以及新的可能——阿来文学创作论
Facing emotional impact of a warming planet 直面全球变暖造成的情感影响
简明经济学
残酷青春中的自我建构和救赎
阅读理解两篇
建构游戏玩不够
古代高危职业之谏论者生存指南
康德是相容论者吗?
紧抓十进制 建构数的认知体系——以《亿以内数的认识》例谈