朱 婉 菁
(温州大学 法学院,浙江 温州 325035 )
大数据作为一种新的技术资源,“忽如一夜春风来,千树万树梨花开”,用唐代诗人岑参的诗句来形容大数据在国内学界各个领域风起云涌的研究应用,一点不为过。大数据被认为是继实验科学、理论科学和计算科学之后的“第四范式”[1]。通过对文献的梳理,大数据在当前的三个研究方向主要为:一是对大数据进行本质主义研究,包括对大数据的基本概念、特性和大数据管理下所产生的作用进行系统研究,以及对大数据的相关关系和因果关系进行哲学层面的探索。一般认为,大数据是指无法在可容忍的时间内用传统IT技术和软硬件工具对其进行感知、获取、管理、处理和服务的数据集合[2],而从认识论的角度出发,业已形成的共识是,大数据使科学从仅追求因果性走向了重视相关性[3],并进一步实现了因果概念的重新刻画[4]。二是对大数据进行交叉学科研究,也即进行“大数据+”的应用式研究。现有研究多对大数据理论与多学科之间的交融、应用方向以及组织方式与资源支持形式等重要问题进行深入讨论,最为典型的就是在政务领域的大数据应用,而多数研究都表明,国家主导是政务大数据发展的根本动力[5]。三是反思大数据技术的工具理性,进行价值复归的伦理规范研究。技术理性的滥觞让大数据技术应用中的伦理问题日趋重要,数字失真、隐私安全、数字鸿沟等伦理风险问题成为研究热点,法律规制以及伦理学和政治经济学层面的批判都在探讨之列,但也正如有学者指出的,这样的思考和反思对大数据技术及其理想化未来的推崇不成比例[6]。而在实践路径层面,国家的战略目标是不可忽视的决定性和方向性力量。2015年8月19日,国务院常务会议通过《关于促进大数据发展的行动纲要》,中国大数据发展进入黄金时代。2015年10月,党的十八届五中全会提出“实施国家大数据战略”,这是大数据第一次写入党的全会决议,也标志着大数据战略正式上升为国家战略。2016年3月,“十三五”规划纲要再次强调要“把大数据作为基础性战略资源,全面实施促进大数据发展行动”。2017年12月,习近平总书记在主持中共中央政治局就实施国家大数据战略第二次集体学习时又特别强调要“面向国家重大需求,面向国民经济发展主战场,全面实施促进大数据发展行动,完善大数据发展政策环境”[7]。2019年,党的第十九届四中全会高屋建瓴地指出大数据技术在国家治理现代化进程中的重要作用,并提出“健全劳动、资本、土地、知识、技术、管理、数据等生产要素由市场评价贡献、按贡献决定报酬的机制”[8],这是对数据在发展数字经济中的重要价值给予了高度肯定。2020年,国务院在发布《关于构建更加完善的要素市场化配置体制机制的意见》中进一步明确,数据已成为国家的重要战略资源,是驱动经济发展的新型生产要素。国家战略性地选择了发展大数据产业,迅速在全国设立大数据管理局,创新实施大数据项目。
数据即意味着生产力,而生产力的革命,势必引起生产关系的变革,大数据技术的应用及普及,本质上就是一场有关人类生活及交往方式的革命性变迁,基于大数据去重新发现、改变、规划政治社会生活成为主流。在理论层面,各学科都开启了用数据探索学科规律的新纪元。但是,当我们将大数据与各个研究领域的结合视为理所当然时,却往往忽视了“为什么要选择大数据”这一本源问题。诚然,技术的变革是推动人类社会前进最高意义上的革命力量,但有关我们是否已经充分认识到了数据真正价值的讨论仍显单薄。纵观国内外相关研究,虽然丰富详尽,但都难以避免陷入“单线进化”的困境,即倾向于以大数据特性的单一视角解释多学科交叉领域的发展问题。特别是在治理领域,夸大或高度依赖数据的技术理性及预测能力,难免有将治理简单化甚至低矮化之嫌,其精当性和涵摄性都有待商榷。近几年,伴随新一代信息技术的纵深发展,热门新概念层出不穷,这既是历史发展的客观规律,也是社会转型的必然结果。但是,对于任何一个新的概念或理论,我们的首要任务都在于理解并解释概念演进的逻辑以及“理论发明”的合理性,而理论的层次性决定了观察问题角度的多样性和复杂性。因此,揭示“数据治理”的独特主张,我们不仅要从历史主义的视野去探究“数据治理”的现实意义和战略考量,也要跳出实用主义(pragmatism)下的工具“魅影”(ghost image)去关注“数据”自身的诉求,即通过将“数据”视为一种本体论(ontology)意义上的“存在”(being)还原进而发现不同于既有理论的问题所在。事实上,这也是我们对毕达哥拉斯当年提出“万物源于数”这一论断所做出的时代回响。在大数据时代,“数据”的本体地位得到了空前张扬,而与此同时,大数据技术使得“数据”的本体自我隐匿也更甚从前。因此,本体论意义上的“数据”无疑经历了一个由古典形态向现代形态的转变重构,而要理解并阐明这种变化至少应该在两方面予以澄清:其一,“数据”就像是柏拉图在他著名洞喻中所描述的那些囚徒在墙上看到的影子,它依赖于物质实在,但它本身也成了一种新的实在,事实上,也只有当“数据”绽放为技术实在,发挥其作为人造物的功能并在使用中揭示出事实间的相关关系时,才算完整回答了“数据是什么”这一始源性问题;其二,“数据”的本体论追问不应当仅仅纠缠于“数据究竟是什么”,而是要超越本体论的预设展开反思,以多种进路尽可能达至对概念的澄明(lichtung),进而开启“数据”对世界的解蔽(entbergung)。也唯有如此,才能真正赋予新概念以新的理论生命,最终,也为阐释“数据治理”的内蕴奠定了质料基础。
“数字治理”抑或“数字化治理”,已是一个耳熟能详的概念。对于数字的热情在进入近代以来成为科学研究的一种“症候”。可以说,以数字为基础的定量研究在整个20世纪成为社会科学的一种范式,随着数字技术的不断升级,数字化的话语霸权地位愈加巩固,而这通常被认为是为即将出现的大数据技术所做的铺垫。在数据科学家维克托·迈尔-舍恩伯格(Victor Mayer Schoenberg)那里,数字化指的是把模拟数据转换成用0和1表示的二进制码。对于有关数字的论述,国内学者张康之对此有着形象的描绘,“数字在思维中的导向作用会把我们引向对一切事物的抽象的方向上去,会要求我们在‘多’中发现‘一’,或者说,把所有的‘多’都还原为‘一’,是‘一’的加总和聚合”[9]。显然,这是一种单向度的认识过程,“数字更多地是认识工具,反映在认识过程中,从属于认识的需要”[9]。而治理虽然作为一种政治行为,具有一定的政治价值,但治理行为的技术性因素往往要重于其价值性因素。在社会政治生活中,治理是一种偏重于工具性的政治行为,更高的行政效率,更低的行政成本,更好的公共服务,是治理追求的目标。因此,数字与治理的关联,应当说强化了治理体制和治理行为的工具理性。
“数据”与“数字”仅一字之差,但却大相径庭。传统意义上的“数据”,是指“有根据的数字”,是作为对客观世界测量结果的记录。“数据”(data)这个词在拉丁文中是“已知”的意思,也可以理解为“事实”,这是欧几里得的一部经典著作的标题[10]104。因此可以认为,从“数字”到“数据”,改变的不仅仅是呈现客观事物的形式,而是我们看待和理解世界的思维方式。最显著的变化莫过于我们产生了对于社会“全知性”的一种自信,即使这种“全知性”有着一定的虚幻。但这种数据的思维导向却是实践的需要,从属于建构主义。尽管社会各界已经普遍认为人类社会进入了大数据时代,并且认可大数据对经济社会发展和国家治理实践带来了巨大影响[11],但是就认识和解读大数据的逻辑来看,这种数据思维仍然固步于旧的思维方式,甚至简化为数字化的升级。可以说,大数据并未助推思维方式的变革,而要突破这一局限,显然需要从过往简单的数字思维中跳脱出来,认识到数据虽然是由数字构成的,但是从数字到数据是一条单向的“质跃”演进路径。在万物互联、数据体量爆炸性增长的态势之下,“数据”需要实现自我进化,而第一步就是要在扬弃中实现概念的更新,进而指向其存在的唯一性。黑格尔在《小逻辑》中指出,“时空中的特定存在与其概念的差异,正是一切有限事物的特征,而且是唯一的特征”[12]144。“概念以它的自在存在为中介,它的差异,和对它的差异的扬弃而达到它自己与它自己本身的结合,这就是实现了的概念。”[12]385-386显然,这样的论断过于抽象,因为人类的思维都具有线性的特质,我们很难一蹴而就实现从数字到数据的概念更新,特别是当数据化这一过程是在数字化“瓦解”了人们对于经验性的习惯认知和服从的基础上所产生的。海量数据、直观显示与非结构化的容纳以及有效处理的认知,彻底重塑了人类的理性思维。因此,当我们谈论数据与数字的区别或差异时,应当确立这样一个理念,我们的目的不是将数据与数字区分出来,而是凸显在相同场景下二者的差异,再根据其应用场景及发挥功能的差别,阐释这种差异赖以存在的深层根源及其发展的本质规律。而本文认为,这种差异性须通过三种途径或者回答以下三个问题加以甄别:一是是否对数据本质有足够的认识,因为当人类社会积累了大量的数据而加以应用时就难以避免陷入“常用而不自知”,而如何走向“自知之明”就会成为首要问题;二是当数据可以成为并且已经成为解决特定困境或治理难题的有效方案时,我们是否有足够的理智和清醒的认识,即它在解决了一个难题之后,可能会产生新的问题;三是对数据价值的真正认识,也即它的首要价值被发掘后是否仍能不断给予自我创新?概言之,只有厘清数据所蕴含的上述三个层面的含义,才可谓拥有了应用数据的理论根基,或进行褒贬可信的立论。
从“数字”到“数据”,通常认为,“数字化”仅仅是精准了作为治理的工具和手段,但是并不构成思维范式的变革以及社会的转型,对近代以来的科学认知框架并未形成事实上的突破。而大数据,毋庸置疑有着无限的成长前景,在我们对大数据的期许中,最重要的一点在于以时代的眼光重新审视数据的内涵和意义。而从“数据”到“数据治理”,本意并不是创设某种合乎或追赶潮流的概念,而是一种深化认识并反思的结果。当然,至今为止,“数据治理”还没有形成统一标准的定义[13]。我们将大数据时代的治理体系预设为“数据治理”,目的在于借助概念的厘清而建构统一的话语体系。而这套话语体系的立论基础延续上文对数据内涵三个层面的分析逻辑,亦就“数据治理”构建了一条多维审视路径:第一,辩证统一的本体论认识路径,“本体”的认识即是矛盾的认识,从“事物的自身”(ansich)出发对“数据治理”这一概念或体系做辩证且统一的阐述,以科技哲学视角管窥“数据治理”的“基本准则”,既要知其然,也要知其所以然,据此为“数据治理”提供理论的“最高支撑点”;第二,反思性的实践认识路径,对以数字化转型为代表的信息技术范式本身提出质疑,力图在最深刻的层次上把握数据与治理的内在统一性,并由此出发去理解“数据治理”的内在本质,以及辨析“数据治理”是否能作为一种新的理论范式等争论;第三,从“认识论”到“价值论”的逻辑转向路径,对主流的科学技术观进行扬弃,从价值论的视角区别“数据”与其他技术,当我们追问“数据治理是什么”的时候,所要探寻的并不仅仅是一种简单的认识论,更是一种深层的价值关怀,即“什么才是数据治理的意义”,从而揭示“数据治理”不断创造新价值的可能与动力来源。
“数据治理”只是描述大数据时代治理实践变迁的初步概念,并不是绝对准确或不容置疑的概念界定。但大数据要求既有治理实践的适应性转变,其发展趋势已经成为客观事实。上述有关对大数据内在构成的认识,数据与数字界分的重要性等诸多赘述以及相关概念间关系的厘清,都是研究如何“依靠数据”进行治理的重要前提,除了避免学术用语产生歧义之外,更是作为如何在大数据战略背景下进行有效治理的理论支撑。由此,结合上述三个基于对大数据本体认识的维度,立足概念的预设立场,最终切换至对“数据治理”的多维审视,从自知性、反思性和创新性三个方面层层递进达至对“数据治理”内蕴的揭示。
首先,“数据治理”的自知性表现在对其历史发展历程的内涵式把握。黄仁宇在《万历十五年》一书中反复阐述中国缺乏“数目字管理”(mathematically manageable)的传统,他认为,中国传统文化向来混淆伦理之“理”与物理之“理”,也就是以类似之处代替逻辑[14],而正是这种重概括而轻实证的惯习导致中国人成为胡适口中的“差不多先生”。因此,实现以事实为基础、以数据为核心的“数目字管理”成为中国迈向现代化的关键要素。而这种管理模式也与我国早期“以GDP指标为中心”的经济发展道路不谋而合。在工具理性主导的发展实践中,人们普遍被“高效率”创造的繁荣所麻痹,而忽略将其与自身生活实践和生命发展联系起来,也因此造就了现代社会中“单向度的人”。而革命性的互联网普及,最大的意义则是勾勒了数字化与数据化的分水岭。从互联网发展的历程来看,最典型的莫过于经由大数据和智能算法重构的“人”。从以往统计学意义上抽象的“人”摇身一变,成为“群体画像”中那个摇曳生姿的“人”,不仅能被多层次数据标注和计算勾勒,而且可以被单独量化以及高度解析。可以说,从数字到数据的转变,是相关关系量化的呈现,是从一维量化指标转变为多维度时间、空间、语义等的全体展现。相比数字,数据有着不同的存在形式和运动状态。虽然数据发展的核心动力来源于人类测量、记录和分析世界的渴望,计量和记录一起促成了数据的诞生。但在万物互联的情境之下,数据不再仅仅是人类计量思维下的独有产物,更是一种“连接”语境和场景的智慧和规律。而从字面上来看,“数据治理”是“数据”与“治理”的组合,然而,这种组合并没有标识清楚“数据”与“治理”之间的关系。因此,研究者在使用“数据治理”这一概念时,可能会出现三种不同的含义:一是以数据为单元的治理,即“数据的治理”,从这个意义上来看,我们可以把“数据治理”作为一个层级的概念,内嵌于技术治理的序列之中;二是以数据为主体的治理,即“数据去治理”,这层含义强调数据的能动性;三是以数据为客体的治理,即“对数据的治理”。可以说,这三层含义在当前的治理语境下是并存、混合且相互牵制的,具体实践应用中亦是如此。事实上,一般意义上的“数据治理”,不仅对治理内涵产生了深刻的变革,同时也在工具手段、价值属性、组织制度等方面与“数目字管理”存在显著的区别。数据“因人而生”,“数据治理”则是由经过治理的数据实现“为人所用”的“数目字管理”的升级进化。
其次,“数据治理”的自知性还表现在对传统治理文化与数据治理观念的冲突及共识上的把握。从人类文明发展史看,技术的变革往往引领不同形态文明的迭进,从器物到思维,最终,将落脚在美国科学史学家I.伯纳德·科恩(Robert S.Cohen)所说的“改宗”(conversion)的过程,也即观念的改变,由此,才能产生“一种新的思维方式或一种新的知识基础”[15]。过往,我们与外部世界进行关联,往往穷其精力寻找因果关系,无论是古代中国在秉承实用主义原理下的直观经验总结,还是西方社会强调对物质本体论的追问,无不是在追求因果关系道路上所做的努力,即使很多时候确定因果关系很困难且用途并不大。而究其根本在于外部获取数据的有限性,这种执迷是信息缺乏和模拟时代的产物。但是当数据体量变大、混杂,且数据处理速度加快时,执着因果关系的预设立场就很难再继续坚守,而这一变化带来的结果就是,我们必须接受且适应混乱性和复杂性。换言之,我们的治理会产生这样的改变,“我们知道它是对的或错的,但我们不知道它对或者错在哪里”,而原因就在于“我们解决问题的方式变成了训练所有可能的模型和拟合所有可能的参数——问题从一个端口进去,答案从另一个端口出来,中间则是一个黑匣子”[10]IX。这种对因果关系的执着到逐渐消弭寻求因果关系的渠道和动力,从更深层意义上来说,其实是人们放弃了对过程意义及价值的理解和追求。而中国传统文化所蕴含的思维模式则是矛盾辩证式的,“祸兮福之所倚,福兮祸之所伏”,在中国文化的思维深处,从来就有两个对立统一的因素彼此关联、共存共生、相辅相成,而这也意味着,观照到不同因素之间的因果、互动的过程性关联是我们一贯的思维模式。事实上,传统治理文化与数据治理观念的冲突并不是简单地在对因果关系的取舍上,而是对于获取因果逻辑背后的过程是否视为有价值。诚然,大数据文化高度推崇工具理性和精确的事实,但是,它却对如何得出事实和理性的推导过程“兴趣索然”。因此,相应的共识应当体现在当无法显现因果逻辑的精确性和传统辩证危机观下的底线原则发生冲突时,让步的应当是何者。例如在社会风险治理领域,有赖于大数据构建的模型,我们已经能够提前预测危机事件,精确地感知风险易发领域,进而进行有的放矢的治理[16]。而治理的一个很重要的原则是防微杜渐。显然,“数据治理”能最大程度地实现这一目的。但是溯本逐源,对于作为治理主体的政府而言,公正性是关键的核心价值,即执行政府权威机构的公正性,而安全或者稳定并非衡量治理质量或者对权威机构进行评价的充分标准。在舍恩伯格的《大数据时代》一书中举了这样一个例子:“宾夕法尼亚大学教授理查德·伯克(Richard Berk)建立了一个大数据模型,他声称这个模型可以预测一个判缓刑或者假释的人一旦提前释放会不会再次杀人。他输入了海量的特定案件变量,包括监禁的原因、首次犯罪的时间、年龄、性别等个人数据。伯克说他的模型对未来行为预测的准确率可以达到75%。”[10]206从建构大数据模型的目的而言,在当前的技术环境下已经最大程度实现了预测的功能。基于理性算法的大数据预测,也许可以为我们打造一个更为安全、高效、可靠的社会,但是这种基于结果的数据反馈,一个最大的问题就是公正性的难以衡量和实现。回到我们的案例本身,从结果导向的视角出发,即使不能实现100%的准确度,牺牲那25%,却能最大程度地维护社会安全,但摧毁的是作为法律公平的基石——无罪推定。“数据治理”给我们展现的是一个精确且能让人信服的结果,但是在这个过程中,到底是何种机制或者价值在主导,我们不得而知。而“数据治理”就抛给我们这样一个反思:我们是否能够承担精确性背后带来的社会的消失?正如齐格蒙特·鲍曼(Zygmunt Bauman)所言,“社会的图像不仅从强制约束的经历中获得了真实性,也从防止个体不幸的集体保险中获得了真实性”[17]26。而这种集体保险在步入“数据治理”时代后,呈现出另一番图景,“社会的高度复杂性和高度不确定性决定了国家及其政府不知道应当从个体那里取走哪些责任与自由,即使国家和政府从中取走了一部分,也可能承担不起来”[18]。作为一种新的技术,以强大的信息数据收集记录力量,看似拨开了横亘在事实面前的“迷雾”,但却也面临着前所未有的挑战,即“数据治理”最终能否意识到在追求精确性的结果导向的道路上,转向追问过程价值的治理是应然之举。事实上,大数据技术可以为这个转变提供技术条件和社会动力,而这对于将追求公正地行使公共权力作为质量核心价值的现代政府而言,无疑意义重大。
再者,“数据治理”的自知性还表现在对数据与治理二者融合的全面把握上。“数据治理”作为一个新的概念,虽然就该概念的证成以及内涵解读仍然处于一种探索性的状态,但各项具体的实践应用已经在快马加鞭。因此,更为重要的或许是审视数据在治理范畴内的可为限度。当然,很多时候我们并不能以一种先验的眼光去进行判定。治理的范围小到社区、自治团体,大到国家,甚至国家间的联盟,而关于治理概念的共识却还未完全达成。在有关概念和内涵的讨论中,主要集中在这两层含义上:第一,治理有强烈的非中心和社会导向的内涵;第二,治理就是问题的有效解决[19]。这也意味着,我们在思考“数据治理”时需要把握一个基本的着眼点,即多中心治理主体的协作。伴随大数据社会化进程的加速,政府、企业、公众等众多主体纷纷“入场”,一般认为,促进多中心合作的手段或者动力在于制度化或者利益共享机制。那么,大数据是否天然地具有对多中心主体的吸引力?答案是肯定的。在大数据时代,权力正从国家向网络转移,以信息技术为媒介的社会互动正取代等级结构成为社会组织形式的主导,同时,数据和信息转变为由公民直接提供,而不再由大众媒体或利益集团过滤而来[20]。信息即权力,对于除政府之外的其他主体而言,“数据治理”提供了新的发展机会和重要推动力使其作为治理的关键参与者[21]。如此一来,社会多元主体势必会竭尽所能地以占据更多的数据信息为己任,对于那些信息化程度较低的主体,在治理过程中面临的最大挑战就是要实现自身的高度信息化,并与社会信息网络深度嵌构,进而消除与其他主体在信息获取、传递等方面的巨大差异。而“数据治理”则为这种过程提供了动力与可实现的渠道。有学者提出“全局数据”这一进化概念,旨在改善数据质量与连接方式的问题[22],而“数据治理”则在一定程度上使全局协调和数据内在驱动成为可能,更优质的数据被洞察以及连接,并开始具备可针对不同个体所处的现实情境提供更为智慧决策结果的能力。上升到国家治理层面,“数字治理”到“数据治理”的变迁,与其说是信息技术应用的迭代升级,毋宁是数字化转型问题加压后倒逼治理主体做出适应性选择的必然结果。
“数据治理”无论是从理论构建还是实践应用出发,其根本的意义和目的都在于推动社会整体的数据化进程。囿于理论与实践的不同步,引发了学界的争论与反思:人们是否具备利用好“数据治理”的潜力?“数据治理”的工具理性是否会导致公共价值伦理的失范?大数据应用于公共领域是否会带来社会不公等风险的进一步加剧等等?这些问题,都成为把握“数据治理”内在本质的关键。而对这些问题的回答都应当建立在我们运用“数据治理”“行于先,思于后”的反思之上。当我们谈数据治理或大数据治理时,就意味着数据和治理两个价值世界之间的碰撞。但数据的社会价值太过宽泛,而治理又有着自身的价值设定和运行逻辑。因此,“数据治理”的内在本质就在于重新评估和衡量二者之间的关联,完成价值重整的使命。
首先,“数据治理”的反思性在于能够引导技术回归治理的价值伦理轨道。大数据的空前繁荣以及在金融、医疗、司法、教育、公共安全、城市交通等各个领域的普及应用,使人们形成了对于数据技术发展及其应用于治理的乐观态度。每一次当新技术应用于由政府承担主要职能的公共领域时,都会有一个质疑的声音,那就是技术是否会带来治理领域公共价值伦理的失范。回到现代社会的治理经验,无论它的前置词是什么,逻辑起点都是现代新秩序,即“善治”,亦即良好的治理。因此,在现代化的语境中谈及治理,都应当以此作为价值依归,或者说以治理的良善驯化技术的某些“非善意”。当然,这里所说的“非善意”并非指诸如大数据等技术本身存在善恶之分,而是应当理解为作为技术在应用的过程中,绝对理性或者应用者本身的“非善意”所导致的行为模式偏差。这样的隐忧并非杞人忧天,因为资本与数字技术的联姻使数据具有了个体无法拒绝的“权力”,而形成的数据资本权力包含着的异己力量能驱动个人不断走向异化[23]。众所周知,在“数据为王”的网络时代,平台乱象丛生且屡禁不止,特别是在未成年人保护上的责任漠视被广为诟病,人们或将其归咎于平台技术的“势利”。2021年6月1日,新修订的《中华人民共和国未成年人保护法》正式施行,其中增设的“网络保护”专章作为此次修法的一大亮点,规定了网络平台运营方在设置“青少年模式”上的相关责任,包括针对未成年人使用其服务设置相应的时间管理、权限管理、消费管理等功能[24]。网络服务提供者也许难以逃脱人性的“唯利是图”而“装睡”,但监管的“较真”却能够促使技术的自我规制和为善。除了制度层面的约束外,合理利用信息过滤技术能够最大限度从信息端降低不良信息对未成年人的影响。而此举正是突显了“善治”导向下对技术的向善改造,而这些无疑都是反思的结果,以治理的价值凸显技术的“善意”,以技术的善意来推动社会整体的“理性化”。
其次,“数据治理”的反思性能够不断实现数据的价值创造。数据到底存在多少价值?被使用过的数据是否还可以继续创造价值?围绕这两个问题,大数据领域反复提及的谷歌公司重复使用人们搜索关键词的行为数据而比官方更及时有效监测到流感传播的例子也许可以给出一个答案[25]。在现代社会中,类似民政部门、统计部门、公安部门、移动公司等,坐拥庞大的数据库,但很多时候它们的数据只服务于组织内部传统且有限的职能,实难产生真正的创新价值,而通过反思最终会让数据资源达至最具有创新性和价值性的组织机构,这也是各国在大数据建设中普遍采取政企合作战略的原因。同样,这也是著名的科斯定理(Coase theorem)告诉我们的规律:假定当交易成本为零时,资源的配置最终会达到最有效率的状况。以此推演数据产权资源的最终配置情况,那么结果也是类似的。虽然这只是一个理论上的思想实验,但现实也同样印证了这一结果,虽然对于某企业家宣称的“某国用户愿意用隐私换便利”的言论曾引起社会公众的普遍不满,但事实上,曾担任过微软首席经济学家的苏珊·艾希(Susan Athey)就做过一个类似实验,通过这个实验发现,尽管实验的被试者们宣称自己对本人的隐私很重视,但实际上他们却都愿意以很小的代价出售自己的大量信息和数据[26]。也正是基于这个坚定的假定和实验结果,我们有理由相信,在经济利益的驱动下,各个掌握数据资源的公司对数据的价值创新会犹如军备竞赛一般,永不止步。
最后,坚守“数据治理”的反思性事实上就等同于将一直作为工具的数据实现从“理性”到“智慧”的跨越。从抽样数据到全量数据,大数据实现的不仅仅是“工具理性”,而是在突破传统决策框架的基础上跃升到智慧治理,破除“社会数字化”之下公民在强大的“数据收集机器”面前几乎毫不设防,也无法设防的困境[27]。传统的“技术理性”或者“工具理性”是扎根于人类物质需求上的一种理性精神,追求的目的是人类物质需求的满足,因而带来的治理行动也必定是具有功利性,即便是实现了如前所述的对技术工具之“善治”的追求,但根本上还是一种对社会的功利性改造。大数据的“理性”技术特性在解决政治、经济、社会中的一些旧顽疾上功效卓越,但“人应该诗意地栖息在大地上”并不仅仅只是一句浪漫的诗句。经历将近四十年的时间,治理对人类生命价值实现的重要性日益凸显,从数字化到数据化,在治理动机和效果上有着根本的变革,我们坚守“数据治理”的反思性,根本的意义在于一系列以大数据为基础的技术于社会而言不仅仅是一种改进,而是可以从根本上实现“人类是目的而不是手段”这一终极价值。这于人类社会而言,是全面进步的契机。虽然个人数据泄露事件一直是作为数据治理日臻成熟道路上的“隐忧”和“丑闻”,但每一次数据安全事故带来的反思,却也进一步激发了人类对于自尊、自由意志和政治权利的“上下求索”,随之而来的是作为完整意义上的人之权利、责任、参与等意识的同步提升。
“数据治理”的创新性内蕴源于其内在的超越性和革命性。作为一种新型的治理模式多半无法逃脱制度性依赖或者制度性“疲态”,即效用的递减。但是数据化的独特性就在于能够时刻进行新的价值创造。应当说,20世纪以来的研究都已经展示出一个方向,那就是利用技术去解决问题和提升服务。而在新近的所有技术应用中,如果说与我们今天所探讨的“数据治理”有着何种根本区别的话,那么应当就是大数据技术更像是一个取之不尽用之不竭的矿藏,它的价值在被发掘后仍能不断创造给予,“一旦世界被数据化,就只有你想不到,而没有信息做不到的事情了”[10]125,而这很大程度上是源于大数据的内在超越性。数据,在某种意义上就是所有事物的表达和呈现方式,它是现实的存在,但同时又是主观建构、千变万化的。言外之意,只要我们相信世界可以通过数据化而获得解释,那么我们也就会相信数据可以作为超越时空的客观事实而存在,这便成了数据的内在本性——超越其客观存在的一种存在。人类社会自近代以来在追求标准化、精准化的道路上自觉地形成了一个开放体系,即接受技术的不断自我超越。而进入21世纪后所呈现的便是数据井喷之势,无论是在数量、结构还是复杂性等方面,都远甚于以往任何时期。但从近代以来对技术的发展所进行的反思和实践应用来看,诚如马克思所意识到的:“在我们这个时代,每一种事物好像都包含有自己的反面。我们看到,机器具有减少人类劳动和使劳动更有成效的神奇力量,然而却引起了饥饿和过度的疲劳。财富的新源泉,由于某种奇怪的、不可思议的魔力而变成贫困的源泉。技术的胜利,似乎是以道德的败坏为代价换来的。随着人类愈益控制自然,个人却似乎愈益成为别人的奴隶或自身的卑劣行为的奴隶。”[28]以数据技术为载体的治理当然也无法避免会陷入这种困顿。但是令人欣慰的是,当我们看到世界万物皆可数据化时,这种“量化一切”就会成为人类与生俱来的能力,那么通过创新解决问题或创造新价值也就会成为一种本能,正如舍恩伯格所言:“只要一点想象,万千事物都能转化为数据形式,并一直带给我们惊喜。”[10]123甚至传统逻辑所不能进入的“情感”领域也被大数据技术所“入侵”。更重要的一点是,数据的这种创新性源于反思性。正如上述我们所提到的“数据治理”区别“数字治理”的一个重要机制在于其内生的反思性,那么,这种反思带来的结果不仅仅是社会“善治”的导向,更是挖掘人类社会文明演进的最大动力,而作为人类社会文明最重要的两个方面就体现于治理人格和治理能力。
第一,实践“数据治理”能够创设新的治理人格。作为一种新型的治理模式,“数据治理”代表着人类文明的一种新的类型,其中,治理人格是人类文明的一个重要方面。不同的治理类型决定了不同的治理人格形态,而每一种形态的治理人格都反映了当时的社会经济、政治、文化的状况[29]。在农业文明的统治型社会治理模式中,巨大的等级差别和自上而下的权力集中造成普遍人格依附;而在工业社会的治理体系中,对工具理性的强化和崇拜几乎祛除了人格存在和发展的基本条件,人们因为倚重于政府而表现出了“逃避自由”的行为倾向,宁愿付出接受现代奴役的代价也不愿意承担责任[18],进而转为“单向度的人”,这更多显示出一种对治理人格的隐秘。而进入以科技进步和竞争为特征的后工业时代,数据型社会治理模式以高度的精准性、客观性和预测性代替了社会治理者的自主性,“数据治理”对于每一个人来说,一方面是近乎可以预测的命运,但另一方面又意味着更多的可能性,这是无可回避的矛盾和价值权衡。正如人们所忧虑的大数据时代的治理难题,“你的数据,他的产权”这一模式是否真的可以持续?也许除了前面所提到的科斯定律给我们的解答之外,最大的欣慰就在于,看似那些依托个人情感和自由意志的治理经验和娴熟技能已经不再重要,但也给予了前所未有的机会将人从他治之中彻底解放出来,形成了全新的治理人格,在这里,“两种紧密交织的能力就获得了史无前例的生存与成功价值。其一是灵活性:即能够迅速地改变轨道,立即适应变化了的环境的能力,永远都不受根深蒂固的习惯和‘太重以至于无法移动或太近以至于无法摆脱’的财产的束缚。另一个则是全面性:一个人不应该把所有的鸡蛋都放在一个篮子里——如果特定技能不再有需求,而其他技术升值了,那么花在深化这项技能上的时间就完全白费了。我们从学生的发展中了解到,在一个瞬息万变的环境中,恰恰是‘多才多艺’、非专门化和知识面广的学生获得了最大的生存机会”[17]167-168。
第二,“数据治理”能够不断突破人类治理能力的局限性。尽管到目前为止,人们对于人工智能是否会超越人类的看法仍然莫衷一是,但我们已经可以接受这样一个共识,那些人们引以为傲的各种智能,事实上都可以还原为神经元相互作用的过程。这也意味着,由大数据建构的智能本质上可以视为是人类智能的外延拓展,不断超越和创新是这个时代赋予智能的一个鲜明标签,“它的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山的一角,而绝大部分都隐藏在表面之下”[10]127。但智能的强化并不等同于能力的提升,后者是一条不断习得、感知、反馈、修正的道路。当前由数据类型技术引发的社会问题已经不容忽视,因此如何突破人类治理能力的局限是前述逻辑思考的最终指向。大数据在参与调整与构建治理模型的过程中可以完成自我价值的再创造,这也意味着人类作为参与其中的主体,虽然可能“并不清楚什么是安全的、什么是有风险的,更难以分辨什么是合乎伦理的,而什么又是令人恐惧的”[30],但“数据治理”能够摆脱各个领域传统需要依赖人类表达能力的局限,因为数据本身以及应用的因果解释都是脱离人类所能理解的自然语言范畴的。换言之,在大数据时代,“我们理解世界不再需要建立在假设的基础之上”[10]74。诚然,数据的井喷应用也导致了不断涌现的公共问题,诸如数据安全、隐私泄露以及人们隐忧的“黑箱操作”可能加剧社会的不平等。事实上,这也是在每一轮技术革新浪潮中都会出现的共性问题,也许依照当前所提出的各项方案并不能很好地解决上述这些问题,但是却能激发人类治理能力的全面迭代。每一次技术革新带来人类社会的变革都会爆发出人类所共识的经验性结论的改变,“数据治理”依赖的特性早已在事实上推动我们思考社会基本规则的重构,以及重新定义例如公正、自由、民主等治理理念,而正是这种认知的改变,能够不断形成突破人类治理能力藩篱的根本动力。
“数据治理”的产生,源于大数据的生产属性。作为物质生产能力的大数据,将改变人类社会的生产和交往方式,包括治理形态,这是“数据治理”得以形成的根本原因。当前,社会治理已经进入一个转型期,“每个社会都需要创造适合于自己的治理方式,社会的演变要求更新每个时代的治理模式。这一更新的必要性在21世纪初尤为迫切,因为我们这个时代的治理模式没有跟上社会发展的步伐”[31]。这是理论界和实务界的共识。而“数据治理”是否可以作为一种独立的理论范式,既不同于工业社会下的传统官僚制模式,也区别于网络治理这一治理新模式,很值得讨论。伴随治理理念在20世纪末引入中国,首当其冲的是以西方语境下的合作治理作为标准范式,而后协作治理成为更贴近中国现实的选择[32],实践中亦涌现了诸多典型个案,但长久以来典型个案始终难以完成从“悬浮”到“嵌入”的过程,制度层面的设计并不缺乏,显然技术的原因不可避而不谈。而步入大数据时代之后,经由国家战略的强力推动在中国场景下构建了一种新的技术资源,把大数据作为一种治理工具和治理情境加以开发和利用,已经成为创新发展社会治理新的增长点。“数据治理”或许成为一个最具现实可能性的选择,构筑中国情境下治理的动力来源和适宜形式。
理解大数据对于治理实践的影响,首先需要厘清“数字治理”与“数据治理”之间的关系,澄清有关“数据治理”的系列误解,从而充分发掘“数据治理”的内在意蕴和社会意义。作为一种内在的演进力量和广泛的社会实践运动,“数据治理”始于自身形态的变革,通过有意识主动地对数据的存在方式及价值的理性反思,破解“数据治理”的内在矛盾,进而实现“数据治理”的创新。因此,从自知、反思和创新三个层面层层递进,能够最大程度地为我们揭示“数据治理”的内涵和要义。
第一,应当以历史演进的视角审视“数据治理”。从数字到数据,不仅仅是丰富和拓展了治理信息的载体和形式,更大意义上是为“善治”的成长提供了“养料”,比如对于治理价值理念的强调,数据反思的提倡,这些都在“数据化”条件下成为主流。而进入21世纪以来,大数据的全景式监控迫使我们思考自身生存系统的正当性以及人类社会演进的方向[33],也正是在这个意义上,我们形成了对“善治”新的理解和对“数据治理”新的追求。第二,也是更为重要的,“数据治理”从根本上区别于“数字治理”,是在于内生的反思性和创新性,这也是“数据治理”并不仅仅是单纯数字化或网络化治理的延伸的根本原因,其超越性和革命性可以改变其所处的社会生产关系网络。既然“数据治理”可以作为一种独立的治理范式,那么,它的前景和未来又如何呢?
现实一再告诫人们,不能将治理视为一种数学游戏而忽视人的差异性和真实感受,不能简单化地将社会视为由均等个人组成的匀质共同体,只对受益群体和受损群体进行人数多寡的比较[34]。正如主流的治理理论所认为的,治理的重要性之一在于构建共同的价值认同,无论这种共同的价值认同在未来具体是什么,但确信无疑的是它应当而且必须能够赋予人类坚定的意志,反抗逃脱所有构成对人类人性和自主性进行支配的力量,这是未来的治理无法推卸的责任和使命。因此,在可预见的未来,我们在“数据治理”的理论开展抑或实践推进上,应当始终围绕两方面充分展开:一方面,需要充分认识大数据对于生产和交往的革命性影响,也要认识到大数据将带来治理形态的实质性改变,这是发展“数据治理”,全面提升治理能力的前提性条件。但是“既有的社会治理模式同时也是作为一种思维范式而存在的,这种思维范式为人的思想提供了一个框框,使人无法突破”[35]。因而,除了国家层面强化顶层设计之外,一个努力的方向就是在全社会形成“数据治理”的发展共识,而这就需要政府尽可能向社会开放数据,共享数据价值,实现公众、企业和政府的三方共赢;另一方面,又要认识到大数据对于治理实践的影响还存在诸多限制性条件。这类限制性条件主要分为两类:第一类是在工业社会与信息社会的交汇期,大数据发展还不充分,比如有关治理的观念、目标、价值、民众情感偏好等还不能全部以数字或符号的形式加以收集、存储、管理、分析和应用,以及公共部门在利用公众的个人数据时,还无法树立可供社会各组织效仿的大数据行业标准[36],而这无疑会影响数据对于治理的积极作用;第二类是“数据治理”的发展不可避免地存在各种负面效应,比如数据公共性、数据公益性、数据隐私性等方面的问题,而公共部门的态度和立法决策将是作为影响大数据对治理建设性作用的决定性因素。虽然不少研究表明,迄今为止,控制仍然主导着“数据治理”[37],但是我们也发现,无论是企业在大数据标准体系建设上的不断自我完善,还是政府与人工智能决策相互补全的日渐常态化,都表明“数据治理”在控制和自治的平衡策略上日臻成熟。尽管存在诸多风险与挑战,但我们仍然要认识到,在信息智能化的背景下,“数据治理”的普及应用将带来人类社会整体福利的提升是毋庸置疑的。正因如此,重要的或许不是要求“数据治理”能够“量化一切”,或者提供所有优化的解决方案,而是以更为包容和务实的态度评估其是否相比于当前的社会治理运行机制有所提升。因此,以积极、建设性的态度对待有关大数据对于治理实践的影响,将“数据治理”纳入国家治理体系和治理能力现代化建设之中,这是必要的,毕竟可靠的公共部门信息才是大数据的关键来源[38]。而“数据治理”的重要前提是建设统一共享的数据平台[13],这也是现阶段信息化系统建设发展的历史性任务,但目前很多地方政府建设的大数据平台,在数据信息整合与传递上仍然是单向度的,难以实现大数据融合共享下的治理效能提升,截至2019年末,全国县域政务服务在线办事率仅为25.4%[39],便是一个很好的例证。事实上,这也体现了大数据时代数据崇拜的“迷思”。因此,时刻警惕“大数据傲慢”(big data hubris)[24]可能带来的灾难性后果——全面而无法反抗的“计划体制的复辟”[40]也许是我们这个时代一种不可或缺的“清醒”。处理好既有治理模式、经验与大数据条件下治理之间的关系,承认既有治理范式与“数据治理”范式的积极面和消极面实有必要。在此基础上,再通过创新数据治理机制的方式探索、推进相关的改进。总而言之,作为“数据治理”中的每一个行动者,必须学会在未来的治理中相互合作而非彼此掣肘,“善假于物”但“不为物役”,才能在享受技术红利的同时又不失自由。