陈潭
(广州大学公共管理学院,广东广州,510006)
伴随着互联网时代的技术迭代和数据积淀,以容量大、增速快、种类多、价值高为主要特征的大数据应运而生[1],并嵌入人类社会生活的方方面面。在近代人类政治文明演化进程中,信息化发展与治理效能的嵌入耦合及其多维互构是国家治理现代化的恒久议题。尤其是21世纪以来,伴随着虚拟社会的异军突起、国际化浪潮的全面冲击以及后物质主义时代的纵深发展,全球政治经济形势正经历着剧烈变化,传统的国家治理模式越来越难以适应高度不确定和极其复杂的国际形势。在这一宏观背景下,如何借助信息科技发展的技术红利来创新和变革国家治理的模式,显得尤为关键而迫切。通过与移动终端、物联网、云计算以及人工智能等新型信息技术的深度耦合,大数据技术的集群能有效嵌入国家治理机制,逐渐成为各国政府更新治理理念、变革治理方式、创新治理工具、提升治理成效的可行路径。为推动国家治理体系的现代化,英国、美国等发达国家早已将大数据资源的平台建设上升到国家战略高度,中国也在2015年发布的《促进大数据发展行动纲要》中提出,要全面推进大数据的发展和应用,加快数字中国和网络强国建设。
在大数据的驱动下,由于国家拥有了更加综合和全面的信息,国家治理领域被逐渐开放,企业、社会组织甚至公民个体都将在国家治理体系中游走,过去那些基于非公开、非完全信息而形成的、相对闭塞的管理思维和方法,将会被彻底改变[2]。然而,作为一种客观存在的技术嵌入,大数据并非十全十美,会因其自身的技术缺陷以及相关主体间的利益纠葛,给国家治理带来灾难。因此,全面、理性、辩证地看待和审视大数据驱动国家治理的向度和风险挑战,既是促进国家治理适应复杂化的国际形势、实现治理机制创新转向的关键要义,也是明晰信息技术精进与人类政治文明演进相互作用机理的重要参照。
国家治理结构是一个包含若干变量的函数关系式,随着外部环境的变化和时代的变迁而不断变动。作为推动国家治理结构变迁的重要变量,大数据的嵌入对国家治理结构产生了深刻的变革和影响。
由于受社会变迁、利益分割、信息不对称等因素的影响,无论是传统的国家管理,还是现代的国家治理,都呈现出“碎片化治理”状态:参与国家治理的各个行动主体之间在治理理念、治理标准、治理手段、治理机制和治理结果等方面存在一定的冲突和矛盾,无法达成集体行动,进而造成资源浪费、社会分割和服务短缺等问题。
实现国家治理体系和治理能力现代化的主要障碍是国家治理的碎片化。从理论上而言,国家是一个内部存在巨大张力的有机整体,其治理目标和手段应该具有协同性。但从实践来看,国家并不是铁板一块,各个部门间实际上处于相对分散的状态,表现在国家政体、政府和政策三个层面:首先在政体层面上,“碎片化威权主义(Fragmented Authoritarianism)”[3]就是对国家治理中充满谈判、讨价还价和寻求共识的描述;在政府层面上,“部门主义”、“职责同构”[4]、“条块分割”、“九龙治水”、“山头主义”等词则主要是对我国政府部门中出现的利益分割和各自为政的碎片化状态的描述;在政策层面上,政策不连贯[5]、城乡分割、地区分割、人群分割、管理分割和短命政策等问题则是国家政策碎片化的重要体现。国家治理碎片化导致构成国家治理的参与主体之间无法达成集体行动,彼此产生内耗和冲突,严重制约着公共政策科学化、公共服务高效化和社会治理精准化的实现。
作为一种国家治理技术,大数据的运用会在一定程度上促进国家协同治理的实现。哈肯认为:“如果在由混沌产生有序,或一种有序性逐渐转变为另一种新的有序性的场合中,这样的普遍规律起作用的话,那么,在这类过程中必然有着某种内在的自动机制。”[6]协同治理内在自动机制作用的发挥需要建立在信息对称基础上,而大数据在很大程度上能够解决国家治理中各个主体之间的信息不对称问题。这主要体现在以下三个方面:一是数据整合。现有的国家治理的大数据种类繁多、形式多样、格式不一,要真正将这些体量巨大的国家治理数据转化为国家治理资源,运用于国家经济和社会建设之中,就必须突破数据整合的藩篱,而随着大数据技术的日益发展,实现各类数据的有效整合已经基本实现,这在很大程度上解决了信息对称的基础性问题。二是数据挖掘。数据挖掘主要是通过对数据规律和规则的发现来促进国家治理主体之间的行动协调。信息整合是实现行动协调的基础性前提,而数据挖掘则是实现行动协调的具体手段,其通过信息匹配和关联来消除国家治理中潜在的冲突和障碍。三是数据预测。大数据的功能不仅限于对信息的整合、匹配和关联,更在于通过已有信息的数据分析实现各个国家治理主体之间的行动预测,从而在最大程度上实现国家治理主体之间的行动协调。总之,大数据在很大程度上改变了之前的信息不对称状态,化解了大量的潜在矛盾和冲突,使得国家治理主体之间的行动更加协同和和谐。
治理层级与治理幅度悖论是国家治理结构中一个长期讨论的话题,治理幅度与治理层级之间往往呈现着负相关关系,即治理层级越多,治理幅度则越小;治理层级越少,则治理幅度越大。由于传统的管理能力受资源、技术、信息和工具等方面的限制,因而国家只能通过减小管理幅度、增加管理层级来实现管理目标。但管理层级过多也会带来一系列问题。其一,是成本效率问题。管理层级的增加势必会需要更多的人力、物力和财力,从而扩大了政府规模和政府体量,增加国家运行的负担。另外,随着政府层级的增加,各种信息的传递和反馈需要更长的路径和时间,这也降低了政府运作的效率。其二,是协调成本问题。随着政府层级的增加,地方政府之间协调的频率呈几何数增加,这在无形中增加了国家治理体系潜在的冲突和矛盾,也提升了国家治理结构中的协调成本。其三,是层层加压问题。由于我国属于单一制的国家结构,国家层级过多容易产生“压力型体制”,形成数量化的任务分解机制和物质化的考评体系,进而引发数据造假和关系疏通等一系列消极行为[7]。其四,是代理异化问题。层级增加则意味着各个层级的“代理人”数量增加,由委托代理理论可知,在委托代理中最容易产生道德风险、逆向选择和机会主义等行为,这也就意味着参与治理的层级数量越多,国家治理目标被异化的风险则越大。
万没想到,负气忘形的何良诸,被案子缠上了。有记者找到何良诸,问琥珀铭文被窃事件,嫌疑犯叫赵集。事情发生在北大坎地区,一座深千米的煤矿井下,那儿与省城相隔几百公里,天上地下,怎么找到他的头上?肯定是文化厅内部有人出卖了他。要不然,谁能知道何良诸在北大坎市呆过,谁能知道何良诸跟赵集是生死之交。
大数据时代的到来,致使原本小幅度、多层级的国家治理结构转变为宽幅度、少层次的扁平化结构具有可能性。国家治理结构的扁平化,不仅意味着国家治理层级的减少和国家治理成本的降低,更意味着国家治理效率的提高和治理能力的提升。具体而言,大数据对国家治理层级的影响主要体现在以下三个方面。一是提升信息处理能力。随着大数据对信息的储存、加工、挖掘等能力的提升,国家可以通过大数据技术进行集约型大批量处理国家的治理信息,这不仅减小了国家治理的成本,而且扩大了国家治理的范围。二是缩短信息传递路程。在缺乏大数据和互联网支持的时代,国家管理的信息传递依赖层级节制的科层体制,这种传递路径冗长拖沓,速度也缓慢低效;借助于大数据整合平台传递数据则变得十分简洁容易,使科层制上下沟通超越了传统的行政文书模式,走向更加扁平化、去中心化的网络模式。三是对传统上级传递信息路径的依赖程度减弱。金字塔式的政府管理层级体系的正常运转,很大程度上是建立在上下级信息及时沟通的基础上。但是随着大数据技术的发展,政府上下层级之间的依赖性逐渐减弱:下级政府的决策会因为大数据的运用而变得更加独立,而上级政府也可根据大数据提供的信息直接做出科学决策。总之,大数据时代到来的影响从表面上看,似乎仅仅是帮助国家治理层级之间的沟通更加通畅便利,而实际上是大数据技术正在引发一场渐进性治理革命,无形中推动着国家治理层级走向扁平化。
治理空间在本质上是政府权力运行的场域。规范与优化权力运行的重要前提,是打开权力运行的“黑箱”,加强对权力的监督,使治理空间更加清晰化、透明化。监督权是完善的国家治理结构的重要组成部分,也是优化治理空间的重要依托,虽然监督权是从决策权和执行权中派生出来的一种权力,但缺乏这种派生性权力的监督,决策的科学性和执行的公正性就很难保证。监督意味着把权力关进笼子里,因而执行监督权并不是一件好的差事,监督必然受到被监督者的反抗和敌视,正如汉密尔顿所言:“被约束的或者被削减的权力,几乎经常是用以约束或削弱那种权力的对手和仇敌。”[8]因此在实践中,监督乏力、监督缺位、监督虚置和监督越位的现象经常存在。这是由以下几方面的原因造成的:首先,监督权的独立性无法保证。“独立是确保正直的良方,或者它至少有助于确保正直免受来自那些企图与它妥协的人的压力”[9],实际上监督权经常受到人情关系和利益渗透等因素的影响,导致其客观中立的立场受到侵蚀。其次,监督能力的有限性。虽然监督机构是一个常设性机构,但面对决策机构和执行机构规模庞大、盘根错节的各种行为,监督机构实质上很难做到全面系统的监督,因此有人说政府“除了受到偶然性监督外,对其实行任何实质性监督都不过是不切实际的期望而已”[10]。最后,监督权本身缺乏监督。监督权本身也是一种权力,也能够左右和影响事务发展的全局。很多时候问题并不出在决策或权力执行等方面,而是监督权本身出了问题。因此,监督权如果缺乏公正合理的监督,就会滥用和乱用,则可能扰乱国家治理的秩序,造成更大的负面影响。
大数据在某种程度上可以弥补传统国家治理监督中的不足和缺陷,简化监督程序、优化监督结构、提高监督效率。具体而言,主要体现在以下三个方面:一是能提高监督的客观性。借助于大数据的国家治理监督主要是通过对国家治理所涉及的各种数据信息进行整理,并与其相关的正面清单、负面清单、服务清单、权力清单等进行比对分析,来监督相关的国家治理行为。由于整个过程是基于全局数据和机器学习来实现的,其结果也是基于一定的算法和推理分析完成的,受人为因素干预较少,因此相对客观公正。二是能增强监督的系统性。以往由于受人力、物力、财力等客观条件的限制,国家很难对规模庞大的各级政府机构进行全面系统地监管监督,因此有的地方政府机构就会产生机会主义和侥幸心理。随着大数据技术的发展,国家根据现有的数据清单能够对各个层级的治理主体进行匹配、比对和分析,可以在短时段内完成以前无法完成监督任务,这就超越了传统抽样监督法的缺陷,使监督更加系统全面。三是能实现监督的前瞻性。国家借助于大数据技术,在对相关信息的挖掘、对比、分析、总结的基础上,发现一些特定的现象和规律,以此来预警或设置相应的监督行为,在最大程度上提高现有监督资源的运用效率。
总之,大数据的使用使得国家监督权的发挥更加公正客观、全面系统和具有前瞻性,有助于优化国家治理的空间,使其更加透明化。
国家治理体系是一个多层次、多领域的复杂系统,因此国家治理也是一个复杂的系统工程。大数据驱动的国家治理,不只是简单的物理过程,更多的是一种复杂的化学反应。大数据以其隐蔽的或公开的方式影响着国家治理的各个领域。习近平总书记在中共中央政治局第二次集体学习时强调,要建立健全大数据辅助科学决策和社会治理的机制,推进政府管理和社会治理模式创新,实现政府决策科学化、社会治理精准化、公共服务高效化。因此,大数据驱动国家治理功能的价值向度从以下三个方面来探讨。
决策制度是国家治理体系的重要组成部分。决策的成功与否,会对后续政策的执行和监管产生一系列多米诺骨牌效应,不仅影响人民对党和政府的信任,而且关涉社会的经济效益和政治稳定,因此决策科学化一直是政府部门所追求和努力的目标。从我国政府决策的实践来看,其民主化和科学化程度都有待提高。
从民主化角度来看,因为党政机关在我国各种事物的决策中处于核心地位,尤其是决策权主要集中于党政“一把手”,所以就会出现下述现象,即有些事“只要有一定的规章,放在下面,放在企业、事业、社会单位,让他们真正按照民主集中制自行处理,本来可以很好办,但是统统拿到党政领导机关、拿到中央部门来,就很难办。谁也没有这样的神通,能够办这么繁重而生疏的事情”[11]。这就导致决策的民主化程度不高。事实上,决策应该是在利益各方“彼此行使权力或影响力的复杂的过程被制定出来”[12]。从科学化角度而言,我国政府的决策过程存在较强随意性:决策者喜欢凭经验和感觉办事,甚至出现一些“三拍决策”(拍脑袋决定、拍胸脯保证、拍屁股走人)现象;决策结果缺乏科学有效的数据支撑。相对而言,大数据能够通过海量数据分析,从多维角度发现决策对象的内在特点和行为规律,辅助进行交叉验证,提高决策的准确性。从民主化方面来说,大数据实质上促成了一种扁平化的信息传递和沟通方式,这种扁平化的结构也在无形之中推动了政府决策的民主化。
政府决策之所以能成为大数据驱动国家治理的重要场域,是因为大数据能在一定程度上弥补政府决策实践中存在的短板和漏洞。大数据驱动政府决策的具体领域很多,包括农业、经济、交通等民生领域。以农产品种植为例,我国农产品的供给与需求经常会出现结构性短缺或过剩,进而引发农产品价格产生忽高忽低的现象,影响农民种植的积极性,并对社会稳定造成极大威胁。在供给侧,如果大蒜、绿豆、白菜、粮食等农产品价格一直处于忽高忽低的状态,就会严重影响农产品市场的稳定性。如果凭借大数据来统计相关的海量信息和预算下一年各种农产品的种植面积,再参考天气变化的历史数据等,就能估算出来年农产品恰当的供给规模和供给结构。在需求侧,大数据的充分运用可以对消费群体的规模、需求和金融状况进行监测,对资本流入农产品领域的规模、去向和结构进行估算,再对特殊事件和特殊节点进行分析,就能够大致评估出市场对农产品的需求规模和需求结构。通过对供需双方相关情况的分析,大数据就能够为政府制定农业政策提供客观有效的信息支持,进而帮助政府做出科学、精准的决策。基于大数据而获得的政府决策,依据是体量巨大的全局信息,而不是决策代表的抽样或经验感知。随着大数据技术的不断成熟,其将成为政府科学决策和民主决策的重要推手。
社会治理客体存在的上述特征,导致社会治理存在以下三方面的困局。一是资源紧张。社会治理需要投入大量的人力、物力、财力等资源,而我国资源十分有限,难以满足社会治理日益增长的各种需求。二是效果不佳。由于社会治理涉及的内容错综复杂,多个环节和领域相互嵌合,如果单从某方面下手会很难达到实际效果。三是措施不够精准。当前的社会治理主要采取“摊大饼”的方式统一开展,没有针对具体的个体和组织特征采取精准的治理措施。随着大数据技术采用,不但大批量繁杂的社会治理信息可以得到科学化处理,而且通过数据挖掘和模型设定等手段也可实现社会治理的个性化和精准化,从而提高社会治理的效率。
“全模式社会治理就是运用现代信息技术,通过流程再造、业务集成,以数字化、精细化、系统化的方式变革社会管理,其中一个显著的亮点在于实现了对非互联网大数据的社会化应用。”[13]大数据除了可以运用于由互联网自动生成的大数据社会治理领域外,其还可以适应于由非互联网收集的大数据社会治理领域的分析,如扶贫大数据、网格化治理大数据、食品安全大数据等等。社会治理领域信息的数字化转化拓展了大数据的生存空间和运用限度,扩展了大数据的作用场域。以老年人照护为例,对老年人的护理行为虽然不能像电子商务或微信那样,可以自动生成海量数据,但可以通过借助电子监控设备采集老年人在每个时间节点的饮食习惯、睡眠习惯、活动状况、情绪状态、健康指数等数据,并借用一定的数据模型来分析老年人的生活规律和习惯,并据此给出个性化的看护建议。这在很大程度上减轻了社会组织和志愿者的工作压力,可以节约大量的社会资源,提高社会治理效率。借助大数据的社会治理使得治理环境更加开放共享、治理方式更加简洁省力、治理效果更加精准高效。
因其使用过程中的不可分割性和不可排他性,公共服务很容易产生“搭便车”问题,导致其供给经常处于短缺或低效状态,因此,公共服务供给不能完全通过市场机制来进行配置。困扰政府部门的另一突出问题是诸如教育、医疗和养老等基础性公共服务供给的非均等化。此类公共服务供给不但在不同的区域、人群、城乡之间的分配很不平衡,而且还带来了公共服务供给与需求不匹配、短缺与过剩并存等一系列问题。
随着新公共服务理论的发展,公共服务供给争论的焦点超越了公平与效率,转移至“人”的层面。登哈特认为,应该“将公民置于首位,强调的重点不应该放在为政府这艘航船掌舵或是划桨上,而应该放在建立明显具有完整性和回应性的公共机构上”[14],这就要求政府在公共服务供给上不仅要尽力做到效率与公平,更要做到人性与温情。尤其应该注意的是,随着中国特色社会主义新时代的到来,我国社会的主要矛盾已经转化为人民日益增长的美好生活的需要和不平衡不充分的发展之间的矛盾,人民对公共服务的数量和质量需求也已经上升到一个新的水平,这就需要与之匹配的生产力来驱动公共服务的有效供给,而作为生产要素的大数据在很大程度上能够助力满足这种需求。
公共服务领域是大数据应用的天然场所,大数据技术可以根据公共服务的具体领域建立不同的挖掘算法和分析模型,寻找公共服务供给的内在规律和特点,根据不同的服务对象提供个性化、精准化、高效化的公共服务。以公共交通服务为例,随着私家车数量的剧增,城市拥堵是大城市常见的现象。传统的信息技术条件很难给每一个出行者提供避免拥堵的个性化方案,但在大数据技术的支撑下,服务端不但可以根据历史的交通信息分析出城市交通的时空规律,还可以结合个人的出行习惯进行综合测算,给服务对象规划出最合适的交通线路。大数据在公共交通领域的运用,一方面为出行群体节约了大量时间,使其提高了出行效率;另一方面也保障了城市交通井然有序地运行,减轻了城市交通管理的压力。国家的公共服务是与民生紧密相关的,其服务对象除了交通,还涉及居民的住房、医疗、生态环境、文化、食品安全、教育、就业等方面。因此在公共服务领域利用大数据提高其服务效率和温度,不仅可以展示政府公信力,还可以重塑政府的形象。
作为国家治理的技术,大数据本身只是一种中立客观的工具。然而,国家治理是一个饱含价值倾向和政治立场的行为,因而大数据驱动的国家治理也存在着数据主权风险、数据安全风险、数据垄断风险,必须进行有效的规避和应对。
数据主权是“在大数据、云计算背景下,一国对本国的数据及本国国民的跨境数据拥有所有权、控制权、管辖权和使用权,是国家数据主权和个人数据权利的总和,体现为对内的最高数据管控权和对外的数据处理权”[15]。随着大数据时代的发展,数据主权也给国家治理的边界带来了巨大的冲击,突出表现在数据战略、数据流动和数据霸权对国家主权等方面的影响。
国家主权和国家安全在很大程度上是建立在国家竞争力的基础之上,而“大数据也会撼动国家竞争力”[16],无论是作为一种战略或价值,还是作为一种资源或技术,大数据对国家竞争力都有深刻的影响。随着生产力的发展和社会的进步,国与国之间的竞争逐渐由传统的土地、资源等生产要素之间的竞争转向信息和数据资源之间的竞争。大数据时代的数据竞争是一场没有硝烟的战争,它不是对物质资源的争夺和哄抢,而是对数据资源的争夺和掌控。随着美国、英国和欧盟等国家和地区将大数据平台建设上升为一种国家战略,大数据带来的国家之间的博弈和竞争也更加激烈。对经济而言,大数据可以通过数据挖掘、智能制造、智能选择等方式促进生产力的大幅提升,从而促进国家经济发展水平的全面升级;对政治而言,大数据可以通过信息的分析、挖掘和监控等手段,帮助国家掌控网络舆情和社会话语建构,理清政治意识形态的布局,提升国家的国际话语权;对社会而言,通过大数据的分析和挖掘可以发现社会的运行规律,辅助国家进行社会治理决策,防止重大社会安全事故的发生;对军事而言,随着大数据的运用,信息数据资源在军事战略决策中的地位越来越高,大数据资源也是军事对抗的必争之地,谁掌握了大数据的主动权,谁将处于军事博弈中的有利位置。总之,一旦上升到国家层面,大数据就不仅是实现国家治理的重要资源,还是国家之间竞争的关键领域。
由于大数据具有可复制性和高流动性,因而对大数据进行跨界存储、检索和处理是比较容易实现的行为。而大数据的跨界行为有可能对国家主权产生冲击。首先,由于大数据的创造者、分析者、加工者、储存者、传输者、使用者等可能分属不同的国家和不同的公司,而大数据的这种跨界重叠行为势必会导致国家主权的交互重叠和相互冲突;其次,“数据主权与跨境数据规制的核心问题是对本国数据的排他性的最高控制权”[17],也即国家主权强调对本国跨境数据的管控权和处理权,而数据的复制和流动势必会增强这种主权的模糊性,进而引发国家之间关于数据主权的冲突;最后,在国际上在缺乏相关法律法规的情况下,数据流动造成的各种社会问题应该如何归责和追究,是摆在主权国家面前的一个重要问题。以云储存为例,由于大数据产生的信息量十分巨大,传统的储存方式难以应对,于是一种通过网络来处理和存储的形式应运而生。在云储存模式下,个人和公司的数据都放在云端存储,因而云端成为数据安全的重要决定者。但在这种模式下,数据安全和个人隐私很难保障。美国的《爱国者法案》规定,无论是哪国公民只要将个人数据存储在美国境内的互联网公司里,美国联邦政府就有权提取该数据的相关信息。目前提供这种云端服务的大互联网公司主要有微软、百度、谷歌、亚马逊、脸谱等,而这些公司大部分归属美国所有。因此,这种云端储存可能会给国家治理带来巨大风险。
继西方政治霸权和文化霸权之后,数据霸权是霸权主义演绎的“新变种”,旨在通过更加隐蔽的或公开的方式掠取他国数据或垄断数据。数据霸权不仅是由上述客观因素造成,还是某些西方大国的主观蓄意行为,如一些国家利用监听技术窃听他国个人或组织的信息;利用网络和卫星等高科技攫取国外农业、经济、军事等方面的重要情报;利用国家职能部门系统地收集和统计他国辖区内的人事、财政、发展规划等方面的敏感数据,甚至利用间谍软件和加密技术等监控他国经济、社会、军事等重要活动。美国的“棱镜门”事件就是典型的数据霸权行为,斯诺登曾爆料,美国政府通过棱镜项目直接从微软、谷歌、雅虎等9 家互联网企业服务器中收集信息,窃取了包括苹果手机在内的所有主流智能手机的用户数据,包括电子邮件、通信信息、网络搜索信息等[18]。大数据和信息技术在各国发展不均衡的情况下,国与国之间的数据鸿沟也越来越大,一些大国利用先发优势和技术优势占据了大量的数据资源,后发国家则处于数据赤贫状态。
因价值、技术和资源的战略性地位,大数据信息引起了国际社会的高度重视和激烈竞争。由于具有较强的流动性、复制性和虚拟性,数据信息改变了传统国家治理的地理界限,加剧了PII(个人可识别信息)和非PII 及国家治理边界的模糊性。正是基于这种模糊性的治理漏洞,一些国家实施数据掠夺或数据攫取行动,给其他国家主权和利益造成极大损害。数据霸权行为就是大数据技术投射到国家治理领域的一种负面操作,对国家治理提出了巨大的挑战。
大数据是一把双刃剑,利用好了,可以造福人类,促进社会进步;利用不好,则可能给社会带灾难和危机,甚至引发社会动乱和社会革命。从使用安全性角度考虑,大数据的运用在国家治理中的运用还需要考虑技术、道德和制度三方面的制约。
“大数据给政府带来的挑战,既有制度上的,也有技术上的。”[19]数据驱动的决策需要大数据技术的保障。数据对于决策的驱动作用,通常遵循着“数据—信息—决策”的发展路径,这意味着决策者要从数据中提取出有效的信息。但实践中,数字化信息是由各种文字、图片、视频、音频等非结构化、半结构化与结构化数据组成的,“大数据的异质性、规模性、及时性、复杂性,以及隐私问题,都阻碍了数据价值的获取。”[20]从这个角度来看,大数据在给决策者带来有效信息的同时,也带来了 “数据建模的挑战、数据管理的挑战、数据服务/工具的挑战”[21],造成了包括数据背景信息的差异性、数据的不确定性、数据的质量、不同格式的数据之间的转换、数据的清洗、数据的可视化等一系列问题。所以,拥有数据获取、数据挖掘能力对决策者来说至关重要。“政府在多个领域的规划与决策质量,依赖于对精确、客观数据的收集、分析与解释,从而能够更好地发现事态趋势与优化决策过程。如果政府具有收集与分析数据的强大能力,那么其决策将具有更高的精确度。”[22]另外,从理论上讲,由于大数据所指的是全局数据,所以大数据对国家治理很高的运用价值;但实践中可以发现,无论是网络自动生成的数据,还是人为收集的数据,在本质上都是局部数据,当把局部数据作为整体数据进行分析时,则存在以偏概全和结果偏误的风险。
从数据属性与道德限度看,大数据本质上是对私人信息的汇总,它首先将海量的私人信息汇聚成体量庞大的资源数据库,再通过对资源数据库中的相关数据进行挖掘和分析以攫取有价值的信息。这一过程可能侵犯了公民的隐私权,对公民的人身安全和财产安全也会产生威胁。虽然在大多时候,大数据技术可以实现公共服务的高效化、公共决策的科学化和社会治理的精细化,但这些都是在一定的道德规范约束的基础上实现的。以互联网零售为例,互联网零售平台可以通过对用户关于商品的购买次数、选择类型、浏览史、收藏记录等相关信息进行分析来推测顾客的偏好和需求,从而精准地推送相关产品给相关用户。这一过程实际上是对消费者个人隐私的一种监控,本质上是对公民隐私权的一种侵犯。如果此类大数据信息收集的目的是为了改善用户的需求和体验效果,这是可以理解的;但如果是用于助力损害公民利益的非法行为,则后果是难以想象的。例如,有互联网公司通过利用大数据来分析用户对某一产品的使用次数和依赖性等指标,以达到对不同类型的用户实行价格差别化对待的目的,俗称“杀熟”;还有某些互联网企业通过对用户的地域分布、职业特征、年龄结构等信息进行大数据分析,使某种产品在价格相同的情况下对不同用户实施差异化服务。这些行为都是采用大数据背后可能隐藏的道德风险,给国家治理也提出了警示和挑战。
数据质量决定数据价值。“糟糕的数据质量可能会也可能不会阻碍分析工具获得业务洞察”[23],但一定会影响工作效率,增加数据“噪音”的处理成本。据此,需要在测度、提高和验证数据质量,以及整合组织数据方法等方面制定一套标准化的行为准则。然而,大数据战略的有效实施并不是一厢情愿的事情,它不仅需要良好的大数据思维和环境,更需要合理的政府机制和国家制度的有效配合。“开放和共享是大数据的本质特征,是大数据战略实施的基本要求”[24],数据质量的提高主要受以下制度因素的制约:一方面,由于受职责同构、条块分割、部门保护、部门利益等因素的影响,政务数据的开放和共享还任重道远;另一方面,由于不同的政府职能部门如民政、教育、公安、交通运输、人力社保、住保房管、医疗卫生等,都建立了各自的资源数据库,所以其信息分属不同的管理系统,实施不同的统计标准和统计口径,因此对这些资源数据库的开放与整合也将是一个复杂的系统工程。另外,压力型体制也给大数据战略的推行提出了重要挑战。“压力型体制”最早是由荣敬本等人在调查新密市管理体制状况的过程中提出来的,是一个具有高度整合性和推广性的概念,主要是指一级政治组织(县、乡)为了实现经济赶超,完成上级下达的各项指标而采取的数量化任务分解的管理方式和物质化的评价体系[25]。一项行政任务在科层管理模式下层层下压,导致基层官员的工作量和压力越来越大,再加上基层管理资源有限,基层公务员可能会通过关系疏通和数据造假来应对和缓解这种矛盾。如果基层工作中的数据存在虚假现象,就会使国家治理的大数据在源头上就出现了偏差,通过这些数据信息得出的结论和规律也有可能是虚假的,这就给国家治理埋下了巨大的风险。
大数据在本质上是一种价值中立的信息资源,但其需要依托于一定的信息技术、组织结构和社会环境才能发挥作用。大数据鸿沟的产生是由于信息技术上的限制、组织结构中的区隔和社会环境下的封闭导致的。大数据鸿沟的存在加剧了人群、部门、行业、地区、阶层等内部的分化和差距,这对国家治理的协同化形成了挑战。
第一,反对数据垄断,强化技术协同。数据垄断是造成数据鸿沟的重要原因。数据垄断主要是指各部门从自身利益出发,故意阻碍数据开放和共享的破坏性行为。数据垄断导致多种重要信息和决策资源集中在少数部门和个人手中,这些部门和个人利用大数据的资源优势做出有利于自身的决策和选择,扩大了同其他人群、部门和行业等之间的差距,造成竞争过程和结果的不公平。数据垄断的成因有三种,一是利益冲突。不同地区、人群和行业的利益占有情况直接影响其数据开放意愿和开放程度;二是技术限制。由于“数据的异质性、不一致性与不完备性,数据范围、数据时效性、隐私与数据所有权等问题”[26],导致现有的技术无法有效地实现大数据的整合和协同;三是数据安全。大数据的隐私和单位机密的保护往往可以上升到道德和国家安全层面,这是各部门拒绝信息开放与共享的重要借口。另外,由于大数据技术在不同部门、行业和地区有不同的运用标准和制度,这也为不同部门、人群和行业实行数据垄断提供了重要托词,进而加剧了数据垄断。由此可见,现有的大数据垄断主要指向技术上的限制和阻滞,因而技术协同是未来破解数据垄断的重要指向。
第二,克服数据壁垒,强化部门协同。数据碎片化问题在中国比较明显,各级地方政府以及政府各个部门之间的信息沟通不畅、共享度不高,各为己谋、相互封闭的现象比较突出。大数据功能发挥的重要前提是实现全局数据的整合,而由组织结构分割所带来的数据壁垒则阻碍了全局数据的形成,影响了大数据功能的发挥。具体而言,数据壁垒主要体现在以下三个方面。一是数据生产区隔。各个部门按照自身标准进行数据生产和统计,造成数据之间的转化和整合困难。二是数据流通阻滞。由各部门的数据之间的对话较少,数据仅限于部门内部使用和调取。三是数据封闭使用。数据使用的范围仅限于本部门,大大降低了数据的运用价值。大数据强调是全局数据,而现有的数据壁垒将原本具有整体性的大数据资源分割成零碎的、小块的、分散的数据资源,阻碍了大数据价值功能的实现。当下,大数据开放和共享中存在的技术短板、部门利益、安全陷阱、问责压力与产权纠结等主要障碍和壁垒,增大了行政成本、制度成本和协调成本[27]。数据壁垒的风险来源于组织结构的碎片化,同样风险的化解也依赖于组织结构的协同和整合。
第三,拆解数据围墙,强化社会协同。社会治理是国家治理一部分,社会治理所涵盖的治理主体十分广泛,既包括政府部门和企业组织,还包括群团组织和社会个体,因而统一社会治理主体之间的行动的也是十分困难。大数据强调“全数据”的形成,而分散于社会治理主体之间的信息资源很难自动形成整合性的全局信息,更多的是以“孤岛”“飞地”“条块”等形式存在。数据围墙主要表现为以下几种形式:一是政务数据围墙。由政府系统生产和管理的数据不仅数量庞大,而且涉及国家的重点生产领域。政务数据主要在政府内部进行传输和加工,存在数据分割和信息壁垒等问题。二是企业数据围墙。随着经济和社会的飞速发展,大型企业不仅拥有搜集大数据的平台设施,而且掌握着国民经济和社会生活的重要数据,由于这些大数据具有较强的商业特色,因而具有排他性、竞争性和封闭性。三是群团数据围墙。随着社会组织、志愿组织和咨询智囊等的兴起和繁荣,这些群团组织掌握着大量重要的社会信息和数据。由于群团组织的分散性和特殊性,其生产和拥有的数据间也会呈现隔离状态。四是私人数据围墙。某些个人出于特定的目的,主动收集某类数据或者排斥数据供给,形成某种相对封闭的状态。总之,社会治理中的数据围墙是大数据运用的重要障碍,需要通过社会协同化治理来予以化解。
伴随着大数据技术的嵌入性发展,其与国家治理之间的多维耦合与深度互构深刻地改变着传统的国家治理结构、治理机制与治理方式,全方位地形塑着国家治理的未来图景。在大数据的强力驱动下,国家治理结构将实现治理主体协同化、治理层级扁平化、治理空间透明化,国家治理的关键领域也会呈现政府决策科学化、社会治理精准化、公共服务高效化的实践景况。但是,这些技术红利并不意味着我们可以对大数据的治理功效予以全面肯定,从而不假思索地任其自由发展。
事实上,作为一种信息技术,大数据技术会在利益的裹挟下变得不再价值中立,技术红利本应带来的公共利益也可能会大打折扣,甚至荡然无存;数据垄断、技术霸权、隐私侵犯、数据鸿沟等治理隐患也倍值关注。未来,技术精进的脚步并不会止步,大数据与国家治理的相互影响将愈发深入。在这种情境下,需要我们慎思的,并非是如何利用大数据的技术红利,而是如何在发挥其治理功效的同时消弭潜在忧患,如何在治理协同化的同时打破数据区隔,如何在治理扁平化的同时强化组织领导,如何在治理透明化的同时确保信息安全,如何在决策科学化的同时体现人文关怀,如何在治理精细化的同时避免隐私侵犯,如何在服务高效化的同时克服碎片供给,等等。这些都是大数据驱动国家治理现代化进程中无法回避的核心议题,也是今后学术研究的重要切入点。