徐圣龙
早在2011年,麦肯锡公司在《大数据:下一个创新、竞争与生产力的前沿》报告中就指出,“数据已经无所不在,存在于社会生活的各个领域、每一个经济体、每一个组织以及每一个数字技术的使用者之中”,并且,“对于世界经济而言,数据可以创造非常重要的价值,包括提高企业和公有部门的生产力和竞争力,为消费者创造大量的经济价值”[注]McKinsey Global Institute,“Big Data:The Next Frontier for Innovation,Competition and Productivity”,June,2011,pp.1-2.。到2016年,麦肯锡公司再次重申并强调了这一观点,即大数据对于社会生活,特别是经济生活将带来革命性的转变,其指出,“五年后,我们仍然坚信这一观点,即大数据的潜力远没有‘夸大其词’。事实上,我们认为,2011年有关大数据的报告只是揭示了冰山一角。今天,伴随着数据及其分析手段的巨大增长,有关数据的应用和机会发生着相应的改变”,“改变的步伐正在加速”,“这一系列变革的趋势正在开启‘工业解体’,并提出全新的组织挑战”[注]McKinsey Global Institute,“The Age of Analytics:Competing in a Data-driven World”,December 2016,p.21.。
在市场领域,大数据的应用已经较为普遍,从最初的“炒作周期”(Hype Cycle)开始进入“部署阶段”(Deployment Phase)。Matt Turck认为,“经过数年时间的发展,大数据开始从炫酷的新技术,发展到部署在生产中的核心企业系统”[注]Matt Turck,“Firing on All Cylinders:The 2017 Big Data Landscape”,April 5,2017,http://mattturck.com/bigdata2017/.,这意味着大数据实质上拥有了改变生产交往的能力,它正在按照自身的属性和特点重塑既有的生产流程和商业形式。在此基础上,麦肯锡公司断言,“引领趋势的前沿公司,正在利用其能力,以全新的思维方式解决业务问题。在某些情况下,他们引入了数据驱动(Data-Driven)的商业模式,这令整个行业感到意外”[注]McKinsey Global Institute,“The Age of Analytics:Competing in a Data-driven World”,December 2016,p.1.。在大数据深刻改变着生产交往和商业形式的同时,这种“数据驱动”的模式也必然会波及整个社会,它预示着一种潜在的、革命性的变化正在发生,即“数据驱动世界”(Data-Driven World)的到来。
作为政治领域主要构成的民主治理,无疑会受到大数据带来的“数据驱动世界”的冲击。这一冲击将在何种层面、以何种方式展开,这是一个非常值得研究的问题。一般而言,政治领域的应用要落后于市场实践,这是多方面原因造成的。不过,有一点可以肯定,即大数据对于政治领域的革命性影响,可能会“迟到”,但不会“缺席”。基于此,研究大数据对于民主交往潜在的、革命性变革,具有重要价值。因此,笔者将以政治领域的民主交往为对象,基于网络时代与大数据时代的区分,阐释大数据对于民主治理的革命性影响。
如何界定大数据对于民主交往的影响,需要明确两个前提:第一,大数据的本质属性是什么,这决定了在何种框架内探讨大数据与民主的关系问题。虽然这一问题并不直接指向“大数据民主”,但是,具有方法论的意义。第二,大数据区别于工业社会以及互联网的最大特点是什么,这决定了如何具体展开“大数据民主”的特殊性。这一问题直指“大数据民主”如何区别于既有的民主范式,打破有关民主实践的常规性认知,特别是工业社会民主交往及其补充形式——网络民主的局限。
其实,这涉及到区分网络时代与大数据时代的必要性。固然,理解大数据对于社会变迁的影响,从大数据的属性和特点出发即可,但是,因为在非生产领域,对于大数据革命性变革的认识还存在模糊地带,尤其是不少对于大数据条件下民主治理的研究,仍然延续了网络民主的范式,所以,既要从大数据的属性和特点出发,阐释大数据对于民主治理的改变,更要从大数据时代与网络时代的区分出发,说明大数据的不同之处以及它对民主治理的革命性影响。
如何理解大数据对于政治交往的影响,特别是对于民主治理的改变,目前还没有较为共识性的看法。在商业领域,对于大数据的革命性认知已经较为普遍,比如“工业解体”、“组织再造”、“数据驱动”、“智慧社会”、“信息社会”等概念,都承认大数据将带来不同于工业时代的社会变迁,它不是简单地将工业社会的“产品”通过互联网加以扩散和传播,它是要再造一个全新的社会形态。在这一新的社会形态中,大数据具备自身的物质基础(即生产力),重塑原有的生产流程和商业形式(即竞争力),并波及社会各个领域,包括政治领域。这是理解大数据时代的一个前提性认知。在此基础上,笔者认为,可以将大数据界定为一种物质能力。作为物质能力的大数据,它的革命性影响将在两个层面展开:第一,生产层面,大数据会“以一种前所未有的方式,通过对海量数据进行分析,获得有巨大价值的产品和服务,或深刻的洞见”,即大数据可以创造价值;第二,交往层面,“大数据是人们获得新的认知、创造新的价值的源泉;大数据还是改变市场、组织机构,以及政府与公民关系的方法”,即人与人之间的关系会因为大数据而发生改变[注][英] 维克多·迈尔-舍恩伯格等:《大数据时代:生活、工作与思维的大变革》,盛杨燕等译,浙江人民出版社2012年版,第4、9页。。
大数据对于人类社会生活的改变,本质上预示着一场有关生产及交往方式的革命性变迁。正如戴维·博利尔(David Bollier)指出的,“社会的各个系统紧密相连,随着全新的软件工具和技术被发明出来,并用于数据分析,以获得有价值的预测和判断,一种全新的‘知识的基础设施’正在成为现实”[注]David Bollier,The Promise and Peril of Big Data,Washington,DC:The Aspen Institute,2010,p.1.。这里,“知识的基础设施”(Knowledge Infrastructure)正是马克思意义上的物质生产能力。马克思曾明确指出,“在人们的生产力发展的一定状况下,就会有一定的交换[commerce]和消费形式。在生产、交换和消费发展的一定阶段上,就会有相应的社会制度形式、相应的家庭、等级或阶级组织,一句话,就会有相应的市民社会”[注]《马克思恩格斯文集》第10卷,人民出版社2009年版,第42-43页。,因此,大数据作为一种生产能力,它的出现必然要求与之相适应的“交换和消费形式”。换言之,在既有的生产和交往形式下,新出现的大数据,必然会改变原来的“生产、交往和消费”等社会生活各个方面的内容。正如马克思所描述的,“人们在他们的交往[commerce]方式不再适合于既得的生产力时,就不得不改变他们继承下来的一切社会形式”[注]《马克思恩格斯文集》第10卷,人民出版社2009年版,第43-44页。,大数据正是这一带来社会交往变迁的物质生产能力。
将大数据定义为一种“知识的基础设施”,作为一种物质的生产能力,构成了研究大数据及社会交往变迁的逻辑起点。固然,这个论断可能还存在一定的争论,但是,又有充分的证据表明,大数据正在带来人类社会的整体性变迁。既然作为一种物质的生产能力,大数据也会要求与之相适应的社会交往形式,其中,包含政治的交往方式,特别是民主治理的内容。可是,在现有有关大数据条件下民主治理的研究中,多是从网络民主的视角出发,忽略大数据的物质生产属性,这很容易造成停留在网络民主的范式之中思考大数据对于民主治理的影响。事实上,大数据带来的政治交往变迁潜力,已经远远超出了网络民主的范畴,这一切的起点正是在于大数据作为“知识的基础设施”,将改变整个人类的社会生活。
笔者将大数据时代的民主交往定义为“大数据民主”。按照马克思的理论,生产改变交往,交往包括形式和内容。大数据对于民主交往的改变,涵盖民主形式和民主内容两方面,形式方面受大数据的技术特性影响,内容方面受大数据的物质属性影响,这直接带来民主内涵和外延的变迁,预示着全新民主实践范式(包括民主概念、民主构成要素、民主结构、民主功能等)的生长[注]笔者认为,大数据提供了全新的民主实践范式,它在民主参与、民主结果等方面,解决了前大数据时代在民主实践上的诸多困境,提供了全新的民主实践可能。参见徐圣龙《大数据与民主实践的新范式》,《探索》2018年第1期。。目前,“大数据民主”这一概念并不是约定成俗的用法,还存在诸多争议和模糊之处,因此需要在以下几个方面作出规定:第一,“大数据民主”用于指称政治生活中大数据的应用所带来的民主实践变迁,并不是指大数据自身发展是否需要民主化的问题;第二,“大数据民主”特指大数据作为一种物质生产能力,其对于政治领域民主交往的影响所产生的全新民主实践范式;第三,“大数据民主”并不是类似于既有的网络民主、电子民主等民主形式,它需要置于生产与交往的逻辑关系中加以考察;第四,“大数据民主”只是描述大数据时代民主实践变迁的初步概念,并不是绝对准确或不容置疑的概念界定,不过,大数据要求既有民主实践的适应性转变却是发展趋势,并将在未来成为客观事实。
一般而言,民主的研究路径可以区分为定性和定量两大类。定性的民主方法主要是将民主的理想范式加以规定,并将现实政治生活中的民主实践通过理想范式加以评价,以提出民主改进的方法。后来,随着行为主义政治学的兴起,民主的规范研究方法开始“退潮”,民主的量化研究开始流行开来,即民主科学,特别是围绕民主选举的测量研究。但是,在前大数据时代,民主科学的研究方法并不属于自然科学的范畴,相反,其只能纳入社会科学领域,而社会科学领域又被称之为“准科学”。其中原因有两个方面的内容:第一,有关民主交往过程的全部数据,无法有效收集、存储;第二,即使存在民主交往实践的相关数据,也缺乏挖掘民主海量数据的能力,以实现民主交往的“科学化”。正因为如此,工业社会民主实践的科学多数时候都是“样本科学”,即通过样本研究,“映射”整体情况,从而描述民主实践活动。
“大数据民主”的研究路径主要建立在大数据的技术特性基础之上,它将彻底扭转现有民主科学方法的局限性,同时也会影响到民主的规范研究方法。正如邓肯·沃茨(Duncan J.Watts)所指出的,之前,“有关社会网络的数据只是围绕一些小群体的一次性的粗略数据”,“很多研究都是基于参与者的自我描述,这其中有着大量的主观偏见、观点错误和模糊论述”,相反,基于互联网的沟通和交互的社会网络研究改变了这一局限,“一方面,我们可以实时观察数以百万计的个体基于真实影响的行为选择,另一方面,计算机技术也可以使我们模仿和处理海量的社会网络中的个体行为”,因此,“社会网络科学”出现了[注]Duncan J.Watts,“A Twenty-first Century Science”,Nature,Vol.445,February 1,2007,p.489.。作为其中的民主网络,它同样因为海量数据的收集、存储、管理和分析的应用,实现了民主的科学研究方法。在大数据的背景下,民主的科学研究将不再依赖于“民主样本”,因为,“样本即总体”,大数据对于民主科学方法的改变正是在于“不用随机分析法这样的捷径,而采用所有数据的方法”[注][美] 维克多·迈尔-舍恩伯格等:《大数据时代:生活、工作与思维的大变革》,盛杨燕等译,浙江人民出版社2013年版,第39页。,前提也在于民主交往相关数据的收集和挖掘正成为可能。
另外,“大数据民主”也会影响传统的规范研究方法。在规范研究方法中,通过“理想类型”的标准衡量民主交往实践,其中,因果关系的探究是主要方面。但是,大数据将会改变民主方法中的因果逻辑。基于民主交往的全数据和数据挖掘,可以充分释放民主事实,即相关关系,而不是基于民主概念的逻辑演绎过程。因为,基于假设的因果逻辑,一方面,其被证实的难度和成本都非常大,很难获得确证性结论;另一方面,即使是“缓慢的、有条不紊的因果关系”[注][美] 维克多·迈尔-舍恩伯格等:《大数据时代:生活、工作与思维的大变革》,盛杨燕等译,浙江人民出版社2013年版,第84页。,也存在僵化和教条的可能,这反而会阻碍民主实践的发展。与之相对,“相关关系分析法更准确、更快,而且不易受偏见的影响”,并且,“通过去探求‘是什么’,而不是‘为什么’,相关关系帮助我们更好地理解了这个世界”[注][美] 维克多·迈尔-舍恩伯格等:《大数据时代:生活、工作与思维的大变革》,盛杨燕等译,浙江人民出版社2013年版,第75、83页。。“大数据民主”对于民主方法的改变是全面的、彻底的,不管是民主科学研究方法还是民主规范研究方法,都会受到大数据技术的影响,发生实质性转换,提供全新的民主内容,这又构成民主议程得以再造的方法论基础。
但是,在现有有关“大数据民主”的研究中,多是沿用了网络民主的范式,没有从大数据的生产属性、特别是它的技术特性出发,展开民主治理的相关研究。这里存在两类研究误区:第一,将“大数据民主”等同于网络民主或电子民主。比如,在《“互联网+”政治:大数据时代的国家治理》一书中,作者认为,“电子民主是新技术平台下民主发展的一种新载体。它实质上就是公民切实、全面参与民主运作程序的一种民主形式。故公民的切实和全面的参与是电子民主区别于以往其他民主形式的最典型的特征”[注]高奇琦等:《“互联网+”政治:大数据时代的国家治理》,上海人民出版社2017年版,第167页。。这里,作者将大数据时代的民主治理等同于“电子民主”。第二,将“大数据民主”认定为丰富和拓展了现有的网络民主和电子民主,比如,有学者认为,“互联网的勃兴和大数据时代的到来,使得人人拥有麦克风,人人都可以通过网络终端查阅、转发、评论公共事件和公众人物。公众的生活在赛博空间(Cyberspace)和现实时空中穿梭,关注政治和政治参与的热情日趋高涨,自然而然地也就推进了民主政治”,并且,“大数据时代的网络‘大民主’依托网络平台天生具有开放性、平等性、互动性”,其表现形式“与‘文化大革命’时期‘大鸣大放大字报大辩论’式的‘大民主’有着惊人的相似性,只不过政治营销的媒体从纸媒体变成了富媒体”[注]陈潭等:《大数据时代的国家治理》,中国社会科学出版社2015年版,第250-251页。。这里,作者虽然将大数据时代背景下的民主实践界定为“大民主”,不过,“大民主”与之前的网络民主、电子民主并无实质性差异,只是在开放性、平等性、互动性等方面获得了进一步的扩大和增强。
笔者认为,理解“大数据民主”,首要在于明确大数据的根本属性,即物质生产能力。在此基础上,基于生产与交往的关系,从大数据的技术特性出发,包括对于海量参与的吸纳、对于非结构化参与的有效处理、对于相关关系即事实性关系的发掘等,才能充分理解大数据对于民主治理的革命性影响。否则,又会落入网络民主的研究范式,只是将“大数据民主”理解为丰富和拓展了工业社会民主交往的形式,忽略大数据在生产领域已经产生的具有革命性和颠覆性的物质能力。
网络的出现无疑冲击着原有的工业社会,正如阿尔文·托夫勒所描述的,“一个新的文明正在我们生活中出现”,“它的深刻意义,就像一万年前发明农业的第一次浪潮对人类解放的变革,或者如同工业革命引起的第二次浪潮所带来的震撼世界翻天覆地的变化”[注][美] 阿尔文·托夫勒:《第三次浪潮》,朱志焱等译,新华出版社1996年版,第3页。。确实,网络的出现影响了工业社会的生产及交往方式,怎么夸大其革命性意义都不为过。只是,这种改变并不是一蹴而就的,即使以最乐观的估计,也要几十年才能完成。正因为如此,一方面,网络的出现正在以“点滴式”改变着社会交往,包括政治交往;另一方面,在真正完成这一革命性转换之前,它仍然需要依附于既有工业社会的生产和交往形式。托夫勒将这一转型中的历史阶段界定为“革命性的前提”,笔者认为,这是对过渡时期的最好注脚,在这一阶段,“我们是旧工业文明的最后一代,又是未来新文明中的一员”,“我们许多个人的烦恼,痛苦和转向,都能从第二次浪潮与第三次浪潮之间的巨大冲突,在我们个人和政治制度中所引起的矛盾里找到根源”[注][美] 阿尔文·托夫勒:《第三次浪潮》,朱志焱等译,新华出版社1996年版,第5、7页。。网络对于民主交往的影响,也正是建立在这一逻辑前提之上。
网络催生民主交往的改变,但是,这一改变是以既有的民主交往为依据的。换言之,网络所带来的民主新内容、新形式,是运转于工业社会民主实践之中的,而不是脱离现实语境,演绎出全新的民主实践形态。这是理解网络与民主关系的基本出发点。在此之外,网络民主的发展也在推动着全新民主实践形态的形成,这一生长过程伴随着物质生产能力的革新以及经济政治结构的迭代。这时,全新的民主交往将因为生产交往的改变而成为事实,网络民主正是构成其前期准备和孕育过程。
网络对于民主交往的改变,比较早的论述如马克·波斯特(Mark Poster)认为,“如果民主意味着个体权利的具体表达和对公职人员的决定权利,那么,在网络空间和数字身份的影响下,现在就需要一个全新的概念来描述领导者与追随者之间的关系”,其中,政治过程受到电子网络的影响,“产生了全新的去中心化的对话方式,创造了人机结合的全新形式,全新的个体和集体的‘声音’、‘身影’、‘交互’,已经成为政治组成和政治集团的全新构成”[注]Mark Poster,“Cyber Democracy:The Internet and the Public Sphere”,1995,http://se.unisa.edu.au/vc~essays.html.。政治过程中的民主交往因为网络的介入,正在变得和之前大不相同,甚至需要被重新定义。不过,新出现的一系列因素包括内容和形式,还远不足以改变现实政治中的民主实践过程,换言之,网络的出现只是丰富和拓展了既有民主实践的载体和形式,工业结构下的民主生活也仅仅是迎来了存量调整和增量改变。正如有学者指出的,“网络民主不是独立的民主形态,而是媒介与民主新的结合形态,它的突出特性就是为参与者提供了一个‘对话的广场’和‘互动空间’,重现了‘广场政治’的某些要素,丰富和拓展了民主的内涵”[注]郭小安:《网络民主的概念界定及辨析》,《天津行政学院学报》2009年第3期。。
正因为如此,不少学者提出了对网络民主的警惕和防范,主要原因也在于:作为过渡形态的民主交往,网络民主并不能独立为一种完整的民主实践范式,相反,它需要依附于工业结构下的民主实践,这在带来一系列全新要素的同时,也有可能打破工业社会民主交往的“脆弱”平衡,即网络民主宣称的价值目标、程序规则、善意结果并不一定能够实现,甚至可能造成完全相反的结果。比如,有学者明确指出,“网络技术政治功能的另一个方面,即它的专制主义特性”,与之对应,即会产生依托网络技术的帝国主义,“网络技术帝国主义可以表述为:掌握网络核心技术和强大网络资源的国家,通过网络技术传播其政治文化,影响甚至左右若干国家的政治文化,进而实现特定政治目的的网络技术政治垄断”[注]娄成武、张雷:《质疑网络民主的现实性》,《政治学研究》2003年第3期。。确实,这种担心是合理的,一方面,网络民主在民主实践特别是民主载体方面,创新较多,这无疑宣示工业社会民主交往更新的必要性;另一方面,网络民主依附于既有民主实践,更不能取代工业社会的民主交往,那么,过分夸大网络民主的实效,甚至用网络民主取代既有民主实践,这都可能带来相反的结果,即“‘网络民主’的发展很可能超出了现实社会所具有的监控能力,导致政治秩序的紊乱,使民主走向反面”[注]曹泳鑫、曹峰旗:《西方网络民主思潮:产生动因及其现实性质疑》,《政治学研究》2008年第2期。。
其实,对网络民主的批评和质疑,根本还是在于网络民主并不能独立为一种民主实践范式,是属于新兴民主实践兴起过程中的过渡形态,是依附于工业社会民主交往的重要补充和创新形式。明确了这一点,则可以较为客观地评价网络与民主实践的关系。事实是,网络的出现催生了既有民主实践的改变,特别是在民主形式和民主载体方面,很多原有的民主实践方式都实现了互联网化,而一些新兴的互联网民主形式也方兴未艾,这无疑是网络改变民主实践的重要表现。网络对于民主实践的改变,主要表现在三个方面:“一是现有民主的信息化,即利用网络信息技术巩固和加强民主,如电子选举、电子投票等;二是对现有民主的重塑和拓展,如网络加强了直接民主的成分,重塑传统的代议民主形式;三是网络引发的新的民主形式,如网络公共空间的协商对话、电子议政厅、电子广场、在线民主等”[注]郭小安:《网络民主的概念界定及辨析》,《天津行政学院学报》2009年第3期。,这三个方面的改变大大拓展了民主实践的载体。
总体而言,“网络作为一种技术媒介,它可以改变民主的作用形式”,并且,“技术对于民主的影响往往局限于治理方式的更新和改变”,“网络技术可以从治理方式上改变民主的面貌,但不可能从国家形式上颠覆代议民主制度,网络民主与代议民主不是非此即彼的关系,而是可以相互作用,共同补充”[注]郭小安:《网络民主——媒介与民主关系的新形式》,《四川行政学院学报》2009年第1期。。这一有关网络民主的共识性认知,至少可以得出两方面的结论:第一,网络的产生并没有颠覆工业社会的民主交往实践,甚至在某种程度上,网络仍然依附于工业社会的生产关系和交往形式,这一点上,它与大数据的生产属性存在本质差别,网络民主包含于工业社会的生产与交往关系之中。第二,网络确实带来了某些新的要素,这些要素影响到工业社会的民主交往,特别是在形式和载体多样化方面。但是,既有民主实践仍然支配着网络民主的运转过程,网络所具备的技术特性还不足以重塑工业社会的民主交往,这一点与大数据的技术特性存在根本差异,特别是在海量参与和非结构化参与方面。因此,可以得出结论,作为拓展和丰富工业社会民主交往形式和载体的网络民主,仍然包含于工业社会民主实践过程之中。
网络对于民主交往的影响,虽然附着于工业社会的民主实践过程,但是,改变也是真实发生的,并且,这种改变预示着全新民主实践范式的孕育。笔者认为,一方面,需要承认网络民主所存在的不足,即网络民主不足以取代现实政治中的民主机制;另一方面,也是更为重要的,即网络确实更新和拓展了民主实践的载体、形式、方式等,这种改变正在重塑现实民主交往过程。网络对于民主交往革命性转变的未来意义,主要有两个层面的内容:
第一,网络不断实现民主观念表达、民主选择偏好、民主政治行为等民主交往的各个组成要素的电子化、数字化,这为大数据改变民主交往提供了不竭的“原料”。根据麦肯锡公司的最初定义,大数据就是指“数据规模超出了典型意义上数据库软件工具所能捕捉、存储、管理和分析的范围”[注]McKinsey Global Institute,“Big Data:The Next Frontier for Innovation,Competition and Productivity”,June 2011,p.1.。这一海量数据不仅存在于商业领域,在政治领域同样如此。那么,作为一种物质生产能力的大数据,其并不局限于保有海量数据,这还只是第一步。“毕竟容量只是表象,价值才是本质”,“大数据的真正意义还在于大价值”,即“大数据是指人类有前所未有的能力来使用海量的数据,在其中发现新知识、创造新价值,从而为社会带来‘大知识’、‘大科技’、‘大利润’和‘大智能’等发展机遇”[注]涂子沛:《数据之巅:大数据革命,历史、现实与未来》,中信出版社2014年版,第258-259页。,这才是大数据生产能力的存在依据。大数据对于政治交往的影响是不可避免的,在海量数据的支撑下,必然要求相应的“数据治国”,即“要凭借对数据的有效收集、处理和分析来治理国家,决定国家的大政方针和具体政策”[注]涂子沛:《大数据》,广西师范大学出版社2015年版,新版自序,第Ⅶ页。。作为国家治理重要组成的民主交往,也需要建立在对数据的“整合、分析和开放”基础之上,这一系列的工作在网络条件下都得到了充分的发展。网络为“大数据民主”发展提供了充分而必要的民主交往的数据准备。
第二,网络民主为“大数据民主”的数据“整合、分析和开放”提供了前期训练,它尝试实现不同于工业社会民主交往的全新内容,特别是在普遍参与和非结构化参与两个方面。因此,多数学者认为,随着网络的出现,它可以更加充分和有效地实现民主内涵,“真正的政治参与要求公民们致力于和其他公民的直接讨论。因特网的政治影响,于是经常借助协商民主人士所提供的透镜而被观察。人们希望因特网将会扩展公共空间,既扩大所讨论的意见范围,也扩大能参与讨论的公民人数”,最后,“聚焦于政治平等——且特别聚焦于使形式上的政治平等在实践中变得有意义”[注][美] 马修·辛德曼:《数字民主的迷思》,唐杰译,中国政法大学出版社2016年版,第10页。。不过,这种形式上的政治平等及其实践意义,在网络条件下很难充分实现。换言之,离开了大数据的生产属性和技术支持,政治交往领域的民主实践还很难脱离工业社会民主交往的范畴。比如,民主参与的充分性如何有效保证,即使拥有了互联网的支持,普遍的、海量的政治参与也是不可想象的,多数学者也表达了相应的担心;民主公意的有效性如何实现,特别是民主内涵的充分释放,以及非结构化参与达至公共意志的过程,单纯的网络民主并不能解决这一系列的问题,不管是在生产与交往的关系之中,还是单纯地从技术特性出发。当然,网络民主提出的这些有益尝试是值得肯定的,因为很快在“大数据民主”条件下,参与的广泛性和公意的有效性将因为大数据的生产属性和技术支持而获得实质性的进步。网络民主无论是从民主交往的数据准备,还是从民主实践的全新内容,都为“大数据民主”的生长提供了非常有利的条件。在这一点上,需要对网络民主持有更为开放的态度,肯定其积极、建设性意义,正视互联网、特别是紧随其后的大数据对于民主交往可能带来的革命性转变。
“大数据民主”区别于网络民主的根本之处在于,其来源于大数据这一物质生产能力的转换,是建立在全新的生产与交往基础之上,故而,其提供的也是全新的民主实践范式,围绕民主实践过程,需要重新进行定义。笔者认为,“大数据民主”作为全新的民主实践范式,区别于工业社会的民主实践,也超越了网络民主对于民主形式和载体的更新。换言之,“大数据民主”解决了工业社会民主实践的诸多问题和不足,使得民主参与的普遍性和民主公意的有效性发生实质性改变。基于此,民主实践的议程将发生适应性转变。这里,民主议程包括民主的发起,即民主参与阶段;民主参与数据的处理,即结构化、半结构化、非结构化参与阶段;民主决策结果和民主执行,即民主实质的实现阶段等三个方面的内容。与大数据的生产属性和技术特性相适应的民主议程再造,正是托夫勒所描述的“第三次浪潮”在民主交往领域将会发生的事情。这一民主过程会打破对于工业社会民主交往的常规性认知,显得“不可想象”,但是,却又是现实可能的。
在前大数据时代,民主交往的形式主要通过代议、代表的机制来完成。在经常反对民主的声音中,普遍的参与爆炸构成否定直接民主的一个重要理由。并且,因为技术条件的限制,即使允许普遍的直接参与民主,也无法有效处理普遍参与所带来的海量民主数据,这反而会造成民主运转的失效,带来不可避免的政治不稳定因素。因此,在世界范围内,工业社会的民主形式主要以代议制的方式来实践。甚至如马克思主义的民主观,在区分民主内容与民主形式的基础上,围绕民主形式,也并不一味强调普遍的、直接的参与民主。这是基于工业社会生产能力和交往关系的必然结果。但是,代议制民主也有其不可避免的局限性,“即使是在西方,对它的批评也没有间断过,认为它不能也不可能体现人民主权的实质,是一种初级的民主,是一种因直接民主一时不具备实现条件而采取的不得已的、凑合的权宜之计”[注]唐丽萍:《从代议制民主到参与式民主——网络民主能否重塑民主治理》,《兰州学刊》2007年第3期。。由此可见,代议制民主在民主的本质内涵上与民主的原初涵义存在落差,只是,在物质条件不具备和技术手段不充分的背景下,这种落差被默认为民主实践的现实。
互联网兴起之后,对于民主本质内涵(即人民主权)的呼声开始出现,并且认为,互联网将为人民的普遍参与提供关键的物质支撑和技术支持。这在网络民主的研究中已经成为一个常识性的观点,即“与代议民主制的间接、有限、精英的特性相比,以网络政治信息传播手段为其技术基础的网络民主制具有直接性、平等性、便捷性等特点”[注]唐丽萍:《网络民主能重塑民主治理吗?——对现代民主制三种形式的解读》,《学习与探索》2006年第3期。,这在很大程度上更为符合民主的原初内涵和人民主权的本质特征。但是,担心与忧虑也随影而行,特别是对于互联网中民主操控与民粹主义的担心,因此,各种有关“乌托邦”、“网络暴政”、“多数暴政”、“非理性”等批判声音开始出现。这一现象其实很好理解,即使是在现实的民主交往中,也很难避免这类问题,关键在于,网络民主参与是不平衡的、也是非常容易失控的。对于不平衡,它主要表现在多数沉默;对于失控,它主要表现在人为操控因素的存在。特别是民主参与的充分性方面,如何保证各种声音同时存在,互联网并不能很好地做到这一点。换言之,互联网之中的民主参与,结果都容易偏向“声响最大”的参与主体,它无法有效应对海量参与带来的不同声音的有效处理。
大数据不同于网络民主的地方,根本原因在于其来源于生产与交往的关系,直接原因则在于其提供了不同于互联网的技术手段,即对于海量参与的支持。在全新的民主交往活动中,公民的价值观念、选择偏好以及行为方式都将通过数字或符号的形式加以收集、存储、管理和分析,这时,民主议程将不再是简单的比例代表制、意见征集、样本映射、个别访谈等方式,也不再是片面地倒向“声响最大”的参与主体,而是通过对参与者民主交往全数据的处理,以完成普遍的、直接的民主参与过程。大数据条件下的海量参与将经历三个环节:第一,民主交往数据的范围界定。在这一环节,需要确认哪些数据属于“大数据民主”的范畴,特别是那些在工业社会民主交往中不被纳入民主议程的海量参与数据。因此,可以将大数据背景下民主交往数据从两个方面进行类型区分:一方面,分为结构化数据与半结构化、非结构化数据;另一方面,分为离线数据与实时数据流。第二,民主交往数据的收集和传输环节。这一环节主要通过大数据公共平台和各种大数据技术,收集和传输民主交往所产生的系列数据。比如,对于结构化、半结构化和非结构化民主交往数据,可以通过Sqoop、Flume等方式进行收集传输;对于民主交往的数据流,可以使用Kafka方式进行收集传输。第三,民主交往数据的存储环节。“大数据民主”首先允许海量参与,这意味着覆盖全体参与者的全部参与行为,乃至价值观念和选择偏好。并且,它并不会如网络民主那样,只是直观地展现“声响最大”的参与主体,而是对全部参与主体的民主数据进行存储。海量参与数据使得“大数据民主”根本区别于之前的民主议程,它是“大数据民主”得以可能的“原料”。海量参与数据,包括不同类型的海量数据,可以通过分布式文件系统进行存储、管理,比如HDFS和Tachyon,它们可以高效、廉价、可扩展地实现民主交往海量数据存储、管理。
在前大数据时代,民主数据的处理能力是非常贫乏的。这种民主数据处理能力的匮乏主要表现在两个方面:第一,民主海量参与数据处理能力的匮乏。工业社会民主交往主要通过代议制和代表制来完成,直接原因正是在于既有民主制度无法容纳海量民主参与。这不管是对于发达国家还是转型国家来说,都是同样适用的。这在亨廷顿研究后发国家的民主转型中,有过较为充分的论述。因此,流行的代议民主机制成为唯一可能的选择。互联网的兴起是民主数据处理能力改善的一个福音,但是,这种改善仍然是有限的。一直到谷歌“三大论文”[注]Sanjay Ghemawat,Howard Gobioff and Shun-Tak Leung,“The Google File System”;Jeffrey Dean and Sanjay Ghemawat,“MapReduce:Simplified Data Processing on Large Clusters”;Fay Chang,Jeffrey Dean,Sanjay Ghemawat,Wilson C.Hsieh,Deborah A.Wallach,Mike Burrows,Tushar Chandra,Andrew Fikes,Robert E.Gruber,“Bigtable:A Distributed Storage System for Structured Data”,Google,Inc..的出现,才在技术上有效解决了这一难题。谷歌“三大”论文提出的GFS、MapReduce、BigTable等概念,正是构成后续大数据分布式存储和处理系统的奠基石。第二,民主海量参与非结构化数据处理能力的匮乏。不管是在工业时代还是在互联网兴起之后,民主参与的代议制形式多数通过选举民主的方式来完成,究其原因,根本在于前大数据时代不具备充分的处理非结构化数据的能力。选举民主主要产生结构化的数据,它通过简单的“是/否”或者“A/B/C...”等完成民主选择,并将民主结果建立在这一简单的二元选择(非此即彼)之上,忽略了民主选择的充分内涵,特别是民主参与主体的意见表达和非二元选择诉求。网络民主在反映“声响最大”的参与主体方面,不过以另外一种形式重复了这种二元选择。大数据的技术优势在于,它不仅可以容纳海量的结构化数据的处理过程,同时也能有效应对海量的非结构化数据的处理,包括文字、图片、视频、动画等。这与民主参与主体充分的民主表达是联系在一起的,避免了民主内涵的化约倾向。
民主数据处理能力的强弱决定了民主实践新范式是否可以成立。工业时代民主交往的代议制形式保证了当时条件下民主数据的有效处理,互联网时代民主形式的多样化、特别是直接参与化倾向,获得了一定的发展,但是,民主数据处理能力还较为有限。大数据的兴起,不管是在民主数据量的层面还是质的层面,都提供了不同于前大数据时代的民主数据处理能力。笔者认为,相对于海量民主参与数据的处理,非结构化海量数据的处理能力真正实现了大数据条件下民主范式的转换,并充分实现民主的“人民主权”本质。因为,只有充分的民主表达,才能实现充分的民主内涵;而充分的民主表达,必然会产生简单数字之外的多样数据类型,即文本、图片、视频等。在民主数据处理阶段,它主要经历两个环节:第一,民主交往数据的处理环节。“大数据民主”所产生的海量数据,需要通过分布式文件处理系统进行快速、高效的分析,它是与海量数据存储相对应的环节。对于离线数据,包括结构化、半结构化和非结构化数据,可以通过MapReduce、Spark进行处理;对于民主交往的实时数据流,可以通过Storm进行处理。第二,民主交往数据的挖掘环节。数据挖掘环节主要针对相关关系展示民主事实,它与数据处理环节相联系。在数据处理环节,可以通过算法模型获得有关民主实践的一般性知识,但是,通过数据挖掘,可以更好地实现民主交往的公意内涵。现在,一般常用的数据挖掘语言如R、Python等都可以用于民主交往数据的挖掘过程,特别是对于非结构化民主交往数据的挖掘。
这里,笔者尝试以协商民主为例,较为直观地展示民主数据处理中非结构化数据的挖掘对于民主内涵充分实现的重要意义,它也构成民主新范式得以成立的重要依据,因为,它确实不同于常识中的民主实践过程。协商民主可以简单地理解为“一种治理形式,其中,平等、自由的公民在公共协商过程中,提出各种相关理由,说服他人,或者转换自身的偏好,在广泛考虑公共利益的基础上利用公开审议过程的理性指导协商,从而赋予立法和决策以政治合法性”[注]陈家刚:《协商民主引论》,《马克思主义与现实》2004年第3期。。这里的关键在于,每个参与协商民主的主体,他们所提供的意见、看法、观点,如何在多主体、特别是海量主体的参与中,最后实现民主决策。如果只是简单的商谈和讨论,最后进行票决,那么,它与选举民主并无实质性区别;如果它依赖某个个体最终作出决策,还是无法充分吸纳多主体的各类意见。当然,协商民主更加趋于民主的本质内涵,但是,民主本质内涵的实现过程却并不能自动实现。大数据所具有的非结构化民主数据的处理能力,提供了这一问题的解决办法。比如,以“A”主题的商谈为例,基于Python语言,大数据首先可以将全部参与主体的意见表达纳入数据处理过程(数据准备);其次,针对协商的主要表达形式——文本,大数据具备一系列的文本挖掘技术,可以从全部民主数据(文本)中提取有价值信息,比如,通过TF-IDF实现关键词的发掘、通过LDA模型实现文本主题提炼、通过情绪分析实现文本归类、通过词向量分析实现主题词之间的语义分析,等等。这一系列的文本挖掘,可以全面、客观地展现协商过程所有参与主体在“A”主题下的观点提炼、观点聚类、不同观点相关关系等,这对于充分商谈基础上的民主决策无疑是非常关键的。
前大数据时代的民主结果输出,主要由集中方式或多数表决的方式来完成。一般而言,民主结果的执行阶段,还包含反馈环节。究其原因,主要有两点:第一,前大数据时代,任何意义上的民主决策并不能真正、充分地实现全员参与,所以,其不可避免地存在集中和精英倾向,这要求不断修正民主决策,以更好地符合公共意志;第二,即使充分地实现精英决策与大众参与的有效结合,并不能保证民主决策结果的理性与正确,因此,需要通过反馈环节来实现民主结果的合理化。戴维·伊斯顿就指出,反馈环的意义在于,“当局生产输出,社会成员对于输出作出反应,这种反应的信息获得与当局的沟通,最后,当局作出下一步的可能行为”[注][美] 戴维·伊斯顿:《政治生活的系统分析》,王浦劬译,华夏出版社1998年版,第33页。。可见,前大数据时代的民主反馈,既可以弥合精英决策与大众参与之间的落差,也可以限制民主结果的不合理因素。
在“大数据民主”的决策与执行阶段,它不存在第一方面的问题,即不充分参与导致的民主落差。不管是海量参与还是非结构化参与,“大数据民主”提供了充分参与,并将充分参与的民主交往数据纳入处理过程,最后输出民主结果。问题的关键在于第二方面,即大数据条件下的民主交往是否会产生不合理的结果?答案是肯定的。但是,这不能简单等同于前大数据时代民主结果的非理性。因为,“大数据民主”提供了公共意志的凝练过程,但作为民主结果的公共意志是否合理,则是另一个层面的问题。至少在卢梭意义上的公意与众意(或马克思意义上民主内容与民主形式)的统一过程,在大数据条件下仍然存在漫长的探索过程。这里涉及到的就是大数据条件下民主交往的反馈环节,它主要指向民主数据处理的算法优化过程。
在民主结果输出与执行阶段,“大数据民主”包含两个环节的内容:第一,民主结果输出环节。在这一环节,通过民主参与海量数据的处理与挖掘,可以实现民主参与的充分性与民主公意的有效性相结合,输出民主结果或公共意志。民主结果的输出可以通过可视化的方式,直观展示出来,从而完成大数据条件下民主交往的一次过程。第二,经历过大数据支撑的民主参与、民主数据处理和民主结果输出,需要进入到具体的民主执行阶段。这是大数据条件下民主交往的二次过程。在民主执行环节,通过大数据对于民主实践相关数据的收集、存储、管理和分析,辨识民主决策与公共利益的吻合度。如果民主决策符合公众利益,那么,民主交往数据处理阶段的算法模型就是合理的,如果二者相悖,则有必要根据民主实践情况来优化算法模型。算法其实就是“任何良定义的计算过程,该过程取某个值或值的集合作为输入并产生某个值或值的集合作为输出”[注][美] Thomas H.Cormen,Charles E.Leiserson,Ronald L.Rivest and Clifford Stein:《算法导论》,殷建平等译,机械工业出版社2013年版,第3页。。在大数据时代,“计算型社会”的兴起成为必然,“关于人和社会本身的数据现在已经极为丰富,而且这类数据还在快速增长,未来一切的社会现象、社会过程和社会问题,都可以而且应该通过以计算为特点的定量方法分析解决,这样更加精确、更加科学”[注]涂子沛:《数据之巅:大数据革命,历史、现实与未来》,中信出版社2014年版,第270-275页。。这说明,根源于生产与交往关系的大数据,将不可避免地产生社会计算。这种社会计算应用于民主交往领域,就要求尽可能地实现民主结果与公共意志的一致性,一致性的完成有赖于民主交往数据处理阶段的算法模型根据民主实践数据的反馈作出优化。在优化民主算法模型的过程中,“大数据民主”不断趋于民主本质,即建立在充分参与基础上的公共意志的实现。
通过比较网络民主与“大数据民主”,可以更好地发掘大数据对于工业社会民主交往的革命性意义。这种意义主要包含两个方面的内容:第一,大数据的物质能力。从生产与交往的关系中理解大数据,更为符合大数据的根本特质。它不仅表现在生产领域的巨大价值创造,也表现在对交往形式的革命性再造,比如“工业解体”、“组织再造”、“智慧社会”等。在国外,有学者将其定义为“知识的基础设施”,这同马克思所描述的物质能力是一致的。因此,理解大数据的生产属性,是理解大数据影响人类社会生活包括民主生活的逻辑起点。比如,维克多·迈尔-舍恩伯格就指出,“现在大多数人都认为大数据是一个技术问题,应侧重于硬件或软件,而我们认为应当更多地考虑当大数据说话时会发生什么”[注][美] 维克多·迈尔-舍恩伯格等:《大数据时代:生活、工作与思维的大变革》,盛杨燕等译,浙江人民出版社2013年版,第240页。,只有如此,才能理解大数据的颠覆性意义。第二,大数据的技术特性。大数据首先是一种物质能力,其次是一种技术手段。这种技术手段区别于工业时代及紧随其后的互联网,它聚焦于海量数据,特别是擅长于非结构化数据的处理,这对于民主交往的普遍参与是非常重要的。大数据可以有效实现从大众参与到公共意志的民主过程,在民主的不同环节区别于工业社会的代议制民主以及网络民主。这种区分是颠覆性的,它会打破人们有关民主议程的常规认识,转而从大数据的技术特性出发,再造全新的民主流程。
从区别于工业时代的代议民主及其补充形式网络民主,到大数据带来民主治理范式的转换,再到大数据民主实践范式在日常政治生活中得到支持,还有很长的一段发展过程。目前,在大数据如何影响民主治理问题上,已经取得了一些共识,比如,大数据技术应用于民主实践可能会带来改变、大数据与国家治理的结合等。但是,这明显是不够的。“大数据民主”会在何种意义上“颠覆”工业社会的民主交往(包括区别),其生成的民主治理新范式是什么?这都需要以大数据的双重属性(即物质属性与技术特性)为逻辑起点,全面、系统展开“大数据民主”的构成要素。
当然,在肯定“大数据民主”积极、正向意义的同时,还需要认识到目前条件下“大数据民主”发展所存在的诸多障碍。这类限制性条件分为两类:第一类是在工业与信息社会交汇期,大数据发展还不充分,比如有关民主治理的观念、偏好、行为还不能以数字或符号的形式加以收集、存储、管理、分析和应用,这无疑会影响“大数据民主”对于民主治理的积极作用;第二类是“大数据民主”的发展不可避免地存在各种负面效应,比如数据公共性、数据公益性、数据权、数据隐私等方面的问题,这无疑会影响到“大数据民主”对于民主治理的建设性作用。因此,以积极、建设性的态度对待大数据对于民主交往的影响,将“大数据民主”纳入国家治理体系和治理能力现代化建设之中,这是必要的;同时,处理好既有民主交往与大数据条件下民主交往之间的关系,承认既有民主范式与“大数据民主”范式的积极方面和消极方面,发挥合力,这无疑是推动民主治理实践的关键议题。