◎胡 键 (上海社会科学院,上海200020)
大数据与公共管理变革
◎胡 键 (上海社会科学院,上海200020)
大数据具有数量大、数据多样化、价值密度低、速度快的特征,通过技术提供独特的也是全新的思维奠定了我们的学习创新(深度学习)、科技创新和管理创新。大数据科学与管理科学的结合从而产生大数据的管理,大数据独特的收集功能、储存功能、分析功能、价值挖掘功能和预测功能,促使公共管理从封闭性的管理结构转向开放性的管理结构;从官僚科层制转向扁平化结构;从公共管理与政治管理边界模糊的结构转向公共管理与政治管理边界清晰的结构;从专注于对人的管理转变为对数据的管理并借助于大数据来为人服务的模式;从被动应对性的公共决策转向基于大数据之上的主动性的优化决策。当然,这些变革也就意味着风险,其中包括导致公共管理中的不确定性风险和不可靠性风险。
大数据;公共管理;大数据功能;公共管理变革
公共管理是公权力的行使者决定公共资源在公共领域配置的过程。公权力配置公共资源并不是随意性的,科学配置公共资源必须建立在对公共领域详细了解的基础上;否则,公共资源的配置就会出现扭曲,最终导致公共资源的浪费和无效配置。传统的公共管理是借助于历史经验的反复比较,正所谓“以史为鉴,可知兴替”。今天虽然历史纵向的比较仍然可以获得经验,但这并非唯一的方法,甚至可以说是一种陈旧的方法论。新的方法是基于大数据的公共管理,大数据将带来公共管理的重大革命。
“大数据”是近年来的一个技术热词,也是一个学术热词,同时也是一个政府施政的热词①“大数据”作为一个技术方面的用词,是1980年著名未来学家托夫勒在其所著的《第三次浪潮》中首先提出来的,2008年9月《自然》杂志推出名为“大数据”的封面专栏。由此,“大数据”才成为互联网技术行业中的热门词汇,同时也成为一个学术热词。随着麦肯锡公司对大数据的应用,大数据迅速进入美国、德国、法国、英国、澳大利亚、日本等国的施政战略框架之中。2015年8月31日,中国制定《促进大数据发展行动纲要》的大数据发展战略规划文件。。大数据究竟是什么?并非一个人人都能回答的问题。有学者把大数据视为一种统计工具,并将大数据解释为“不是基于人工设计、借助传统方法而获得的有限、固定、不连续、不可扩充的结构型数据,而是基于现代信息技术与工具可以自动记录、储存和连续扩充的、大大超出传统统计记录与储存能力的一切类型的数据”[1]。在这些学者看来,大数据对人类思维的影响也仅仅是表现在“认识数据思维的变化”、“收集数据思维的变化”和“分析数据思维的变化”[1]。即便有学者对大数据有比前者更深入的理解,认为“大数据将深刻影响人类的决策模式和社会经济的运行模式”,但也仍然是从统计学的角度来思考大数据的意义[2]。从技术上来看,大数据可以归入统计工具之内,但大数据与统计工具是存在巨大差别的。传统统计工具是以传统统计方法为代表的“以算法为中心”的,而大数据是以数据挖掘为核心的“以数据为中心”的统计[3]。前者通常需要提前对数据分布和误差结构等做出假设,在某种意义上其结果只是人工拟合的近似世界而非真实世界,而后者基于总体数据可以给出更加精确的描述和预测[4]。由此可见,大数据虽然可以归入统计工具之内,但它不是一般意义上的统计,一般的统计只是基于既有数据的分析,而大数据是透过既有的数据可以挖掘出既有数据隐藏着的数据和价值。尤其是大数据中的非结构性数据本身就隐藏着巨大的价值,这是战略预测的重要依据;相反,传统统计工具一般不会对非结构性数据产生兴趣。也有学者认为,大数据既是数据,也是一种技术和能力,“是数据收集、分析的前沿技术,是从各种类型的庞大数据中快速获得有价值信息的能力”[5]。持这种观点的学者认为,大数据实际上是用来精准决策的工具。但是,大数据在于它的全数据、混杂性和相关性,大数据根本无法提供精准决策的工具。不过,大数据却能够提供一种独特的思维。也就是说,大数据并不是提供决策的具体工具的,而是提供全新的决策思维的。指望用大数据来提供一种精准的决策工具是不可能的,但大数据思维的确使决策对数据产生严重的依赖性,然而,正如舍恩伯格所说的那样,“数据远远没有我们想象的那么可靠”[6]208,“大数据为我们提供的不是最终答案,只是参考答案”[6]233。还有学者认为,大数据就是指人们借助于云技术运用数据的能力,当然这种数据不是一般的数据,而是海量数据包括结构性数据和非结构性数据。也即是人们借助于云技术使用结构型数据和非结构性数据的能力,而这种能力体现在国家治理、隐私保护、公共服务、医疗卫生等。这方面的成果不少,但基本上都是从集体的领域来分析的,这里不一一列举。
大数据固然是数据,也是技术、能力和价值,也正因为如此,人们都是从这些方面来认识大数据特征的,即通常用4个V(即Volume,Variety,Value,Velocity)来概括大数据的特征。
1.数据体量巨大(Volume)。据估计,人类生产的所有印刷材料的数据量是200PB(1PB=210TB),而历史上全人类说过的所有的话的数据量大约是5EB(1EB=210PB)。当前,典型个人计算机硬盘的容量为TB量级,而一些大企业的数据量已经接近EB量级①TB级数据就是2的40次方B,PB级数据就是2的50次方B,ZB级数据是2的70次方B。例如,2009年,美国国会图书馆相当于235TB,所有美国学术研究图书馆只有2PB,每天由Google处理的数据相当于24PB。到2020年全球数据量将达到44ZB。。
2.数据类型繁多(Variety)。这种类型的多样性也让数据被分为结构化数据和非结构化数据。相对于以往便于存储的以文本为主的结构化数据,非结构化数据越来越多,包括网络日志、音频、视频、图片、地理位置信息等,这些多类型的数据对数据的处理能力提出更高的要求。
3.价值密度低(Value)。价值密度的高低与数据总量的大小成反比。以视频为例,一部1小时的视频,在连续不间断的监控中,有用数据可能仅有一两秒。如何通过强大的机器算法更迅速地完成数据的价值“提纯”,成为目前大数据背景下亟待解决的难题[7]。由于数据多、总量大、价值密度低,因此,人们对数据(信息)的关注度就非常低。正如约瑟夫·奈所说:“丰富的信息导致关注的贫乏。当我们被大量的信息淹没在其中之时,我们难以确定关注什么。注意力取代信息成为稀有资源,而可以将有价值的信号与白噪音区分开来的人就获得了权力。”[8]奈所说的“将有价值的信号与白噪音区分开来”,在大数据中就是数据挖掘;而“获得了权力”的意思在大数据中就是指获得价值。另外,Value还有一层意思是指大数据所蕴含的巨大价值。大数据虽然因信息超大规模而导致关注度降低,进而使数据的价值密度降低,但是,大数据之大在于数据具有“再生性”,数据的价值具有巨大的增值效应。大数据的使用者并非停留在对表层数据的使用和发现表层数据的价值,而是通过表层数据不断挖掘,既可挖掘更深层次的数据,也可通过深层次的各种数据(包括结构性数据和非结构性数据),从而挖掘出更大的价值。
4.速度快(Velocity)。大数据框架内的速度包括两个方面:一方面,指如何加快数据的导入;另一方面,指如何加快分析和利用新导入的数据。前者的一个重要原因是大数据时代数据产生迅速,而大数据本身要求的是全数据,如果没有快速导入数据的技术,那么就很难做到全数据,不是全数据就不能成为大数据。后者则是由大数据的目标所决定的。大数据的目标是利用大数据进行科学分析和科学预测,新数据不断产生,那就意味着新问题、新情况也迅速产生。没有快速分析和利用新数据的能力,那么,所有的预测都是滞后的。滞后的预测会导致大数据丧失其预测功能。因此,在如此海量的数据面前,处理数据的效率就是一个机构的生命力所在。
除了上述四个特征,大数据更重要的还是提供一种独特的思维,即大数据思维。什么是大数据思维呢?(1)开放性思维。由于大数据的来源是多源性、多路径的,也就是说,数据本身是开放性的。因此,在分析数据和基于大数据进行预测的时候也需要一种开放性的思维来进行分析和预测。(2)非线性思维。这种思维要求我们在分析问题的时候不能仅仅凭几个要素来进行决策,而是要把所有相关性因素都要纳入分析框架。尤其是不能用简单的因果关系来进行决策,要充分考虑问题的复杂性。(3)价值思维,不能把数据仅仅看作数据,要认识到数据背后的巨大价值。传统的数据思维是数理统计思维,认为数据的本质在于统计,统计的目的是揭示历史过往中的基本特征和基本规律,根本没有通过数据来获得价值的思维。大数据思维就是通过数据的导入、分析,挖掘出巨大的价值。这种思维是完全不同于传统思维的全新思维。这种思维奠定了我们的学习创新(深度学习)、科技创新和管理创新。
公共管理的数据来自何处?弄清楚这个问题,首先要清楚数字和数据的区别,以及数据科学与管理科学是怎样结合在一起的。不但数字与数据有巨大的差别,而且传统数据与大数据也有本质的区别。一个数字只是一个符号,表现为一个数值或者是文本型数字,数字只是数据的一种形式。而数据则是一个很宽泛的概念,“只要是对客观事物记录下来的、可以鉴别的符号都可以称之为数据,包括数字、文字、音频、视频等等”[9]。也就是说,数据是关于某个(些)方面的一组数字,表现形式就不只是数字,而是有更多的表现形式。数字毫无疑问是统计科学的基本素材,但统计主要是对结构化数据进行统计分析,对非结构化数据一般都不会纳入传统统计之内,而实际上,云技术普及应用之后,90%的数据是非结构性数据,而且是富含大量价值的数据。由此可见,数字和数据不但在形式上完全不一样,而且在内容上也是大相径庭的。在云技术出现之前,数据仍然主要表现为以结构性数据为主的传统数据。这种数据虽然也会用于分析和研究,也表现为定量的微观分析,但它所诠释的仍然是一个问题的宏观和整体的状况,而且根据这种数据所进行的决策也仍然是宏观决策。这主要是受制于传统数据的采集方法、分类方法和采集标准。然而,云技术诞生以后,大数据的采集、分类、分析等方法和手段都彻底精细化,这样大数据才能对所涉及的对象进行微观性和个性化的分析。换言之,传统的数据只能算是小数据,小数据揭示问题的宏观现象,而大数据则可以揭示问题的内在本质。
大数据产生之后,数据科学迎来划时代的变革,这种变革的最大表现是数据科学与其他科学的内在结合,并形成基于大数据的新兴科学。数据科学最初与企业管理结合得最紧,主要原因是:随着社会化分工越来越细,企业生产的社会化程度也越来越高,因而企业的管理包括预测、决策等都越来越复杂,越来越依赖于完整的客观数据。而基于云平台和云计算的大数据可以为企业提供这种大数据服务。随着数据科学的迅速发展,公共管理、社会管理等也都全面引入数据科学。尤其是在新世纪,各国在继20世纪90年代推行的各行各业包括政府的“上网工程”之后,各国在新世纪又大力推行大数据战略。所以,大数据已经全面介入公共管理、社会管理之中。在这种情形下,数据科学与管理科学的高度相符嵌入而实现管理实践的巨大飞跃,尤其是使基于大数据之上的精细化管理和微观管理成为现实。在继西方各大国大数据战略之后,中国政府也颁布相应的大数据战略,制定“建立‘用数据说话、用数据决策、用数据管理、用数据创新’的管理机制,实现基于数据的科学决策,将推动政府管理理念和社会治理模式进步”的行动方案[10]。这也表明,大数据将在短期内成为公共管理等领域内的主要技术工具,也是提升政府治理能力的重要技术手段。
既然大数据全面嵌入公共管理,那么,公共管理所依赖的大数据又来自何处呢?众所周知,公共管理的内容非常广泛,公共管理以社会公共事务作为管理对象,而社会公共事务的具体内容分为公共资源、公共项目、社会问题等内容。因此,用于公共管理的大数据并不是单一性的,而是来自各个领域的大数据。几十年互联网的发展为数据积累提供了重要技术平台,加之大数据搜索引擎的发展,使社会产生的所有数据都能够获得迅速且有效的收集和储存。特别是世界各国的电子政务建设为公共管理积累了大量数字化的业务数据,既是政府大数据的重要来源,也是用于公共管理的大数据。这些数据主要来自以下四个方面:
1.来自互联网的大数据。这些数据大多分散在不同储存系统,包括数据库如Oracle、DB2、SQL Server等;Excel、电子邮件服务器等数据源上也积累不少数据源;Hadoop(分布式处理平台)系统如ApcheCloudea、Hortonworks、MapR,以及NoSQL数据库如Cassandra、HBase、MongoDB等也储存大量的数据。此外,云应用如Salesforce.com和社交网站如新浪微博、腾讯微博、搜狐微博等上也产生大量的数据[11]。当然,来自互联网的大数据必须基于搜集技术和保存技术。这种技术的发展是惊人的,例如对用户在网站上行为的记录(访问日记)在20世纪90年代中期,其保存率仅有1%,而在21世纪的第一个十年中的发展已经可以达到100%的保存率。这些数据虽然并非都可以用于公共管理,但公共管理已经越来越离不开来自互联网的数据。以新浪微博的数据为例,新浪微博中产生大量的关于政治参与、反腐倡廉、社会安全、社会问题、公共卫生事件、社会突发事件等的数据,而这些恰恰就是公共管理最重要的数据源之一,甚至这些数据在很大程度上影响公共决策。近年来,来自互联网的数据对公共决策的影响越来越大,有的公共决策甚至直接就是在网民的舆论压力之下进行决策的。例如,2012年8月26日凌晨,陕西省延安市境内发生重大车祸致36人死亡,2人重伤。陕西省安监局局长杨达才视察事故现场开心嘻笑的照片引发轩然大波,网友对他进行“上天入地”的人肉搜索,发现其曾佩戴过多款名表。2012年9月21日,陕西省撤销杨达才的所有职务,并对其严重违纪行为进一步调查。2012年11月28日,网民在微博上发布一组视频和照片,称山东省农业厅副厅长单增德与一单身女性保持不正当关系长达6年,如今想甩掉“包袱”,动用警力非法拘禁其情妇。山东省纪委调查后认定该情况属实,并对单增德立案调查。2012年11月下旬,网络爆料人士实名举报重庆市北碚区委书记雷政富,并发布其不雅视频。2012年11月23日,经重庆市纪委调查核实,互联网流传有关不雅视频中的男性确为北碚区委书记雷政富。重庆市免去雷政富北碚区委书记职务,并对其立案调查。随后,重庆市一次性免去牵涉不雅视频的10名厅级官员和国企高管的职务。2013年1月17日,一则有关陕西省神木县“房姐”的帖子网上热传,该网帖称陕西省神木县农村商业银行副行长龚爱爱在北京有20多套房产,总价值近10亿元,后又被曝有4个户口;1月24日,公安部成立工作组核查“房姐”户口问题;1月31日,北京警方证实,龚爱爱在京拥有41套住房,共9666.9平方米,还有奥迪轿车一辆;2月3日,龚爱爱在北京被专案组抓获,已按程序依法刑事拘留,而为其违法办户口的北京、山西和陕西4名民警也被刑拘。诸如此类的网络事件验证了来自互联网大数据的强大威力。
2.来自公权力运行(政府)过程中的大数据。根据社会过程论的观点,政治过程包括政治系统从输入到输出的全部活动,是二者一系列互动行为构成的动态系统[12]。政治系统的输入和输出,最重要的就是由话语、文件、口号、音频、视频等数据构成的信息输入和输出。这些数据是权力输入和输出的实际表现,因而也就是公共管理所依赖的大数据。政府数据的构成,从公开程度来看,可分为三层:第一层是免费公开、惠及民生的数据;第二层是有价值、有偿公开的数据;第三层是不能公开的数据。目前,中国有用信息的80%由政府掌握,长期以来,这些信息一方面大多处于不对外公开状态,严重地制约经济发展;另一方面,部门之间、上下级之间的政府信息相互割裂、数据之间无法有效共享,形成一个个信息孤岛,难以发挥应有的作用。从数据的性质来看,政府手里的大数据可以分为:(1)资产性数据,也就是直接表现为财产的数据,如国民收入、国债、对外贸易和投资等数据;(2)资源性数据,如自然资源、环境资源、政治资源、人口资源、教育与科研资源等数据;(3)互动性数据,也就是政府施政过程中与社会互动产生的数据,以及政府与市场主体互动产生的数据,包括宏观经济形势、居民健康状况、居民收入和社会保障等方面的数据。
3.来自企业的大数据。企业是大数据最重要的来源,它几乎每时每刻都在产生数据,而企业管理层是绝对不允许数据丢失的,另外,从行业机密来考虑,企业也不允许随意公开和丢失经营数据,因而企业的数据积累是最为全面的。更为重要的是,为防范风险,知名企业往往会通过建立容灾系统来备份自己的数据。“9·11”事件后,为了防备数据在企业遭受恐怖袭击、地震、火灾等重大事件被毁掉,各国、各企业都加大容灾系统的建设,以保护好这些数据。公共管理并非只是针对社会成员的,同样也针对企业主体。所以,企业的数据积累也是公共管理大数据的重要来源。
4.来自个人的大数据。个人的基本数据包括涉及个人隐私的所有数据,如健康状况、电话号码、银行账号等既是公共管理的依据,也是公共管理的对象。个人在日常生活中的活动行程数据包括上网、电子邮件、短信,以及博客、微博、微信等自媒体数据。例如,汽车传感数据用于评价司机行为会推动汽车保险业的深刻变革。此外,还有个人在其职业活动中形成的各种数据,如写作、科研、发明等,同样是公共管理数据的重要来源。
大数据客观上为公共管理提供处理公权力内部的权力运作问题、公权力对公共资源的配置问题,以及为我们维护社会安全、应对社会问题提供全新的思路和技术。这也是大数据时代公共管理与传统公共管理的最大区别。大数据公共管理更多的是处理数据,而对于不同来源的数据和不同性质的数据,公共管理的处理方式不一样。
舍恩伯格和库克耶所著的《大数据时代》提出大数据时代的管理变革,但他们主要是从风险管理的角度来分析的。他们认为,在大数据时代,“我们时刻都暴露在‘第三只眼睛’之下:亚马逊监视着我们的购物习惯,谷歌监视着我们的网页浏览习惯,而微博似乎什么都知道,不仅窃听到我们心中的‘TA’,还有我们的社交关系网”,“我们的隐私被第二次利用了”,所以,他们提出“管理规范的革命”,并认为大数据将对管理带来五大方面的变革,即“个人隐私保护:从个人许可到让数据使用者承担责任;个人动因VS预测分析;大数据算法师的崛起;反数据垄断”①参见维克托·迈尔-舍恩伯格、肯尼斯·库克耶:《大数据时代:生活、工作与思维的大变革》,盛杨燕、周涛译,浙江人民出版社2013年版,第三部分。。但是,本文则是从管理的效率、效能来分析大数据为什么能够促进公共管理变革。大数据能够促进公共管理的变革,是因为大数据有其特殊的功能。
1.大数据具有强大的数据收集功能。当今时代,数据呈三维爆炸式增长,即同一类数据在快速增长、数据增长速度在加快、新的数据来源和新的数据种类在不断增加[13]。在这种情形下,传统的数据收集方式根本无能为力,而云平台支撑下的大数据技术却能够把海量、快速、多样的数据实现软件化、智能化。因而,大数据也就能够为公共管理提供多元化、多源性的信息,这样就能够呈现更为真实的客观实际。大数据为民意辩论和协商共识提供足够的信息。公共管理的重要环节是民众参与和通过协商来达成共识。而参与和协商的前提是民众的信息充分知晓,信息不对称的协商是不平等的协商,这种协商是难以达成共识的。在这种情形下,大数据就发挥提供多样化、多源性信息的功能。因此,大数据和云计算实现了彻底的大多数决策的范式。
2.大数据本身具有数据管理的功能。大数据的数据管理是依托于云平台的智能化管理。大数据的管理功能既包括对大数据的管理,也包括使用大数据结果的管理。从公共管理来看,对大数据本身的管理体现在政府能够拥有对云硬件进行虚拟化的虚拟技术、对各种数据进行编程的编程技术和提供大数据使用服务的云服务平台技术;对大数据使用结果的管理功能则体现在适应大数据时代大数据使用的国家立法能力上,也就是通过有效立法来加强对大数据使用结果的管理。简言之,数据管理是大数据时代公共管理最重要的内容之一。
3.大数据具有强大的分析功能。数据没有经过分析就是一组没有生命力的数据,只有经过技术分析的数据才能够“发声”,才能够用于预测和进行公共决策。没有大数据思维就难以获得大数据的分析功能。大数据的分析功能不仅是分析已经“发声”的大数据,还要有能力重组各种已经存在且即将被挖掘出来的数据。由于大数据的核心是预测,因此,大数据结合传统的分析方法之后,就是要“(1)使用全部或更多的数据来建立预测模型;(2)组合多种分析模型和技术来改善结果;(3)创造一个闭环的环境,让新知识运用在生产模型中;(4)构建实时性的预测模型;(5)专注于应用预测模型技术”[14]。在思维过程中对数据进行重组,从而挖掘出数据的新价值,是大数据分析功能的核心内容。
4.大数据具有数据挖掘和数据重组的功能。在公共管理过程中,我们往往重视重要数据和可以用二维表结构来逻辑表达实现的结构性数据,并依据这些数据来进行公共决策,从而忽视众多所谓的不重要的、非结构性数据,但这些数据客观上对公共决策是有重要影响的。不过,“孤立的数据是没有价值的”[15]。非结构性数据不能被发现其价值,就是因为它们是孤立的,但大数据技术却能够通过挖掘和重组功能对非结构性数据进行充分利用,尤其是通过算法来构建数据的相关关系并挖掘数据价值,把分散的数据整合起来,并在云平台上通过云技术处理,使之成为有内在相关性的大数据,最终应用到公共管理过程中。
5.大数据具有强大的预测功能。预测自古以来就存在,那么大数据时代的预测与以往的预测有何不同呢?其最大的区别在于“一”与“多”的关系不同。传统的预测是从“一”来预测“多”的,而大数据时代的预测则是相反,从“多”来预测“一”的。《吕氏春秋·察今》有段话说:“有道之士,贵以近知远,以今知古,以所见知所不见。故审堂下之阴,而知日月之行,阴阳之变;见瓶水之冰,而知天下之寒,鱼鳖之藏也。尝一脔肉,而知一镬之味,一鼎之调。荆人欲袭宋,使人先表水。水暴益,荆人弗知,循表而夜涉,溺死者千有余人,军惊而坏都舍。向其先表之时可导也,今水已变而益多矣,荆人尚犹循表而导之,此其所以败也。”这是典型的从“一”预测“多”的情形。以“一”预测“多”的误差比较大,也导致预测的结果具有相当大的不确定性。然而,大数据的预测完全不同,大数据预测是基于海量数据甚至是全数据来预测某一种趋势、某一种结果或某一种情形。在《三国演义》第四十六回中,周瑜问孔明:“即日将与曹军交战,水路交兵,当以何兵器为先?”孔明回答:“大江之上,以弓箭为先。”周瑜说:“但今军中正缺箭用,敢烦先生监造十万枝箭,以为应敌之具。此系公事,先生幸勿推却。”孔明毫不推却地说:“都督见委,自当效劳。”孔明之所以敢接这个常人不可能完成的任务,是因为孔明先前进行了相关的“大数据”分析。天气:“今日有大雾”;曹操的心理特点:“吾料曹操于重雾中必不敢出”;友军中的鲁肃:“子敬只得救我”。在这种情形下,诸葛亮也依据自己掌握的“大数据”进行预测。天气:“是夜大雾漫天,长江之中,雾气更甚,对面不相见”,即浓雾不会暴露目标;敌对方:“重雾迷江,彼军忽至”,也就是说,曹操因多疑,在浓雾之下必将按兵不动;盟友:“鲁肃私自拨轻快船二十只,各船三十余人”,这表明诸葛亮早就清楚鲁肃的职权和能力,以及他的为人。这一切都围绕着一个目标来分析和预测:造十万枝箭来攻打曹操。结果是众所周知的,几乎是完全按照诸葛亮预测的情形发展。“草船借箭”即为用“大数据思维”来进行预测的经典案例。大数据预测不是以随机样本为前提而是全数据,不追求数据的精确性而是在混杂性的数据中寻找相关关系。这就是诸葛亮所说的:“为将而不通天文,不识地利,不知奇门,不晓阴阳,不看阵图,不明兵势,是庸才也。”虽然是混杂的数据,但预测的结果却不是多样性的,而是单一性的结果。也就是说,大数据的预测追求预测结果的唯一性。这对于公共管理的意义而言,在于大数据的预测功能规避公共决策结果的不可预知性和结果的多样性风险。
大数据推动公共管理的变革并不是因为大数据提供了数据服务,而是因为大数据带来管理思维的变革、管理结构的变革、管理边界的进一步明晰,以及公共管理对象的变化和管理效能的重大变化。大数据技术运用和相应的大数据服务,使公共管理彻底革新。
1.大数据促使公共管理从封闭性的管理结构转向开放性的管理结构。传统的公共管理受制于公权力,而公权力的运行在客观上存在封闭性的特点,如所谓的保密性、国家安全等,社会组织的参与、市场组织的参与度比较低。这种封闭性决定公权力在进行公共资源配置的过程中存在权力寻租的现象,即便没有权利寻租问题,但由于其封闭性也会导致社会的不信任,使公权力本身陷入“塔西佗陷阱”之中。相反,大数据完全不一样,大数据是在互联网和云平台上运行的,大数据时代的公共管理存在天然的开放性。市场组织与社会组织,甚至民众个体都可以在公共管理的框架中游走。在这个过程中,普通公众成为管理框架中的一员,管理者与需求者瞬时转换,实现全民参与管理,管理主体与客体对象的边缘变得模糊。这种开放性表明,原来的单一治理模式向多元共治模式的重大变革。
2.大数据使公共管理由官僚科层制转向扁平化结构。官僚科层制管理是一种金字塔型的治理结构,其结果导致资源配置形成与之相反的倒金字塔形结构,离金字塔塔尖越近的部门获得的公共资源越多。这样的公共管理结果最终是难以持续的。社会的不满情绪也大多源于此。公共资源的分配强调在程序化基础上的公平,而官僚科层制管理虽然有程序但缺乏公平。所以,官僚体制内部的层级在公共资源分配中发挥决定性的作用。然而,大数据就完全不一样,大数据把横向分工合作与纵向科层制的僵化结构打破,政府内部的数据共享与共同决策将最终消除官僚层级对公共资源分配的决定性作用,同时也会消除部门之间的公共资源鸿沟。
3.大数据公共管理与政治管理的边界进一步得到明晰。传统的公共管理更多的是基于政治意识形态的安全而实施的过程,把一切涉及经济利益诉求的集体行动和个人维权行为都纳入到与政府对抗甚至视之为颠覆政府的政治诉求行动,所以刚性维稳成为公共管理的常态。其结果往往是与实际目标相去甚远,进一步激化社会矛盾。实际上大多数的集体行动和维权行动都是以经济利益为目标的,与政治诉求根本就没有关系。大数据的监控会把这一切都明明白白地告诉公共管理者。关于这方面的监控过去都是采取人对人的监控,而人往往会对一切都进行主观判断,甚至为某种目的而故意隐瞒客观事实,把经济诉求的社会行动上报成为政治诉求的社会行动,其结果不言自明。大数据不一样,大数据采取的是技术监控和技术分析,包括对人的行为的监控。技术只会告诉你数据,不会做出主观判断,技术用数据说话。大数据的公共管理就是要去政治化的管理而转变为社会化的管理。
4.大数据促使公共管理从强化对人的管理转变为对数据的管理,并借助于大数据来为人服务。传统的公共管理是为社会秩序服务的,所以专注于对人的行为进行规范化,使之合秩序化。在这种管理框架中,人是公共管理的目标,而不是管理服务的对象。大数据的公共管理,一是数据管理,因为数据是最为关键的管理对象,数据在云平台上安全运行是大数据条件下公共管理的前提条件,因此,对数据的管理是第一位的,只有对数据有效管理,才能实现有效的公共管理。也就是说,对数据的管理是公共管理最重要的一部分。二是用数据服务公众,即大数据的公共管理从直接对人的管理转变为直接对人的服务。这是公共管理根本性的变革。
5.从公共管理的效能来看,尤其是针对社会问题,公共管理决策应该是一种预测性的决策,而不是被动应对性的决策。传统的公共管理往往是一种被动应对性的公共决策,即只有当某种现象出现后,出于强化或防止该现象的再次发生的目的而进行公共决策。这种决策相当于用先前付出的代价来购买新的公共决策。大数据技术条件下可以避免这种用历史代价来购买未来公共决策的现象,那就是用大数据进行预测式决策。这是因为,大数据不但构筑规模庞大、类型多样的数据,而且云计算的快速计算能力,能够实现“全样本”的数据支撑,从而能够使公共管理更好地做出预测性优化决策。
变革也就意味着风险,其中包括不确定性的风险和不可靠性的风险。正如前文所述,大数据预测是以“多”对“一”的预测,其结果应该是确定性的。但是,传统的公共管理引入大数据之后使公共管理的新手段具有不确定性,同时公共管理的内容也具有不确定性,这样会导致公共管理的结果具有不确定性。不可靠的风险是指大数据作为全数据的可靠性问题,以及大数据带来的包括个人隐私保护等方面的问题,都会给公共管理提出全新的挑战。
1.大数据真的是全数据吗?所谓全数据都是相对的,但大数据条件下的公共管理对全数据具有天然的依赖性。因此,对大数据实际上就是全数据的依赖会导致公共管理为收集数据而收集数据,或者说是为追求全数据而导致公共管理因数据动态而困惑。虽然公共管理的目标是提高服务质量,但数据的大爆炸会导致公共管理者更多地应对数据爆炸带来的收集困惑,为如何收集瞬间即逝的非结构性数据而费尽周折。而公共管理的服务内容很有可能被数据收集过程冲淡甚至被忽视。对数据的执迷是大数据时代公共管理面对的第一大挑战。
2.大数据如何保护个人隐私?保护个人隐私虽然不是公共管理的目标,但它是公共管理的内容之一。传统的公共管理也包括对隐私权保护的内容,即任何个人隐私都必须得到公共管理行为的保护,公共管理过程不得侵犯个人隐私;否则,公共管理就会被认为是违背法律的。然而,大数据所收集的所有数据都存放在互联网之中和云平台之上,而技术的使用者是受到人性控制的,人性可以通过道德来进行制约,可是技术是不具有道德规制功能的。于是,掌握大数据技术的人并不会因为其技术水平的提高而提高其道德水准;相反,在巨大的利益诱惑下,技术会异化为攫取云平台之上的大数据特别是个人隐私方面的数据来谋取暴利,甚至是进行诈骗、勒索。近年来,网络诈骗、电信诈骗层出不穷,就是因为人追逐特殊利益的本性而导致大数据技术的异化。由此可见,大数据本是为了提高公共管理水平,但大数据技术的异化给公共管理带来新的难题。
3.大数据如何进行公共管理方面的立法?公共管理必须有法可依,但立法的原则不同,公共管理的内容是不一样的。例如,传统立法使用个人隐私数据必须征得个人同意。在大数据时代,大数据把个人隐私几乎完全暴露在互联网之中。因此,在立法管理上就要进行变革,即国家立法要从个人许可转变为让数据使用者承担责任[6]220。由于大数据的价值并不是从表面的数据直接体现出来的价值,而是通过挖掘之后而发现数据的价值进行二级使用,因此,个人许可的立法原则就难以获得全数据,但获得全数据之后,数据使用者是否主动要为使用数据负法律责任呢?这无疑是一个未知数。大数据的公共管理要促使数据使用者评估数据使用的风险、规避或减少潜在伤害,但数据使用者往往忽视法律的底线,从而使公共管理在大数据条件下存在数据使用者道德的不确定性风险。
[1]李金昌.大数据与统计新思维[J].统计研究,2014,(1):10-15.
[2]田茂再.大数据时代统计学重构研究中的几个热点问题[J].统计研究,2015,(5):3-13.
[3]BREIMAN L.Statistical Modeling:The Two Cultures[J].Statistical Science,2001,16(3):199-231.
[4]黄璜,黄竹修.大数据与公共政策研究:概念、关系与视角[J].中国行政管理,2015,(10):25-30.
[5]蔡翠红.国际关系中的大数据变革及其挑战[J].世界经济与政治,2014,(5):124-143.
[6]维克托·迈尔-舍恩伯格,肯尼斯·库克耶.大数据时代:生活、工作与思维的大变革[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2013.
[7]朱建平,章贵军,刘晓葳.大数据时代下数据分析理念的辨析[J].统计研究,2014,(2):10-17.
[8]约瑟夫·奈.硬权力与软权力[M].门洪华,译.北京:北京大学出版社,2005:152.
[9]魏瑾瑞,蒋萍.数据科学的统计学内涵[J].统计研究,2014,(5):3-9.
[10]中华人民共和国国务院.促进大数据发展行动纲要[EB/ OL].(2015-09-05)[2016-07-12].http://www.199it.com/archives/380895.html.
[11]杨正洪.智慧城市:大数据、物联网和云计算之应用[M].北京:清华大学出版社,2014:23.
[12]中国大百科全书·政治学[M].北京:中国大百科全书出版社,1992:492.
[13]涂子沛.大数据[M].桂林:广西师范大学出版社,2013:55.
[14]MINELLI M,CHAMBERS M,DHIRAJ A.大数据分析:决胜互联网金融时代[M].阿里巴巴集团商家业务事业部,译.北京:人民邮电出版社,2014:98.
[15]赵国栋,等.大数据时代的历史机遇:产业变革与数据科学[M].北京:清华大学出版社,2013:31.
(责任编辑:朱永良)
D035;F490
A
1005-460X(2016)06-0006-07
2016-08-18
国家社会科学基金项目“中国软实力评估及增进方略研究”(14BKS064)
胡键(1968—),男,湖南道县人,研究员,博士研究生导师,从事中国软实力研究。