罗屿
大数据时代最大的亮点,就是人和社会的计算,越来越多的社会问题都将通过计算得到解决。对政府而言,在增强决策的科学性、增强公共服务能力、提升社会管理水平等方面,大数据也正发挥越来越重要的作用
2012年,一场围绕数字“62.74%”的争论,让信息专家涂子沛忍不住发声。
当年8月,国家发改委社会发展研究所杨宜勇所长根据他所构建的中华民族复兴进程测评体系,发布了一项研究成果:2010年,中华民族复兴指数为0.6274,即中国的民族复兴大业已经完成了大概62.74%。
杨的结论发布后,引起了争议甚至哄笑。更有学者批评,杨的这种研究方法反映了当前社会治理理念与模式当中存在科学主义弊端——“迷信理智,其具体表现之一就是迷信数据”。
涂子沛曾在中国的公共部门工作十年,后辞去公职赴美留学,彼时正居住在美国匹兹堡。作为最早将大数据概念引入国内的研究者之一,那时的他刚刚在国内出版《大数据》一书,对于民族复兴量化风波,他在当年写给媒体的专栏文章中表示,对杨宜勇的研究结论,他也存疑,但他更不赞同的,是学者提出的“迷信数据”一说。
“综观全世界,社会治理或者说公共治理、公共政策的一个发展趋势就是科学化,而一切问题科学化的基础就是数据。在这种趋势和大潮之下,中国社会治理领域的问题恰恰不是科学主义导致的偏颇、不是数据迷信,而是科学主义严重不足、缺乏用数据来说话的理性精神。”
正因如此,涂子沛这两年更像一个执着的布道者——演讲、出书,向国内大众普及数据理念及文化。
2014年,涂子沛出版《数据之巅》一书,和《大数据》一脉相承,书中仍以美国为主线,系统梳理了这个上帝与数据共舞的国家,其数据文化的形成,阐述了其数据治国之道。但和《大数据》一样,涂子沛写作的出发点,仍是中国。
在书中,涂子沛再次提及“民族复兴是否可以量化”。他说自己仍态度鲜明地支持量化,关键是要建立正确的模型。在他看来,大数据时代最大的亮点,就是人和社会的计算,越来越多的社会问题都将通过计算得到解决。
无数据,不决策
若将大数据研究领域比做“江湖”,有人属“国家治理派”,有人则是“产业升级派”,涂子沛无疑是前者。
与从商业角度论述大数据不同,无论《大数据》还是《数据之巅》,涂子沛更多强调数据在增强政府决策的科学性、增强公共服务能力、提升社会管理水平等方面的重要作用。
而“国家治理派”的建言,如空谷回响,很快有了回应。
《大数据》出版不久,2012年10月8号,身在美国的涂子沛收到广东一位媒体友人的信息——时任广东省委书记的汪洋正在向广东省财政厅全体干部推荐他的书。
而这,只是涂子沛与广东产生交集的开始。2012年12月,广东省宣布启动大数据战略,还将“在政府各部门开展数据开放试点,并通过部门网站向社会开放可供下载和分析使用的数据,进一步推进政务公开”。此后不久,广东又宣布,根据《广东省实施大数据战略工作方案》,为保证大数据战略的有效实施,广东省将组建大数据管理局。这个新的政府部门定编为副厅级单位,按照当时广东省领导人的解释,它“不是临时性的,而是一个战略性的、有行政职权的机构”。涂子沛在汪洋的批示下,出任广东大数据管理局顾问。
作为顾问,涂子沛认为,政府成立大数据管理局,推进工作的难点在于,地方政府并非完全没有数据,而是数据的整合能力、分析能力过于薄弱,“教育局、交通局、旅游局……其数据放在一起分析,才能发现新知识、新规律,但现在的情况是,无论哪个局都无权查看别人数据。”为打破这种壁垒,涂子沛建议,可在大数据管理局内设置“首席数据分析官”,专司跨部门的数据整合分析。“信息技术的发展,最终影响的是机构设置、职能重组、流程重新定义与优化,并非简单的技术问题,它需要行政力量强有力的支持,所以应当作为‘一把手工程来抓。”
涂子沛强调的数据整合与利用,在美国政府治理经验中,就有可借鉴之处。
比如,美国的交通管理局和治安管理局,曾把他们各自数据记录加总到一起——把治安案件发生的地点、时间,和交通事故发生的地点、时间,整合到同一张地图,发现几年来两个机构的记录高度重合。这引发了政府执勤方式的改革,即两个部门联合执勤,后来证明这种方式行之有效。
而美国联邦政府的大数据项目LEHD(工作单位和家庭住址的纵向动态系统),也证明了数据整合联通的重要意义。
如今,LEHD可以查询到一个城市乃至一个街区的居住人口、工作人口、薪酬水平、工作类别、性别和年龄分布等等,并可以进行纵向分析。
正是有了LEHD,任何一个服务机构,大到一所医院,小到一个银行ATM自动取款机,都可以根据其数据分析,确定选点的最佳位置。此外,如果要修路、建桥,具体的地点选在哪里?该地区有多少人流量、车流量?公路需要几个车道,大桥需要多大的承载力?LEHD都可做相应分析。另外,如今倡导的宜居城市、宜居社区,鼓励大家步行或乘公交车上下班,但一个城市、一个社区内到底有多少人可以步行上下班?又有多少人能搭乘公交车上下班?现有的公交路线是否应该调整?政府的廉租房应该建在哪里?通过LEHD,美国的城市管理者、规划者和研究者都可以从分析数据中,获得启发和决策支持。
2010年,LEHD又推出了新应用——公共应急管理。该应用整合了关于飓风、热带风暴、暴雨、洪水、暴雪、火山等恶劣天气、自然灾害及其他人为灾害的实时数据,这些数据来源于国家气象局、国家农业部、内务部、联邦应急管理局四个单位,数据实时更新,个别数据每4个小时更新一次。
在大规模灾祸发生时,该系统可快速评估受到灾害影响的居民多少和人口特征,以便对灾区的疏散、撤离、补偿以及需要提供的各种公共服务进行规划。
“回望历史,中国是个数据文化匮乏的国家;就现状而言,中国数据的公信力弱,质量低,数据定义的一致性差也是不争的事实。”涂子沛希望自己讲述的美国政府循“数”管理的故事,可以在国内形成“用数据说话、用数据管理、用数据决策、用数据创新”的氛围。
大众智慧解决大众问题
2012年《大数据》一书出版后,涂子沛经常回国演讲、座谈,和很多人一样,他经历了几次航班延误,当陷入不可预估的等待时,他感觉自己的情绪非常不美好。
“美国社会怎么解决这个问题?开放数据。”涂子沛索性在一次演讲中,以此为例。他表示,在美国交通部开放了航班数据后,有民间人士仅用一个月时间就开发了一套航班延误免费查询系统。“你在乘坐任何一个航班时,都可以找到每个时间点上,无论下雪、下雨,或是节假日等等,这趟航班晚不晚点,平均晚点多少。”涂子沛说,这个来自民间的程序还可以对所有航班的延误大排名,藉此间接推动各个航空公司的服务效率。“更重要的是,它把一种稳定的秩序、一种稳定感传递给消费者,你等待的时间变得可以预期,你的生活可以自己掌握。”
类似这种让大众解决大众问题的故事,还有很多。
例如,鼠患曾是让纽约城市管理者头疼的问题。2004年1月,纽约市卫生厅开放了全市餐厅历次卫生检查和受理投诉的数据,民间就有数据爱好者利用这些数据做了一个可视化应用,被称为纽约市的“地区老鼠指数”。他把卫生厅开放数据中关于老鼠出没的数据加以整理,并以邮编为地域单位,用可视化的形式展现在地图上,颜色越深的地方表示鼠患越严重。此外,他还列出了该邮编之内,卫生条件被评定为“最差”的餐馆。在纽约市卫生厅的网站上,输入邮编或地址,还可以查阅城市内鼠患严重的大楼及其位置。
至于成立于2008年的美国民间公益平台SeeClickFix,同样也是基于数据开放基础上,由民众贡献智慧参与社会治理的案例。SeeClickFix的意思是“看见、点击、搞定”,而民众可以通过SeeClickFix平台,提交生活中发现的问题。
如2014年1月23日,有人在SeeClickFix上发帖抱怨,在纽黑文市艾德街上停车吃了罚单,但根本找不到“禁止停车”的标志。这个帖子引起了近30名司机跟帖,他们讲述了同样的遭遇。当天,纽黑文市的警方就跟帖回应,承认贴在树干上的“禁止停车”标志太少且不显眼,宣布取消这些罚单,并重新设置这条街上的禁停标志。
据悉,全美已经有170个地方政府利用SeeClickFix这个公益平台和市民互动,解决市民反映的问题和投诉,休斯敦、费城、奥克兰、图森、纽黑文等城市的政府甚至直接采用该系统为政府工作人员分派任务。SeeClickFix则根据每个地方出现问题的多少、解决问题的多少和速度的快慢,在网上为各个城市打分排名,定时评选绩效最高的城市。
无论是“地区老鼠指数”,还是SeeClickFix平台,在涂子沛看来,都可视作社会大众基于开放信息进行的创新。“数据作为一种特殊的创新资源,它的价值会在使用中不断被传递、放大。”涂子沛强调,每一个人,对自己所在的这个社会,是负有责任的,需要把自己的意见加入其中,有意识地构建并推动社会的良性变革。“在这样的过程中,信息的交换与分享就显得非常重要。”
而国内,也有类似尝试。
早在2012年,神州数码就致力于城市公共信息服务平台建设,并先后在佛山、福州、张家港等地落地。以佛山市公共服务平台为例,该平台由“我的声音”、“我的政府”、“我的生活”、“我的支付”四个板块构成。特别是“我的声音”板块,市民可以在平台上反映在城市生活中发现的问题,通过它参与城市管理。
但神州数码的目标不止于此。根据其首席信息官谢耘的说法,以市民为中心的城市公共服务平台仅仅是第一步,随着数据量的积累,这些数据将对政府的决策起到重要参考作用。
政府购买云服务
对神州数码而言,佛山市公共服务平台的搭建,是其签出的第一单政府购买云服务合同。
关于“云”,曾任美国联邦政府首席信息官的昆德拉有过这样生动的描述:曾经,每一个家庭、农庄、村落、城市都必须有自己的水井。今天,你仅仅打开水龙头,干净的水就通过公共供水管道输送给我们。云计算,也是这个道理,就像我们厨房里的水一样,可以根据我们的需要,随时打开或者关上。在自来水供应公司,有一群专业人员负责水的质量、安全以及24小时不间断供应。当你关上水龙头,不仅节约了水,也不用为你没用的水付费。
2010年12月,在昆德拉的主导下,联邦政府宣布“云优先”政策,规定所有新建的政府信息系统,必须优先考虑云平台。对于“云”,最初联邦政府官员也曾“云山雾罩”,但和英美等有深厚契约传统的国家相比,在中国普及“云”知识、推动“云”部署,显然更有难度。“由于缺乏良好的法治传统,中国社会人和人之间、组织和组织之间的信任度较低,而云是将软件和数据完全托管给服务商,这对中国社会大部分个人、公司及组织而言,都是难以接受的。”但涂子沛仍旧认为,进入大数据时代,“云”将成为城市生活中排在水、电、气之后的第四公共部门。在他看来,为推动云计算在中国尽快成为一个产业,在不涉及国家安全的情况下,中国政府的各级部门都不应该再营建自己的数据中心、开发本地软件,无论是存储还是计算,都应该以云的形式向社会购买服务。“政府如果能带头,传统社会对于发展云产业的限制就可能被快速打破。”
如今,涂子沛的新身份,也为他布道“云”知识提供了更大舞台——2014年底,他举家回国,正式出任阿里巴巴副总裁,从事数据新商业模式的研究,帮助阿里开展政府及公共领域的大数据项目,并推动阿里云计算的国际化战略。
2014年底,一场大数据商业模式大赛——智慧交通算法大挑战,在阿里巴巴大数据科研平台“天池”上正式启动。参赛选手可以在这个平台上获取贵阳市真实的交通数据,并通过对这些海量交通数据的挖掘,设置一套可以根据交通流量情况实时控制红绿灯变化的系统,让每一辆经过这个地区路口的车,在红灯面前的等待时间最短,最大程度减少城市拥堵。而这场大赛则源于“云上贵州”项目——2014年12月20日,贵州省政府在阿里云开发者大会西南峰会上宣布,交通、环保、食药、工业、电子政务、旅游、电商七朵云的41个业务系统迁移至“云上贵州”平台。
关于政府上云,涂子沛坦言难点在于,企业把云资源给政府,后者就像拿到一个皇冠,“但皇冠上没有明珠,这些明珠就是数据,需要政府自己掏出来。”而在国务院2015年1月印发的《关于促进云计算创新发展培育信息产业新业态的意见》中,不仅鼓励政府加大购买云服务的能力,还要求在保障信息安全和个人隐私的前提下,探索部分数据资源向社会开放,并且政府部门间数据要共享。
“科技的浪潮把我们推进到了信息时代,但并不代表我们迈进了信息社会,一个真正的信息社会是信息自由流动的社会。”但涂子沛也坦言,信息时代也有挑战,比如隐私问题——对个人来说,越多地使用云,就意味着越多的行为被记录;对全社会来说,则意味着更大的记录、更大的数据。“美国有幼儿园,通过手机平台和家长互动,孩子每换一片尿布、当天的表现、每个进步、每个异常,都被记录在平台上。这意味着从摇篮到坟墓,人的一生都将被记录,这些数据一旦整合,就是对个人隐私极大的侵害。”
对此,涂子沛给出的“药方”是教育,“我们未来的一代人,数据和隐私,将成为伴随他们一生的话题。隐私教育从少儿就要开始,就像儿童的性教育一样重要。”
作为大数据江湖中的“国家治理派”,回国后的涂子沛希望可以在省市县三级,推动形成向数据时代成功转型的地方样本。而2014年的一次演讲,让他与浙江省德清县结缘。“我在图书馆作报告,不知县长就在台下。”而报告结束的当晚,涂子沛就被德清县聘为唯一一名政府顾问。作为顾问的他,正在帮助德清策划落实几个行动,比如向企业送云。
涂子沛说自己是一个乐观的技术主义者。在他看来,技术的发展虽然会给人们带来挑战,但机遇永远会和挑战并存,而人们也终将受益于技术的发展和进步,在即将到来的智能时代获得更大的自由和解放。“所有的技术,归根到底是为人和社会服务,就是希望我们过一种幸福有尊严的生活,这个愿望,贯穿着整个人类的历史。”