文 杨玉莹(安徽大学管理学院,安徽合肥 230601)
大数据时代下政府数据开放的挑战与对策研究
文 杨玉莹(安徽大学管理学院,安徽合肥 230601)
政府将拥有的数据向社会开放,不仅是建设透明服务型政府的内在要求,更关键的是能够利用大数据技术和社会创新力量将政府数据的潜在经济价值最大限度地挖掘开发。我国目前在政府数据开放中面临来自数据质量、隐私安全风险、网络舆情危机以及政府协作能力等方面的挑战,需采取提高数据质量、加强隐私安全保护、主动回应民意诉求以及与市场共同营造数据开放生态圈等应对措施。
大数据 政府数据开放 数据开放平台
政府信息公开已经成为我国建设新型阳光政府、实现国家治理能力与治理体系现代化的必然要求。近年来,我国政府信息公开的进程日益加快。自2008年《中华人民共和国政府信息公开条例》实施以来,中央及地方政府对政府信息公开相继作出了明确规定和工作部署,并开通了中国政府网官方微博和官方微信,将重要政务信息及时通过各种形式向广大社会公众公开[1]。但是就目前来看,政府信息公开很少涉及到数据集层面,即使有部分数据公开也只是以报告或表格的形式,公众获取形式单一,缺乏标准化,难以进行深度挖掘、加工和分析。尤其在信息数据爆炸的大数据革命新时代,政府数据公开正凭借其精细度高和互动性强的特点逐步取缔传统例行公事般的政府信息公开。如何搜集、开发、加工并开放政府数据,最大限度发挥、释放政府数据信息的附加价值,处理好与大数据时代的关系以便在即将到来的数据革命中占领战略制高点,是政府必须深思并付诸行动的深刻问题。
据了解,政府部门掌握着全社会80%的信息资源[2]。政府工作关系着民生的方方面面,在日常的公共管理和公共服务过程中自然地积累了包括交通、医疗、养老、卫生、社保等各种类型的庞大数据,由此也拥有着最丰富的信息资源。然而政府对于各项数据的深度挖掘和开发、利用并不应仅限于 “闭门造车”,还要充分调动广大社会力量的参与,通过无数的活跃个体来推动公共管理大数据价值的开发利用。政府数据开放是社会政治、经济和信息技术水平发展到一定时期的产物[3]。下面以一些具有代表性的地方政府为例来浅析目前我国政府数据开放的现状。
(一)政府数据开放平台建设初具规模
政府要想进行数据开放,必须依托政府数据开发平台来对数据进行编目、管理和公开展示,保证政府开放数据的可机读、及时性、开放性、真实性和完整性。2012年,“上海市政府数据服务网”试运营;2014年,北京、上海组织比赛征集应用开放数据的优秀创意;2015年,李克强表示要尽最大可能公开政府掌握的数据。据初步统计,截至2016年8月,我国地方政府建有数据开放平台网站(或栏目)的有5个省级政府、4个省会城市或副省级城市政府、2个其他市政府、8个区政府。
(二)政府数据公开覆盖领域较为广泛
我国开设的政府数据公开平台现主要以两种形式为社会公众提供数据查询目录:一种是按照资源主题进行划分,另一种是按提供机构分类。例如上海市政务数据资源网在其主题目次下设置的数据集涉及到经济建设、资源环境、教育科技、民生服务、道路交通、公共安全、卫生健康等12个方面,截至2016年12月总共开放了1052项数据集;在其提供机构目次下设置的数据集涉及有上海市发展和改革委员会、公安局、监察局、民政局、司法局、财政局、人力资源和社会保障局等40个机构,截至2016年12月总共发布数据集有1016项。除此之外还有部分省、市等利用电子文件及标签形式进行目录分类,如青岛市政府利用处罚、许可、企业、公益、价格、旅游、建筑、农业等关键词标签进行数据开发类型划分,截至2016年12月共开放了3342项数据集。
由此可见,我国政府数据开放多以民生领域为主,所公布的数据具有主题分类多样化、覆盖范围广泛化等特点。但相比较来看,各地开放的数据量和数据范围以及数据种类等还存在很大差异,在数据公开方面缺乏统一的规定,因此形成了较大的不平衡性。
大数据不仅打开了信息社会的新篇章,同时也推动了政府转型并迈向智慧治理时代的步伐。但是大数据在带来知识爆炸和价值增值的同时也潜藏着巨大的社会风险,政府在数据开放的过程中也正面临着前所未有的挑战。
(一)大数据时代政府数据质量的考验
1.数据的全面性与真实性。大数据的分析以数据的搜集整理为基础,而现如今,数据的搜集主要来源于人们持有的手机、电脑等智能机器。然而,即使是在科技迅速发展的当今社会,这种低成本、便捷化的搜集信息的方式同样会带来一种致命的缺陷:数据的全面性不可避免地受到了威胁。现如今还有很大一部分农民和底层城市居民因经济条件限制而无法接触到科技产品或智能终端,因此代表其意见和诉求的数据信息也就相应地无法传达到大数据系统中。这种因现实条件差异带来的数据信息上的不平等加剧了数据鸿沟的形成,数据缺口的存在也影响了大数据分析的全面性。与此同时,量化分析中的数据盲点也使大数据的准确性受到质疑。因为在大多数情况下,片面地对某部分数据进行简单分析和利用很有可能会犯主观上的错误,只有将所有相关数据全部联系起来进行对比观察和比较分析,才能从整体上出发得到精确客观的结论。
2.数据的可机读性与动态维护。政府数据开放面对的群体是社会公众,要想让用户对数据进行个性化的加工和再利用,其前提必须是对数据进行充分的公开开放,保证需求端的易操作性和可机读性。2015年复旦大学 《中国地方政府开放数据现状、问题与难点》的研究发现,北京、上海、武汉、无锡、湛江、宁波海曙、佛山南海等具有代表性的7个实施数据开放的城市中,武汉公开数据总量最高,为635个数据集,但其中有一半是PDF格式,可机读比例仅为54%;可机读数据最多的为上海,共有398个,各地平均可机读率为84.1%。可见我国在开放数据的可机读率方面还有很大的发展空间。另外,在数据的动态更新与维护方面也有待提高。在调查的7个地区中平均仅有17.21%的数据按承诺得到了更新,剩下的86.25%都是静态数据,迟迟得不到实时追踪[4]。如果政府只是例行公事般将数据搬到平台上来而对其是否便于用户利用不管不顾,那就只是信息公开而不是数据开放,也无法深层挖掘大数据的潜在价值。
(二)大数据时代政府数据公开的风险
1.大数据对行为预测的精准性。全球电子商务的创始者亚马逊之所以能在竞争激烈的市场环境中脱颖而出,其根本原因就是能走在互联网和大数据时代的前端,通过传统门店无法比拟的数据预测分析手段,根据用户在本网站或者第三方网站上的相关行为充分收集到大量客户在购买前、购买时及购买后的丰富的交易行为信息,并进行深度挖掘,从而分析市场行情、预测用户购买意向,制定针对不同客户群体的个性化推荐。大数据对个体或群体未来行为的分析预测不仅应用于商业竞争,也同样适用于政府的公共管理和公共服务。然而,大数据对未来状况的预测是建立在数据的全面、精准以及完全理性的基础之上的,也就是说,稍有不慎,大数据的预测就可能出现相当程度的偏差,而这种偏差给社会或个人带来的风险可能是非常严重的。例如近些年来国际上利用大数据来预防犯罪,实施“预测警务”的成功率达70%。这个数字在大数据预测的初级阶段显得卓有成效,然而剩下的30%在科学技术尚未能够填补的当今社会,那些由于误测而存在的“潜在危险分子”给社会带来的影响是可想而知的。
2.大数据分析的安全性和隐私性。生活在互联网笼罩下的大数据时代,只要我们使用电脑或者手机等终端设备,就都逃不开隐私数据被搜集的问题。大数据体系在广泛采集社会公众在互联网上留下的个人信息并进行存储、加工和分析的同时并没有考虑到个体是否确实愿意将自己的信息进行上传和共享。在特定的大数据时代,传统的告知与许可以及匿名化等隐私保护策略已然失去其作用。由于很多数据在搜集时的初衷并不是用于他处,使用信息的一方也无法告知个人信息将被用作何种用途,因此个人是否愿意提供或兜售信息的选择权也就无从谈起。同时由于网络隐私权保护专门立法的缺失,越来越多的社会公众意识到自己无时无刻都暴露在“第三只眼”之下,公民的隐私权受到前所未有的侵犯和威胁。
(三)大数据时代的网络舆情危机
1.民意诉求的挑战。一是政府对自身工作的改进和监督。随着政府数据的开放,政府行政工作的程序、方式和结果等都更多地暴露在公众的监督之下,政府工作人员的一举一动每时每刻都受到千千万万群众的注视,这就要求政府工作的每个环节都必须不断完善、改进和优化,才能经得起大数据时代的考验;二是政府对民意诉求的响应。随着数据公开内容的不断扩大,政府工作人员必须接受网络民主正在扩大的事实,转变对公众的态度,对于公众提出的任何质疑与要求,都必须迅速做出回应,抛弃“打官腔、说空话”的做法。面对大数据时代下汹涌而来的民意,当前的政府工作人员显然缺乏同公众和媒体打交道的经验。面对公众的质疑和诉求,如何理性应对并及时回应,也是政府应该学习的课程。
2.网络问责和网络反腐的风险。互联网时代下的网络问责正以其匿名性、平等性、自由性及低成本化等特征受到社会公众的热烈追捧[5]。随着电脑、手机等电子设备和微信、微博等社交沟通平台的广泛普及和发展,越来越多的群众依靠网络的形式对政府机构及政府工作人员的言论、行为等进行关注,建立起公共话题,并通过传播媒介,结合活跃网民的高频点击、持续关注和自由评论来制造强烈的公共舆论氛围,从而对当地的政府和纪检部门造成巨大的舆论压力,迫使有关部门要求当事人对舆论观点作出解释、澄清甚至整改。尤其是在我国政府持续不断地加大反腐倡廉建设的时代背景下,依靠大数据进行反腐已然成为反腐倡廉的新生代强有力武器。
然而,政府在响应反腐倡廉、网络问责而进行数据开放的过程中也面临着一系列的问题和挑战。网络问责的自由性和匿名性为网络暴力、网络造假等恶劣行径提供了藏身之处,政府工作人员因此极易成为网上、网下联动事件的受害者。部分网民的盲目跟风心理也不可避免地被一些怀揣恶意的利益集团利用,通过网络群体性事件对部分工作人员实行人身攻击和恶意诽谤等。因此,政府在进行数据开放的同时,如何引导群众对数据信息的真实性进行判断鉴别,不被舆论所挟持,如何在数据开放的过程中控制舆论导向,避免网络暴力的形成,让数据开放、大数据技术和网络问责在健康文明的环境中提升政府能力,同时将网络风险降到最低,是政府在数据开放中亟待解决的课题。
(四)大数据时代的政府协作能力考验
政府是各类数据资源的集大成者,社会生活中数据的全面搜索与集中主要依靠政府来完成,但数据的深度挖掘与价值开发仅仅依靠政府的力量是无法完成的,这就决定了政府必须提高自身与公民或其他组织团体进行协作共赢的能力,充分利用社会群众的创新能力释放政府数据开放的潜在价值。例如我国目前在政府数据开放平台建设方面除了专门新建数据开放平台以及依托大数据交易平台或其他重点应用平台建设(如重庆)[6]之外,还有部分数据开放平台是依托政府门户网站来建设运行。依托政府门户网站建设数据开放平台的模式不仅增加了用户操作的繁琐程度,并且很容易使政府信息公开栏目与数据公开栏目存在交集,不利于用户体验和数据信息的获取。这种建设模式随意性较大,极易造成大量数据资源浪费,同时也无法解决数据开放口径不统一、数据共享难的问题。政府在面对诸如此类问题时,要将工作重心转移到如何拓宽合作渠道上来,考虑如何充分利用数据开发公司等社会团体的力量解决数据开放过程中的难题。单单凭借政府单方面的资源和技术不仅满足不了民意诉求,还会造成政府资源浪费和社会力量闲置。如何在政府数据开放过程中通过协作共赢在释放数据巨大价值、满足社会利益的同时降低政府自身成本、提高公共管理能力,是政府面临的又一大挑战。
(一)提高数据质量
1.盘活数据资产。对于数据的收集除了要广泛、全面之外,更重要的是如何盘活现有的数据资产,让政府手中的所有数据都能发挥其应有的价值,其中最为关键的环节就是消除部门间的信息孤岛。很多地方政府部门都建立了自己的数据开放的信息平台,但是部门之间相互独立、缺乏共享交流,形成了一个个数据孤岛,影响沟通协作,增加管理成本。因此可以考虑从纵向和横向两个方面来着手改善。一方面是要在上下级部门间建立统一的数据开放平台,另一方面也要实现水平方向的跨部门之间的数据资产共享和整合。将政府数据进行整合集中管理,再分别进行挖掘分析,方可进行盘活创新。
2.缩小数据鸿沟。在信息时代背景下,数据鸿沟已然从技术问题上升为社会问题。弥合数据鸿沟、缩小信息差别是落实科学发展观的内在要求,更是政府在数据开放过程中肩负的重大责任。如果政府所收集的信息持续遗漏部分群众的需求,其数据开放的成效会大打折扣。因此要加强农村和偏远地区的基础信息化建设,完善其宽带电信普遍服务补偿机制,充分考虑到在经济等方面处于弱势地位的群体的意向。政府收集数据的过程中要尽可能做到广泛、详尽,数据开放过程中要便于社会各个群体查询和获取,同时要打通反馈渠道、建立参与机制,确保用户的需求得到满足,并优先开放利于民生的和用户最为迫切需求的数据集。
3.保证数据真实性。数据造假现象的存在不仅在于统计方法上的疏漏,更与政府部门的自身利益息息相关。如果部门仅仅关注自身利益而忽视数据开放的潜在价值,就会选择性地只公开一些有利于自身发展的相关数据,甚至篡改、变更数据结果。要保证数据的真实性,可以从内部和外部两个方面来进行。一是改进统计方法,完善部门考核制度。部门内部可以从技术方面着手,利用大数据相关信息技术检验数据指标之间的关联性和真实性,避免数据开放的非人为性失误。二是要加强外部监督。将原始数据及相关分析结果及时进行公开,接受社会的审查。同时可借助第三方机构的力量,利用专业化测评考核方式对政府开放数据进行质量监测。
(二)加强隐私安全保护立法
1.制度层面,要建立大数据时代个人隐私保护的法律和行业规范。从立法角度来说,就是要完善现有的法律体系,并制定专门的适用于大数据时代的网络隐私保护法。法律本身的滞后性决定了大数据时代法律法规关于网络侵权的失效。现有关于数据开放的法律体系十分不完善,立法层级低、立法规定零散等问题突出,立法规范仅仅停留在鼓励和倡导数据开放层面,尚未确立数据开放应遵守的硬性原则。涉及国家及商业秘密的开放及其例外原则缺乏可操作性,没有有效的政策或机制让数据开放中的隐私保护问题有据可依。因此,要将隐私权作为一项独立的个人权利进行立法,对侵犯公众隐私权的行为罪责和惩罚方式及力度进行明确的规定。要规范数据开放中的个人信息保护问题,明确政府在进行个人信息采集过程中应遵循的规则,对恶意收集和传播他人隐私信息的行为给予严厉制裁。大数据时代的立法模式要注意结合大数据信息时代的背景和技术条件,将大数据隐私安全问题与法律规范相结合,制定适用于大数据时代特点的网络隐私保护法。
从行业规范和行业自律角度来说,就是要加强数据使用者的内部自我监督。因为数据使用者从另一个方面来说也是网络安全的侵犯者,同时也是数据二次利用的最大受益者,只有使用者自身意识到个人隐私保护的重要性,才能从根本上避免数据开放过程中隐私安全问题的发生。因此,大数据时代的隐私保护更应侧重于数据使用者的责任承担,让数据使用者建立起规范自身的机制,同时制定有效可行的行业规范,所有违反规范的相关人员都要受到行业内部的惩处。
2.技术层面。对于隐私安全保护来说,制度和技术是两个不可或缺的层面。制度是技术实施的保障,同时技术又将制度加以巩固深化。因此在加快制度建设的同时也要加强技术层面的提升,两者相互补充,才能更好地解决隐私安全问题。例如可以利用数字加密技术来防止入侵者窃取或私自更改重要的数据,确保数据的安全性和真实性,保障个人隐私安全[7]。或者通过分类分级的办法对个人信息采取保护措施。个人信息作为大数据的重要来源,具有数量庞大、种类复杂的特点,因此要对个人信息采取分类保护方法,即按照保护级别将个人信息分为个人身份信息、敏感信息、准标示符信息、公开信息以及日志信息[8]。除了公开信息以外,其他种类的信息均应纳入隐私保护的范畴,同时数据使用者应该根据不同的个人隐私级别制定实施不同的技术保障措施。
(三)主动及时回应舆情
1.政府数据公开要做到主动、及时,要以公开为常态,不公开为例外。我国各级政府在数据的主动积极公开方面还存在很大的提升空间。数据内容陈旧、不够详尽的应付式公开,互相推诿的消极被动式公开,维护自身利益、规避风险的选择性公开以及对公众的质问不予回应的单向度公开等等做法都对政府的公信力造成了不良影响。为此,政府在数据公开方面应做到积极主动、责任明确,对于公众需求且不涉及国家机密的数据全部予以主动开放并及时更新维护,让政府的工作细节全部暴露在阳光之下、聚焦于公民眼中,鼓励引导社会公众积极参与对政府数据的挖掘和使用,从源头上获取社会的信任,树立政府公信力,规避政务舆情的风险。
2.对于政务舆情危机和公民的质疑盘问要及时回应。随着政府数据公开的内容越来越庞大而复杂,公民从这些数据中发现的问题及产生的疑问和要求也就相应地增多。政府工作人员在这种网络民主日益扩大的趋势下必须具备一种全面把握信息和应对社会及媒体诘问的能力。如果政府工作人员们在面对网络问政时不知所措或是打官腔、说空话,就自然地会失去政府的威信力,也容易在社会公众中塑造一种漠视民情、办事不力的形象。
3.要增设网络舆情追惩机制。一是要利用数据开放中的网络监督进行技术反腐,通过广大社会群众的力量推进反腐斗争工作,对于网络舆情中反映出的行政问题要及时进行追查审核,并对当事人给予一定程度的处罚措施。二是要增强对信息的判断力和鉴别力,对于不正当的恶意言论要及时通过行政手段予以制止,并通过宣传教育加强民众对于网络舆论的鉴别意识,要做到客观公正、清醒独立,不被舆论所挟持,引导数据开放朝着健康高效的道路发展。
(四)与市场共同营造数据开放生态圈
政府与市场是政府数据开放系统中最重要的两大主体。政府负责将数据进行收集和开放,而市场负责将数据进行再加工和重新利用,两者相互补充,缺一不可。政府作为开放数据的提供者,要同时在数据管理和平台建设上下功夫。社会公众获取数据必须要经过市场上的数据开发公司。这些数据利用者在政府与社会公众之间起到了沟通反馈、缩小数据鸿沟的桥梁作用,在政府数据开放中的地位不可小觑。政府要将市场视作合作伙伴,在数据开放过程中充分利用市场的作用进行数据增值。一方面,数据开发公司相较政府来说信息技术更为先进,人才储备也更为完善,因此在数据平台的开发建设和大数据分析、云计算技术等方面可以为政府提供更成熟的建议和成果。政府将数据平台建设进行外包,不仅可以从不成熟业务中脱离,还能够提高数据开放的效率。另一方面,数据的开发者和利用者是数据开放的最大受益者,他们最知道自己对于数据的各类分析需求,因此能够对数据的增值再利用进行更为个性化的挖掘和开发。数据利用者的能力是十分关键的,机构用户、增值开发者、一手用户、二手用户等等是一个生态圈,每个群体都发挥着不同的作用,因此只需负责好自己职能之内的事。政府要做到不越俎代庖,不干涉市场,在此基础上实现合作共赢。政府各部门之间也要实现信息共享,从单兵作战型数据管理转向协作共享型数据管理,最大限度地发挥政府数据的附加经济价值。培养数据开放生态圈意识,让数据从产生到利用形成一个良性的正效益循环,数据开放的意义和价值才能得以体现。
[1]徐继华,冯启娜,陈贞汝.智慧政府—大数据治国时代的来临[M].北京:中信出版社,2014.
[2]原光,王艺.我国政府信息资源增值利用模式的创新[J].统计与决策,2009(16).
[3][6]张勇进.我国地方政府数据开放现状研究[J].中国行政管理,2016(11).
[4]创新2.0时代政府数据开放的挑战、困惑及探索[J].办公自动化,2015(22).
[5]陈懿.网络问责及完善对策研究[D].西北师范大学,2013.
[7]刘雅辉,张铁赢,靳小龙,程学旗.大数据时代的个人隐私保护[J].计算机研究与发展,2015(01).
[8]Peason S.Taking account of privacy when designing cloud computing services[c]//Proc ofthe 31stICSE Workshop on Software Engineering Challenges of Cloud Computing.Piscataway,NJ:IEEE,2009:44-52.
责任编辑:唐若兰
D035-39
:A
1008-6323(2017)02-0012-05
杨玉莹,安徽大学管理学院硕士研究生。
2017-01-11