国外政府数据开放研究*

2014-12-31 09:13迪莉娅
图书馆论坛 2014年9期
关键词:利用政府信息

迪莉娅

1 相关概念的界定

政府数据是指一切产生于政府内部或虽然产生于政府外部,但对政府活动、公共事务和普通民众有影响、有意义的数据资源的统称[1]。政府拥有整个社会信息资源的80%以上,是数据最大的生产者和拥有者。政府数据的开放成为越来越多民众的诉求和政治开明以及经济、文化发展的重要标志。从世界范围看,政府的开放首先从信息公开开始,但在2009年美国奥巴马政府颁布《开放政府指令》之后,世界范围内又掀起政府数据开放的浪潮,政府数据的开放加深和拓宽了政府信息公开的力度,也预示着政府开放和透明进入了新的里程碑。

在解读政府数据开放的概念中,必然涉及到数据与信息的概念以及它们的关系,对此概念和关系学界有多种提法,其核心含义基本一致,例如信息是被加工成对接受者有意义的数据[2],信息等同于数据+意义[3],信息是已经被解释和被接受者所理解的数据[4],数据需要被解释和加工才能成为信息[5],数据是被加工和提炼成信息的原材料等[6](见图1)。

图1 从数据到知识的转化过程图[7]

虽然关于数据和信息的关系学界基本上达成共识,但政府数据开放的含义和粒度的认识却有所不同,可总结为三种:(1)数据开放就是数据链的开放。开放数据所指数据应从数据链的角度予以理解,它是包含所有事实、数据、信息、知识、智慧所组成的数据。它不是单一的数据链上的某一种元素,而是呈现的一种集合数据形式[8]。(2)数据开放=数据+信息的开放。政府数据开放是指由政府和政府控制的实体生产和委托所产生的数据和信息的开放[9]。(3)数据开放就是原始数据的开放。政府按照用户特定的需求和一定的互联网协议、规则、框架,对Web数据进行存储和组织,而利用的数据或来自不同的数据源或是不同的数据类型,最终目标是实现数据在网络空间的开放、共享与重用[10](见图2)。

图2 数据开放的粒度分析图

对首提政府数据开放的奥巴马政府来讲,数据开放的初衷是指原始数据(raw data)的开放,在政府数据开放的八大原则中第二原则指出“数据必须是原始的”。本文所指的数据开放也是指原始数据的开放,因为数据用最小的粒度呈现给用户,让不同的用户各取所需,自己决定怎样组合它们,数据才能发挥全部的潜在价值[11]。

2 政府数据开放的价值

政府数据开放是政府信息公开的进一步发展,数据是信息的前身,而原始数据的开放是政府信息资源深层次开放和利用的标志。由于开放的政府数据具有非竞争性、非排他性、高价值并可重复利用等特性,这就决定了数据所产生的价值并不一定由资源的所有者甚至是价值的创造者所拥有。并且在大数据背景下,多方相关利益者之间价值的生成和分配本质上也是多元的。

2.1 政治价值

早在1914年美国大法官Brandeis说:阳光被认为是最好的消毒剂;灯光是最有效的警察[12]。第一,政府数据开放给政府部门带来的首要价值是促使政府更加透明。透明意味着由公共部门推动社会价值的一种行动,是认识信息、透明度和民主之间关系的基本原理,它本身就是一场革命[13],这将促使政府的决策和服务更加开放和透明。第二,提高政府效能。政府数据的开放有助于打破政府各部门间、政府与公民间的固有边界,“信息孤岛”现象将有可能大幅度削减,数据共享有望成为现实。开放数据可以提供政府决策所需要的基本信息支持,提高政府各机构协同办公的效率和为民办事的效率,极大地提升政府的治理能力和公共服务能力。第三,促进和加强公民参与公共事务的兴趣和能力。因为公民获取的信息越多,参与政府事务的可能性就越大。利用信息是公民了解政府做什么的第一步,同时也为公民参与公共事务奠定了基础。但是这种开放超过了简单的利用信息的需求,通过技术的开放性和法律的开放性向公民提供更大的自由和潜力参与公共事务[14],甚至也为合作打下了基础。例如,在政府数据开放的推动下,2011年印尼政府建立了公众参与信息系统,该系统可以让公民实时的检测和核查政府提供的服务,并且还可以利用信息改进教育、卫生、能源与国防资源分配的方式[15]。

2.2 经济价值

政府数据开放的经济价值首先是为大数据产业的发展创造良好的环境。因为数据的“流动性”和“可获取性”是大数据产业发展的重要基础[16],而数据开放是产业发展的前提。率先制定政府数据开放政策的美国的实践证明,大数据的利润最终只能来源于“开放数据”,包括“开放政府的数据”“开放企业的数据”等,对催生和发展数据产业起到了积极的推动作用。其次,体现在政府数据的再利用上。2010年欧盟公布的《数字议程》指出:公共领域的信息是欧洲信息重要的资源,再利用数据的市场价值将有320亿欧元,公共数据可以产生新的商业和工作机会,给消费者提供更多的选择机会和更有价值的商品[17]。再次,数据的创新性利用。数据的利用、再利用和创新性利用是数据产生价值的三个层次,其中创新性利用数据是价值产生的核心。因为数据具有不会被它所激发的思想和创新消耗的特性,相反,它可以为创新提供无穷的燃料。因为这些创新型的应用,数据的能量得到层层放大[18]。因此,美国、英国、加拿大等国家都通过数据门户,设立高额奖金,通过“开放竞赛”“创意竞赛”等方式鼓励公民创新性使用数据,取得了很大的收益。例如,美国利用政府数据的开放,开发了近400多个app应用,如RAIDSOnline,该应用为市民提供了列克星敦市发生盗窃、抢劫、车祸、暴力等多种犯罪地理位置的示意图,市民可以根据该地图有效地做好防御,从而降低犯罪率的发生,提升城市的安全性[19]。

2.3 文化价值

政府数据是社会的基础数据,没有它的开放,整个社会的数据整合就难以论及,通过在数据整合上的分析,把最终的决策建立在数据和事实之上,促进了基于数据的决策文化的形成。可以说,数据不仅仅是一种权利,更是一种文化,而每个人在有效使用数据的文化的培养中发挥着重要作用,这种文化的改变并不能仅仅诉诸于供应商或者立法的渠道,数据文化的形成需要嵌入到整个机构系统中。根据哈佛商业评论的调查发现,如果机构广泛使用数据,至少有50%以上的机构能够改善财务绩效。广泛的使用数据分析,可以增加生产效率、减少风险和帮助人们做出更快更好的决策。在一个数据驱动的企业当中,员工变得更加积极主动和具有创造性,更容易产生新的思想。管理者则利用数据分析工具测试这些新的思想,提供反馈,鼓励合作和创新[20](见图3)。

图3 数据文化形成过程图

数据是信息化时代的“石油”。未来国家的核心竞争力将很大程度上依赖将数据转化为信息和知识的速度与能力,而这种转化的速度和能力,实际上则取决于数据方面的技术和管理应用到政府、企业决策方面的文化的形成。

3 国外政府数据开放的特点

3.1 政策先行

顶层设计政策是很多国家推动数据开放的重要举措,一来可为政策的执行指明方向和有效实施提供保障,二来减少政策实践的成本,避免重复建设和资源浪费。自2009年以来,美国、澳大利亚、丹麦、欧盟、英国、日本等相继制定数据开放政策[21](见表1)。

表1 各国(地区)制定数据开放政策时间表

3.2 法律保障

为应对数据开放涉及的用户隐私和安全问题,欧美普遍的做法有两种:第一,制定新的网络数据保护的法律;第二,修改原有的与信息相关的法律,为数据的开放和利用提供法律保障。其中美国为应对数据开放的挑战,2012年制定和颁布了《消费者数据隐私保护法案》,用来提高个人隐私权的保护以及个人信息在互联网环境中使用的保护。该法案中提出消费者的7种权益[22]:(1)个人控制信息的权益。消费者有权对数据企业收集个人数据的内容以及如何使用数据进行控制;(2)透明性的原则。消费者有权方便读取和访问涉及隐私和安全问题的信息;(3)尊重数据背景的原则。消费者有权要求公司收集、使用和公开的个人信息与消费者提供数据时的背景保持一致;(4)安全的原则。消费者有权对个人数据得到保证的安全;(5)可访问和准确性的原则。消费者有权利访问和修改个人数据,确保数据敏感性以及错误数据带来不良后果的风险适度;(6)限制收集的原则。消费者有权对企业收集和保留的个人数据进行合理的限制;(7)责任性原则。消费者有权要求公司采用正确的方法处理个人的数据,以确保与消费者隐私权保护法案保持一致。

澳大利亚和欧盟则采用修正或改革法案的方式,加强数据开放带来的隐私和安全问题的保护。澳大利亚提出政府和企业收集公民的信息时要受到严格的控制,必须服从一系列的法律规定,例如1982年的信息自由法案、1983年的档案法、1997年的电信法案、1999年的电子交易法案、2001年的情报服务法案。这些法律文书作为有效的安全的信息库和公民信息管家来维护公众对政府的信任。欧盟的数据保护指令实行于1995年,当时互联网的使用并不普遍。但到目前为止,27个成员国对该法令的认识各不相同,因此在推行过程中产生分歧。2012年1月欧盟委员会提出全面改革1995年数据保护的指令,加强网络隐私权利的保护和促进欧洲的数字经济。

3.3 数据门户的共享和共建

为促进政府数据的广泛利用,通过建立专门的数据门户网站为公民提供服务,成为很多国家进行数据开放的重要方法。政府在网上公布的数据具有以下特点:(1)数据公开合法性,皆由官方许可公开,并符合法律对信息公开的规定;(2)数据格式多样性,包含RAW、CSV、RDF、XML、JSON;(3)数据机器可读性,便于用户或第三方开发者进行分析、综合与集成,实现数据混搭、可视化和关联数据发布等[23]。最早建立数据网站的美国在2009年开通www.data.gov数据网站;随后,英国、加拿大、欧盟、印度、澳大利亚等建立专门的数据网站公开政府数据(见表2)。

表2 各国(地区)数据资源开放表

3.4 数据的有效管理模式

如何有效采集数据、整合数据、发布数据和利用数据是数据门户可持续发展的核心。各国的数据门户管理方法虽然有所不同,各具特色,但在以下几个方面已成为趋势:

(1)数据群的建设。“数据群”是指将从不同机构获得的数据,整合到一个大主题下,如:“健康”“教育”“商务”的数据分类方法[24]。美国的数据门户网站共建立了农业、教育、能源、健康、法律、消费者等17个不同类型的数据群。而印度的数据门户数据群还在发展中,但已经有了健康、农业、统计等5个数据群。数据群以数据内容为分类依据,涵盖各个领域,为公民快速、便捷的查找数据提供方便(见表3)。

表3 各国(地区)数据门户管理结构表

(2)关联开放数据的应用。关联数据是国际互联网协会(W3C)推荐的一种用来发布和联接各类数据、信息和知识的标准。通过在现有的万维网基础上,建立一个映射所有自然、社会和精神世界的数据网络,通过对事物及其相互关系进行机器可读的描述,使互联网进化为一个富含语义的、互联互通的知识海洋,从而使任何人都能够借助整个互联网在更大范围内,准确、高效、可靠地查找、分享、利用这些相互关联的信息和知识[25]。关联数据具有以下特性:①使用URI作为任何事物的标识名称,不仅是标识文档;②使用HTTP URI,使任何人都可以参引这一全局唯一的名称;③当有人访问名称时,以RDF形式提供有用的信息;④尽可能提供链接,指向其他的URI,以使人们发现更多的相关信息[26]。

由于关联开放数据充分借鉴了Web网络的泛在性、分布性与链接性,并广泛采用语义网技术模式,因而能够实现全球范围内数据的开放互联,并构建富含语义的数据网络,从而为数据的开放共享提供现实可行的途径,并提高数据的透明度和促进机构以及个人之间更为广泛的合作交流。关联数据的应用也是政府促进数据开放和再利用的重要方式,英国、欧盟采用关联开放数据的方式,连接不同的资源,促进数据的创新性使用(见表3、图4)。

图4 欧盟数据门户关联开放数据结构图[27]

(3)用户的参与。大多数的政府数据门户都很重视公民的参与,基本上在网站上都建立了博客、信息定制和专门的信息交流服务。例如美国的数据门户、英国的数据门户、澳大利亚的数据门户不仅具有提交数据集、网络应用的请求、以及就服务进行在线评论等功能,而且数据门户的信息可以与Youtube、Facebook、Twitter等多个社区网站链接和共享信息(见图5)。

图5 美国数据共享社区截图

除在数据门户上提供用户参与的频道外,许多国家和政府在推广数据门户方面还采取了很多措施(见表4)。

表4 各国推广数据应用的措施[28]

4 国外政府数据开放对我国的启示

(1)制定我国政府数据开放政策。数据增值的关键在于整合,但自由整合的前提是数据的开放。在大数据时代,开放数据的意义不仅仅是满足公民的知情权,更在于让生产资料、生活数据自由地流动起来、全面应用起来,以推动知识经济和网络经济的发展,促进我国经济增长由粗放型向精细型转型升级[29]。制定政府数据开放的政策是促进信息深度公开、信息利用、重新利用和创新性利用的前提,是我国大数据产业的重要条件,而且对整个社会效率的提高、政府工作的透明度和社会的创新具有重要的意义。例如,1983年美国将原本用于军事的卫星定位系统GPS向公众开放使用,并且在2000后取消对民用GPS精度的限制。从汽车导航、精准农业耕作到物流、通讯等,GPS开放后不仅服务于生产和生活等领域,还创造了大量就业岗位。据估算,仅美国就有约300万的就业岗位依赖于GPS[30]。同样对交通、气象、公安等数据的开放则会对缓解交通、控制污染、降低犯罪率等领域都会产生积极的作用。

(2)制定国家数据安全和网络用户隐私保护专门的标准和法律。大数据环境下数据的开放,信息安全和个人隐私的保护面临挑战:大数据的聚集与分析加速了个人隐私的泄漏。由于在大数据环境下可将来自电子邮件、社交网络、传感器等各种格式的数据汇集在一起,其中包含个人、企业的客户资料等各种属于个人的敏感数据,但我国并没有制定网络环境下的个人信息保护法,因此在利用大数据技术进行分析或者利用的情况下,难以避免个人隐私的泄漏。另外,随着数据开放的发展,大数据的汇集和利用成为重要的资产,因为在这些资产中蕴含着重要的宝藏,成为很多黑客攻击的目标。而且黑客也在不断地更新技术攻击大数据,即利用大数据技术攻击大数据[31]。因此,各国都在积极研发大数据安全技术和制定相关法律应对大数据的挑战。这就需要我国要自主研发大数据安全技术,制定数据技术标准和运营标准,尽快制定关于数据主权划分、数据安全和个人隐私保护的专门的法律,为我国数据的开放创造健康的环境。

(3)建立统一、集成的政府数据门户。所谓统一与集成是指数据门户在统一管理、统一标准、统一规范的方针下建立起来的信息共建、信息共用和共享的网群体系,具体做法有:第一,通过充分利用云计算技术,实行分布式的管理方式,建立纵向与横向的数据供应链,即:纵向的数据链包括中央、省、市、县等发布的数据集;而横向数据集则包括教育部、财政部、工信部等部门发布的数据集。通过数据网为用户的数据利用提供集成的服务,同时避免服务方面的数据孤岛和重复建设的问题。第二,充分利用Web2.0技术,加强数据网的博客、QQ、RSS、维基等功能,促进政府与用户的互动交流,提高用户的参与度。第三,加强语义网技术的应用,提高数据门户数据的整合、关联、分析的能力,为用户提供丰富的“智慧”性数据打基础。第四,加强数据网移动技术的应用,深入分析移动互联网用户的需求侧重点,针对移动用户访问时间碎片化、地理位置属性强、硬件局限性(屏幕尺寸、续航能力)等特点,注重引入基于位置的服务,随时随地感知移动用户需求,有效组织相关信息和服务,满足移动互联网用户的多样化需求[32]。

(4)建立有效的数据管理机制。第一,需要建立数据主管部门,专门负责数据的管理、审查和发布工作。数据门户是纵、横合一的网站,涉及到众多部门和领域公共数据的公开,须由专门的数据主管负责数据的审查和发布,可以避免所发布的数据信息涉及隐私、保密、安全等法律规定,并且对政府部门应发布的数据质量和数量给予监控,以保证数据发布工作的完整执行和公众相关数据需求的满足[33]。第二,建立有效的数据管理体系。通过建立一套完整的元数据分类体系,将数据网上XML、CSV、KML、KMZ、XLS等多种格式的数据整合在一起,通过多元的检索途径、分析工具与应用程序,方便用户查找和利用数据内容。第三,建立“以公众为中心”的理念,积极推广数据的使用。公众的参与和使用是政府开放数据的核心精神之一;政府开放数据的实行,集合公众的专业素养与知识来协助政府解决公共事务问题,让公众可以借由政府开放数据来参与公共事务,并期许能从政府数据再利用上创造出新的经济价值与创新式的利用数据[34]。同时,通过公众的参与,发现用户的需求和对质量的反馈,可以更好地满足公众的个性化的需求和改进数据服务的质量。

5 结语

在大数据环境下,数据将成为这个社会发展新阶段重要的生产资料、创新的动力,数据整合将成为知识经济的新亮点。数据开放成为信息时代最重要的一种权利[35]。本文以界定政府数据开放的含义为切入点,阐述了政府数据开放所带来的政治、经济和文化价值,并重点分析了国外政府数据开放的特点及对我国政府数据开放的启示。

[1] 李绪蓉,徐焕良. 政府信息资源管理与开发[M]. 北京:北京大学出版社,2005:56.

[2] Davis G B,Olson M H. Management Information Systems [M]. New York:McGraw Hill,1985:34.

[3] Checkland P B,Scholes J. Soft systems Methodology in Action[M]. Chicester,UK:John Wiley and Sons,1990:303.

[4] Lucey T. Management Information Systems [M]. 6th ed. London:DP Publications,1991:21.

[5] Warner T. Communication Skills for Information Systems[M]. London:Pitman Publishing,1996:45.

[6] Silver G A,Silver M L. Systems Analysis and Design[M]. MA:Addison Wesley,1989:64.

[7][11][18]涂子沛.大数据:正在到来的数据革命[M].桂林:广西师范大学出版社,2012.

[8] 李佳佳. 信息管理的新视角:开放数据[J]. 情报理论与实践,2010 (7):36.

[9] Alexandre Lopes Machado,Jos’e Maria Parente de Oliveira. DIGO: An Open Data Architecture for e-Government [R]. [S. l.]: 15th IEEE International Enterprise Distributed Object Computing Conference Workshops,2011:56.

[10] 吴旻. 开放数据在英美政府中的应用及启示[J]. 图书与情报,2012 (1):128-129.

[12] Brandeis L D. Other people’s money [EB/OL]. [2013-12-12]. http://www.law.louisville.edu/library/collections/brandies/node/196/.

[13] Harrison T M,Guerrero S,Burke G B,et al. Open government and e-government:democratic challenges from a public value perspective[C]//The Proceedings of the 12th Annual International Conference on Digital Government Research:Digital Government Innovation in Challenging Times. College Park,MD :[s.n.],2011:245-253.

[14] UN Department of Economic and Social Affairs. Open Government Data for Citizen Engagement in Managing Development[EB/OL].[2013-12-13]. http://workspace.unp an.org/sites/Internet/Documents/OGDCE%20Toolkit%20v1.13-Feb2013.pdf.

[15] McKinsey and Company. Innovation in Government:Indonesia and Colombia[EB/OL]. [2013-12-15]. http://www.mckinsey.com/insights/public_sector/innovation_in_government_india_and_estonia.

[16] 障碍:数据的“流动性”和“可获取性”[EB /OL]. [2013-12-16]. http://www.d1net.com/storage/news/202938.html.

[17] Communication Commission. Open Data -an Engine for Innovation, Economic Growth and Transparent Governance [EB/OL]. [2013-12-03]. http://eur-lex.europa.eu/LexUriServ/LexUriServ.do?uri=COM:2011:0882:FIN:EN:PDF.

[19] 张玉梅. 公共数据开放的国际经验———基于公共数据开放门户网站分析[J].信息系统工程,2013(7):89.

[20] Global Survey:Analytics Fuels Data-Driven Culture,Innovation [EB/OL]. [2013-12-30]. http://www.businesswire.com/news/home/20120927005159/en/Global-Survey-Analytics-Fuels-Data-Driven-Culture-Innovation.

[21] 美国:Apps.gov 网站作为政府“一站式云服务”门户[EB/OL]. [2013-11-12]. http://roll.sohu.com/20121010/n354588226.shtml.

[22] White House. Consumer Data Privacy in a Networked World:a Framework Protecting Privacy and Promoting Innovation in the Global Digital Economy[R].[S.l. :s.n.],2012:32.

[23][33] 侯人华,徐少同. 美国政府开放数据的管理和利用分析———以www.data.gov 为例[J]. 图书情报工作,2011,55 (4):119-122.

[24] 陆健英,郑磊,Sharon S. Dawes.美国的政府数据开放:历史、进展与启示[J].电子政务,2013(6):29.

[25] Structured Dynamics LLC. Linked Data FAQ[EB/OL].[2013-11-26]. http//structured dynamics.com/linked_data.html.

[26] Berners-Lee T. Linked Data[EB/OL]. [2013-11-18].http://www.w3.org/ Design Issues/LinkedData.html.

[27] The European Data Model[ EB/OL].[2013-11-06].http://pro.europeana.eu/web/guest/tech-details.

[28][34] 杨东谋,罗晋,王慧茹,等. 国际政府数据开放实施现况初探[J]. 电子政务,2013 (6):16-25.

[29] 大数据面临的问题与挑战[EB/OL].[2013-11-06].http://www.enet.com.cn/article/2013/0701/A20130 701293898.shtml.

[30] 开放数据平台是打开“智慧城市”的钥匙[EB/OL].[2010-12-07]. http://www.southcn.com/jsfw/zxdt/content/2013-06/08/content_70656335_2.htm.

[31] 冯伟. 大数据时代面临的信息安全的机遇和挑战[J].中国科技投资,2012 (34):51.

[32] 于施洋,王建冬. 政府网站分析进入大数据时代[J].电子政务,2013 (8):79.

[35] 数据开放也是一种竞争[EB/OL].[2013-11-07]. http://news.cnxianzai.com/2012/08/430395.html.

猜你喜欢
利用政府信息
利用min{a,b}的积分表示解决一类绝对值不等式
利用一半进行移多补少
知法犯法的政府副秘书长
利用数的分解来思考
Roommate is necessary when far away from home
订阅信息
依靠政府,我们才能有所作为
政府手里有三种工具
展会信息
完形填空三则