杜小武 马美艳 刘军峰 赵需要
(西安石油大学经济管理学院 西安 710065)
继“物联网”“云计算”“移动互联网”之后,大数据时代也随之而来,政府信息公开也逐步嬗变为政府数据开放。大数据时代政府数据已经成为国家的战略性资源,做好政府数据开放,充分挖掘其内部价值,将极大推动国家的经济增长和社会发展。数据和信息本就是一体,“数据”是没有经过任何加工与解读的原始记录,不具有明确意义,“信息”是对数据的进一步加工和处理,具有一定的解释意义。
2009年奥巴马政府宣布实施“开放政府指令”是政府数据开放的起源。同年,美国政府开放数据网站Data.gov上线,是全球第一个政府数据开放平台。第二年英国政府数据开放网站Data.gov.uk也正式上线。英美的政府数据开放运动在世界范围内产生了深远影响,推动了我国由政府信息公开向政府数据开放发展。我国首次出现数据开放计划是在2015年4月国务院发布《2015年政府信息公开工作要点》。同年9月,国务院发布了《促进大数据发展行动纲要》,要求我国在2018年底前建成政府数据统一开放平台,并提出促进政府数据的深度挖掘和创新应用将创造出巨大的政治、经济和社会价值。
文章系统梳理了相关的研究动态,主要关注信息生态链和政府数据开放研究领域的文献,文献来源于《中国行政管理》《图书与情报》《电子政务》《图书情报工作》《情报杂志》《情报理论与实践》《情报科学》《图书馆学研究》《图书馆工作与研究》《图书馆》《图书馆理论与实践》等重要期刊。研究表明,政府开放数据生态链是在信息生态链概念的基础上发展而来的,因此文章首先分析信息生态链的研究动态,再对政府开放数据生态链的研究成果做出总结和研究展望。
F.W.Horton在1978年首次提出“信息生态(Information Ecology)”的概念,1997 年美国的Thomas H. Davenport提出 “信息生态学”并将生态理论引入信息管理中,将信息生态定义为“信息的整体管理”[1]。
国外关于信息生态领域的研究逐步开展,如运用信息生态理论分析数字图书馆的发展、网络信息生态以及电子商务信息生态现象等。S.Hannabuss提出了基于数学分析和统计学理论的网络信息生态的构建模式[2]。L.Moccozet构建了一个以用户信息交流和通信技术为主体的个人信息生态系统(PIE,Personal Information System)[3]。Hussain为应对全球气候变化,构建了可以捕捉到影响全球多区域变暖影响因素的数字信息生态系统。它旨在首先捕捉影响不同地区全球变暖的因素,通过分析因素之间的相互联系和相互作用,为宏观政策调整提供依据[4]。Francisco-Javier在解决数字图书馆和信息服务的冲击和演变问题时运用网络信息生态的理论,进一步阐述了信息生态的概念对数字图书馆和信息服务演进的影响[5]。E.Assadourian指出电子商务的发展离不开稳定的经济环境的支持,国家的经济环境是构成电子商务生态环境的成分之一[6]。Zhu Ling采用“全球经济智能体电子商务就绪度排名”的二手数据,利用跨国数据进行实证研究,分析国家信息生态环境对电子商务不同发展阶段的影响作用[7]。
国内最早研究信息生态系统的学者是李美娣,后来具有代表性的是娄策群的研究工作,其提出了信息生态系统是由信息、信息人、信息环境三大要素相互联系、相互作用构成的复杂的系统[8]。2007年韩刚提出信息生态链是由多种要素构成的信息共享系统,信息生态链中包含了信息、信息人和信息环境这些构成信息生态的基本要素[9]。随后,娄策群提出信息生态链是指在信息生态系统中,不同种类信息人之间信息流转的链式依存关系,信息人主要包括信息生产者、信息传递者和信息消费者三类[10]。目前,信息生态链理论已经开始涉及到具体的应用性研究,如网络信息生态链、商务网络信息生态链、电子政务信息生态链以及微博信息生态链等。近年来对信息生态链的研究主要有以下几个方面:
第一,关于信息生态链的概念、内涵研究。郑金帆提出信息生态链是由信息企业、信息机构和信息用户三大要素构成的结构网生态链[11]。李北伟以演化博弈理论为基础,认为网络信息生态链是信息人之间通过博弈形成信息流转的链式依存关系[12],并提出购物网站网络信息生态链的内涵是指在网络信息环境下,各信息主体之间以购物网站为平台,通过信息流动形成的链式依存关系[13]。张海涛对商务网络信息生态链的概念从“内涵”“外延”两个角度逐层进行分析,并从其组成要素出发构建网络信息生态链概念解析图,深入探讨商务网络信息生态链中的各种“关系”,以揭示其概念的内涵[14]。娄策群采用移植、分析综合、逻辑推理等方法提出网络信息生态链协同管理概念,并从四个方面——管理主体、管理对象、管理职能和管理目标对网络信息生态链协同管理概念进行解析[15]。
第二,关于信息生态链的结构模型研究。段尧清对网络信息生态链的表现形式、结构及其功能进行深入的研究,从三个视角——范围、行业和网络信息流转结构对网络信息生态链的表现形式进行论述,构建其基本结构模型和衍生结构模型并论述其结构模型的功能[16]。马捷通过分析节点特征和传播方式,得出社会公共事件网络信息生态链模型结构并针对其存在问题进行优化[17]。杨小溪阐述信息生态链的结构要素以及基本结构形态(线形信息生态链、环形信息生态链和网状信息生态链)的优缺点,在此基础上提出信息生态链结构优化的原则和方法[18]。娄策群指出网络信息生态链结构优化应包括节点素质、节点连接、节点组合、节点关系的优化,优化原则应遵循功效导向、整体优化、动态调整、突出重点相结合,并针对优化内容提出优化措施[19]。王建亚通过政务信息、政务信息人和政务信息生态环境三大组成要素间的相互作用关系构建政务信息生态链模型[20]。霍亮借鉴信息生态链的基本结构,对电子商务信息生态链四大组成要素——信息生产者、信息传递者、信息消费者、信息分解者建立一般模型,并提出相应的优化策略[21]。
第三,关于信息生态链的形成机理研究。马捷论述微博信息生态链形成需经历信息生产者的信息生产、微博关注关系网络的形成、评论与转发的发生三个必要环节,指出微博信息生态链的主观影响因素直接促成三个核心环节的形成,而部分客观因素可以激发主观因素,起到间接的促进作用[22]。张向先基于调查问卷分析方法,对社交网络信息生态链影响因素进行实证研究,分析其构成要素及形成机理[23]。随后,霍明奎分别对网络信息生态链形成机理进行研究,霍明奎从节点和节点关系形成两个方面阐述了网络信息生态链的形成过程,在此基础上提炼出网络信息生态链形成动力系统[24]。娄策群从根本动力、基本条件、主要方式三个方面对网络信息生态链形成机理进行研究[25]。
第四,关于信息生态链的运行机制研究。娄策群研究团队在此方面的研究成果最为丰硕,分别对网络信息生态链运行机制中的共生互利机制、协同竞争机制、价值增值机制、动态平衡机制以及信息流转机制进行研究,对网络信息生态链的健康运行具有理论指导意义和现实的实践意义[26-30]。
国际上对政府数据开放日益关注,国际组织为了对各国政府数据开放情况及效果进行评估,从不同维度进行了调研。2013年,万维网基金会和英国开放基金会分别发布了“开放数据晴雨表”全球报告和“开放数据指数”,随后,纽约大学政府实验室宣布启动“开放数据500”以及我国发布开放数林指数。美国政府致力于将一切由联邦政府创造、收集、处理的数据以免费及免予授权的方式向社会大众公开,供其开发和创新利用。2009年,美国政府宣布实施“开放政府指令”,2013年,出台《开放数据政策》行政命令,旨在利用政策法规保障政府数据开放的健康运行和发展,内容中指示政府须开放七大关键领域数据,并对政府数据开放提出了明确的实施细则。随后,英国、澳大利亚、印度等国家将重点转移到政府数据开放的战略部署工作中,政府开放数据运动在世界范围内产生了深远的影响。
近年来,国外学者对政府数据开放研究主要集中在以下两个方面。第一,关于政府数据开放价值的研究。Jae-Nam Lee指出国家政府数据开放对知识库的形成产生积极影响,国家的知识基础水平决定一个国家的全球竞争力,数据开放是通过形成知识库影响一个国家的竞争力[31]。Fatemeh Ahmadi Zeleti探索政府数据开放的经济价值,设计6-value业务模型框架,便于理解现有开放数据业务中的价值创造和开发机制[32]。第二,对现阶段政府数据开放存在的问题及解决方案的研究。Shamim Talukder基于发展中国家——孟加拉国的385份问卷答复进行实证研究,分析在发展中国家影响公众对政府开放数据的接受度和使用率的决定性因素,并阐明其他发展中国家在此方面面临的问题,为发展中国家提供了有价值的政策指导方针[33]。Mirvat Sewadeh研究现阶段美国政府数据传播面临的主要挑战,并基于一些联邦政府机构如何克服这些挑战的实例分析,为制定数据传播战略提供实践指导意义[34]。Mila对比了西班牙、美国、意大利的培训干预措施对提高政府开放数据水平以及提高用户使用技能的影响。研究表明将培训干预措施嵌入特定的背景中,并考虑到不同类型用户的独特特征、兴趣爱好和期望对政府数据开放的成功至关重要[35]。
目前,我国政府数据开放尚处于起步阶段,我国在2016年英国开放基金会发布的《全球开放数据指数》中排名第97位,中国台湾地区排名第一;在2017年第四版《开放数据晴雨表》中排名第71位,参与评估的国家达115个。这都意味着我国国家层面政府数据开放还处于比较落后的水平。我国在政府数据开放研究中是渐进性的、动态发展的。起先,学者的研究重点趋向于探讨国外政府数据开放实践经验及其对我国的启示。侯人华以美国数据开放网站(Data.gov)为例,分析其数据集特征、管理与利用方式,旨在为我国政府数据开放提供指导建议[36]。随后,学者们陆续总结归纳加拿大、澳大利亚、巴西、新西兰等国家政府数据开放的实践经验,以便给我国实施政府数据开放提供借鉴。其次,对国内政府数据开放现状研究。赵继娣剖析了地方政府开放数据研究现状,指出现阶段存在的主要问题并提出改进我国地方政府数据开放的一些对策[37]。刘新萍分析政府数据开放中存在的潜在风险并提出对策[38]。黄如花对比北京市和上海市政府数据开放的异同,并提出严格把控政策的“质”和“量”、对现有政策的薄弱环节进行补充、合理借鉴发达国家政策中的进步之处三方面的建议[39]。符嵘以上海市为例对政府数据开放主体进行研究,详细分析了四大开放主体,即政府、第三方研究机构、公民、媒体之间的博弈关系[40]。接着,有学者扩大研究范围,针对我国19个地区政府数据开放工作进程展开调研。曹雨佳建立开放数据生存状态标准,分为活跃、健康、濒危、死亡四个,对我国19个地方政府开放数据的生存状态进行调查评估,分析政府开放数据存在的问题,并提出现阶段我国必须制定相关法律法规,推广数据利用、扩大数据影响[41]。由于我国政府数据开放实践较晚,相关的法律法规不完善,政府数据开放过程中必然面临着数据安全和隐私泄漏等问题。曹雨佳以数据安全为视角分别对政府开放数据研究现状和政府开放数据生态系统构建进行研究[42-43]。赵需要分别针对政府数据开放中个人隐私和商业隐私泄露风险问题进行研究,并在识别泄露风险点的基础上提出相应的保护策略[44-45]。
随着政府数据开放方面的研究日趋成熟,对政府开放数据生态链的研究成为近期的研究热点,学者们起先关注到政府数据开放的健康运行需要构建健康和谐的政府开放数据生态系统,然后将研究重点转移到政府开放数据生态系统中最重要的结构要素——政府开放数据生态链。郑磊是我国政府数据开放研究的典型代表,认为政府、数据利用者和公众之间的互动关系,以及外部环境施加的影响都会影响开放数据生态系统的良性发展[46]。在其后发表的文章中指出政府、数据利用者、普通公众和外部环境共同决定着开放数据的最终效果,构成一个复杂动态的“生态系统”,从数据的生成、开放、利用、产生效果再到反馈是一个动态循环的过程[47]。赵需要指出政府数据开放不能仅仅依靠政府行政手段来运作,政府数据开放工作的顺利实施离不开和谐稳定的生态环境[48]。
目前对作为政府开放数据生态系统内部最重要的结构要素“政府开放数据生态链”的研究甚少,其对开放政府的建立有较强的理论指导意义,但现阶段仅有两篇学术论文发表。陈红梅等人认为政府开放数据生态链是在网络环境下为了实现政府开放数据共享,不同政府开放数据主体之间通过政府开放数据流转而形成的链式依存关系。在阐述政府开放数据生态链概念、结构、动力机制的基础上,确立政府开放数据生态链上图书馆的功能定位与服务创新[49]。赵需要对政府开放数据生态链的概念、本质与类型进行详细地剖析与阐述,认为政府开放数据生态链是指在政府开放数据生态系统中,无数的数据场(指数据存在及其作用的个别场所)通过数据的流转连接起来,从而形成某种形式的链式依存关系[50]。
目前关于信息生态及信息生态链领域的研究已趋于稳定,国外研究重点在于利用信息生态理论解决一些现实问题,而我国关注重点在信息生态链的相关理论研究。国外学者较早地提出了信息生态的基本概念、研究内容和研究工具,并且运用相关知识处理和解决现实中的复杂问题,但对信息生态链的形成机理、运行机制、演进规律等方面的研究略显不足。我国在国外有关信息生态的相关理论研究成果的基础上拓展了信息生态链的理论研究,涉及到概念、结构、形成机理、运行机制等多个方面。目前,信息生态链理论也逐步推进到微博信息生态链、图书馆信息生态链、商务网络信息生态链、政务信息生态链等。然而理论性研究成果较多,实证性研究成果较少;定性研究方法使用较多,定量研究方法涉及较少。
国外政府数据开放实践起步较早,研究比较成熟,相关的政策法规也比较完善。我国也是受到世界政府数据开放运动的影响,才认识到政府数据开放是大数据时代和互联网信息技术时代的必然趋势。国内学者的研究局限于对国外政府数据开放的实践经验总结以及对本国数据开放现状、问题、对策建议等方面的研究,虽然近年来逐渐从生态学视角认识到政府数据开放是一个动态的、复杂的、多参与主体相互作用的有机系统,但是对政府开放数据生态链的研究少之又少。研究方法上局限于对比分析、内容分析、调查访谈等定性研究,量化研究方面亟需补充完善。
关于政府开放数据生态系统和政府开放数据生态链研究的文献相对较少,大多数是以定性研究为主,量化研究极其匮乏。未来,学者们应将重点转移到对政府开放数据生态系统效能、系统优化以及政府开放数据生态链的形成机理、运行机制和演进规律等方面的研究,丰富政府开放数据生态系统以及政府开放数据生态链的理论研究。
(来稿时间:2019年5月)