刘建霞 焦洋洋
[摘 要] 随着大数据时代的来临,互联网的信息正以海量的速度不断涌现,位于主导地位的政府信息数据的变化亦是如此,为倾力打造透明、参与、协作的阳光政府,政府数据开放成为必然。只有洞悉目前政府数据开放的研究现状才能为研究者以后的深度研究奠定基础。对CNKI中所有与政府数据开放主题相关的文献分别从发文年代分布、刊物分布、高产机构作者等进行研究分析,以了解政府数据开放的发展态势。结果发现研究者对政府数据开放的研究仍不断深入,更加细化,近几年来政府数据开放依旧是学者们的研究热点。
[关键词] 政府数据开放;政府数据;文献计量
[中图分类号] G322.5 [文献标识码] A [文章编号] 1671-0037(2017)7-67-4
Preliminary Discussion on the Opening Literature of Chinese Government Data based on Bibliometric Analysis
Liu Jianxia Jiao Yangyang
(Zhengzhou University, Zhengzhou Henan 450000)
Abstract: With the coming of the era of big data, the information on the Internet is emerging constantly at tremendous speed, so are the changes of the government information data which are at the leading position, dedicating to create a transparent, participating, and collaborative sunshine government, thus the opening of government data becomes inevitable. Only insight into current research situation of the government data opening can lay a foundation for the future deep research of researchers. All the documents relevant to the subjects of government data opening in CNKI were studied and analyzed respectively from the publication time distribution, journal distribution, the authors of the high-productivity institutions, etc., to understand the development trend and situation of the government data opening. It is found that the researchers'study on government data opening is still going into more depth, and becomes more detailed, government data opening in recent years is still the research focus of scholars.
Key words: government dataopening; government data; bibliometrics
1 引言
信息通信技術的不断发展,web2.0时代和大数据时代的到来,使得信息的沟通更为便捷。公共部门在更为开放和透明的社会和政治环境下,面临着如何通过互联网和社会媒体等技术工具更多更好地向公众提供信息的压力[1]。美国data.gov.网站的建设伴随着信息主管的职能,开放政府数据在美国的应用得以实现,政府数据开放变得触手可及,随后英国、新加坡等国家也分别建设了政府数据门户,进一步加速了政府数据的开放。我国近几年来对于政府数据开放的研究有着迅速的发展,本文旨在通过对已有的政府数据开放的文献计量分析,以研究目前我国学者对政府数据开放的研究现状,并得出结论为以后的研究提供借鉴。
2 数据来源、研究方法
本文以“政府数据开放”为检索主题词,对中国知网的文献进行高级检索,可查得相关记录共计386条,人工去掉会议报纸类的文献,并通过人工甄别与此次研究不相关的其他领域内文献,进行精确匹配后最终确定以280条相关记录进行研究,选取的280篇论文均来自期刊和硕博士论文,以此作为研究对象。
本文主要通过对以下6方面进行研究,探索我国政府数据开放的发展现状以及研究趋势。根据得到的数据对近几年来每年研究者的论文数量进行统计,来判断目前学者对于政府数据开放的研究趋势,以此来判断该主题是否为热点主题;通过对高产作者发文量的统计分析,以得出该领域内的研究重点及前沿问题;通过对论文的来源期刊计量分析,以便了解政府数据开放所相关的领域,并且可以指导后续的研究者选择发表期刊;通过对高产机构的统计分析,去探索现阶段该主题的领先研究机构,进而可以深入该机构对该机构的文献进行深度分析,更加便捷地探索政府数据开放的研究现状;通过所选论文的关键词进行分析,可以从较浅层面去洞悉现阶段我国研究者对于政府数据开放研究的重点问题;进而尝试着对相关文献的主题进行概括归纳,得出目前研究者针对政府数据开放研究的内容和方向,并依照时间的发展顺序来分析每一篇文献,可以更加清楚地掌握政府数据开放研究的进展。endprint
3 文献计量分析
3.1 发文年代分布
在某一时间阶段的发文数量的多少,从一定程度上来说可以得出该时间内此主题的研究热度高低,从而决定该主题能否成为热点问题,从每年的发文量增长速度的快慢可以得出该时间内此主题的研究发展趋势的快慢。本文通过对获取的280篇论文进行年代统计,得出如图1所示文献时间变化曲线:我国学者对政府数据开放的研究始于2010年,随着阳光、透明、参与、协作的政府推进,我国学者对于政府信息公开的研究与日俱增,随之而来公众对于政府数据的进一步需求直接导致学术界亦展开对政府数据开放的崭新研究。2010年第一篇研究政府数据开放的论文,是由贵州大学计算机科学与信息学院的吴玥、李占羽合著的《基于关联数据开放政府数据》[2],从此在学术界里政府数据开放的研究实现了0的突破。通过表1可以看出,统计的280篇文献,其中接近一半的文献都产生于2016年,其次占据比例列数第二的文献数量属于2015年,由此可见最近两年学术界对于政府数据开放的研究极其重视,另一方面也可以得出这两年政府数据开放已成为学术界研究的热点课题。但是,从表中也可以看出,从2008年至2014年的发文数量总和为51篇,几年内的发文量总和依旧少于2015年和2016年任何一年的发文量,可见我国对于政府数据开放的研究起步较晚,前几年发展较慢。
通过下图1文献时间变化曲线可以看出:2008-2012年的发文量几乎处于平稳状态,可见我国对于政府数据开放的研究起步较晚,发展缓慢,但也因此政府数据开放成为了学术界的前沿课题之一;2012-2013这一年内发文量变化趋势微微上升,说明这一年内研究者对该主题的研究有了初步的发展;2013-2015这两年内发文量以线性上升趋势发展,可见这两年内政府数据开放的研究处于增长阶段,发展迅速;2015-2016这一年内文献的增长速度跟上阶段相比也有所降低,但是,发文量依然呈现上升趋势,表明对于政府数据开放的研究发展速度有所降低,然而研究成果依然在增多,究其原因,这两年对于政府数据开放的研究在2015年发展速度达到峰值,当对于某个前沿课题的研究发展到一定速度时,研究者对其的进一步研究存在一定的难度,但不影响发文量的增长。
3.2 发文期刊分布
根据文献分布的布拉德福定律,将期刊按其刊载的某专业论文数量的多寡以递减的顺序排列,则可以分出一个核心区和相继的几个领域[3]。据统计,该280篇文献分别来自137种不同的期刊硕士论文里。如下表2所示,把载文量大于2篇的期刊列至下表,观察表格可见电子政务的载文量位于第一位,载文量占全部文献数量的13.21%,可见该期刊在政府数据开放研究发表论文方面处于核心地位,其次,这12种高载文量期刊中属于情报学领域的核心期刊有5种,说明政府数据开放在情报学领域的研究起着举足轻重的作用,图情类期刊7种,因此,图情类期刊也是政府数据开放刊载文献的重要情报源。通过观察可得出位于高载文量期刊里的论文共计120篇,而一大半的论文都发表于其他类期刊,目前我国政府数据开放研究的论文发表期刊种类繁多,分布比较离散,不方便后期学者的研究。
3.3 机构分布
针对发文机构的分析,可以掌握论文的核心研究地区,可以为其他研究者提供参考。本文将收集到的280篇相关论文的来源机构发文量进行人工排序,其中发表两篇以上以政府数据开放为主题的论文的有11个机构,而发表两篇的有15个,本文主要选取发表论文两篇以上的机构,同时也列举了两个发表两篇论文的机构加以比较并进行图表展示,如图2:通过图2可知武汉大学(武汉大学信息管理学院,武汉大学信息资源研究中心)的发文量居于领先地位,一共发表论文22篇,占全部相关论文数量的7.86%,相应的,武汉大学对于政府数据开放的研究也处于领先水平,其次,黑龍江大学对该主题的研究位居第二,可见其研究水平也相当可观。虽然政府数据开放的研究属于新生课题、前沿课题,但是,在短短几年内已经引起众多机构的重视,说明未来这方面的发展前景极其广泛。
3.4 高产作者发文分布
根据收集到的所有数据,在众多发文作者里分别统计每个作者发表的论文数量,不难发现大部分作者仅发文一篇,即研究涉及到政府数据开放的学者较多,但研究层面相对较浅,28位作者发文达到两篇,以此表格中仅呈现的4名发文两篇的作者为例,这些作者对于政府数据开放的研究较为深入,并且很可能继续深入研究,这对于我国政府数据开放的文献研究将有积极的推进作用。如表3所呈现:来自复旦大学国际关系与公共事务学院的郑磊发文量多达10篇,可见其对政府数据开放的研究达到了相当高的高度,对其他研究者的研究提供了指导方向。夏以堃,黄如花发文量各达7篇和6篇,并且都发表于核心期刊,两位都是武汉大学信息资源研究中心的学者,可见其对政府数据开发的研究已经达到较高的水平。
3.5 关键词分析
根据收集到的280篇文献,对使用的关键词进行统计(部分文献不含关键词的除外),结果见下表4:本文主要对出现10次以上的高频关键词,按照出现频次的高低依次列举如下,所选的全部文献当中超过10次的高频关键词依次是:数据开放、大数据、政府数据、政府数据开放、开放数据、电子政务、开放政府数据、信息公开、开放政府、政府信息公开、政府开放数据。“数据开放”出现的频次多达62次,约占总文献数量的22.14%,分析的所有文献中“数据开放”的出现频次也处于领先地位,一定意义上可以推出目前研究者对政府数据开放研究的主要方向集中在数据开放,其次,随着大数据时代和Web2.0时代的到来,学术界对于政府数据开放的研究也紧密地与大数据结合开来。这11个高频关键词大部分围绕着政府、开放深化而来,可见对政府数据开放的研究近两年来已经不断深入,政府数据开放已经成为研究者研究的热点方向。
3.6 主题分析
从2010年的贵州大学计算机科学与信息学院的吴玥、李占羽合著的第一篇文献《基于关联数据开放政府数据》以来,我国学者对政府数据开放的研究有了崭新的开端,第一次提到采用Linked Data标准来发布开放的政府数据,可以提高政府数据的透明度,增强公民对政府的监督和问责。结合国内没有实现政府数据开放和共享的原因,总结出适应于国内发布开放的政府数据到Web的工作流程,即在确定所需要的数据源后,从各个部门收集数据,按照先发布后调解的原则,把语义描述的数据发布到Web中,将各种类型的数据形式统一转换成关联数据形式存储在RDF数据库中,在测试并调整后,语义发现数据及选择需要的服务,在异构系统进行交互的时候使用本体调解技术实现数据的合并、对齐或一体化,增加数据的重用。关联数据技术使得政府作为一个中心平台,用来满足来自商业、学术和开发人员对数据的广泛需求,最大限度使用各种类型的数据[1]。在学术史上产生了对政府数据开放研究的萌芽,有着举足轻重的作用。endprint
相继2011年以中国人民大学信息资源管理学院的侯少华、徐少同和浙江大学公共管理學院信息资源管理系的谭健为代表的两篇文献《美国政府开放数据的管理与利用分析——以www.data.gov为例》《开放数据及应用现状》对政府数据开放展开进一步探索。侯少华、徐少同以www.data.gov为例,从数据管理的视角,分别对其数据的特点、数据采集方式、数据管理策略、数据利用方式以及优势五个方面进行案例分析,旨在通过对美国数据网站的开放政府数据集特征、管理和利用的分析,揭示美国数据网站在信息公开过程中对数据信息资源的管理与利用方式、方法和水平,期望我国政府信息公开网站建设时可以借鉴。首次对美国政府门户网站的管理利用进行分析以指导我国政府数据开放的发展方向。谭健则通过探讨开放数据在科学学术交流、Web2.0时代信息组织中的愿景,重点介绍了开放数据在当今电子政务中的应用现状,以及非营利性组织、企业对开放数据的推动情况[4]。
2012年以来的研究依旧针对政府数据开放在发达国家的应用进行分析,初步从对美国的研究扩展到同时对英国的数据开放的研究以探究对我国政府发展的启示,进而对关联数据有了新的研究进展。以武汉大学周和为代表的文献《开放政府与政府数据公开战略》,首次对于政府数据公开的战略进行了探索,以美国政府数据开放的进程为例对开放政府进行详细解读,初步探索出政府公开数据的3个战略,即:一是合理地开放政府信息;二是扩大信息公开和敏感信息的保护;三是提高政府信息的可及性[5]。在此阶段我国政府数据开放的研究依然处于平稳发展的初级阶段。随着2013年—2014年本领域内文献数量的增长和积累,学者们针对政府数据开放的研究有了进一步的进展,大部分文献主要通过对“政府数据”“数据开放”“开放政府”“政府数据开放”等相关词的概念进行具体分析,并通过对发达国家如美国、英国、新加坡等国家数据开放网站的研究,从而探求一种适合我国国情的政府数据开放策略,同时针对国内发达城市的政府数据开放的探索性实施进行研究总结。自2015-2016两年论文数量的突飞猛进,我国对政府数据开放的研究出现新飞跃,对于我国政府数据开放平台的构建,政府门户网站的建设有了种种设想,同时许多学者更深入地研究如何深度开放政府数据,使公众可以通过一站式服务快速地获取所需数据,进而实现数据的再次利用,实现增值服务。另有部分学者对于政府数据开放平台的评估分析,以及数据开放中个人隐私保护已经成为较为深度的研究方向。同时,对于政府数据开放的外延问题,如政府数据开放的法律问题的研究、政府数据开放中公共图书馆职能作用的研究都已经成为目前政府数据开放研究的新方向。
4 结果讨论
对所有发文的年代数量分布、文献期刊发文量分布、机构分布、高产作者分布、高频关键词分布和文献主题分析,发现我国政府数据开放的研究起步较晚,现今仍然处于初级阶段,我国政府数据开放的程度也相对较为迟缓。信息技术迅速发展的今天,用户信息交流更为便捷,公众对数据信息的需求量也与日俱增,政府数据开放势在必行,对于政府数据开放的深度研究在近几年里仍然是个热点课题。
5 结语
本文侧重于定量分析学者们对于政府数据开放研究的相关文献,选取的文献范围仅包括中文文献,范围较窄,主题内容层面分析较为浅显,统计计量数据均为人工操作,部分数据难免存在误差,但是,整体发展趋势可以为其他研究者提供方向,为学术界进一步的研究提供借鉴。
参考文献:
[1] 徐慧娜,郑磊.国外政府数据开放研究综述:公共管理视角[J].电子政务,2013(6):2-7.
[2] 吴玥,李占羽.基于关联数据开放政府数据[J].电脑知识与技术[J],2010(11):8688-8691.
[3] 尚新丽,史双青.我国信息经济学研究的文献计量分析[J].图书馆理论与实践,2012(3):25-27,48.
[4] 谭健.开放数据及其应用现状[J].图书与情报,2011(4):42-47.
[5] 周和.开放政府与政府数据公开战略.广州大学学报,2012(10):11-16.endprint