王熙涵 纪向新
(1.黑龙江大学信息管理学院 黑龙江哈尔滨 150080;2.吉林铁道职业技术学院图书馆 吉林吉林 132002)
随着信息技术与人类生产生活的交汇融合,互联网快速发展,引发了数据的爆发式增长,“大数据”“开放数据”等相关内容正日益成为人们关注的焦点。2015年8月31日,国务院印发《促进大数据发展行动纲要》,提出要加强顶层设计和统筹协调,大力推动政府信息系统和公共数据互联开放共享,完善法规制度和标准体系,切实保障数据安全[1]。2017年12月8日,中共中央政治局就实施国家大数据战略进行第二次集体学习,习近平总书记在主持学习时强调:“我们应该深入了解大数据发展现状和趋势及其对经济社会发展的影响,分析我国大数据发展取得的成绩和存在的问题,推动实施国家大数据战略,加快完善数字基础设施,推进数据资源整合和开放共享,保障数据安全,加快建设数字中国。”[2]
加强对开放数据相关问题的实践及理论探讨,已经成为社会各层面关注的焦点。图情领域的相关学者对开放数据相关内容给予了极大的关注,进行了深入的研究,产生了一系列的成果。本文利用文献计量的方法,通过中国知网学术文献总库,从文献增长规律、研究热点、高产作者等角度对我国开放数据领域的研究文献进行分析,试图探寻出我国开放数据领域的研究全貌。
为了更好地反映出国内现阶段对开放数据领域研究的进展情况,本文选用文献计量学的研究方法。在中国知网(CNKI)数据库中,以“主题=开放数据”或“主题=数据开放”为检索条件,时间范围为2007年1月1日至2017年12月31日,检索出的初始文献一共为1982篇。再将初始文献从发布时间、主题词、机构名称等方面筛选比对,剔除与开放数据领域研究无关的记录,最后确定我国开放数据领域研究文献1806篇。
(一)文献增长规律分析。文献的数量变化能够反映出科学研究的关注度高低,能够体现出科学研究成果的多少。因此,可以通过研究文献的时间分布及增长规律,总结出某一时间内相关领域的科学研究发展状况。
从文献时间分布的整体情况来看,自2007年以来,我国开放数据领域研究文献量呈逐步增长的趋势,经历了科学研究的初始期、成长期和成熟期。2013年是文献发布情况的分水岭,2013年以前发表论文共67篇,那时国内对开放数据方面的研究情况还处于初步发展阶段,也即初始期。从2013年开始,随着数据技术的不断发展,大数据、开放数据成为人们关注的焦点,文献量逐年递增,呈明显上升趋势,这个阶段即由成长期逐渐过渡至成熟期。自2015年开始,发文量明显多于之前年份,说明自2015年起,我国对开放数据领域的科学研究进入到高峰期,并持续发展至今日,较为成熟稳定。
(二)文献来源。根据统计,我国开放数据领域文献来源主要分布在期刊论文、学位论文、会议及报纸论文之中。在这1806篇文献中,64.44%的文献来自于期刊论文,超过了学位论文、会议、报纸及其它文章的总和,表明了在开放数据领域的科学文献中,期刊论文处于核心地位。而作为开放数据领域研究的有力推动者,各大高校的研究者们所发表的博硕论文占有将近10%的比重,发出了来自高校的强有力声音。除此之外,发表在国内各大会议及报纸的文献,也反映出学者们对开放数据领域的关注。
(三)研究热点。关键词是一篇文献主要内容的概要,高频关键词能够反映出特定领域的研究热点。通过对1806篇有效文献进行深度分析,可以获得我国开放数据领域关键词分析表,从而分析得出该领域的研究热点。
开放数据领域共涉及15大关键词,其中,“大数据”“开放数据”“政府数据开放”等关键词出现频率较高。对高频词进行分析后,可以归纳出开放数据领域的研究热点,主要分为两大类。第一类侧重于对“开放数据”含义本身进行研究,由理论再向实践过渡,同时强调信息技术的重要性,主要涉及大数据、关联数据、大数据思维等内容;第二类侧重于对“政府数据开放”方面的研究,通过政府信息公开、电子政务、开放政府等内容对这一重要方面进行了阐释。此外,近几年社会热议的话题,如“共享经济”“智慧城市”等也在开放数据领域中被发现,研究者们提出了“数据共享”等概念,体现出了该领域研究的与时俱进。
(四)高影响力文献。我们在中国知网选择下载某一领域相关的文章时,除了查看发文时间、作者、主题词外,最重要的两个影响因素就是被引次数和下载次数,而被引次数更具权威性。一般来说,高影响力文献也可被称为高被引文献。分析开放数据领域中文献被引频次的多少,能够了解该领域的关注点。
在我国开放数据领域被引频次排名前十的文章中,排名第一位的是来自复旦大学国际关系与公共事务学院的郑磊教授于2015年发表在期刊《电子政务》上的文章《中国开放政府数据平台研究:框架、现状与建议》,论文的主要研究方向为电子政务、开放政府、政府数据开放等内容[3],论文是2014年度国家自然科学基金面上项目“大数据背景下开放政府数据的因素与机理研究:系统动力学建模与政策仿真”的研究成果,共被引114次,受到学界的广泛关注,影响力非常高。
(五)高产作者情况。在某一科学研究领域发表的论文数量,能够体现出作者在该领域投入的经历、获得的成果,反映出为相关学科贡献的价值。
武汉大学信息管理学院黄如花教授和黑龙江大学信息管理学院马海群教授在国内开放数据领域研究中属于领军人物,发文量排名前列,为该领域研究做出了突出的贡献。马海群教授依托于国家社科基金重点项目“开放数据与数据安全的政策协同研究”,在开放数据领域进行了深入的研究,代表性成果是2015年发表在《中国图书馆学报》上的《国内外开放数据政策研究现状分析及我国研究动向研判》一文,文章主要结合相关领域的学术研究与实践进展,分析指出我国在开放数据政策这一跨学科研究主题未来可能出现的六大研究动向[4]。
(六)作者机构分布情况。对发文作者的机构分布情况进行分析,能够掌握相关领域的核心学术研究群体。通过分析整理1806篇有效文献,只对每篇文献的独立作者或第一作者所在的机构单位进行统计,同时对机构发文量在10篇以上的进行人工排序,可以得出我国开放数据领域文献第一作者机构分布情况。
通过分析可知,武汉大学和黑龙江大学的发文量居于绝对领先地位,是国内开放数据领域研究的主要机构,取得了许多重要成果。武汉大学发文机构主要由两部分构成,武汉大学信息管理学院和信息资源研究中心,代表人物为黄如花教授和夏义堃研究员,两位领军学者分别依托于国家社会科学基金重大项目“面向国家大数据战略的政府数据开放共享对策研究”和国家自然科学基金面上项目“开放数据下公共信息资源再利用体系的重构研究”开展研究。此外,武汉大学的两位优秀博士研究生刘龙、周志峰,也在开放数据领域进行了科学研究。
(七)科研基金情况。科学研究离不开各项科研经费的支持和保障,一个单位机构的科研实力也能由申请到的科研项目多少来判断。
开放数据领域近年来受到了各方关注,国家及省部级基金项目对该领域的资助力度持续加大,特别是国家社会科学基金和国家自然科学基金。开放数据领域研究的高产作者,普遍受到了基金项目的支持,他们产出了许多高质量的研究成果;而正如上文介绍到的许多有影响力的文献,也是受到基金项目的大力支持因而结成的硕果。我国开放数据领域的文献数量明显增多,这与各级各类基金项目的资助有着密不可分的关系。