学术期刊科学数据出版实践研究
——以《图书馆杂志》数据出版管理平台为例

2022-10-11 08:31■刘
中国科技期刊研究 2022年8期
关键词:数据管理期刊论文

■刘 娴

上海图书馆《图书馆杂志》编辑部,上海市静安区长乐路746号 200040

在科学研究日趋全球化的背景下,开放、协作成为科研活动的常态。科学数据的价值日益凸显,科学数据开放与共享成为开放科学运动的重点,成为科技与教育、出版与传播、图书与情报等领域的重要议题[1]。科学数据出版是落实科学数据建设规划、推动科学数据开放共享的有效方式和重要手段,是推动科学数据共享的最根本途径。

目前有关科学数据出版的研究主要聚焦于流程[2-3]、模式[4-6]、平台[7-8]、政策[9-15]、质量控制[16-18]、实践探索[19-21]、问题与对策[22-25]、数据论文[26-27]等方面。从现有研究来看:理论研究较多,视角较为宽泛;对期刊的数据出版实践研究较少,对国内的数据出版实践研究尤其不够。我国科学数据出版主要发生在侧重于实验数据支撑的自然科学与工程技术领域,针对社会科学领域的数据出版以及数据平台出版与服务实践的研究不多。科学数据作为科学研究的数据支撑,无论是对自然科学的实验分析,还是对社会科学的实证研究都具有重要的价值[28]。

《图书馆杂志》是由上海市图书馆学会与上海图书馆联合主办的《中文核心期刊要目总览》核心期刊、中国人文社会科学核心期刊、中国优秀图书馆学期刊,在探索期刊的创新和融合发展方面一直走在行业的前列。《图书馆杂志》的数据出版实践作为建立较早的社会科学领域的数据出版案例在许多文献[1,4,23,27]中都有介绍,但这些研究都是从《图书馆杂志》数据出版管理平台[29]上得到的简要信息,没有详细的第一手资料。本研究将从笔者供职的《图书馆杂志》具体案例出发,全面论述平台正式启用以来的出版实践,为我国社会科学学术期刊数据出版提供参考。

1 平台建设实践及特色

1.1 平台概况

数据是图书馆的核心资产之一,图书馆正在经历数据化转型,主要表现在图书馆实践数据化、图书馆学研究数据化、图书馆学教育数据化。数据驱动正成为图书馆发展趋势之一,影响图书馆事业的方方面面[30]。为了最大限度地利用这些数据,《图书馆杂志》联合复旦大学大数据研究院人文社会科学数据研究所,于2016年启动了数据出版管理平台(图1)研究项目,该项目是国内社会科学领域“期刊论文+数据论文+数据平台”的典型代表,即传统学术期刊在出版专业学术论文的同时,也出版数据论文,并将支撑专业学术论文结论的数据和数据论文描述的数据在自建的数据管理平台上出版。

图1 《图书馆杂志》数据出版管理平台首页

图2 《图书馆杂志》数据管理平台结构图

1.2 平台技术方案

《图书馆杂志》数据出版管理平台吸纳了哈佛-麻省理工数据中心采用的核心技术框架及规范,参考国际元数据标准规范DDI(Data Documentation Initiative)、DataCite的数据引证规范搭建了既与国际标准接轨又符合国内期刊出版现状的数据出版管理平台。

《图书馆杂志》数据出版管理平台采用全球数据管理领域先进的B/S架构,后台使用Java语言,前台使用HTML5、CSS3、ES5/6等语言,以NODEJS为代理并通过AJAX技术与后台通信。数据库选用具有清晰的数据存储层、业务逻辑层、应用层和人机交互层等逻辑结构的POSTGRESQL,实现数据管理、使用、展现、搜索等功能,支持未来接入大数据服务引擎[31]。此外,平台采用了目前成熟的企业级框架——JSF+EJB+JPA,具有收缩性和可扩展性。

1.3 系统设计框架

《图书馆杂志》数据管理平台的功能设计框架见图2。

服务展示层:展示上海图书馆《图书馆杂志》数据管理平台的服务,由期刊数据管理平台和门户网站组成。

功能模块层:提供《图书馆杂志》数据管理平台的基本功能,包括期刊数据管理、期刊数据引证、期刊数据监护、数据分析、数据权限管理、数据浏览与检索、数据收割、版本管理、数据导航、通知公告管理、资源检索、数据精选等[31]。

技术支撑层:平台底层软件技术支持由身份认证集成、Handle引证系统、CMS系统、数据分析系统构成,为应用系统各功能模块提供通用技术支持,支持统一身份认证的接入、权限校验、数据上传下载、数据多维度分析等功能。

基础设施层:为平台运行的IDC等服务器和网络设备等硬件环境。在云环境下,也可以支持云架构,为上层服务提供稳定、安全、高速的运行环境。

数据规范和使用条款:为保证《图书馆杂志》数据管理平台的良好运转提供了配套的数据管理标准规范和制度保障。

1.4 平台服务功能

《图书馆杂志》数据出版管理平台对存储在该平台的数据提供数据分级管理、数据引证、数据描述、数据分析、数据权限管理、数据浏览、数据检索、数据共享、版本管理、数据导航等服务[32],详见表1。

表1 《图书馆杂志》数据管理平台提供的服务功能

1.5 数据出版类型

《图书馆杂志》数据出版管理平台支持富媒体数据、支撑数据、数据论文、已发表论文独立数据4种数据出版类型(表2)。作者在数据平台上提交数据和描述信息,获取handle号(数字资源全球唯一标识符),实现数据出版[32]。

(1) 富媒体数据出版。对于论文中包含较多图片、表格或者有相关音频、视频等富媒体文件的论文,必要图片、表格随论文出版,拓展阅读的图片、表格、音频、视频在数据出版管理平台增强出版。将handle号附在文末,同时制作二维码,放在标题右侧,供读者扫码读取。

(2) 支撑论文研究结论的数据出版。支撑论文研究结论的数据包括但不限于原始数据,处理后的数据、软件、算法、协议、方法、材料等。将数据上传到平台时生成的handle号附在纸刊文末,供同行专家评审,出版后供其他研究者查阅、评价或引用。

(3) 数据论文出版。数据论文描述的是某一个数据集,给出数据收集、处理过程、软件工具、文件格式等细节描述[33]。数据论文发表在纸刊上,以帮助读者更好地获取、理解和使用数据。数据论文描述的数据集在数据出版管理平台出版,论文与数据之间通过handle号关联。《图书馆杂志》数据论文结构详见1.6节。

(4) 独立数据出版。为促进更多的数据共享复用,避免数据外流,《图书馆杂志》鼓励研究者将已在国内外期刊发表的研究论文中的研究数据、数据集另行投到该刊的数据出版管理平台,数据审核通过后作为研究数据成果单独录用发表,并与原论文出处或地址相互关联[34]。

表2 4种数据出版类型比较分析

1.6 数据论文结构框架

《图书馆杂志》在广泛调研国内外数据论文格式的基础上,结合图情专业学术论文的特征,设置了该刊的数据论文结构框架,包括数据论文基本信息、数据集信息、辅助信息(表3)。可以看到,该数据论文框架具有较好的规范性和统一性。《图书馆杂志》在官网为作者提供数据论文模板,供作者下载参考。

表3 《图书馆杂志》数据论文结构框架

1.7 数据政策

(1) 数据提交政策。在国际学术出版界,许多出版商鼓励或要求作者上传数据、提供数据可用性声明,并在论文中引用数据集。《图书馆杂志》鼓励作者在论文投稿阶段提交数据,并要求其在论文录用阶段提交数据;鼓励或要求作者将高清晰度的富媒体格式文件和数据集上传到数据出版管理平台,同时将上传后的数据handle地址添加至文末。

(2) 数据评审政策。数据评审内容包括研究原创性、独特性,数据真实性、可用性,数据与数据论文的一致性等维度,数据评审流程包括责任编辑初审、数据编辑初审、同行评审、责任编辑复审、主编终审等环节,严格把控数据的质量和可用性。

(3) 数据共享政策。《图书馆杂志》制定了分类分级、逐步加强的数据共享政策;倡导作者共享数据,采用Creative Commons系列知识共享许可协议,包括CC0 和CC-BY 4.0,在保障作者知识产权的基础上促进数据的完全公开共享[19]。

(4) 数据保护政策。严格遵守相关法律和行业标准(引用规范)。为确保数据访问安全,控制访问数据的用户以及用户可访问的数据内容范围,按角色对数据访问设置了3种不同程度的权限管理,即任何人可以访问、授权用户可以访问或者完全保密。系统平台遵循国际标准规范,采取相应的技术方案来保证安全性、可靠性、可用性和扩展性。

2 平台成效

2.1 平台起点较高

《图书馆杂志》数据出版管理平台与以复旦大学大数据研究院人文社会科学数据研究所、复旦大学图书馆张计龙等为代表的学术团队合作,他们在科学数据出版理论研究和实践探索上走在图情界的前列。团队人员既有图情领域的专家,又有经验丰富的平台设计技术人员,这就使得《图书馆杂志》数据出版管理平台的起点较高。

2.2 平台体量初具规模

由于数据出版在提高研究过程透明度、增加论文可信度、提升作者学术影响力、提高作者学术信誉方面具有前所未有的优势,这一新型出版模式得到作者的广泛认同和支持,作者上传数据的积极性越来越高。平台提供数据发布规范与数据论文格式模板,采用同行评议并提供审核标准,提供数据出版生命周期管理,所发布数据具有“来源可靠、质量可信、公开发布、公共利用、唯一标识、知识产权清晰、可正式引用”[35]等特征,还重视作者需求和拓展服务、加强宣传扩大影响力。多管齐下的数据政策使得平台数据的质和量有了一定的保障,行业影响力较大,平台的实践案例经常被学者作为社科领域的出版平台代表与国内外相关平台进行对照研究就是很好的证明。

2.3 数据论文影响力大

《图书馆杂志》纸刊在2018年第8期开设“数据论文”栏目,刊发两篇数据论文——复旦大学大数据研究院人文社会科学数据研究所殷沈琴、张计龙、汪东伟等的《2015年复旦大学师生中文电子期刊资源访问行为数据集》和汪东伟、伏安娜、张计龙等的《2016年复旦大学自然科学领域中文电子期刊资源访问数据集》, 同时在数据出版管理平台发布了这两篇数据论文的数据集,有效地促进了科学数据的传播和复用。截止到2022年4月6日,《2015年复旦大学师生中文电子期刊资源访问行为数据集》被下载了30180次。这两篇数据论文给其他研究者提供了很好的样本,为《图书馆杂志》吸引了来自厦门大学图书馆、浙江大学图书馆、浙江理工大学图书馆等单位作者的投稿。截至2022年4月6日,数据出版管理平台的访问量为1100312人次, 数据集的均篇下载量为9506次。

3 不足及建议

《图书馆杂志》数据出版管理平台在业界具有一定的影响力,但是与欧美发达国家的数据出版管理平台相比还存在差距。

3.1 数据论文数量占比有待提高

出版的数据论文数量占比不高,数据出版与学术期刊融合发展的深度和广度还有待进一步提高。科研人员为了更好地适应数据密集型科研范式的学术生态,有着迫切的数据管理与利用的培训需求。《图书馆杂志》可以抓住这一机遇,与图情档行业期刊如《图书情报工作》合作,共同举办数据论文写作与投稿研修班,对数据提交规范和论文写作进行指导,以便研究人员更好地掌握数据论文这一新型的写作模式,提高科研人员的数据素养,增加研究人员写作数据论文的积极性和规范性。

3.2 数据评审机制有待规范

数据评审是数据质量控制的重要方法,数据评审能够激励科研人员开拓新的研究途径,提高科技成果转化的效率,使科研数据具有更高的重用价值[36]。数据论文的内容和结构不同于学术论文主流的IMRaD结构,同行评议审查数据的标准也与传统学术论文存在差异,《图书馆杂志》数据以及数据论文的评审标准还不够细化,要探索规范、多元的评审标准,帮助评审专家从数据内容的完整性、科学性、可信度、可重用性等方面提出准确、有效的审稿意见,从而规范数据论文的审稿流程,确保数据集的可靠性。

3.3 数据出版团队建设有待加强

《图书馆杂志》设立了数据编辑岗位进行平台日常维护,为作者提供在线帮助。对投稿数据从形式上进行审核,对数据的时效性、客观性、真实性等进行初步评估。对于富媒体数据、支撑论文结论的数据以及数据论文描述的数据,在论文正式刊发时检验论文与数据链接准确与否。平台维护与数据初审工作量大,技术要求高,但编辑部的数据编辑人员不足,要聘请国内外知名数据管理和数据技术专家,筹建数据出版编辑部。

4 结语

相较于国际上比较成熟的数据出版,目前国内的数据出版还存在明显差距,缺乏成熟的科学数据出版管理平台是主要问题之一。《图书馆杂志》建立的数据出版管理平台是社会科学领域期刊的创新探索。该平台技术含量高、功能齐全、数据论文结构规范、数据政策较为完备,在国内期刊界具有一定的影响力,也具备与国际数据出版接轨的基础,但也存在数据论文数量占比较低、数据评审机制有待规范、数据出版团队建设有待加强等问题,还有较大的提升空间。需要借鉴国内外出版机构的先进数据出版经验,完善《图书馆杂志》的数据出版机制和运行模式,更好地服务科研群体;争取在国际主流数据仓储平台如Re3data[37]上进行注册、认证与索引,吸引更多的研究人员上传数据;进一步提升数据管理与传播的有效性、增加数据利用与重用的规范性、提高数据传播的国际影响力。

争取持续的资金支持是平台发展的强大物质基础。科学数据出版涉及科学数据的采集、组织、存档、发布、共享、开放等一系列活动,这些活动涉及的人员、设备、维保等必然产生相应的成本,而且随着数据量的不断累积,需要增加相应的人员和设备,这就形成了长期的不断增长的科学数据管理成本[38]。目前数据出版平台的资金来源主要是上海市新闻出版局的专项基金和上海图书馆的配套资金,在上述项目资助结束后争取新的资金支持是平台可持续发展的基本保障。

在优化出版管理团队、规范数据评议方式与标准、培养科研人员的数据素养等方面还要持续发力,制定更加详细的多层次科研数据政策,使得开放科学数据具有更强的可操作性。

本研究对《图书馆杂志》数据出版管理平台及其实践进行了全景式扫描,为社会科学领域的数据出版提供参考。个案的研究难以概观行业现状,以此实践为基础,与国外的同类期刊如Wiley旗下期刊《美国情报学会会刊》(JournaloftheAmericanSocietyforInformationScience)进行对比讨论是未来的研究方向。

致谢衷心感谢《图书馆杂志》数据出版管理平台方案设计工程师沈聪和数据编辑谈洁在本文写作过程中给予的大力支持!

猜你喜欢
数据管理期刊论文
期刊简介
《防爆电机》期刊
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
航发叶片工艺文件数据管理技术研究
本期论文英文摘要
期刊审稿进度表
数据挖掘在学生成绩数据管理中的应用研究
数据挖掘在学生成绩数据管理中的应用研究
本期论文英文摘要