数据出版及其质量控制研究综述*

2020-01-09 08:28刘兹恒涂志芳
图书馆论坛 2020年10期
关键词:知识库论文期刊

刘兹恒,涂志芳

科学数据(scientific data)或研究数据(research data)是学术成果的重要组成部分,也是数字时代学术资源开放共享的重要内容范畴,而数据出版正是使科学数据能够被社会广泛而有效利用的一种手段。较之于已经发展成熟的传统学术出版,数据出版作为一个相对新兴的研究与实践课题,无论是理论还是实践均需要加强思考和探索,尤其较之于传统学术出版严格的审查机制,数据出版因数据结构复杂、准入门槛较低、开放传播等特点,更加需要通过质量控制手段保障数据质量和价值。因此,本文围绕数据出版的概念、作用、模式、流程等理论与实践问题进行梳理,继而对数据出版质量控制的概念、内容与方法进行综述,并对数据出版质量控制的调查报告和实践研究进行述评,以期在一定程度上促进图书馆界、出版界、科技界对数据出版的认识,克服现存的问题与困难,推进数据出版及其质量控制理论与实践更长足的发展。

1 数据出版基本问题研究综述

国内外对科学数据出版的研究主要从理论性思考探索和实践性调研分析的角度进行,其中理论研究主要包括对数据出版概念、作用、模式、流程、问题与挑战等的论述,实践研究主要包括论文数据附件、数据知识库、数据论文等模式的数据出版调研分析及相关问题讨论。

1.1 数据出版概念

数据出版(data publishing或data publication)首先作为一个概念而存在,不少研究都对数据出版及其相关概念进行了释义或辨析。从出版语义的角度,Lawrence等[1]、Callaghan等[2]对数据的“publish”和“Publish”进行区分,前者将数据文件贴于网络使数据得以开放,但文件没有任何长期存在、不被损坏、相关信息描述等保障;而后者作为正式的数据出版,不仅可揭示数据集的科学质量和重要性,也能为数据生产者带来声誉,同时还意味着对数据长期保存的承诺和面向数据消费者的数据增值。从出版实践的角度,Penev等[3]认为数据出版是将数据上载到网络使得除作者以外的人和组织也能够下载、分析、重用和引用数据的行动;Candela等[4]认为数据出版是一项将数据公开以提供重用并且还能跟踪数据来源和作者贡献的活动。从概念辨析的角度,数据出版与数据发表、数据发布、数据开放[5-7]既关联又区别,数据出版过程还应考虑长期保存与存储、元数据、引用与作者贡献、出版许可与数据重用、数据传播等关键要素。由此可知,数据出版是使科学数据获得“可溯源”“可引用”“质量审查”“承认作者贡献”“长期保存”等特征的活动和过程。

1.2 数据出版作用

随着科学数据管理与共享政策法规制定、标准规范发布、基础设施建设等的深入推进和数据量的不断积累,数据出版的作用不断凸显,国内研究者均高度肯定数据出版的积极作用。数据出版的作用一方面在于其推动数据开放共享,促进整个学术出版和科学研究的发展,如Borgman[8]强调科学数据对新的研究成果产生的价值,Murphy[9]强调数据出版有提高学者学术信誉、保障数据存档与监护、保障数据质量、提供公共利用、提高研究过程透明度的作用。另一方面,数据出版在数据开放共享的基础上,重点解决数据知识产权的问题,保障科学数据的质量,提高数据重用的价值,如吴立宗等[5]突出数据出版解决知识产权问题、提高数据共享积极性的作用,而袁曦临[10]认为数据出版是科学数据管理及其可持续发展的必然结果和最终环节,是推动科学数据共享的最根本途径。此外,数据出版显然也能够为公众提供更多获取、利用科学数据的平等机会,创造社会价值。

1.3 数据出版模式

数据出版模式,又被称为数据出版途径、形态、机制、路径等,现有研究主要从数据出版客体和数据出版主体两个不同视角对数据出版模式进行划分和归纳。

从数据出版客体角度,Lawrence等[1]较早提出数据出版的5种模式:独立数据出版、学术论文辅助数据出版、附录数据出版、期刊数据档案出版、数据论文出版;王丹丹[11]、孔丽华[12]、顾立平[13]、张小强等[6]、何琳等[14]进一步将数据出版总结为3种模式:独立数据出版、作为论文辅助资料的数据出版、数据论文出版。从数据出版主体角度,张丽丽等[15]将数据开放模式总结为3种:自上而下模式、横纵联合模式、自下而上模式;张小强等[6]将数据出版分为4种模式:出版机构控制模式、非出版机构独立控制模式、混合模式、“二次出版”模式。

从数据出版客体和数据出版主体角度划分的数据出版模式之间是相互映射的关系,虽表述略有差异,但仍可归结为3种模式:(1)独立数据出版,该模式将数据作为独立的信息对象提交到开放存取数据知识库;(2)作为论文关联和辅助资料的数据出版,数据往往作为论文的附件、附录而出版或存储到期刊指定的数据仓储并建立论文和数据的关联;(3)数据论文出版,将科学数据作为一种文本文献进行出版,包括发表在专门数据期刊的数据论文和综合性期刊的数据论文。

1.4 数据出版流程

与传统学术出版相似,数据出版也有完整的出版流程,数据出版流程通常指在网络出版数据、相关元数据与文档附件、软件代码等的活动和过程[16],数据质量控制也往往面向出版流程的不同环节而进行。例如,从知识转化与创新的角度,Hense等[17]、杜伟等[18]参考知识螺旋模型,把数据出版过程简化为“内部化”和“外部化”两大环节,其中“内部化”包括搜索和浏览、审核和学习、实验3个小环节,“外部化”包括解释和注释数据、执行质量保障、出版和发布数据3个小环节。从工作流程的角度,Kratz等[19]认为数据出版有4个环节,首先将数据存储在知识库,然后对数据进行描述,再分配标识符,最后进行评审;而数据出版后应可利用、被存档、可引用、可验证;吴立宗等[5]认为数据出版包括数据发布、同行评审、数据出版和永久存储、数据引用、数据评价等环节。目前对数据出版流程的研究主要是针对基于数据知识库的数据出版,其他两种出版模式下的数据出版流程则遵循传统期刊出版流程和数据政策及数据期刊的出版流程。

1.5 数据出版实践

数据出版实践主要从前文所述的论文数据附件、数据知识库、数据论文3种模式展开,相关研究也从数据知识库与数据出版研究、期刊数据政策与数据出版研究、数据期刊与数据论文研究等方面展开。

目前,学者们主要通过对国内外开放数据知识库进行调查分析的方式研究数据知识库的数据出版,常用数据知识库案例包括Dryad、figshare、Dataverse、Zenodo、GenBank、北京大学开放研究数据平台等。相关研究[20-24]主要对数据与论文的链接、数据出版要素、数据学科领域、内容类型、唯一标识符、质量管理、知识库建设过程与经验等问题进行调研分析,厘清数据出版与传统学术出版的异同,明确数据出版的要素、类型与特点。

期刊出版商通过制定数据共享政策对数据出版加以控制和规范,以实现论文和数据的关联出版。学者们通过调查一种或多种学科期刊的数据政策内容,了解作为论文附件的数据开放出版情况。一方面,对特定学科领域期刊的数据政策进行研究,如Zenk-Möltgen等[25]、陈秀娟等[26]、雷秋雨等[27]对社会学、化学、生物学领域期刊数据政策的数据类型、数据存储、质量控制等内容进行分析;另一方面,对多种学科领域的期刊数据政策进行综合研究,如371种自然科学与人文社会科学领域的期刊政策内容调查[28],多领域学术期刊数据政策的制定主体、客体与内容,数据政策的实施及其效果、约束力强度及相关研究项目[29]。大型出版集团、学协会出版社等是推动数据政策制定以及作为论文附件的数据出版的主要力量,也是面向研究人员和广泛的研究社群强化数据共享意识、推进数据共享行为、培养数据共享文化的重要阵地。

数据期刊(data journal)是在科学数据开放共享趋势之下发展起来的新型学术期刊,是促进数据的使用、引用及重用的重要工具[30],数据期刊的定义、类型及出版实践均得到了关注[16,31-32]。据Candela等[33]对国际数据期刊的不完全统计,2015年至少已有15家出版机构出版了至少116种数据期刊,近年来国内外数据期刊数量得到明显增长,我国《中国科学数据》(2016)、《全球变化数据学报》(2017)也相继创刊。数据论文(data paper)是一种新兴的出版物形态,与传统学术论文最大的不同在于数据论文重点描述科学数据本身而不是描述基于科学假设和科学问题的研究结果[34],不过也有学者认为中译名“数据论文”未能很好地反映“data paper”的内涵边界与功能定位,而“数据导引”更为精准贴切[35]。数据论文内容重点描述数据的可用性、覆盖范围、格式、许可、共享、项目来源、数据来源、数据质量、数据重用等要素[36],数据论文出版同样涉及学科属性、出版方式、收录内容要求、引用机制、版权协议、费用等事项[32]。

1.6 数据出版的问题与挑战

尽管数据出版已经在国内外开始了较大规模的实践,但作为学术交流、传播与出版领域相对新兴的议题,数据出版仍存在不少困难和问题需要克服。Hense等[17]认为数据出版面临的挑战存在于格式、内容、科学质量控制、格式质量控制、技术质量控制、浏览与检索、存储等多方面;何琳等[14]认为科学数据的元数据、隐私保护、组织技术、知识产权保护、出版激励机制是数据出版待解决的关键问题。张小强等[6]认为数据出版的主要障碍是伦理规范与标准的缺失,包括数据出版体系中奖惩功能的缺失,数据出版复杂性导致的短期内标准规范的缺失,数据出版的用稿规范、数据引用规范、元数据标准等的不完善;张丽丽[37]认为,相较于传统学术论文出版,数据出版的学术地位和行业认可度、运营模式的可持续性、数据开放与版权保护等方面仍有待发展。也就是说,数据出版的问题和困难在于数据本身内在特性以及数据出版外在环境两个方面:数据本身数量大、格式多样、技术依赖、学科差异大,因此数据出版天然具有复杂性;与数据出版配套的标准规范、技术工具、体制机制等还没有充分发展起来,数据出版要得到像传统学术出版一样的认可,还任重而道远。

2 数据出版质量控制研究综述

2.1 数据质量及其标准

数据质量(data quality)是一个多维度概念,可被描述为一组质量特征的集合,也通常取决于对最终用户目标实现产生的价值大小[38]。明确数据质量的概念及其标准,是对数据出版进行质量控制的基础。

从质量特征的视角,数据质量强调数据本身应该具有的质量特征和属性。Gordon[39]将数据质量定义为数据完整性、有效性、一致性、及时性和准确性的状态以使数据适合特定用途,而高质量的数据则能够在运行、决策、规划中很好地发挥预期作用;胡良霖等[40]认为数据质量包括数值质量和模型质量两个维度,前者如准确性、完整性、一致性、客观性等,后者如相关性、可读性、最小化等,而科学数据质量的评价和控制则可从科学数据质量标准框架、数据成熟度模型、评价方法与软件工具等方面展开。zhu等[41]认为数据质量受所使用的数据标准的质量(quality of data standards)的影响,即提高某些数据标准的质量便可能提高根据标准创建的数据的质量,并提出将完整性(completeness)和相关性(relevancy)作为数据标准质量的两个重要元素。

从数据消费者的视角,数据质量强调数据之于用户的质量和价值。英国皇家学会在“科学是开放事业”[42]报告中提出开放数据的质量标准包括可获取、可理解、可评估和可利用;Peer等[43]认为数据质量意味着“对已知的数据重用而言独立的可理解性”(Independently Understandable Data for Informed Reuse);Hense[17]认为数据质量的关键因素为声誉、可靠性和程序规范;Wang和Strong[44]认为数据质量框架包含内在数据质量(intrinsic data quality)、语境数据质量(contextual data quality)、可表现性数据质量(representational data quality)、可访问性数据质量(accessibility data quality)4个维度。

可见,数据质量的维度和指标十分丰富,数据出版过程中的数据质量控制可概括为3个方面内容:(1)内容质量,主要指数据内在的科学性、逻辑性、真实性、可信度等,如支撑科学新发现的价值、验证文章结论的价值;(2)形式质量,主要指所存储的数据格式的兼容性、可读性、规范性、友好性等;(3)语境质量(元数据质量及上下文信息),主要指理解数据所需的语境信息的充分性、有用性,如元数据的准确性、完整性及元数据描述与数据匹配的真实性等。

2.2 数据质量控制概念、内容与方法

以数据质量标准为基础,以数据质量事实为依据,了解数据质量控制的概念、内容与方法,才能针对性地从数据出版的各个环节进行数据质量控制,从而使数据质量结果符合预期和需求。

关于数据质量控制的概念,相关研究包括释义、辨析及定义等视角。加拿大研究数据组织(Research Data Canada)[45]将数据“质量保证”(quality assurance,QA)定义为用于测量和确保产品质量的一系列过程,而将数据“质量控制”(quality control,QC)定义为满足消费者期望的产品和服务过程。两者的主要区别[46]在于QA是过程导向,侧重建立质量以防止错误,是用正确的方式做正确的事;而QC是产品导向,侧重质量测试(如检测错误),是确保所做的结果符合预期;但通常情况下不对两者进行严格区分[47]。张静蓓等[48]进一步将“数据质量控制”定义为用于确定被测试的数据是否可以有效地被其他研究人员进行验证和重用的一套标准流程。从对概念的阐释可知数据质量控制发生在数据产生、存储、传播、利用多个阶段,不仅需要从源头确保数据产生的质量和价值,也需要在存储与传播过程中对质量进行检测和验证,同时还需在面向用户时确保较高的利用价值。本文在此基础上认为数据质量控制是在明确数据出版的含义及范畴、确定不同的数据出版模式及其流程、了解数据质量的内涵及标准的基础上使得出版后的数据达到甚至超过数据质量标准的一系列政策标准、工具平台、活动、方法等的过程。

关于数据质量控制的内容与方法,包括出版环节、质量控制对象与评审人员等维度。Pampel等[49]认为可从数据创建、数据管理(计划)、数据(集)质量评估3个环节进行数据质量控制。Austin等[16]认为数据评审与审查是数据质量控制的重要方法,包含广泛的质量评估内容,如元数据的准确性、数据文件与文档的充分性和计算与分析结果的准确性,评审还取决于数据出版者的要求、研究者的期望或数据敏感性等因素,数据评审具体可表现为:(1)数据期刊或知识库的外部专家进行同行评审(数据内容的科学性、可信度审查);(2)数据知识库的数据管理专员进行技术审查(数据形式审查);(3)数据知识库的学科内容管理专员对数据内容进行审查(数据内容的完整性审查)。配合数据质量控制的内容,数据质量控制方法包括数据评审、数据审查、数据确认、数据验证等,可借助计算机技术、统计软件、图表工具或参照一般原理、科学逻辑、数据标准等实现。

2.3 数据出版质量控制研究

2.3.1 数据出版质量控制调查报告

部分国外研究资助机构或学术社群对数据出版及其质量控制问题进行了系统性的调查,包括对科研人员的数据共享意愿、数据共享现状、不同模式的数据出版概况、特定学科领域的数据开放出版状况等。

2008年6月,研究信息网络(Research Information Network,RIN)发布题为“共享还是不共享:研究数据出版和质量保证”的调查报告[50],从数据创建过程、数据管理计划、数据集质量评估3个方面对天文学、系统生物学、气候科学等8个学科领域的研究者及数据出版质量控制进行调查,得出结论包括:(1)大多数科研人员认为数据创建者本身最适合判断自己的数据集质量,并且信任其他科研人员的数据质量和完整性;(2)没有统一的方法对数据集内容或技术进行同行评审;(3)数据中心往往采用严格的程序以确保数据本身结构和格式及相关元数据的质量标准,但研究者在提交数据时往往缺乏满足这种要求的技能。

2012年2月,永久访问科学网络记录联盟(Alliance for Permanent Access to the Records of Science Network,APARSEN)发布学术交流环境下科学数据同行评审报告[49],从科研人员、数据知识库、数据期刊三方视角调研科学数据质量控制:(1)科研人员对数据出版持积极态度,但担心数据同行评审因所需时间和工作量的巨大而变得不切实际;(2)数据管理计划、数据知识库及其认证和审计对数据质量控制影响突出,数据知识库的质量控制方法因数据形式、范围、学科而异;(3)期刊通过编辑政策、同行评审进行数据质量控制,但仍存在审查任务重、缺乏技术标准和普遍做法等问题。

2012年9月,由美国国家科学基金会(NSF)资助的调研工作组进行了题为“数据质量监护:确保数据质量促进科学新发展”[51]的专题研讨会,研讨会将科学数据质量可能的问题及解决方案归为4个方面:(1)数据质量标准与语境:识别数据生成、分析、存储、管理、访问、利用与重用及保存等阶段可能的数据质量威胁,明确数据质量标准及其在不同学科的差异;(2)人和制度因素:探索利益相关者进行数据质量控制的激励和限制因素,明确数据质量控制的人力和技术成本,利用风险模型评估数据质量控制的投资回报率;(3)有效和无害的数据监护工具:了解数据质量控制的工具与技术需求,推荐现有工具用于数据选择、元数据自动生成与注释、数据摄取、审计与保存;(4)数据质量指标:确定数据质量指标,开发应用测量并提高数据质量的技术。

2016年9月,由欧盟“地平线2020”项目资助的人文科学研究数据开放存取出版调查报告[52]指出,信任是数据知识库与其相关主体之间的关键因素,而审计(audit)和认证(certification)是对数据知识库进行质量控制从而提高可信度的有效方法,联机计算机图书馆中心(OCLC)、欧盟等已经制定数据知识库的认证标准。

以上针对数据出版质量控制的调查报告,提出了质量控制实践过程中可能遇到的问题及解决方案,为了解数据出版质量控制的不足与缺失、指明未来发展方向具有重要的参考价值。具体而言涉及数据质量控制两个方面的重要议题:(1)数据质量首先依赖研究人员的“自觉”与“自律”;(2)工作量大、技能要求较高、缺乏成熟的标准规范以及工具方法,使得数据质量控制存在困难甚至有些“不切实际”。

2.3.2 数据出版质量控制实践研究

针对期刊政策所涉数据质量控制,不同出版社有不同做法:自然出版集团规定数据评议编委会必须包括至少1名数据标准审核专家,对作者提交数据的质量进行评估,从而确保实验数据的完整性和可重用性;Elsevier要求期刊编辑在评议文章时对数据的时效性、客观性及来源的真实性等进行初步评估[27]。另有期刊与数据知识库合作进行数据管理,如PLOS与Dryad合作进行数据审查,PLOS的作者将数据提交到Dryad后,数据与论文分别接受评审,数据和论文同时出版[53]。

针对数据知识库的数据质量控制,包括数据本身、元数据及相关文档等内容,采用了不同的方法技术,涉及不同的利益相关方。张静蓓等[48]认为数据知识库质量控制包括文件整体质量控制、文档说明质量控制、科学数据本身质量控制、源代码质量控制,其利益相关者包括研究人员、大学图书馆、期刊出版商等。Gordon[39]发现Dryad存在同一创建者姓名表述不统一、日期表达方式不统一、资源类型与事实不相符等问题,建议加强对数据知识库的元数据质量控制。Csordas等[54]调研蛋白质组学领域的数据知识库PRIDE的数据质量控制方法,首先对上传至PRIDE的XML文件进行语法检查;其次对元数据是否缺失、是否一致进行检查;最后根据蛋白质组学领域数据的学科特点检查数值的正确性。

针对数据论文的质量控制,主要采用同行评审的方法,数据评审尚存一定的问题,需要加强解决方案的探索。数据论文同行评审包括封闭式和开放式两种形式,侧重考查前期质量控制、论文和数据的一致性、论文中数据的质量、论文中数据的可用性、论文中数据的功用和贡献度等内容[55]。基于对数据同行评审进展的梳理,Murphy[56]认为目前学界对科学数据同行评审缺少准确的理解,对数据评审与传统出版物评审的关联与区别尚不明确,同时也没有可持续的角色承担数据评审的工作。黄如花等[57]从数据馆员、数据验证服务、数据生命周期管理的角度探索高校图书馆参与数据验证的可能路径。

基于3种数据出版模式研究数据质量控制,相关研究结果表明[11-12,58]:(1)独立数据出版的质量控制:同时进行技术审查和同行评审,前者主要从技术标准层面对数据及数据文档进行完整性的控制;后者确认数字资产的完整性、评价数据集的完整性并评估数据文档的完整性,但目前有相当一部分数据知识库不进行同行评审或只进行内部评审。(2)作为论文附件的数据出版质量控制:内嵌于期刊论文的数据通常表现为图表、表格、数字等形式,主要从逻辑上审查数据对研究结论的影响,依赖数据创建者对数据质量的把控。(3)数据论文出版:考虑到数据论文是数据集的描述,数据集质量体现在完整性、描述的详细程度、数据有用性,因此数据论文质量应包括数据质量、描述质量、描述和数据一致性,一般对

数据及论文进行严格的同行评审。

2.3.3 数据出版质量控制的问题与困难

综上所述,因目前所处的数据出版环境,加之数据及数据出版本身的特点,数据出版质量控制尚存以下问题:(1)数据庞大而复杂、数据量增长较快,数据评审不得不依靠计算机的帮助,评审者需要具备足够的能力并借助软件工具进行科学质量控制;(2)不同类型、不同学科的数据存在明显差异,难有统一的标准和规范;(3)理解数据需要了解数据产生背景及上下文语境,而背景通常“不可见”,致使数据质量控制的难度加大;(4)数据评审是一项复杂的系统工程,数据评审需与数据政策、数据发布、数据存储等环节协同;需要学科领域专家、数据专家、数据管理人员甚至软件工程师的协同,很少有评审者能够评审数据质量的所有方面;现有的数据评审大多仍保留了传统同行评审的形式,未曾深入对数据本身的评审;(5)数据出版质量控制需要大量时间、精力的投入,其投入产出效率可能存在一定的质疑;(6)数据质量不仅在于数据本身,还在于对应的元数据及相关文档;(7)数据出版质量控制是内嵌于数据出版生态系统的子系统,要求良好的数据共享文化作为基础。鉴于以上困难,事实上目前的数据质量控制首先有赖于作者自我审查[17],而后才是同行评审及其他各类审查的质量控制手段。

3 现有研究述评与未来研究展望

综合以上数据出版的理论与实践研究综述,目前相关研究具有以下特点及欠缺:第一,国外理论研究内容较为丰富,涉及数据出版概念、作用、模式、流程、问题、挑战等多个方面,对数据出版实践有较强的指导作用;第二,国外较为注重对数据出版进行长篇幅的系统研究,有助于全面了解数据出版的关键问题;第三,国内早期多对国外理论研究进行推介、对国外实践进行案例研究,后期开始进行少量的创新性理论思考;第四,数据出版最佳实践“从0到1”的建设过程与发展经验对推动更大范围的数据出版具有重要借鉴作用,而目前较为缺乏对这种成熟经验的总结和呈现;第五,目前数据出版主要发生在自然科学与工程技术领域,缺少对国内期刊、人文社科期刊探索数据出版的研究与思考;第六,欠缺对研究人员数据共享意愿影响因素的调查,研究人员及学术共同体对数据出版需求的精准把握;第七,存在较多的系统性梳理与研究欠缺之处:如对数据出版历史机遇与发展进程的系统梳理,对数据出版系统基础设施建设与软实力建设的系统研究,对数据成果和数据作者导向的数据出版影响力的评价方法研究等。

综合以上数据出版质量控制的理论与实践研究综述,相关研究特点及欠缺表现为:第一,国外通常对数据出版质量控制进行专题研讨和调查报告,有助于发现问题、探讨解决方案;第二,国内研究相对分散,缺乏调查报告、硕博士论文或专著对相关问题进行系统梳理和研究;第三,侧重对数据出版质量控制的实践进行案例分析和研究,较为缺少对数据出版及质量控制理论与方法的探讨;第四,国内研究主要集中于对国外实践经验的描述,缺少对国内数据出版问题与困难的建设性思考;第五,对数据出版质量控制所需时间、金钱等投入产出与成本效益缺少量化评估和直观体现;对研究者、数据管理者等相关人员满足数据质量控制所需的技能要求缺乏明确的梳理;对数据质量控制所需的标准规范和方法工具缺乏足够的需求分析和培训设计。

可以预见,未来将有更多的学者对科学数据出版的理论、方法、平台、工具、实践等进行系统而综合的研究,探讨数据出版及数据质量控制存在的问题和面临的困难,推动数据出版实践进展,推动科学数据开放事业的可持续发展。具体而言:加快数据出版政策制度的研究,保护数据作者的知识产权,平衡知识产权保护和开放传播的关系,对原有学术评价体系进行适应性变革,在学术评价体系中承认数据出版的学术贡献;加快数据出版标准规范的研制,完善元数据标准、细化数据引用标准使之更具可操作性;调查数据质量控制对研究人员和数据管理人员的技能要求并建立适应的培训体系;加快数据出版技术、工具、平台的开发,将数据可视化、动态数据呈现等技术应用于数据出版;对数据出版及其质量控制的影响因素进行实证研究,从中发现问题、消除障碍、提出解决方案;从投入产出、成本效益、定性定量的角度分析数据出版及其质量控制的经济效益与社会效益;探索数据出版赋能下的科学数据影响力评价及学术评价,充分展现数据出版在增加学术影响力方面的作用。

猜你喜欢
知识库论文期刊
期刊更名启事
期刊简介
汉语近义词辨析知识库构建研究
期刊问答
本期论文英文摘要
本期论文英文摘要
本期论文英文摘要
卫星状态智能诊断知识库设计方法
机构知识库建设的动力研究
2013年5—12月最佳论文