科技期刊促进原始数据备案与数据共享的作用与策略研究

2024-08-12 00:00邢颖范娟刘惠琴
新闻研究导刊 2024年8期

摘要:科技期刊在传承人类文明、荟萃科学发现、引领科技发展等方面发挥着积极作用。原始数据是科技研究成果的基础和验证依据,对于确保研究结果的可信度和可重复性至关重要。数据备案的目的是确保科技研究中所涉及的原始数据的完整性、可追溯性和可验证性。然而,目前原始数据备案和数据共享方面存在一些问题,如数据共享不足和数据可信度难以保证等。文章通过分析原始数据备案与数据共享的背景和意义、科技期刊原始数据备案与共享工作中存在的问题,对原始数据备案的内容进行归纳与总结;提出科技期刊在原始数据备案与数据共享工作中应起到保障科学研究可信度、可重复性、透明度和开放性的作用,同时应承担起保护作者权益的责任;重点阐述科技期刊应通过明确原始数据备案与共享的重要性,强调数据可信性和完整性;设立原始数据附录或数据仓库;引入数据审查专家;加强编辑和审稿人员的培训等策略,推进原始数据备案与数据共享工作,以真正意义上推动科技创新和知识的传播,促进科技成果的转化和应用,为社会发展和进步作出积极贡献。

关键词:科技期刊;原始数据;数据备案;数据共享;研究成果

中图分类号:G252 文献标志码:A 文章编号:1674-8883(2024)08-0243-04

课题项目:本论文为2022年度天津医科大学肿瘤医院天津市医学重点学科(专科)建设项目“肿瘤学”研究成 果,项目编号:TJYXZDXK-009A

科技期刊作为学术研究的重要组成部分,具有促进科学研究和学术交流的关键作用,不仅是学术成果的重要发布平台,还是评估学术质量和学者声誉的重要依据。科技论文的发表对研究人员的职业发展和学术影响力有着重要的影响。随着科学研究的不断发展,原始数据在科研中的重要性日益凸显。原始数据是科学研究的基础,是验证和复制研究结果的必要条件。

目前,存在着研究结果无法复制和验证的问题,其中原始数据的缺失和不完整是重要原因之一。因此,科技期刊在原始数据备案方面承担着重要的责任,应该鼓励和推动原始数据的共享和备案,遵守科研活动规范,确保研究数据的真实性、实验的可重复性[1],有助于提高科研的可信度。本文旨在探讨科技期刊在原始数据备案与共享方面的作用和可采取的策略,以促进科学研究的可信度和可重复性。

一、原始数据备案与共享的背景和意义

(一)科学研究中原始数据的重要性

原始数据是研究过程中直接获得的数据,包括实验数据、观察数据、调查数据等。其记录了研究的真实情况,是验证和复制研究结果的必要条件,具有不可替代性。通过原始数据,其他研究者可以重新分析、验证和复制研究结果,从而验证研究的可靠性和可重复性。为进一步加强和规范科学数据管理,保障科学数据安全,提高开放共享水平,更好支撑国家科技创新、经济社会发展和国家安全,2018年国务院办公厅发布《科学数据管理办法》,指出原始数据是科学研究中最基本、最重要的数据形式[2]。为贯彻落实《中华人民共和国数据安全法》,2023年1月工业和信息化部、国家互联网信息办公室、发展改革委等十六部门发布了《关于促进数据安全产业发展的指导意见》[3],目的为保障数据持续处于有效保护、合法利用、有序流动状态,打造提供技术、产品和服务的新兴业态,推动数据安全,产业高质量发展,提高各行业各领域数据安全保障能力,加速数据要素市场培育和价值释放,夯实数字中国建设和数字经济发展基础。中国科学院发布的《中国科学院期刊数据管理指南》提供了期刊数据管理的指导原则和操作指南,包括对科技研究数据备案和共享的要求和指导。以上规范的出台说明科学研究中原始数据的重要性和不可替代性,对原始数据进行共享和备案有助于避免科学研究中的数据造假和误导,提高科学研究的可信度。

(二)目前原始数据备案与共享存在的问题

目前,科技期刊在文章原始数据备案工作方面存在一些问题和挑战。首先,许多作者并不重视原始数据的备案,或者缺乏对原始数据备案的意识,导致较多研究结果无法复制和验证,影响了科学研究的可信度。其次,原始数据的备案和共享面临着技术和隐私等方面的挑战。备案数据的规模庞大、格式多样,如何有效管理和维护是一个挑战。同时,原始数据中可能包含个人隐私和商业机密等敏感信息,涉及法律和伦理问题,这就需要加强知识产权保护,对科学数据使用者和生产者的行为进行规范,才能够体现对科学数据知识产权的尊重,采取有效的措施来保护数据的隐私性和合法性[4]。解决这些问题需要多个方面的合作和努力,共同制定和遵守相关的标准和规范,推动原始数据备案的发展,并提供相应的技术和制度支持。

二、原始数据备案的内容

科技期刊的可信度和可重复性依赖于原始数据的完整记录和备案。原始数据备案可以确保研究结果的验证和再现,保障科学研究的透明度和可靠性。原始数据备案需要包括数据来源、格式、质量等方面的内容,还需要考虑数据分析方法、数据引用等特定内容,以支持研究结果的验证和再现,同时也为数据管理和后续使用提供重要的参考依据。

(一)数据描述

需要提供数据的来源,即数据是从何处获取的;采集方式,即数据是通过何种方式收集的;时间范围,即数据的采集时间段;地域位置,即数据采集的具体地点或范围。

(二)数据格式

指明数据的格式,例如文本、图像、音频、视频等。此外,还需要说明数据的组织结构,例如数据是否以表格形式存储,或者是否使用数据库进行管理。

(三)数据内容

说明数据中的变量、字段、属性等信息。这些信息描述了数据的各个方面,如数据的测量指标、数据的分类属性等。

(四)数据质量

说明数据的质量控制措施,如数据清洗、去重、异常值处理等。这些步骤旨在确保数据的准确性、完整性和一致性。

(五)数据许可

说明数据的使用许可和限制的范围。在描述中,需要说明数据的使用是否需要获得授权,以及是否存在特定的限制条件。这包括数据的开放程度、是否可以进行二次分析、是否可以进行商业用途等。

(六)数据文档和元数据

数据文档包括数据字典、数据说明和数据标准等。此外还可以提供其他相关的元数据,如数据质量评估和数据版本控制等信息。以上原始数据备案的内容可以根据具体情况调整和补充,以使原始数据能够被其他研究人员理解、使用和验证。通过备案,可以提高数据的可信度,促进科研成果的共享和交流。

三、科技期刊在原始数据备案与共享中的责任和作用

(一)保障科学研究的可信度和可重复性

原始数据共享的重要性已经越来越被科研界所重视。2010年的“STAP细胞事件”涉及一篇发表在国际期刊《自然》(Nature)的研究论文,声称发现一种能够通过简单的处理方法将成体细胞转化为干细胞的方法。然而,后续的研究发现该研究结果存在严重的数据造假和科学不端行为[5]。这一事件引发了广泛的争议和质疑,如当时的作者能够公开原始数据,其他研究者就可以对其数据进行独立的分析和验证,很可能会更早地发现其中的问题。因此,通过共享原始数据,科研人员可以打造更加透明和可信的研究环境,提高研究的可信度,确保研究可重复。

科技期刊在确保研究成果的可信度和可重复性方面发挥着重要的作用,但并非唯一责任方。期刊方可以通过要求作者共享原始数据、进行数据审查和验证、推动数据管理和标准化等措施,保障研究成果的可信度和可重复性。实际上,确保研究成果的可信度和可重复性需要整个科研系统的共同努力,包括作者、科技期刊、研究机构、政府监管部门等多方合作。作者应当遵循科学研究的伦理规范,确保实验的可重复性和数据的准确性;科技期刊方应当严格审查和验证提交的研究成果,推动数据共享和开放;研究机构和政府监管部门应当合作推出相关法规,监督和管理科研活动,确保科学研究的诚信和可信度。因此,确保研究成果的可信度和可重复性需要各方通力合作,以打造健康的科研生态环境。

(二)强化科学研究的透明度和开放性

在原始数据备案中,科技期刊方可以征询作者的意见,是否可以将研究成果和数据公开共享,如作者同意公开共享,则可以为其他研究者提供使用和再利用的机会,能够在现有数据的基础上进行进一步的研究,将有助于避免重复实验和数据收集,节约资源并加快科学研究的速度,作者本人也可以在增强自身科研能力的同时,提高自身科研数据素养[6]。科技期刊可以根据不同学科领域和研究类型,提出个性化的数据备案要求。例如,对于实验研究,可以要求作者备案实验设计、仪器设备参数、实验过程等详细信息;对于调查研究,可以要求作者备案问卷调查的设计、样本选择方法等。

(三)保护作者的权益

原始数据备案应该确保作者的知识产权得到尊重和保护。作者的知识产权得到充分的尊重和保护,这意味着科技期刊应尊重作者对其数据的所有权,并在数据共享过程中遵守相关的知识产权法律和规范[7]。在合理的数据共享使用机制下,通过制定数据使用协议,明dtti5znPO0OAOIk8b5ypzA==确数据使用的范围和目的,并限制未经授权的数据使用等相关制度,确保作者的知识产权得到尊重和保护。

四、科技期刊方有效保障原始数据备案与共享的措施

(一)明确原始数据备案与共享的重要性

备案原始数据的目的是保障科学研究的透明度和开放性,而原始数据共享是实现这一目标的重要手段之一。长期以来,是否公开所有数据存在争议。多数期刊并不要求作者进行原始数据备案及共享,只有在有人质疑时才会要求共享。然而,随着科研进展,越来越多人认识到公开数据可以再利用,并避免重复劳动。如在临床医学领域中,共享临床试验原始数据的倡议引导临床试验的变革,建立了临床试验的新价值观和新规则[8]。

科技期刊可以通过社论、特刊、宣传活动等方式,向作者与读者宣传和强调原始数据备案与共享的重要性,明确表示对共享数据的支持,并鼓励作者在发表论文时进行备案及共享原始数据。如《自然》(Nature)出版集团等要求作者在审稿或返修阶段提交原始数据,并鼓励作者将数据提交至公共数据存储库[9],少数顶尖期刊要求必须提交数据,并且严格把控数据的质量和可用性,积极倡导作者共享数据,特别是鼓励使用公共存储库。

(二)强调数据可信性和完整性

作者提交论文时,科技期刊应该对原始数据的可信性和完整性提出要求。作者应提供足够的信息和文档,确保原始数据的来源、采集方法、处理等可以被复制和验证。相关内容可以是元数据和文档,以便编辑和审稿人了解数据的背景和使用方法。同时在充分尊重和保护作者对数据、程序等原创内容的知识产权基础上做好数据自愿公开工作[10],进行匿名化和脱敏处理等,并取得作者自愿公开数据的认可授权文件。

(三)设立原始数据附录或数据仓库

原始数据附录是指在发表的研究论文中,附带提供所使用的原始数据的详细信息和相关文档。科技期刊可以设立数据附录或链接至数据仓库,为作者提供一个共享原始数据的平台。如设立或链接至一个在线数据库,作者可以将原始数据上传至其中,并在论文中引用该数据的标识符或链接,以便读者访问和验证数据。国家人口健康科学数据仓储(PHDA)是对国家政府性资金支持的科技活动所形成的人口健康领域相关科学数据、合作机构根据特定需求加工的相关科学数据、机构和个人产出的科学数据(如论文相关数据)进行数据资源存储[11]。美国国家科学基金会资助建立的一个由非营利机构管理的储存医学、生物学、生态学数据的开放数据库(Dryad),汇集了多种学科文章,鼓励提交手稿的作者将研究数据提交至Dryad数据库进行存储并共享数据,与许多主流期刊合作,对每个文件进行必要的检查[12]。科研数据库备案平台(RDD)主要用于临床科研数据以及论文的备案,该系统可以规范地保全科研数据,大幅减少学术争端。当作者将原始数据上传到公共数据库保存时,作者的名字应该永远记录并公开。这样,公众可以通过查阅数据了解这些研究者以及他们对某个科学问题和社会的贡献。

第一,附录部分:可以在文章的附录部分提供原始数据。这种方式可以直接将数据与文章结合起来,读者可以在阅读文章时直接查看和分析数据。第二,数据附加文件:可以要求作者将原始数据作为附加文件提交。这些文件可以是数据集、电子表格、图表或其他形式的数据文件,读者可以通过下载和查看这些文件来获取数据。第三,数据仓库链接:数据仓库由原来的数据库系统进化发展而来,用于存储、分析和报告,是面向分析的一个集成化数据环境[13],是一个独立的在线平台,专门用于存储和管理科技研究数据。科技期刊方要求作者提供原始数据链接,读者可以通过访问数据仓库获取和使用数据。

不同期刊可以采用不同的方式设立数据附录或数据仓库,具体取决于期刊的要求和资源。无论采用哪种方式,旨在提供更全面、透明的科技研究数据,促进数据共享和科学研究的发展。

(四)引入数据审查专家

科技期刊可以引入数据审查专家对原始数据进行审查和验证。这些专家可以对数据的质量、准确性和可重复性进行评估,确保数据的可信度。数据审查专家可以与编辑和审稿人合作,共同确保论文中数据的可靠性。

(五)加强编辑和审稿人员的培训

真实性、完整性和可重复性是科学研究的基本要求,是判断科研成果是否可靠的重要标准。科技期刊应该提供更多关于原始数据备案的培训和指导[14],可以组织培训课程、研讨会等活动。培训内容可以包括数据管理和验证技术的介绍,以及如何评估和审查原始数据的准确性和可靠性。通过加强对编辑和审稿人的培训,让他们了解相关的数据管理和验证技术,能够在编辑和审阅稿件时更好地评估和验证论文中的原始数据,增强其应对研究数据真实性、可重复性问题的能力[15],筛选出具有科学价值和方法正确的研究成果,避免发表低质量或无效的文章。

科研是一项需要广泛合作的事业,需要各方共同努力以取得最终成果。

五、结语

原始数据备案有利于促进科技研究的合作与共享,推动学术交流和创新发展;共享原始数据可以为其他研究者提供更多的资源,促进合作研究和跨学科交流。科技期刊在原始数据备案中承担着重要责任,需要积极倡导并推进数据备案的流程。展望未来,科技期刊原始数据备案的发展方向应包括加强数据管理和存储技术的支持,推动数据共享和开放获取,鼓励作者将原始数据共享,为合作研究和跨学科交流提供平台;倡导数据的标准化和结构符合国际标准。同时,也需要应对数据备案过程中可能面临的挑战,如数据隐私保护、数据安全性和数据管理成本等问题,以推动科技期刊原始数据备案工作朝更加规范化、开放化和可持续的方向发展。

参考文献:

[1] 中国科协全国学会学术出版道德公约[J].山东医药,2023,63(12):21.

[2] 中国政府网.国务院办公厅印发《科学数据管理办法》[J].中国科技财富,2018(4):5.

[3] 工业和信息化部等十六部门关于促进数据安全产业发展的指导意见(工信部联网安[2022]182号)[J].电子政务,2023(2):F0002-F0003.

[4] 杨燕.高校教师科学数据安全行为研究[D].重庆:西南大学,2019.

[5] 杨寓涵.基于全球撤稿的科研诚信研究:现状、实证及政策建议[D].上海:上海财经大学,2019.

[6] 田丽,李佳翼.英国科研数据共享服务的经验与启示:以Figshare平台为例[J].图书馆学研究,2018(23):76-84.

[7] 陈靖壬.我国技术措施立法保护与限制的完善路径:以《著作权法》第三次修订为背景[J].西部学刊,2021(20):65-68.

[8] 吴泰相,卞兆祥,李幼平,等.临床试验原始数据透明化与共享:关于医学研究伦理的哲学命题及其对临床试验的意义[J].中国循证医学杂志,2018,18(6):538-542.

[9] 程铭,潘云涛,马峥,等.国内外学术期刊出版数据政策研究[J].科技与出版, 2021(4):6.

[10] 关于《中国经济学》鼓励作者自愿公开论文原始数据及程序代码的公告[J].中国经济学,2023(3):371.

[11] 吴思竹,钱庆,周伟,等.面向人口健康领域科研项目数据汇交的数据仓储设计与实现[J].数据分析与知识发现,2020,4(12):1-13.

[12] 林芳芳,赵辉.美国Dryad数据库共享政策及启示[J].中国科技资源导刊,2015,47(6):48-52,94.

[13] 吴露,龙翔凌.基于数据仓库的公立医院预算管理审计体系构建及相关问题探讨[J].医院管理论坛,2023,40(7):26-29,58.

[14] 刘晓蔚.探究传媒的公信力与传媒人的数据意识[J].传媒论坛,2020,3(13):35-36.

[15] 陈序文,姚长青,雷雪.学术出版视角下科研成果可重复性保障机制研究[J].中国科技期刊研究,2023,34(11):1451-1457.

作者简介 邢颖,编辑,研究方向:医学编辑实务与编辑学理论。 范娟,编辑,研究方向:医学编辑实务与编辑学理论。 刘惠琴,编审,研究方向:医学编辑实务与编辑学理论。