大数据时代医学期刊数据共享方案的实施探讨

2018-02-10 02:30姜永茂包雅琳
中国科技期刊研究 2018年5期
关键词:医学期刊论文期刊

■陈 昕 姜永茂 包雅琳

1)《中华医学杂志英文版》编辑部,北京市东城区东四西大街42号 1007102)中华医学会杂志社,北京市东城区东四西大街42号 100710

随着信息技术的发展,大数据的重要性越来越被认可。大数据(或称巨量资料)具备5V特点,即Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)[1],通过数据处理可产生更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化信息资产。庞大的数据流可以产生新的科学线索,大数据已成为新技术、新发明和新理论的重要源泉。医学行业正是大数据应用的重要领域,大数据对临床诊断、疾病治疗、发病机制探索、病理生理机制明确,甚至对新药物开发和临床应用都将产生深远影响[2],而医学科研数据的开放共享是实现这一目标的重要途径。2003年10月,德国马普学会提出了《关于自然科学与人文科学知识开放获取的柏林宣言》,倡导科研论文、数据、参考资料、照片图表、学术类多媒体资源等开放共享,呼吁科研机构将科学资源开放获取[3]。为完善科研数据开放获取制度,国内外政府部门、国际组织、科技期刊等利益相关者提出开放数据管理与共享政策,要求科研数据能公开获取,以推进科学研究,实现科学研究新突破。

1 国际性医学期刊有关数据共享的政策与要求

2016年1月,国际医学期刊编辑委员会(International Committee of Medical Journal Editors, ICMJE)发布1项关于临床试验数据共享的提案,并提出以下2点要求。

(1) 2018年7月1日及以后提交至ICMJE成员刊的临床试验报告,必须包含以下数据共享声明:①是否包含共享研究对象的去标识个体数据(如变量清单等);②共享哪些数据;③是否可获得其他与研究相关的文档(研究方案、统计分析计划等);④何时可获取数据以及可开放获取多久;⑤获取共享试验数据的要求(包括谁能获取数据、用于何种研究目的及如何获取)。

(2) 2019年1月1日及以后入组受试者的临床试验,必须在临床试验注册平台提交数据共享计划。如果数据共享计划有变化或更改,应在注册平台更新并于提交论文时加以说明。此外,ICMJE还在有关临床试验注册的政策说明中就临床研究数据共享相关问题进行阐述[4]。

为响应ICMJE数据共享要求,2017年多种著名医学期刊同时刊发了题目为《临床试验数据共享声明:国际医学期刊编辑委员会统一要求》的述评文章;同时在Author Instructions中发布科研数据开放共享政策, 要求作者将相关数据作为支撑信息随论文一起提交[5-7]。实际上,《新英格兰医学杂志》(TheNewEnglandJournalofMedicine,NEJM)和《美国医学杂志》(TheJournaloftheAmericanMedicalAssociation,JAMA)2016年以来,已发表多篇有关大数据共享的文章,多角度论述大数据共享对提高医疗质量、改善人类健康发挥的巨大作用[8-10]。《柳叶刀》(TheLancet)和《英国医学期刊》(BritishMedicalJournal,BMJ)于2017年发表类似文章,指出数据共享目前存在的问题[11-12]。

国际著名医学期刊有关数据开放共享的相关政策按照强弱标准通常可分为以下3种:(1)作者及时提交相关数据或补充材料并愿意开放是论文出版的条件之一,不提供相关信息的论文将被期刊拒绝发表;(2)建议或鼓励作者将相关数据作为支撑信息同论文一起出版,但不作为论文是否出版的依据,由作者自己决定;(3)作者可提交相关数据作为支撑信息,但是否出版由期刊决定[13]。

在数据共享政策的实施与实践方面,很多国际性医学期刊也有明确要求。例如,PLoSONE2008年便有数据共享政策,要求作者承诺满足他人要求免费提供研究信息(例如数据)和材料(例如质粒)的合理诉求;除个例外,作者必须公开所有支撑论文结果的数据;作者拒绝分享数据和方法将是被拒稿的原因之一[14]。又如,BMJ自2009年起鼓励作者共享数据,并要求在其期刊发表的论文必须将数据集中发布在Dryad资料库;之后BMJ又要求作者签署数据共享声明,解释数据可以何种方式共享、与谁共享[15]。

2 医学期刊数据共享实施中存在的问题

研究表明,数据共享对期刊影响力有显著的促进作用。Piwowar等[16]对85种癌症微阵列临床出版物的被引历史进行调查分析,发现其微阵列数据中48%的开放获取数据期刊占所有期刊引用率的85%,显示出数据共享与文章被引频次呈明显的正相关,即通过数据共享可显著提高文章或期刊的被引率[17]。尽管数据共享可丰富论文信息,提高论文和期刊影响力,很多国际性医学期刊也致力于推进数据共享,但总体效果仍然不尽人意。主要源于以下2方面。

(1) 多数研究机构/研究者共享数据的意愿不强烈。尽管政府部门、国际组织、科技期刊等一直呼吁并积极推动数据共享,但期刊的数据共享实践进展缓慢,多数研究者虽然认为科学数据共享对科学研究具有重要意义,但在共享自己的数据时,存在诸多顾虑,不愿意共享。Leroy[18]对心理学领域研究人员的调查发现,仅有不到30%的研究人员愿意共享研究数据。

2016年NEJM发表的一篇评论性文章认为,使用数据的人不能理解原始数据收集者的研究设计、数据收集和分析过程,但却从原始数据收集者处“窃取”劳动成果,甚至得出与原始数据收集者相反的结论,这是寄生虫行为。该篇文章认为:①研究人员应成为研究过程中数据的独立生成者,从一个新的想法出发,而这个新想法不应该只是之前研究的简单延伸;②研究者应确定潜在合作对象,合作者们收集到的实验数据应该对自身即将进行的实验有推动作用,之后再与目标合作对象商谈合作事宜,共同检测新假说;③研究者们应该共同发布研究成果,并说明此项研究由两个研究小组共同完成,一个小组提出假设,另一小组提供数据,证明假设。数据共享过程对人类科学的进步必将产生至关重要的影响[19]。

(2) 数据聚集管理问题。期刊对数据存储位置并无统一的要求。有些期刊要求研究者将研究数据上传至公共仓储,如PLoSONE使用公共数据库上传数据。数据库可以是专业领域内的,也可以是通用的(例如Dryad)。投稿时填写的数据共享声明中必须写明数据位于哪个公共数据库及编号。有些期刊让作者将研究数据直接提交至期刊平台,由期刊进行存储管理[20]。有些期刊则让作者保存论文补充材料,当其他研究人员提出合理数据利用需求时,由作者提供。以上3种数据存储方式中,公共仓储是数据分享的较优方式,研究人员易于从庞大的数据库中查找所需数据。目前我国医学期刊多采用后两种存储方式,数据较分散,研究人员很难发现数据来源,不利于数据的重复利用,造成医学研究机构在数据存储方面单打独斗、各自为政的局面,使得临床研究数据孤岛成为常态和普遍现象。例如,《中华医学杂志英文版》(ChineseMedicalJournal, CMJ)建议研究者将研究数据与论文一起提交,期刊将数据作为补充材料直接保存于网站,并在原文电子版中提供访问链接,但实践中研究人员很难检索到此类数据,可用性不足。

3 我国医学期刊实施数据共享情况及相关问题探讨

3.1 我国医学期刊数据共享现状

相对于较为成熟的国外医学期刊数据共享发展情况,我国期刊的数据共享仍处于尝试阶段。由于对数据共享认识不足,重视程度不够,数据共享政策制定进展缓慢,虽然已有医学期刊对数据共享政策进行调研,但尚无相关数据共享实践的归纳与探究。

我国一项数据共享意愿调查表明,约2/3的作者不愿共享与试验结果和研究结论直接相关联的数据,以及为得出研究结论所使用的数据[21],与国外多数科研人员不愿意共享科学数据的情况类似,其主要原因有:数据被抄袭和滥用、数据所有权问题、数据隐私等。

目前,我国多数医学期刊尚未提出数据共享要求,某些期刊虽在稿约中提出数据共享要求,但政策规定并不严明,有的甚至建议作者根据个人意愿选择数据存储方式,可存储于个人网页或所在机构网络服务器,论文正式发表前只需提供数据相关链接等。作为我国较早关注数据共享的医学期刊,CMJ从2015年开始将作者提供的相关数据以补充材料的形式与论文共同在线出版,但直到2018年才在Author Instructions中明确提出数据分享及作者需签署数据共享声明的要求,而对数据类型、数据存储形式等方面并无相关说明,数据共享政策的制定尚处于探索阶段。与国外期刊相似,CMJ自2015年开始实施数据共享以来的效果并不理想。CMJ于2015年共发表研究文章456篇,仅2篇文章的作者提供了相关数据作为补充材料;2016年和2017年提供数据共享的作者虽然有所增加,但也仅占当年研究文章的10.5%(40/381)和9.1%(34/375)。

临床研究以论文这一载体形式进行发表和传播,进而被转化成临床实践造福于患者。医学期刊在医学论文传播过程中发挥着重要作用,这决定了期刊在临床研究大数据共享和建设的标准化和规范化管理方面应扮演重要角色。在科研过程中每一类独立的利益相关政策对科学数据共享的约束力有限,因此需要从宏观上进行顶层设计,构建系统的、科学的数据共享政策体系,引导和推进科研资助机构、期刊、出版社、数据中心、机构知识库等多主体出台相互衔接、互为补充的政策。国内出版社或期刊管理部门应参照ICMJE的建议,同时结合中国国情,制定强制性、必备性的研究数据共享和建设管理规则。再联合卫生行政主管部门、综合性医学学会或专业分会及媒体宣传公司等多部门,加强数据共享的宣传工作,让我国医学期刊和研究人员认识到大数据下的科研数据共享意义,从而积极配合开展数据共享和建设工作。

3.2 我国医学期刊数据共享和建设的相关问题

在开放科学数据的大环境下,我国期刊应逐步发布强制性数据共享政策,明确共享数据类型、存储方式和位置、数据引用和质量控制等方面要求。期刊要特别考虑研究者对文章发表的迫切性,及不同单位共享数据并撰写文章发表时所衍生出新的版权或著作权问题[22]。医学大数据库生产出的论文,第一作者与著作权单位署名问题、资料来源单位署名顺序问题,以及不同单位作者撰写论文出现相似性问题等,均为医学临床试验大数据共享和建设时医学编辑所面临的问题,同时还需要考虑转化产生的经济利益分配问题、临床试验数据的科学性和准确性问题。明确并解决以上问题是保证临床研究数据共享和建设合理进行的前提。此外,期刊编辑在执行数据共享政策的同时,也应配合研究人员的诉求,逐步完善数据共享政策。

大数据时代下,出版社和所属行业管理部门可牵头搭建公共数据库,将数据按照学科、主题等类型进行存储,易于查找。期刊也可与高信任度、具有较为严格存储标准的第三方数据库合作,将各类型的共享数据整合至公共数据平台,以利于科学数据的关联集成与再利用。

4 结语

研究数据共享不仅能减少科研中的重复劳动,降低科研成本,还可以通过共享研究数据,重复检验科研成果,帮助减少科研误差,有利于科学研究的繁荣和发展。国外医学期刊在数据共享方面的发展已较成熟,而我国尚处于初级阶段。CMJ的实践经验证明,期刊在推进研究数据共享过程中还面临较多问题,包括数据共享政策不完善、实施力度不够、研究者不愿共享数据、数据仓储平台建设不健全等。在大数据时代,希望我国期刊能借鉴和参考国外期刊的经验,构建和发展适合自身的数据共享方案。

[1] 许晔. 大数据时代中国面临的挑战与对策[J]. 中国科技论坛,2015(3):24-29.

[2] Kong X,Feng M,Wang R. The current status and challenges of establishment and utilization of medical big data in China[J].EuropeanGeriatricMedicine,2015,6(6):515-517.

[3] 于媛. 关于开放获取自然科学与人文科学资源的柏林宣言[J]. 图书情报工作动态,2004(12):15.

[4] International Committee of Medical Journal Editors. Clinical trials[EB/OL]. [2018-01-08]. http://icmje.org/recommendations/browse/publishing-and-editorial-issues/clinical-trial-registration.html#one.

[5] Taichman D B, Sahni P,Pinborg A,etal. Data sharing statements for clinical trials:A requirement of the international committee of medical journal editors[J].TheJournaloftheAmericanMedicalAssociation,2017,317(24):2491-2492.

[6] Taichman D B,Sahni P,Pinborg A,etal. Data sharing statements for clinical trials—A requirement of the international committee of medical journal editors[J].TheNewEnglandJournalofMedicine,2017,376(23):2277-2279.

[7] Taichman D B,Sahni P,Pinborg A,etal. Data sharing statements for clinical trials[J].TheLancet,2017,389(10086):e12-e14.

[8] Kiley R,Peatfield T,Hansen J,etal. Data sharing from clinical trials—A research funder′s perspective[J].TheNewEnglandJournalofMedicine,2017,377(20):1990-1992.

[9] Rockhold F,Nisen P,Freeman A.Data sharing at a crossroads[J].TheNewEnglandJournalofMedicine,2016,375(12):1115-1117.

[10] Boutron I,Dechartres A,Baron G,etal. Sharing of data from industry-funded registered clinical trials[J].TheJournaloftheAmericanMedicalAssociation,2016,315(24):2729-2730.

[11] Cheah P Y,Day N P J. Data sharing:Experience from a tropical medicine research unit[J].TheLancet,2017,390(10103):1642.

[12] McDonald L,Schultze A,Simpson A,etal. Lack of data sharing in observational studies[J].BritishMedicalJournal,2017,359:j4866.

[13] 刘颖,王旋. 医学领域国际学术期刊数据出版政策分析[J]. 中国科技期刊研究,2017,28(8):685-689.

[14]PLoSONE. Materials and software sharing[EB/OL]. [2018-03-01]. http://journals.plos.org/plosone/s/materials-and-software-sharing.

[15] 陈全平. 学术期刊数据政策及相关研究[J]. 图书与情报,2015(5):9-15.

[16] Piwowar H A,Day R S,Fridsma D B. Sharing detailed research data is associated with increased citation[J].PLoSONE,2007,2(3):e308.

[17] 黄如花,邱春艳. 国外科学数据共享研究综述[J]. 情报资料工作,2013,(4):25-31.

[18] Leroy W. Responsibility for raw data[J].AmericanPsychologist,1962(17):657-658.

[19] Longo D L,Drazen J M. Data sharing[J].TheNewEnglandJournalofMedicine,2016,374(3):276-277.

[20] 雷秋雨,马建玲. 学术期刊数据出版政策研究综述——以JCR中进化生物学领域期刊为例[J]. 图书馆理论与实践,2016(1):30-34.

[21] 罗晓兰,李明. 国内期刊论文科学数据共享政策与投稿意愿研究[J]. 中国科技期刊研究,2017,28(8):696-703.

[22] 周建文. 大数据环境中的医疗数据隐私保护[J]. 中国管理信息化,2015,18(4):51.

猜你喜欢
医学期刊论文期刊
期刊更名启事
期刊简介
山西医学期刊社简介
山西医学期刊社简介
山西医学期刊社简介
山西医学期刊社简介
期刊问答
下期论文摘要预登
下期论文摘要预登
下期论文摘要预登