“开放科学 数据共享 软件共享”, 你准备好了吗?

2016-02-28 18:47
心理科学进展 2016年6期
关键词:科学研究开放性指南

朱 滢

(北京大学心理系, 北京 100871)

当前, “开放科学、数据共享、软件共享”(Open science, data sharing, software sharing)的趋势十分明显, 它是科学的未来(Gewin, 2016)。那么,“开放科学、数据共享、软件共享”是如何体现的呢?

它的最明确的信号是刊登在2015年《科学》杂志上的“促进期刊透明性和开放性的指南” (以下简称指南) (Nosek, et al. 2015)一文, 接受该指南的杂志或研究团体, 就意味着它们支持科学的透明性、开放性和重现性(reproducibility, 一项实验可以由原作者或其他人重复进行)。具体说来,就是可以仅仅刊登实验设计, 广泛征求意见后再进行实验; 实验结束后将原始数据公布, 以便人们使用或检查; 刊登无显著差别的发现以及重复的研究, 等等。这些做法可以改善科研的重现性,扩大科学观察的范围。据报道, 名为《Research Ideas and Outcomes》(RIO)的杂志已于2015年11月正式登场。它可以仅仅刊登研究设想, 或方法,或工作流程(Workflows), 或数据, 或报告, 或软件。一句话, 它可以仅仅刊登研究周期中的任何一项产品(参见2015年9月《Science》News)。这样的杂志正好体现了当今的科学精神——科学的开放性。它与过去的刊物仅仅刊登科研的最后成果——论文不同, 更关心做科学的做法(Take more care about the modus operandi of doing science than only the publication of results)。这样, 科研的每一环节都可以得到监控, 从而大大提高了科学自身的纠错能力, 并改善了科研的重现性。另外, 有一类杂志的总称叫 PLOS, 它包括生物学及医学各分支的8份期刊。PLOS从2014年3月起要求作者在投稿时包含一项数据可用性的声明, 让读者可以得到该数据。PLOS相信, 数据可用性允许数据重复, 再分析, 新分析, 解释, 或包含在元分析中, 从而促进研究的重现性, 所有这些都会提供一个更好的“货真价实”的科学研究。

目前, 538个出版社和杂志(包括 Elserier和Springer出版社)以及 57个研究团体(包括美国科学促进会)已采用指南。另外, 实行数据公开政策的基金会也愈来愈多, 他们要求申请者在科研中公开数据。这些基金会包括美国国家科学基金会(the US National Science Foundation)以及一些慈善基金会(the Bill & Melinda Gates Foundation in Seattle, Washington, and the Wellcome Trust in London)。还有一些基金会目前对公开数据不作硬性要求, 但鼓励人们这样做。因此, 有人认为, 如果不走“开放科学、数据共享、软件共享”这条道路,今后做科学研究将会变得十分艰难(Gewin, 2016)。

但是, 许多年轻人包括研究生与博士后还没有决定是否接受数据共享。一方面是因为他/她们的老板才有选择的权利, 因为老板为他/她们提供科研经费; 另一方面, 人们担心数据共享可能的副作用。例如, 数据共享后有可能会让别人在科研上抢先一步做出成果; 公布数据后要回答来信询问, 会花很多时间, 等等。提倡数据共享的人提醒说, 参与开放科学的人们有可能得到三种引用:引用数据, 引用软件和引用最后的文章。这些引用最终会导致好的名声, 即知名度——这是申请基金和找工作的一个极为重要的条件。至于一些可能的副作用也不必担心, 例如, 根据数据、软件公布的时间是可以防止剽窃行为的; 在公布数据的同时附上怎样使用数据的说明, 可以节约作者的许多时间。还有, 当前共享数据不存在什么技术障碍。例如, 线上的存储库如Fig Share或Zenodo使数据存储愈来愈容易。

“开放科学、数据共享、软件共享”的开放精神,源于当下科学研究的需要, 即改善科学的重现性。2015年在《科学》杂志上撰写“促进期刊透明性和开放性的指南”的作者(Nosek, B. et al.2015), 就是在2015年在《科学》杂志上刊登实验报告, 报道100项心理学实验成功重现的不足1/2的作者(Open Science Collaboration, 2015), 这绝不是偶然的!因为心理科学研究重现性差的问题在科学界具有普遍意义。科研发现必须能够重复,它才能成为累积起来的科学知识, 成为科学长城中的一块砖或是一颗沙粒; 科研发现如果不能重复, 它就会被抛弃掉。因此, 科学的进步既依赖创新也依赖重现(Open Science Collaboration, Science,2015)。而改善科学重现性的唯一方法就是提倡“开放科学、数据共享、软件共享”的开放精神, 这涉及科研人员, 学术期刊与出版社, 资助科研的基金会及各种学术团体, 以及公众对科学的关注与参与, 可以说, 这就是当代的科学精神。

心理学科学研究的重现性不佳, 更为迫切地要求公开数据(朱滢, 伍锡洪, 2016)。为此,《Psychological Science》杂志采取措施鼓励人们进行重复性研究。具体的做法是, 如果作者愿意,该杂志给某些文章贴上“公开数据”的标签, 清楚地告诉读者, 这些数据在哪里可以找到。据报道,从2013年到2015年贴有“公开数据”标签的文章由10%增加到38%, 这也就是“数据共享”比例的增长。

国内心理学学者已经开始对“开放科学”进行了有益的探索。如复旦大学心理系教授张学新与同行发起了学术期刊的“公评”审稿制度, 他们正在创办由多个高校共建的双语期刊《中国心理学家》(Chinese Psychologist)。这份期刊所发表的科研报告将在网上做公开评审, 作者也可以与评论者在网上展开相互讨论(黄永明, 南方周末,2015−11−05)。中国科学院心理研究所研究员、副所长刘勋正在加紧建设一个网络服务器平台, 并设计移动客户端与该平台交换数据, 包括大规模行为数据和脑成像数据。借此达到数据共享的目的, 推动心理学实验任务的标准化(私人通信2016)。

“开放科学、数据共享、软件共享”依赖互联网让科学成为更多人的科学(有人称为“公民科学” (citizen science)), 使科学更健康地发展。有人用一句话总结“开放科学”:“科学有问题, 但网络可以修复” (Science has its problems, but the Web could be fix)。

致谢:本文得到陆岩女士大力帮助, 在此表示感谢!

朱滢, 伍锡洪. (2016).《科学》和《自然》杂志 2015 年的两篇心理学文章.心理科学, 39(2), 474−477.

Gewin, V. (2016). An open mind on open data. Nature,529,117−119

Nosek, B, et al. (2015). Supplementary materials for promoting an open research culture.Science, 348, 1422−1425. DOI:10. 1126/science.aab2734

Open Science Collaboration. (2015). Estimating the reproducibility of psychological science.Science, 349,aac4716 DOI: 10. 1126/science.aac4716

猜你喜欢
科学研究开放性指南
欢迎订阅《林业科学研究》
欢迎订阅《纺织科学研究》
纺织科学研究
例析三类开放性问题的解法
初中英语开放性探究式阅读教学策略
纺织科学研究
指南数读
论碰撞的混搭指南
寻求开放性道路
重读天一阁开放性