王凌峰 程灵慧
(桂林电子科技大学商学院 桂林 541004)
1939年科学学奠基人贝尔纳(J.D.Bernal)在《科学的社会功能》—书中,专辟一章探讨学术交流方式问题,贝尔纳提出建立科学文献收发中心,直接以单篇论文而不是期刊为单位进行学术交流的设想[1]。今天的网络预印本是贝尔纳科学文献收发中心设想的一种具体实现[2]。预印本(Pre-print)指研究成果未经同行评议、尚未在正式出版物(最常见即期刊)上公开发表,出于交流和证明优先权目的而先行向同行公开和传播的论文[3]。预印本可以通过纸张方式实现,也可以通过电子网络方式实现。1991 年全球第一个网络预印本平台 arXiv 诞生,2016年前后全球范围涌现一批不同学科领域的网络预印本平台。
预印本相对于期刊至少具有以下6点优势[4]: a.迅速公布科研成果,预印本文章发表和传播速度快,有助于放大作者和研究成果的关注度。b.促进学术自由交流。c.更大范围地获取论文反馈意见,帮助作者完善成果。传统期刊是论文发表前修改,发表后除勘误撤稿再无不断修改完善行为,而预印本文章公开后作者可以根据读者意见不断修改。 d.记录思想发展历程。e.确立科研发现优先权,避免因审稿人偏见或者期刊反复拒稿,导致成果无法及时发表而丧失优先权。f.比期刊更快地追踪科研最新动态。
由于预印本相对期刊具有上述优势,2000年前后一些研究者认为预印本即使不能取代期刊,也至少可以与期刊平分秋色,甚至提出“后期刊时代”概念,如Julie M. Hurd当时预测2020年预印本将与期刊一起成为学术交流两大支撑[5]。近年来也有文章认为预印本已重构与再造了学术交流体系[6]。
以1991年arXiv预印本建立作为起点,预印本至今已有三十多年发展历史,目前预印本与期刊之间究竟处于何种状态?两者未来发展趋势为何?本文将上述关切具体化为三个问题予以讨论:预印本和期刊平分秋色以及预印本重构和再造了学术交流体系的观点是否成立?若预印本未能重构再造学术交流体系,主要原因为何?预印本与期刊之间能否互补合作,优势融合,从而更好地推动论文发表与学术交流?
何谓“两大支撑”与“重构与再造”?从预印本、期刊两者发布的论文数量看,当预印本文章数量与期刊论文数量相等时,才能认为预印本与期刊一样是学术交流“两大支撑”,“重构再造”了学术交流体系。下文以此为据进行讨论。
Dimensions数据库是Digital Science公司推出的科研搜索引擎,集成了国际主流出版商、数据库和第三方平台的期刊论文、图书、预印本、数据集、专利、基金项目、政策文档等信息,并对不同类型文献进行分类标识[7]。在Dimensions网站首页中,通过左侧“publication type”选项筛选出预印本文章和期刊论文总数量。此外,考虑预印本网站虽然很多,但arXiv、bioRxiv、ChemRxiv、SSRN是物理+数学+计算机、生物、化学、社会科学领域预印本文献数量最有代表性的预印本,代表上述领域的预印本文章发表的现状与趋势,通过“source title”选项单独筛选出上述四个预印本网站中的文献数量。上述检索的时间均为1991—2021年。
表1数据为Dimensions数据库统计的不分学科的期刊论文与预印本文章数量倍数的变化情况。可以看到:期刊论文与预印本文章的数量差距确实在缩小,但是缩小幅度不断下降。30年来不分学科的预印本文章数量在2015年后加速上升,2015—2020年间,当年比上一年预印本文章新增数量依次为1.3万、2.7万、4.3万、5.7万、13.58万,但2021年预印本文章较2020年新增数量大幅下降,仅1.6万篇。
表1 不分学科的期刊论文数量与预印本文章数量之比 单位:篇
对表1中不分学科的期刊论文数量与预印本文章数量倍数(Y)与年度(X-1990)使用幂函数拟合,公式拟合为Y=662.89*(X-1990)-1.11。该公式意味着当Y=1(即期刊论文与预印本论文数量比等于1)、2……7时,X分别为2336、2175、2118年、2089、2071、2059、2050年,即到2050年,期刊论文数量仍然是预印本文章7倍。
新冠疫情初期,全球涌现大量疫情相关的预印本文章,被认为是预印本重构再造学术交流体系的一个重要表现。本文在Dimensions平台利用title/abstract包含关键词“COVID-19”或“SARS-CoV-2”或“coronavirus”检索2020—2022年COVID-19相关文献。新冠疫情主题的预印本文章数量呈现下降趋势,同时期刊论文与预印本文章倍数从2020年的4.4倍进一步放大到12.4倍,如表2所示。
表2 2020—2022年新冠疫情主题预印本文章与期刊论文数量对比
目前我国处于活跃状态的预印本网站有中国科技论文在线(http://www.paper.edu.cn/)、中国科学院预印本平台(http://www.chinaxiv.org)、中国预印本服务系统(https://preprint.nstl.gov.cn)。表3列出2003—2021年我国预印本文章与期刊论文数量变化,期刊论文数据来自中国知网。
表3 2003—2021年我国代表性预印本数据库发布文章与同期我国期刊论文数量
表3表明,中国科技论文在线2009年首发论文最多,一年超过10 000篇,之后大幅下降,近3年每年首发论文都低于2000篇。中国科学院预印本2017年发布预印本文章6000篇,之后大幅下滑,近3年每年发文都低于1 300篇。中国预印本服务系统近三年每年都低于1 000篇。我国期刊论文与预印本文章倍数呈现先下降再上升的U型曲线趋势,从2003年的1.3万余倍、下降到2009年的200余倍最低点后开始反弹,2021年反弹到554倍,上述走势与表1显示的国际趋势不同。
表1-表3的上述数据表明,30年来全球预印本文章确实增加很多,但与同期期刊论文数量相比差距还非常大,且2021年开始全球预印本文章数量增幅下降迹象明显,开始进入平稳期。与此同时,2003年以来,我国期刊论文数量与预印本文章数量的倍数比呈现出U型曲线特征。
综上所述,预印本在某些学科领域确实丰富了论文发表方式,为互联网时代学术交流体系中的非正式交流注入强大新活力,但其在正式交流领域中的影响力与期刊还有很大差距,认为预印本重构与再造学术交流体系的观点以及所谓后期刊时代之类的提法,整体上缺乏足够数据支持,目前预印本仍然扮演期刊的补充角色,而不是与期刊平分秋色,更不谈上重构与再造学术交流体系。
Hurd在2000年提出的2020年预印本与期刊平分秋色的预测为何未能实现?本文认为,原因在于下述逻辑:国家政策部门普遍不认可→高校与科研院所普遍不认可→高校与科研院所下属的大多数研究者自然也不积极发布预印本文章。国家政策部门指全国层级的教育科技人事政府部门、国家级课题与项目立项机构。
以我国为例讨论上述逻辑。
在我国,国家政策部门主要包括教育部(国家学位委员会)、科技部、国家自然科学基金、国家哲学社会科学基金等。国家政策部门掌握大量经费,在科技论文成果统计、学科评估、研究生招生指标分配、科教人员招聘、职称评定、科教人员聘岗、成果查重查新、课题申请与结题、学位点申报、硕士博士研究生毕业、研究生奖学金评定等诸多利益场合,国家政策部门不认可预印本文章,意味着发布预印本文章不能取得上述利益回报。此种情况下,我国大部分高校、科研机构不会认可预印本文章,那么大多数高校、科研院所下属的研究者自然不会积极提交预印本文章。毕竟,类似于俄罗斯数学家佩雷尔曼(Grigori Perelman)一样不在意论文发表方式、追求学术、淡泊名利的研究者是极少数,佩雷尔曼获得菲尔兹奖和美国克雷数学研究所千禧年大奖的文章没有在期刊发表,只在arXiv公开,且佩雷尔曼并没有领取菲尔兹奖和千禧年大奖,特别是千禧年大奖奖金为100万美元。由此,很多研究者对预印本表现出口头支持但缺乏实际行动的“态度—行为差距”现象。对中国高校教师进行的中国科技论文在线认知度调查显示[8],大部分被调查者支持预印本发展,但表示支持的被调查者却普遍没有向预印本提交过文章,原因是“所在单位不认可预印本文章”。
现阶段我国国家政策部门为什么不认可预印本文章?主要原因是预印本文章质量保障力度弱于期刊。学术期刊普遍采纳同行评议作为论文质量保障的机制,同行评议并不完美,但统计意义上能保证论文平均质量底线[9]。相比之下,预印本的论文质量控制仅针对作者身份与论文学术性,而不针对论文质量。ArXiv、bioRxiv、ChemRxiv、SSRN等国际代表性预印本平台的论文质量控制方法有审核论文上传者和作者身份、审核论文格式、审核论文内容的学术性和真实性。此外还有学者提出以人工审核为主机器审核为辅强化上传者和作者的研究身份审核、开放点评(社区评议,注册研究者可对关注文章发表看法)、通过社区评议对论文评级、问题论文撤稿、建立非诚信作者名单等建议[10]。
有一种观点认为,预印本可以通过社区评议保证文章平均质量,支持该观点的研究者认为,一篇期刊论文的评议人通常仅有3~5人,而预印本公开后,一篇文章可以受到几十甚至更多读者的点评,由此可以保证预印本文章平均质量[11]。该观点貌似有理,但与现实不符,现实中多数读者并不会花费宝贵时间精力去点评预印本文章,点评属于偶尔为之。2019 年全球最大生物学预印本平台 bioRxiv 进行的一项调查显示,该平台发布预印本文章仅有 10%被读者点评,如果进一步考虑评论条数不低于3条、每条评论字数不少于100字之类的合理筛选条件,则该比例更低[12]。
在上述情况下,要争取国家政策部门将预印本文章和期刊论文同等对待,就需要向国家政策部门证明预印本文章质量与期刊论文相当,即“预印本文章与期刊论文等质证明”。目前常见的一个预印本文章与期刊论文等质证明是预印本文章期刊发表率,如arXiv预印本文章的期刊发表率65%,其中凝聚态物理领域的预印本文章期刊发表率更高达80%[13]。BioRxiv在2016年发布的文章中,大约2/3发布后半年内在期刊发表[14]。但是,对于国家政策部门而言,期刊发表率作为预印本与期刊文章等质证明的不足在于:a.即使有较大比例预印本文章最终在期刊发表,仍然还有相当一部分没有在期刊发表。b.既然预印本文章大部分会在期刊发表,直接认可期刊论文即可,何必另外组织人员去评价没有在期刊发表的预印本文章[15]?
有极少数预印本论文没有经过期刊组织的同行评议,仍然为学术界所承认,前文提及佩雷尔曼证明庞加莱猜想的预印本文章即一个例子。但需要强调的是,大部分研究者不可能效仿佩雷尔曼,因为佩雷尔曼研究的庞加莱猜想在国际数学界有很高关注度,而且佩雷尔曼是成名的国际一流数学家。佩雷尔曼提交预印本文章的同时,邮件邀请国际上研究庞加莱猜想的一些顶尖研究者评议其文章。由于佩雷尔曼已具有相当学术声誉,其他高水平同行愿意评议其工作,所以其预印本文章没有期刊同行评议,但同样接受了高水平同行评议。大部分研究者不具备解决或者发现庞加莱猜想级别问题的能力,缺乏足够学术声誉吸引高水平同行评议自身研究。因此,大部分研究者首选将文章向期刊投稿,而不是提交预印本。
预印本目前整体上相对于期刊而言,属于补充角色,但两者之间也存在一定合作。预印本、期刊各有优缺点,最突出者即预印本发表快但是没有同行评议、期刊有同行评议但发表慢,对此两者形成互补关系,因此出现局部合作现象,最典型的合作方式即预印本扮演期刊投稿池角色,目前代表性的国际性预印本arXiv、bioXiv、SSRN等都建立了与期刊无缝对接的投稿系统[16]。
以arXiv预印本数据库为例,欧美出现了若干“骑在arXiv预印本背上”(Journals Piggyback on arXiv)的所谓Overlay期刊,如
国内方面,根据2017年中国科学院文献情报中心主办的中国科学院预印本官网发布新闻,该预印本与9本国内中文学术期刊建立了与上述欧美期刊类似的做法。百度“chinaxiv+合作期刊”,可以得到更多最新的合作期刊信息。
但是,预印本与期刊的上述合作属于局部、小范围现象,原因很简单,多数作者的心理是既然目前所在工作单位、国家政策部门只认可期刊论文,直接向期刊投稿即可,而且提交预印本存在论文创意被剽窃的风险。因此,将论文先在预印本公开后再向期刊投稿发表的作者在国内外始终都是相对少数。
3.2期刊与预印本优势融合:预印本2.0
期刊有同行评议保障论文平均质量,但拒稿普遍导致发表周期长,而预印本不拒稿,发表周期短、但是没有同行评议保障论文平均质量。那么,能否设计一种论文发表系统,不拒稿,同时又进行同行评议,融合期刊、预印本优点而去掉其缺点?回答是肯定的,预印本2.0可以实现上述要求。
预印本2.0=预印本+同行评议+论文分级[17]。作者向预印本2.0提交文章后,经过最基本的法律或者学术不端审核后,不会被拒稿,进行同行评议,将论文根据质量高低评议为不同等级。由此,预印本2.0融合期刊、预印本优点而去掉各自缺点。
预印本2.0的同行评议模式有多种模式,关注较多有三种:编辑邀请、社区评议、自组织同行评议。编辑邀请即大多数期刊长期采用的做法,由期刊编辑邀请评议人,分配待评论文交其评议。社区评议指读者对于感兴趣文章发表看法,不需要被邀请,也即自由点评。自组织同行评议指在互联网文献数据库、研究者个人网页、学术网站注册研究者、专门建设的评议人数据库等多种信息来源中,使用算法搜索待评论文所属领域研究者作为评议人,然后算法发出邀请,如对方接受邀请,再由算法将多篇待评论文与一组评议人之间进行匹配。
预印本2.0采用社区评议的缺点是:a.由于属于自由点评,不需要被邀请,因此评议责任模糊,评议随意性强。b.有些论文可能一直无人评议,或者仅一人评议,或者评议字数很少,不具有参考价值。c.一些作者可能邀请利益相关人员对自己的论文给出不符合实际的过高评级,也可能出现对存在利益竞争对象的论文恶意低评的情况。
建议预印本2.0采用自组织同行评议为主、编辑邀请评议为辅的同行评议组合模式。编辑邀请为辅,指对于少数主题过于小众的论文,采用编辑邀请的同行评议模式。多数论文采用自组织同行评议,其优点在于:a.作弊难度大,通过算法完成同行评议中确定评议人、匹配待评材料和评议人两个关键环节,不需要人介入,不容易作弊。b.效率高,算法可以7×24运行,而编辑需要休息。自组织同行评议在国内外多个场景已有成功实践,课题评审有我国国家自然科学基金评审智能指派、一些国际学术会议采用多伦多论文匹配系统(TPMS,The Toronto paper matching system,通过互联网调用该系统SaaS服务的网站http://torontopapermatching.org)、学位论文评审如凡科校际送审平台(https://www.lwglxt.com)/教育部学位论文送审平台(https://lwss.cdgdc.edu.cn)。期刊有欧盟资助Decentralized Science平台(https://decentralized.science/),其流程为:作者和期刊在该平台注册。作者向期刊提交论文。期刊初审通过后向平台提交论文。平台在评议人数据库中搜索和邀请专家。
由于预印本2.0融合预印本、期刊各自优点而去掉两者缺点,理论上说,预印本2.0具备取代期刊、预印本,成为今后多数研究者论文发表首选渠道的潜力。但潜力要成为现实,需要两个核心条件。
3.3.1资源集聚:预印本1+1格局
资源集聚指一个学科中的期刊往往数十本甚至几十、几百本之多,而一个学科中的预印本最初可能有多个,但最终会形成“1+1格局”,即一个国际代表性预印本、一个国内代表性预印本[18]。1+1格局出现的原因是:一个学科最初可能在全球和全国出现多个预印本,随着时间推移,多数作者必然首选论文数量最多的预印本提交自身论文,以尽量扩大个人论文的影响。较高水平研究者会将较高质量论文投往国际英文预印本,而数量上占多数的一般水平作者撰写的本国语言论文则自然倾向于投向本国预印本数据库。
“国际一个代表性预印本”方面,在物理学、计算机科学、数学领域,arXiv是上述领域全球研究者英文预印本首选发布平台。在生物学领域,BioRxiv是全球研究者英文预印本首选发布平台,其余生物学科英文预印本如Peer J Preprints、Nature Precedings等论文提交量远低于bioRxiv[14]。社会科学领域,预印本SSRN的注册作者、论文提交数量同样远超其他社会科学预印本。
“国内一个代表性预印本”方面,以我国为例,2003年前后国内出现多个预印本论文数据库,如中国预印本服务系统、奇迹文库、中国科技论文在线等,目前仅中国科技论文在线保持活跃。2016年,中国科学院主办的预印本上线,依托中国科学院的院所系统,有一定活跃度,但论文提交数量明显低于中国科技论文在线。
由于现有预印本引入同行评议对论文评级后即平滑升级为预印本2.0。因此,预印本的1+1格局为预印本2.0的形成提供了物质基础。
3.3.2国家政策部门认可
文献[17]对预印本2.0争取国家政策部门认可问题有较系统讨论,其建议的具体措施要点是:a.直接采用各学科领域权威期刊的同行评议指标、审稿单、程序做法,不要自行设计,同行评议指标与程序与权威期刊一致。b.评议人资格要求与国内核心期刊相当。c.论文评级标准与期刊分区对标。国际惯例多数学科期刊通常分四个分区。预印本2.0对论文评级时,可以考虑:5级对标国内外中英文顶级期刊(通常为一区中影响因子最高的3~5本期刊)、4级对标英文一区期刊与国内权威期刊论文平均水平、3级对标英文二区期刊(国内中文核心期刊)论文平均水平、2级与英文三四区(国内中文非核心期刊中工作量比较大的论文)论文平均水平对标、1级则与非核心中文期刊中工作量较小的论文对标。由于篇幅与主题原因,此处只是给出一个参考对标,不做更多阐述。
在上述措施基础上,进行预印本2.0论文评级与期刊论文的等质证明,有多种具体做法,如:a.抽样双盲对比。每年或者半年一次,分学科随机抽取国内外各分区代表性期刊的一定数量论文,邀请专家与随机抽取的预印本2.0对应学科各级论文对比,确定质量对应关系。邀请教育部、科技部、国家自然科学基金、国家社会科学基金等国家政策部门管理人员、专家参与,并加强宣传。b.模拟投稿。以学科领域为单位,将预印本2.0不同级论文,作为投稿向不同分区期刊投稿,如某个分区录用某个分级论文比例较高,可以证明两者等质。c.计算拟影响因子[19]。所谓拟影响因子指将预印本2.0的每个学科每一级论文分别视为一本期刊,统计其在代表性文献数据库(如中国知网、WoS、Scopus等)中的被引次数,计算拟影响因子,从而可以与期刊影响因子对应起来,在国家政策部门与学术界形成预印本2.0某个评级之论文的平均质量与某影响因子期刊论文相当的认识,解决等质证明问题。第一、二种措施可以立刻取得成果,而第三种措施见效较慢,因为积累一定数值的影响因子需要三五年甚至更长时间。
其他一些措施有:a.限制年度评级论文数量。一个研究者一年可以发布多篇论文(比如不超过6篇,平均2个月撰写一篇论文),但限制评级论文数量,如不超过3篇,也就是平均一篇有4个月工作时间,有助于提高质量。b.为更好地保护预印本文章知识产权,吸引高质量论文,与版权登记业务机构签署合作协议,文章提交通过基本审核后即自动取得版权保护[20]。c.研究传染病主题的论文没有完成同行评议之前不发布,否则删除其论文并给予其他处罚(如一段时间内其发布文章被禁止访问与下载、评议等)。社交媒体发布转载必须说明全文原始出处。新冠疫情期间,一些媒体为获取更多流量,选择性呈现部分预印本文章数据和结论,引发社会恐慌,上述措施可以抑制该缺陷。
期刊组织同行评议的历史比预印本存在的时间长得多,预印本2.0试图一步到位、取得国家政策部门全盘认可并不可行,可以采用以点带面策略。具体即先说服部分国家政策部门在部分学科、部分典型利益场合(如学科评估、职称晋升、岗位聘任、研究生毕业条件等)部分采用预印本2.0论文评级结果,先试先行,从0到1,逐步打开局面,最终实现国家政策部门对预印本2.0论文与期刊论文一视同仁。
由于预印本2.0不拒稿、发表速度快、发表成本低,因此一旦政策部门在典型利益场合认可预印本2.0的论文评级结果,若干年后,期刊与预印本2.0之间将出现以下局面:a.高影响因子期刊不会受到影响。b.低影响因子但发表周期短、不收版面费或者版面费低的期刊,始终有一定数量中低水平研究者选择发表论文,仍然继续存在。c.低影响因子、发表周期长或者版面费高的期刊稿源质量与数量逐步下降直至停刊。
出现上述局面的原因在于:高影响因子期刊数量少,其组织的同行评议较严格、评议质量较高,发文量普遍不多,政策部门与学术社区认可度高,学术声誉较高,预印本2.0对其影响小。少数影响因子一般、发表速度快、不收发表费或者发表费低的期刊,由于研究者对此类期刊仍然有需要,毕竟高影响因子期刊发文有限,故此类期刊仍可继续办刊。受预印本2.0冲击最大的期刊是影响因子不高、发表周期长或者发表费用过高的期刊。
预印本2.0融合期刊、预印本优势,同时又去除两者不足,发布与交流学术论文乃至著作、研究报告等成果更加简单、便捷,有利于科研效率和科研成果影响力的提升,减少知识传播与访问获取障碍,学术交流更加快速、自由、开放和透明,加速推动开放科学的实现。
预印本、期刊均起源于欧美,而预印本2.0概念以及目前全球最大预印本2.0数据库——中国科技论文在线——在我国提出与实践。但是,20年来中国科技论文在线发展不愠不火,其变革论文发表与学术交流方式的巨大潜力未能充分展现。
国家政策部门(特别是科技部、教育部、国家自然科学基金、国家哲学社会科学基金)、国内预印本2.0主办机构、预印本2.0观点的研究者及支持者是推动预印本2.0建设的三个核心群体。预印本2.0观点的研究者以及支持者要通过论文、博文、同行个体交流、会议、论坛、自媒体等方式努力扩大影响,与国内预印本2.0主办机构协同,令预印本2.0概念早日进入国家政策部门视野,推动预印本2.0建设,为下一个20年全球学术交流变革提出中国方案,发出中国声音,走出中国道路。