开放获取政策与实践的关键问题探析

2022-02-18 00:08陆彩女顾立平中国科学院上海药物研究所中国科学院文献情报中心中国科学院大学图书情报档案管理系北京大学图书馆
图书馆理论与实践 2022年1期
关键词:出版商知识库资助

陆彩女,顾立平,聂 华(.中国科学院上海药物研究所;2.中国科学院文献情报中心;3.中国科学院大学图书情报档案管理系;.北京大学图书馆)

2020年,全球新冠肺炎疫情大暴发,社会公众、政府部门、研究机构等进一步认识到了科研信息开放获取(Open Access,OA)的重要性。自布达佩斯开放获取倡议发布以来,开放获取尽管已经取得了丰硕的成果,如全球范围内开放获取政策的制定与落实、开放获取期刊的蓬勃发展、开放获取知识库的逐步壮大等,但科研人员在获取学术文献时,通常需要支付高昂的期刊订阅费之后才能访问全文,并且订阅费依然在逐年增长,对于图书馆来说甚至已经到了难以支持的地步[1]。也就是说,开放获取并没有按照预期发挥出布达佩斯开放获取倡议中希望实现的变革性甚至是替代性作用。基于此,本文将对当前开放获取政策与实践过程中的一些关键性问题作深入探究,并针对这些问题提出一些简单可行的建议和措施,以期能尽早、更好地实现真正的开放获取。

1 开放获取实践现状

本文所述的开放获取信息资源是指经过同行评审、受著作权保护、真实可靠的科学研究产出,如期刊论文、科学数据等。在出版商、研究机构与研究资助机构、学者等各参与方的多年努力下,目前开放获取活动基本形成了两种实践模式:金色开放获取(Gold OA)和绿色开放获取(Green OA)[2]。从学术出版流程来看,Gold OA是在学术期刊论文出版流程的源头实现开放获取,也就是在论文发表时,用户可立即通过网络免费阅读该论文全文;Green OA是在出版流程的末端实现开放获取,即在论文已经发表的情况下(无论是不是Gold OA),用户通过存储这些论文的知识库(通常是由论文作者所属机构或研究资助机构建设的机构知识库)免费阅览该论文全文。

期刊论文在学术出版流程中会历经三个版本:预印本、后印本和出版本[3]。预印本是同行评议和出版前的版本,通常是提交给出版商的版本;后印本又称最终审定稿,是在正式出版前经过同行评议后基于审稿意见修改后的版本,是在出版社副本编辑和格式化之前的版本;出版本是经出版商格式化后最终发布的版本。多数期刊出版社支持作者存储同行评议最终稿,即后印本;部分出版社只允许存储预印本;部分出版社允许存储出版本[4]。此外,Green OA论文并不是在出版时就能立即在机构知识库中存储并开放,多数出版社要求论文在出版后经过一段时滞期后才能开放获取,通常科学、技术、工程、医学领域(STEM)期刊论文的时滞期是出版后6—12个月,人文社科领域是12—24个月[4]。从版本和时滞期这两个角度来看,Green OA既没有干涉论文的正常出版流程,机构知识库基本只收录隶属本机构科研人员的知识产出,也基本不影响出版商或集成商通过时滞期内论文销售而获益。但尽管如此,据调查36家大型出版商的期刊中,只有约20种期刊允许以零时滞期和知识共享许可(CC-BY)形式进行自存储[5]。

Gold OA在政策和实践中经常会被提及的一个概念是论文处理费(Article Processing Charge,APC)。APC的出现是因为Gold OA这种出版即可见的方式极大地压缩了论文的利润空间,出版商为了弥补自身损失,将其受损的利益转嫁到作者身上[6],所以当前Gold OA通常需要由作者或研究资助机构甚至国家出面支付一定数额的APC费用,且费用不低。当前出版社收取的APC基本在2,000—5,000美元之间[7],知名学术期刊的APC更高。除了价格高昂以外,APC定价也存在价差大、规则混乱且不明晰、成本难以估计等问题[6]。大型商业出版商早已借APC这个概念,将OA从出版模式转变为一种盈利模式[8]。所以,APC问题是Gold OA目前需要警惕的主要问题。当然,资助机构和政策制定者们也都意识到了这一问题并纷纷出台了相应的举措倒逼APC更加透明化、合理化。如:Plan S制定了APC价格透明度框架[9];我国科技部在2020年发布了《关于破除科技评价中“唯论文”不良导向的若干措施(试行)》[10]。

2 当前开放获取实践的问题

由前文可知,Gold OA需要依托OA期刊(包括完全OA期刊或复合OA期刊)来操作落实,Green OA也需要依托机构知识库(或区域知识库或学科领域知识库等)来操作落实。目前两种开放获取模式在操作层面都出现了一些问题。

2.1 Gold OA的本质问题

Gold OA在近20年中发展迅猛,截至2021年3月,仅被DOAJ(开放存取期刊目录)收录的期刊就多达1.6万多种[11]。此外,还有许多订阅期刊为了满足作者或资助机构开放获取的要求而提供OA出版的情况,几乎所有订阅型期刊都提供OA出版选择[12]。如此庞大的期刊规模,不可避免地会出现鱼目混珠、以次充好的情况。目前来看,Gold OA在实践层面主要存在以下问题。

2.1.1 复合开放获取(HybridOpenAccess)期刊或延迟开放获取(DelayedOpenAccess)期刊

复合开放获取期刊需通过订购才能阅读全文,但是作者可选择支付APC后将自己论文立即开放[13]。延迟开放获取期刊也需通过订购才能阅读全文,但在时滞期到期后出版商自动提供论文的开放获取[14]。开放获取的初衷是让用户立即免费获取到可靠、不受限制的论文,而复合开放获取期刊或延迟开放获取期刊则是一部分论文是开放获取出版论文,另一部分论文依然采取付费访问方式。严格来说,复合开放获取期刊和延迟开放获取期刊相对于开放获取初衷,出现了一定的偏离与变化,并不是完全意义上的开放获取,然其作为走向完全开放获取的一个中间过渡产品有一定的必然性和合理性。另外,虽然PlanS(开放获取S计划)已明确资助者不得支持复合开放出版,但离复合开放获取期刊真正“消失”尚需一段时日[15]。

2.1.2 掠夺性期刊(PredatoryJournal)或欺诈型期刊(FraudJournal)

掠夺性期刊是指那些假借开放出版名义、实为收取论文处理费而采用多种欺诈手段、且有意放弃质量控制的期刊[16]。科罗拉多大学的Jeffrey Beall列出了掠夺性OA期刊名单[17]和掠夺性OA出版商名单[18]。这些掠夺性期刊给OA期刊整体形象带来极大的负面影响,使得科研人员不仅对OA期刊的科研质量提出疑问,而且对开放获取产生犹疑,因此对开放获取的发展具有不容小觑的破坏性。

2.1.3 第二梯队(Second-Tier)期刊

OA期刊多为出版集团的新创期刊,而声誉较好的既有期刊则仍普遍是传统的订阅期刊。传统订阅期刊的拒稿率要远远高于接受率,而OA期刊,尤其是巨型OA期刊都有高接受率和高发文量[19]。不难推测,在同一出版集团,OA期刊会接受被传统订阅期刊拒绝的稿件,从而沦为出版集团中的第二梯队期刊。就期刊影响因子来看,以Nature Publishing Group(NPG)为例,其出版的86种非OA期刊的2019年度平均影响因子为18.148,而其出版的36种OA期刊的2019年度平均影响因子仅为6.481[20]。

尽管目前有些机构已经制定了一些期刊质量管理规定或评价标准,如自设预警期刊名单[21]、科研机构通过自建平台或提出各项政策框架以促使OA期刊APC更加透明化[1]等,但是上述做法只能引导作者的投稿行为,而不是APC[22],因此,这些措施并不能彻底解决Gold OA存在的问题。

2.2 Green OA的本质问题

截至2021年3月,被OpenDOAR(开放存取知识库目录)收录的知识库接近8,000个,其中5,000多个都是机构知识库[23]。2021年3月,我国教育部发文表示高校应开展机构知识库的建设工作[24]。由此可见,机构知识库未来还会得到长足发展。但Green OA除了存在时滞期和版本这两个问题之外,还存在着一系列其他问题。

2.2.1 机构知识库“变身”为存储库(InstitutionalDatabase)

建设机构知识库的初衷和目的是实现开放获取,但是出于各种原因,很多机构知识库中存储的大量资源都不对外开放,只将其作为机构知识产出的存储库[15]。机构知识库不开放的原因包括版权限制、缺乏激励、开放获取认识模糊等。机构知识库作为机构学术信息资产管理基础架构的有机组成部分,为科研机构学术信息资产管理提供包括科研绩效管理、机构管理和决策支持等情景敏感的支撑服务,但不可回避的是,其在开放获取中所承担的角色和定位正在逐渐弱化和淡化。大量研究结果表明,机构知识库的开放程度达不到布达佩斯开放获取倡议的预期标准[26],这与开放获取的精神大相径庭。

2.2.2 机构知识库数据质量控制(QualityControl)问题

由于机构知识库在数据采集、清洗和规范过程中所面临的复杂性和困难,部分机构知识库提供的数据内容信息存在一定的质量问题,如数据不完整、元数据不规范、全文链接缺失、版本信息不完整或无效等。数据质量问题导致使用者无法判定信息的真实性和可用性,从而对机构知识库产生怀疑和负面印象。据调查,我国大部分机构知识库不处理版权问题,期刊论文仍是机构知识库收藏的主要资源类型,而自动采集的数据质量、完整性达不到预期,期刊论文之外的灰色文献又因其质量控制体系不完善而导致其质量良莠不齐,权威性不足[26]。

2.2.3 数据孤岛(DataIreland)问题

机构知识库只收录隶属于本机构科研人员的研究成果,范围有限,且我国大部分机构知识库都不支持可提高网络资源共享范围和能力的互操作协议OAI-PMH[26],这就导致部分机构知识库不能被纳入全球开放获取知识库网络,只是仅仅作为一个个“数据孤岛”存在,严重影响了机构知识库的开放互操作能力、展示度和影响力。尽管目前已经出现了整合性质的知识库平台,但各个知识库之间仍然是各自为政,缺乏合作机制与标准规范,很难真正实现底层数据的互操作,更无从要求各个独立的机构知识库实现真正的开放互联。

2.3 开放获取实践的关键性问题

2.3.1 GoldOA发展道路中本土期刊的发展问题

全球的科研机构和科研资助机构必须集中聚力才能真正解决Gold OA存在的掠夺性期刊、第二梯队期刊等问题。有效措施包括有选择性地资助OA论文、促使第一梯队期刊转变为OA期刊(如Plan S)等。但是,在全球科研资助经费相对集中的现状下,本土期刊与本土学术交流平台如何发展是一个较大的问题。Plan S广泛推进的结果就是在继续支持完全OA期刊的基础上,资助订阅期刊转型过渡为OA期刊。目前,全球巨型期刊出版商都位于欧美,使得欧盟、美国等国家和地区天然地在学术交流、开放出版中占据一定优势[27]。随着Plan S的提出与强势推进,全球顶级期刊出版商纷纷加入开放获取计划[28],未来这些巨型期刊出版商的垄断地位反而有可能进一步增强[27],我国本土期刊与本土出版平台倘若没有及时得到足够的重视和大力的资助,中国学术期刊依旧会被“卡脖子”。

我国的学术产出需求相当巨大,2018—2020年我国SCI和SSCI论文数量已连续三年位居全球第一[29]。但同时我国只有255种SCI和SSCI期刊(未包括港澳台地区数据),仅占全部12,856种SCI和SSCI期刊总数的1.98%[20]。不仅本土期刊少,我国学者在本土期刊上发表的论文也少。2020年,我国作者参与发表的53.6万篇SCI论文中,仅3.6万篇发表在本土学术期刊上[29]。就OA论文来看,SCI和SSCI收录全球2020年发表的OA论文数为75.5万篇,而在我国期刊上发表的OA论文只有不到8,000篇,本土学术期刊OA论文比例仅为1.06%[29]。这就是当前我国学术界存在的一个新矛盾:我国学者日益增长的巨大学术论文产出需求同落后的本土期刊之间的矛盾。

2.3.2 GreenOA的“替代药”问题

Green OA因版本和时滞期的问题,不能真正做到立即、免费、全面开放获取,在实践中还出现了只存储不开放、数据质量低、数据孤岛等问题。此外,机构知识库通常只能通过谷歌、谷歌学术或OA内容集成平台进行揭示,就连PubMed(医学文献检索)中也没有广泛采用机构知识库外链,只有36家机构知识库参与PubMed外链[30],说明目前机构知识库的资源揭示度与影响力仍然有待加强。此外,绝大多数科研人员在阅读或引用时仍更青睐出版本,而不是最终审定稿和预印本[31],他们认为出版本相对而言更权威、更值得信赖,最终审定稿和预印本无法直接获得论文的支撑材料,也不易于了解论文后续的更正或撤稿情况。因此,如果不解决上述问题,Green OA最终只能是付费数据库的一个“替代药”,无法真正取代付费数据库。

但实际上,Gold OA和Green OA之间并不是竞争关系,而是相辅相成的关系。因为Green OA的自存储政策对Gold OA同样适用,Gold OA论文在出版时可立即存储到机构知识库中,并立即开放,没有时滞期。一方面,Gold OA发展得越强大,存储于机构知识库中的OA论文就越多,机构知识库的开放程度与影响力也越大;另一方面,机构知识库建设得越完善、全球知识库网络建设得越深入全面,则内容存缴时的元数据级、内容级、访问级的质量控制机制[32]、内容审查机制以及评审机制[33]越能识别出那些掠夺性OA期刊发文。同时,全球开放知识库网络的存在也有利于保持市场制衡,防止APC价格失控增长[34]。

3 建议及措施

3.1 从国家层面高度重视本土期刊的发展

近几年,政策制定者们意识到了本土期刊发展的紧迫性,毕竟学术期刊的归属在一定程度上决定了学术话语权的归属。“十四五”规划中已明确提出“构建国家科研论文和科技信息高端交流平台”[35],多家部委也联合推出了中国科技期刊影响力提升计划[36],科技部的科技评价也要求科研工作者的国内期刊论文数不少于总论文的三分之一[10]。目前,我国已出现了一些成绩尚可的期刊和出版社,如Cell Research、Light、中国科学传媒等[28],但是仅有几家好的出版社或几本一流科技期刊是远远不够的,本土期刊与本土学术交流平台整体实力的持续提升可能需要几十年甚至更长时间。虽然本土期刊的发展已被提到了一个重要地位,但是国内OA期刊和高端学术出版交流平台仍然处于起步阶段,有待建立和加强。本土OA期刊的发展可以从国家层面成立专项基金,在资助国内OA期刊与学术交流平台、鼓励并资助现有期刊与平台向开放获取转型[37]等方面制定策略,增加投入。另外,对于学术评价和激励制度进行一定的调整,如不把SCI论文相关指标作为评价的直接依据[38],鼓励科研人员在本土期刊,尤其是在本土OA期刊上发表论文。

3.2 加强全球机构知识库之间的互联互通

随着全球机构知识库联盟的成立与机构知识库国际化、联盟化发展,机构知识库标准化和互操作技术愈发重要。国际上,全球开放获取知识库联盟早在2017年就强调开放获取的目的不只是为了方便开放获取,更是要建立一个可持续的世界性知识共享空间,通过互操作的标准和实践,将本地服务与全国、区域及全球网络相连,突出本地与全球之间的关联与协作[39]。Plan S也对机构知识库的开放、互操作提出了更高的要求,开放获取知识库互操作增强措施包括跨网络进行元数据交换、采用共同标准和API、实施共同功能等[40]。在国内,中国高校机构知识库联盟等机构知识库联盟的成立和运作促进了机构知识库建设向更高程度的开放、共建共享、标准化和规范化方向发展。机构知识库也可以借鉴其他学术交流平台的出版模式,如预印本、出版商、数据库等,积极发挥自身在学术出版交流中的作用。

3.3 建立健全我国开放获取相关政策、机制或标准

我国部分科研机构、资助机构等已发布了开放获取相关规划或意见,如中国科学院与国家自然科学基金委于2014年发布的开放获取政策[41]。但是,目前尚未在国家层面推出开放获取计划和政策。我国可借鉴OA2020、Plan S等开放获政策,循序渐进地设计并实施适合于我国的开放获取政策与机制,将开放获取落实到具体的政策行为、资助行为和知识成果管理行为中[42]。对于Gold OA,可以发布开放出版计划、资助政策与标准,培育本土OA期刊与本土开放学术交流高端平台,引导、鼓励并支持期刊出版社的传统出版模式向OA期刊转型,制定OA期刊质量评价标准、APC价格透明度要求与定价机制等。对于Green OA,可以发布自存储与开放政策,支持并资助建设国家层面与机构层面开放知识库的建设与发展,落实开放知识库建设与维护责任与经费、开放原则、自存缴行为,设计机构知识库互操作框架、制定机构知识库建设标准等。

猜你喜欢
出版商知识库资助
高校资助育人成效的提升路径分析
“隐形资助”低调又暖心
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
高速公路信息系统维护知识库的建立和应用
基于Drupal发布学者知识库关联数据的研究
2600多名贫困学生得到资助
遭车祸仍信守资助承诺
位置与方向测试题
各行各业
2006年国际消费类杂志调查