阿嘎尔
(内蒙古工业大学图书馆,呼和浩特 010051)
学术协作网络(Scholarly Collaboration Networks,SCNs),又称科研社交网络(Academic Social Networks,ASNs),影响较大的平台包括Academia.edu、Research Gate、Mendeley等。SCNs是一种促进学者发展专业关系的平台,通过这一平台可以实现跨机构和地理界限的在线互动,建立学者间的协作网络,共享与交流科研学术信息。一些SCNs如Mendeley、Zotero、CiteULike等虽然提供了交流研究成果的功能,但并不支持学者上传与下载学术出版物,这些SCNs更多因为强大的引文管理功能为人熟知。另一些支持分享与下载学术出版物的SCNs是本文研究的对象,典型代表为ResearchGate与Academia.edu。此类SCNs在提供服务的过程中,常涉及存储/托管与分发受版权保护的内容,进而侵害到出版商的权利。针对此问题,全球各大出版商往往采取发送移除通知、诉讼等方式维权。但近年来,部分出版商策略转向温和,寻求与SCNs互利合作。
国内外围绕SCNs的讨论于2010年后呈增长趋势,涉及类型与功能比较、用户行为研究等,国外的相关研究热点近年来集中于版权法、学术自存档等,Manca[1]以及国内的李玲丽等[2]、曾燕等[3]曾做了较为全面的研究综述。专门针对出版商与SCNs关系的学术探讨较少。比较有代表性的是2017年经济学家Laakso等[4]围绕SCNs对学术出版相关利益者影响的调查研究,他们认为,就当前期刊订阅商业模式而言,SCNs还无法撼动学术出版商在学术出版中的主导地位,但若利益冲突进一步激化,出版商必然做出回应,诉讼或尝试收购都有可能。
总体而言,针对出版商与SCNs关系的学术探讨缺少相对系统的梳理与讨论。尤其鉴于近两年相关议题发展呈现出的新趋势,就此展开讨论极有必要,也有助于反思并进而优化当前图书馆信息服务。
ResearchGate(以下简称“RG”)与Academia.edu(以下简称“Academia”)均成立于2008年,为当前全球影响力最大的两个SCNs(见表1)。根据统计范围为2015年12月—2016年11月的一项调查[5],RG访问量(Visits)高达71 000万余次,高于ScienceDirect(52 000万余次)与Wiley Online Library(36 000万余次),是Sci-Hub(11 000万余次)的将近7倍。另外一项面向15 000名学者考察SCNs使用情况的统计数据[6]显示,RG的活跃使用度遥遥领先,是Academia的2倍多。至少发表过一篇论文的受访者中有61%使用RG,28%使用Academia。
表1 RG与Academia概况
与其流行度相映照的是,RG与Academia网站为大量受版权保护的学术期刊论文提供访问与下载。研究显示[7],在RG上随机抽取的500份英文期刊论文中,非OA论文392篇,其中201篇违反了该论文所在期刊的版权政策,构成侵权。而根据出版商联盟CRS的外部调查[8],截至2017年RG已经提供了多达400万篇受版权保护的文章,并且涉及侵权的文章数量每天都在继续增长。
2013年12月,学术出版巨头Elsevier向Academia发送告知书,要求该网站将2 800篇涉及侵权的论文撤下[9]。这些论文全部属于最终出版版本,而非作者初稿。根据作者在发表论文时与出版商之间的协议,这类论文可在作者与同事之间内部交流,用于内部教学与学术会议。Elsevier在一份声明中强调,“不能允许大规模免费访问(此类论文)……尤其是通过(如Academia这样的)营利性网站”[10]。事件以Academia陆续撤除侵权论文结束,双方并未诉诸公堂。
2017年9月,代表140家出版商的国际科学、技术和医学出版商协会(International Association of Scientific Technical and Medical Publishers,STM)就侵权论文事宜向RG致函[11],建议RG与各出版商方签署《文章共享自愿原则》(Voluntary Principles on Article Sharing),接受《文章共享框架》(Article Sharing Framework)技术解决方案[12],这一方案可以帮助平台自动处理用户上传的论文,向用户提示该论文是否可以公开或私下共享。同时,STM也希望可以获得RG上与研究活动相关的使用数据。
同年10月,STM成员Elsevier、美国化学学会(ACS)、Brill、Wiley和Wolters Kluwer成立专门针对RG的合理共享联盟(Coalition for Responsible Sharing,CRS)。据其称,RG拒绝了STM的建议与方案,而是要求出版商为在RG上非法分享的每篇论文发送删除通知[8]。CRS认为这是一种短期措施而非长期解决方案,低效且混乱。“不必要的复杂过程”会破坏研究人员的用户体验,而且被删除的受版权保护的文章有时还会重新上传,删除并不能解决RG的潜在行为模式。虽然一些出版商旗下的SCNs已采用《文章共享框架》,但这一方法并没有被其他独立的SCNs广泛认可。CRS意图借RG作为处理其他SCNs涉及相关问题的范例,而不断检查各平台所有上传论文的版本显然并不是适宜于普遍应用的方案。
尽管RG陆续移除了170余万篇侵权论文,2017年10月,ACS和Elsevier在德国(RG注册地)的一家地区法院对其提起诉讼,并于2018年在美国再次提起诉讼,以寻求法律层面的澄清与支持,明确RG在侵犯版权方面的法律责任,并可以将《文章共享框架》应用于RG。当前两起诉讼均尚未有结果。
在出版商与SCNs的纠纷中,呈现出以下特点。
其一,出版商没有起诉任何一位上传论文的作者/SCNs用户。
Elsevier曾于2015年状告免费文献获取网站Sci-Hub,并于2017年6月赢得诉讼。但不同于Sci-Hub,SCNs上的各个版本论文基本为作者本人上传。从法理层面,许多作者已经违背发表论文时与出版商之间的协议,但在与Academia和RG的纠纷中,出版商都不遗余力地表明不会针对论文作者。例如,ACS就通过电子邮件向作者和图书馆说明其对SCNs的维权工作,并强调出版商并不敌视学术分享,但敦促作者在期刊的版权协议范围内行事[13]。
对于学术出版商而言,学者/学术界是学术出版产品的价值来源,无论是针对一名还是上千名作者发起诉讼,都会带来严重的情绪反弹与公关危机,意义甚微。但即便如此,作者应当了解自己在与出版商协议下所拥有的有限权利,或者在初期就选择符合自己需求的出版方式。对于图书馆等机构来说,有义务开展围绕版权法、开放获取等相关问题的指导。
比起论文作者,营利性SCNs显然更容易成为攻击目标。出版商一直反复强调,营利性SCNs正是依靠大量论文的托管和重新分发为其网站带来巨大流量,进而通过广告等方式盈利。此外,有学者指出,Elsevier等出版商近年来投资了一系列依赖于身份管理访问和控制的工作流产品和服务,控制身份管理是其近年来发展战略的重要部分[14]。而SCNs在构建学术身份管理和一系列相关服务方面已经取得相当的成绩,尤其是RG,从其被定义为“学术版的脸书”可见一斑。这种商业竞争考量很可能也是以Elsevier为代表的出版商制定策略时的因素之一。
其二,公关风险与出版商维权相伴而来。
Elservier作为学术出版巨头,一直致力于打击Sci-Hub等“黑色OA”。但它也经常是学术界愤怒的焦点,被认为在反对开放以保护其基于付费墙的业务方面有着“臭名昭著”的历史[15]。学术界自发抵制Elsevier的“知识的代价”运动自2012年开始,至今已经有上万名研究人员签署,保证不在Elsevier旗下期刊发表论文、担任编辑与审稿人。在与Academia和RG纠纷期间,也再一次引起学者在社交媒体上对学术出版商的情绪反弹与批评[16]。
根据公开的法律文件,在与RG的美国诉讼中,Elsevier与ACS共列出3 143篇RG平台上涉嫌违反版权法的论文[17]。而RG在一份动议[18]中辩称:如果认定RG上出现的这些论文侵权,就必然意味着撰写论文的人无权分享。根据《美国版权法》(特别是在美国卡罗来纳州),鉴于几乎所有论文都是合著,目前没有证据表明出版商从论文的合著作者那里获得了有效的专有权转让,而这些合著作者的“利益可能会因该案的决定而受到影响”。RG认为法院必须向包括第一作者与合著者的所有人提供诉讼通知,让他们有机会保护自己的权利。法院尚未对这一动议作出裁决,但若之后确实将3 143篇论文涉及的所有作者卷入到诉讼中,对于Elsevier和ACS来说无疑是又一场公关灾难。
目前出版商与RG的诉讼还没有结果,但通过2017年Elsevier与Sci-Hub的诉讼事件不难看出,即使最终出版商诉讼胜利,也无法控制Sci-Hub更换域名后继续共享海量文献,也无法阻止更多的论文在共享平台出现。出版商和SCNs作为学术交流生态系统中的利益相关者,比起诉讼,寻求共赢的技术解决方案可能更有实效[19]。
就在2017年CRS寻求合作失败,强硬要求RG移除侵权论文并发起诉讼的同时,出版商Springer Nature(以下简称“SN”)采取了另一种策略,与RG发布联合声明[20],宣布双方计划展开重要合作,“寻找在保护知识产权的前提下,在线共享学术期刊论文的解决方案”,并邀请其他出版商加入会谈。2018年4月,SN宣布与RG达成正式合作协议,声明将在保护作者和出版商权利的前提下,共同致力于促进学术协作网络上学术研究成果的分享[21]。双方合作计划的时间线参见图1。参与的出版商还包括剑桥大学出版社与德国Thieme出版社。
图1 SN与RG合作计划时间线
2020年,SN发布了一份报告[22],包含合作计划的基本情况,以及面向700名全球学者的系列调查结果。虽然对于更为具体的技术结构、数据交流等没有说明,但对于初步了解大型出版商与SCNs流量巨头的首次深度合作有很大帮助。本文第二部分将基于官方发布的报告、新闻评论等公开信息,结合用户角度的实际操作,对此次合作计划予以梳理。
2.1.1 总体目标
消除学者访问、获取、共享高质量学术研究的屏障,保证内容的顺畅获取。最大程度发挥SN与RG的能力、优势,提高学术研究工作的可见性与可发现性,改善科研成果的获取方式。
2.1.2 合作方式
数据关联层面的技术结构双方并未详述,简要来说,SN以PDF和XML格式向RG提供期刊内容,同时提供关于机构验证(IP地址)和期刊授权的相关数据;相应,RG会向SN返回使用数据与聚合分析数据,以帮助SN更好地了解其内容在RG的使用情况。
可以从以下3个方面认识此次合作的重点。
(1)论文关联。在RG,用户分享的论文一般包括预印本,已被期刊接受的初稿(Accepted Manuscripts,AM),经过同行评审、排版和编辑后的最终出版版本(Version of Record,VoR)。用户在上传时会被提醒确认自己上传论文版本没有违反与出版商之间的许可使用协议,RG并不负责审查。上传后,该论文就会在用户个人主页“出版物”页面上显示。此外,用户同时还可以向所需论文的作者“请求全文”,作者会收到相应的邮件提醒。
根据合作计划,SN期刊论文的VoR会直接与相关的所有作者的RG账户关联,而无须用户自己添加。同时,作者依然可以分享符合许可协议的预印本、初稿等。由此省去了作者自己上传VoR的步骤,同时也规避了违反许可使用协议的风险。
(2)权限验证。若用户所属机构本身为SN的订阅客户,用户可以直接在RG阅读和下载论文的全文PDF,而不需要额外的机构身份登录或验证。其他无权限用户可以查阅论文的预览版本,包括摘要、图表、元数据等(见图2)。
图2 论文关联与用户获取示意图
这一权限验证方法基于RG用户IP和用户机构所属。首先检查IP地址,如果没有通过,则检查用户的机构从属关系和电子邮件地址,即利用RG本身的配置文件信息作为用户授权的基础。RG在注册时要求用户填写研究机构邮箱(如×××.edu.cn)以及所属机构(如××大学)。根据合作,只要满足“机构邮箱注册+机构所属为SN订阅客户”条件后,用户即可顺利获取全文。用户便利性极大提高,实现在机构外而不需要额外验证与VPN等传统技术的订阅资源获取。但鉴于有用户添加虚假信息的情形,尚不明确SN与RG如何把控,SN也称“仍然还有空间改进SN机构用户到RG的映射过程”。可能随着合作计划进展,会有进一步的调整与方法披露。
(3)数据交流。通过使用数据的统计与分析,SN可以把握其官方平台外的用户行为,同时获得更全面的内容使用评估测量,有助于了解用户需求,进而优化服务。如合作期间,SN对科研人员行为展开一系列调查,涉及学者偏向的论文版本、学者的学术领域统计、不同领域学者对SN期刊的偏好等。
此外,合作一定程度上帮助SN减少了论文泄漏。除了出版商平台以外,大众还有很多途径可以获得需要的学术论文内容,如搜索引擎、社交媒体、电子邮件和“黑色OA”,这就是被出版商称为“泄漏”(Leakage)的现象,用户通过未经授权的途径访问学术出版物,使得出版商无法全面获取与评估产品的使用情况。借助合作,SN产品内容在RG上的使用可以很容易地使用COUNTER等行业标准来获取和评估,得益于此,SN可以在向客户报告产品使用情况时,将在RG平台的使用数据纳入统计。
2.2.1 对于学者/用户
(1)风险规避。由出版商直接上传论文VoR,作者规避了违反许可协议的风险。但这一上传过程是默认的,所以也有34%的作者在调查中表示希望自己有选择权[22]。
(2)研究可见性增加,学者影响力提升。受益于RG清晰的出版物界面(包含作者、项目、实验室等关联信息)、强大的社交联系与个性化推荐功能,专业领域和研究兴趣重合的学者可以快速关联,进而提升学者在SN发表研究的曝光率与可见性。
(3)更便利的远程访问。如前文所述,只要满足“机构邮箱注册+机构所属为SN订阅客户”条件后,用户即可顺利获取全文,非订阅机构用户也可以阅读预览版本。同时所有RG用户依然有上传预印本、AM以及向作者直接请求全文的权利。
2.2.2 对于图书馆
便利的远程访问也帮助图书馆的订阅资源得到更充分利用,尤其在新型冠状病毒肺炎疫情期间,为图书馆分担了相当一部分的资源获取需求。值得注意的是,当具有权限的用户下载SN期刊全文时,RG会跳出弹窗,提示这次获取是由于用户所在机构图书馆订阅而得以实现(见图3)。调查中,有图书馆馆员认为该服务提升了图书馆的声誉,因为一些学者很多时候并不了解所在机构订阅了哪些资源。
图3 成功开始全文下载时关于用户机构订阅说明的弹窗提示
2.2.3 对于出版商与学术协作网络
(1)积极的作者反馈。据统计[22],90%的作者对RG和SN之间的合作关系非常看好,96%的作者对于其论文全文被SN自动关联RG表示认同,还有学者提出希望更多的出版商可以与RG展开类似的合作。
(2)使用量增加。SN期刊的曝光率/可见性随着学者间的交流与互动在相关学科领域得到了提高。据统计[22],与SN平台相比,联合到RG的内容下载量增加0.6%~19.5%,阅读量增加3.6%~59.7%。
(3)对使用数据更全面的掌握。双方通过收集、分析用户行为数据,可以了解用户习惯,量化服务价值。合作计划帮助SN减少了论文泄漏,得以将RG平台的使用情况(如下载量、阅读量)纳入考量,并反馈给SN的订阅机构用户,从而能够最大限度地反映SN产品价值。
(4)“泄漏”转移。出版商通过合作,将“泄漏”转到图书馆的合法路径,转化为可以利用的数据,实际上达到了利用SCNs稳定图书馆订购的目的。用户通过既不属于出版商也不属于图书馆的平台,达到了利用图书馆订阅的结果,一定程度上巩固了出版商对于图书馆的订购价值。
(5)进一步扩大RG影响力。与主流出版商的合作为RG赋予了某种意义上的“合法性”,将其与Sci-Hub、Libgen等非法共享论文全文的网站区分开。同时,RG证明了自己成为传统远程访问方式重要补充的能力,在科研机构层面的声誉得到了提升。此外,这一合作计划作为“RG+出版商”合作的正面案例,客观上很可能会在RG与Elsevier和ACS的诉讼中起到积极作用,为该诉讼的谈判留有余地。
SN与RG的合作计划中呈现出的一些趋势与取向,对于包括图书馆在内的主体优化自身信息服务有所启示。
出版商无论是采取诉讼还是合作策略,如何解决SCNs上学术出版物共享的版权问题始终是关键。在STM与CRS向RG提出的技术解决方案中,是在用户将论文“上传时”进行自动的版权合规性检查,《文章共享框架》对平台“审查”用户上传内容提出了一定要求,如对DOI与JAV字符串和元数据的查找。但一直以来,RG将“论文是否侵权”的判断义务完全交给作者判断,RG只愿意在“上传后”,采取移除侵权论文等措施。在合作计划中,VoR论文由SN官方直接关联,用户无须任何操作,风险规避的同时,也符合上述RG“只负责善后”的一贯做法。
作为营利性的商业企业,各出版商采取的策略以及RG的不同回应,自然有其从各自利益出发的衡量与决策。但同时,从信息服务角度来看,虽然目的都是解决版权问题,合作计划同时更注重保证用户体验。不同于CRS“以版权所有权为中心”的解决思路,而转向为“以学者工作流程为中心”“以用户为中心”。学术出版物的共享只是学者研究工作流程的一部分,作者分享自己的论文并不是为了牟利,学者使用SCNs不只是为了传播与获取文献,更多是建立学者间联系和对话的空间。版权问题的处理不应成为问题的中心,而应是促进学者工作流程顺畅的方式,最终目标是满足用户/学者的需求。
由此反思图书馆信息服务,对于用户来说,与Sci-Hub、SCNs等相比,通过图书馆查找和访问学术文献相关的流程是否“摩擦”过多,效率过低。即使有“一站式搜索”功能,图书馆资源获取经常要求用户在多个页面、产品之间跳转。而Sci-Hub一个界面就提供了海量跨平台学术文献的获取,即使它是非法的。以美国乔治敦大学图书馆为例,对于图书馆已订阅的资源,用户需要6次点击,用时24秒获得;而在Sci-Hub只需要2次点击,用时5秒[23],客观上实现了用户“发现即获取”的要求。如何优化服务,进一步提升用户发现、访问、阅读的体验与效率,提高资源可见性与可发现性,是当前学术资源交流生态下图书馆服务提升的一个痛点。
媒体理论家Hall[24]曾指出,在当前信息环境下,谁为内容的访问把关并不重要,因为访问客观上已经是免费的,最重要的是,谁为围绕内容的使用所产生的数据把关,并因此能够从中获取最大价值。
近年来,学术出版商一直在调整商业模式,用户行为数据的汇总与再利用或转售已经成为出版商业务的重要部分[25]。拥有更多的数据可以提升既有服务,扩大服务范围,开拓更广泛的商业领域,使有关知识、研究发展和相关利益方的数据能够作为一种经济资产来使用。这涉及“跟踪”研究人员在利用信息服务时产生的使用数据(如个性化档案、访问和使用数据、使用信息源的时间等)。所以,无论是CRS还是SN,SCNs用户数据的获取与分析都是谈判的目标之一。
而从用户数据的利用中获得收入也是SCNs的商业模式,学者在享受平台便利的同时,也一直在为SCNs提供海量行为数据和“注意力价值”。Hall[24]认为营利性SCNs“寄生”于学术界,学者“正在向以盈利为目的的,拥有大量风险资本支持的公司提供数据”。SCNs的盈利取决于将学者生成的数据流变现的能力,广告自然是最直接的收入,此外,SCNs还会为研发机构提供趋势研究数据。一些SCNs还通过发展基于其强大社交协作功能的同行评价功能试图进一步扩大在学术界的影响力甚至话语权,如RG的RG Score和Academia的PaperRank,不仅反映了论文的引用,还通过细致的数据统计与分析反映了学者在SCNs上的活动与影响力。
综上,关于个人和机构研究活动的数据集正在由商业化运作的营利性公司汇集。在当前信息生态下,学者在享受便捷服务的同时,应意识到有关研究活动的数据的重要性,以及这些数据作为经济资产的使用方式。从图书馆角度应反思,如何正确引导学者使用RG等商业平台,是否有非营利性替代方案?能够创建大规模数据集能力的重要性日益增加,对于图书馆的挑战有哪些?
2021年4月,出版商Wiley宣布退出CRS,并将与RG展开合作试点。公开的信息显示,此次合作的具体实施应与“SN+RG”的合作计划基本相同。这也从侧面说明“SN+RG”的合作效果得到一定的认可,呈现了出版商与SCNs关系的另一种可能。
无论对于出版商还是图书馆,资源的发现和获取、衡量学术影响力的方式需要与时俱进的解决方案。虽然对于SCNs的本质褒贬不一,但客观上,其已成为现代学术交流生态的重要组成部分。出版商一直在探索与SCNs互利共赢的途径,图书馆也应批判性地认识SCNs在促进资源获取、学术交流等领域的优势,明晰SCNs在版权法与数据使用等议题中的责任与义务,进而将其为我所用。抓住机遇,面对挑战,探索更好服务于用户的可持续路径。