开放与融合背景下的学术出版平台建设研究

2022-09-09 06:24王欣董洪光刘峥
数字图书馆论坛 2022年8期
关键词:学术融合内容

王欣 董洪光 刘峥

(1. 高等教育出版社有限公司,北京 100029;2. 中国科学院文献情报中心,北京 100080)

近年来,我国高度重视科技创新工作,建设作为创新重要基础设施的学术平台迫在眉睫。2020年9月,习近平总书记主持召开科学家座谈会,在提到加快解决制约科技创新发展的一些关键问题时强调:“要办好一流学术期刊和各类学术平台,加强国内国际学术交流”。作为强化国家战略科技力量的一项具体措施,《中共中央关于制定国民经济和社会发展第十四个五年规划和二〇三五年远景目标的建议》中提出要“构建国家科研论文和科技信息高端交流平台”[1]。

经历20年的变革发展,开放获取与媒体融合在学术平台建设中日益发挥主导作用,形成以开放促融合、以融合促创新的良好态势。学术出版平台在学术平台体系中长期占据决定性位置,在开放与融合的背景下审视国内学术出版平台的发展现状与存在的问题,探析其未来发展路径,对学术出版平台建设具有重要意义。

1 开放获取与媒体融合的发展历程

在开放获取20年的发展历程中,2002年《布达佩斯开放获取宣言》和2003年《柏林宣言》代表着开放获取运动的兴起,而2015年“OA 2020倡议”、2018年“S联盟”“S计划”及后续转换协议落地实施则推动着开放获取运动进入爆发阶段。截至2021年底,共计42个国家/地区的155个组织签署了OA 2020意向书,S联盟成员增至27家[2]。Elsevier、Springer等学术出版巨头和《科学》《自然》《细胞》等顶级学术期刊相继发布开放获取政策。开放获取期刊增速显著高于学术期刊总体增速,开放获取论文年增长率明显高于订阅论文,且2020年开放获取论文数量首次超越订阅论文,标志着开放获取已经成为主流出版模式[3]。

媒体融合在国外的发展历程更长,国外媒体融合主要以市场规则为核心导向,而国内更强调其社会价值与监督功能。2014年以来,国内有4份关于融合发展的政策文件相继出台,包括《关于推动传统媒体和新兴媒体融合发展的指导意见》(2014年8月印发)、《关于推动传统出版和新兴出版融合发展的指导意见》(2015年3月印发)、《关于加快推进媒体深度融合发展的意见》(2020年9月印发)以及《关于推动出版深度融合发展的实施意见》(2022年4月印发)。这些政策文件为构建新型学术出版传播体系指明了方向,为“十四五”时期出版融合纵深发展奠定了坚实基础[4]。

在2022年4月发布的《STM趋势报告2026》中体现了开放获取与媒体融合对全球学术出版的双向驱动。该报告主题为“大规模开放之美”[5],其中预测未来5年内全球学术研究与出版生态系统即将面对两项变革:3~5年内开放获取平台激增,基于海量学术内容的、可扩展的知识发现工具将获得长足发展,出版商平台面临重新定位问题;学术群体多元化,除原有学术出版生态中的作者、同行评议专家和学术编辑等核心群体外,活跃于社交媒体的新一代研究人员、依赖科技资讯的新一代读者、直接影响内容活跃度的意见领袖、维护可信学术环境的监督者等群体均被独立定义,充分体现媒体融合特性。

我们正在迎接一场由开放获取与媒体融合双向驱动的学术出版变革。开放获取使得用户可获得的学术内容激增,它推动着传统订阅模式的学术出版平台逐步向提供全流程服务、深度智能化服务迈进,努力营造高效、透明、可信的学术环境;媒体融合带来了更多元化的学术出版用户群体和更丰富的学术内容呈现方式,并迅速形成新的学术内容传播渠道和学术用户访问入口。开放为融合提供了基础条件,融合进一步提升了开放的价值。

2 国外学术出版平台的变革之路

20世纪末,国外学术出版巨头纷纷启动全文数据库建设,并于21世纪初提供基于XML结构化数据的内容增强型订阅服务,成功实现传统纸质出版与数字出版的融合发展并获得巨额利润。开放获取运动及同期Creative Commons协议[6]的提出突破版权壁垒,从根本上打破了全文订阅服务的底层逻辑,在接下来十余年的博弈对抗与妥协中,学术出版商在做大做强学术内容的同时,基于对行业发展趋势的预判,充分拥抱新技术和新需求,逐步完成战略转型与业务拓展,学术出版平台体系也随之发生诸多变化。本文梳理近十年国外学术出版平台发展线,选取变革中的代表性侧面进行剖析。由于国内外学术出版平台市场环境不同,本文不涉及平台商业模式问题。

2.1 收购行业内头部技术公司,提供全流程学术出版平台解决方案

开放获取环境下,搜索引擎、索引评价体系、社交媒体及精准推荐工具等原有提供知识发现与引流服务的第三方主体都有机会提供全文及基于全文的深度服务,出版商仅凭全文订阅服务就能攫取丰厚利润的日子一去不复返了,全文数据库与内容集成已经不再是全球学术出版的前沿竞争领地[2]。近年来,国外学术出版巨头大举收购头部技术公司,为行业内中小型出版机构提供全流程学术出版平台解决方案。收购不仅帮助出版巨头获得专业技术和平台产品,更重要的是,同时收获了平台产品之前数年沉淀下来的大量原生用户。

2016年,Wiley公司以1.2亿美元的价格收购了为全球学术期刊发展服务的软件公司Atypon[7],跨越式地实现从内容出版到平台解决方案提供商的转型升级。Atypon在被收购之前已经在行业内运作了20年,此前已独立完成对Metapress、eXtyles等产品的收购,合作者包括全球最大和最有威望的一些学术组织和机构。Atypon旗下学术出版平台Literatum为全球近9000种期刊和1500余家出版商提供智能搜索、信息发现、访问控制、电子商务、市场营销等服务,现已进入中国市场。

2018年,Elsevier公司收购Aries系统,成为Aries拳头产品——全球三大投审稿系统之一的Editorial Manager的新东家[8]。Editorial Manager在被收购前已经为PLOS、Springer以及Elsevier等全球150多家出版商的3300多种学术期刊提供稿件在线处理服务。由于每天都有成千上万的论文流经Editorial Manager,所以Elsevier收购Aries的举措使其提供行业服务的吸引力和集中性得到了显著提高。Elsevier在收购之前已经自主开发了与Editorial Manager功能相近的稿件提交和跟踪系统Evise并已投入使用,但依然放弃Evise选择收购用户基础更好的成熟产品,足以证明出版商在战略转型与业务拓展过程中快速完成用户积累的重要性。

2.2 布局智能计算,全面提升深度服务能力

智能技术助推全行业创新发展。有实力的出版商积极布局智能计算,挖掘尚未被关注或满足的用户需求,跳出全文文献服务的同质化低水平竞争圈层,提供深度高附加值的差异化服务,具体体现在以下3个层面。

(1)单一学术文献层面。通过凝练学术文献的核心内容,帮助用户最高效地完成文献阅读、知识获取和认知升级。如Wiley公司尝试利用AI算法,针对期刊论文自动创建多种维度的摘要;再如面向入门级人群生成用通俗化语言表达的非技术性论文摘要等。

(2)知识组织层面。通过机器学习与数据挖掘,实现跨文献的内容自动分类、聚合与组织。如Elsevier公司ScienceDirect平台提供的Topics智能服务,可以帮助用户非常便捷地在阅读文献的过程中补充学习相关概念和术语,一键获取权威解释,并在一系列学术文献的上下文语境中理解具体应用场景。用户也可以通过搜索服务定位到自己感兴趣的Topics页面,通过定制化服务跟踪相关Topics的最新进展[9]。

(3)内容分发层面。通过智能算法实现用户行为与学术内容的精准匹配,将最切近需求的内容实时分发给用户。ScienceDirect和SpringerLink都将个性化定制与推送服务作为平台的发展重点。被Wiley公司收购的Atypon公司于2019年底研发了Scitrus[10]——一款AI驱动的新型知识发现工具,它使用机器学习来了解用户不断发展的兴趣,实时反馈最新的期刊论文、预印本、新闻和专业会议等,并以社交媒体的样式交付给科研用户。这是学术出版平台通过技术创新布局入口及流量、培育用户黏性、努力提升自身国际化传播能力的典型案例。

同样地,智能计算也已被尝试应用于学术出版平台的其他组成部分,助力提升内容出版效率。如集成于投审稿系统中的稿件技术性初筛服务、审稿人推荐服务、学术论文相似度检查及AI图像审核服务,集成于生产系统中的AI文字编辑与校对服务等。

2.3 进军开放业态,做透明高效可信学术环境的主导者

开放与融合将不可避免地催生出多种新业态和新对手,如2021年被热议的“预印本是否会取代期刊”[11]。国外学术出版平台主动进军预印本服务、开放同行评议及科学数据管理与出版等开放业态,在竞争环境中寻找新的立足点。

(1)高效。预印本服务是在开放获取大背景下逐步发展起来的学术交流模式。学术出版平台经历了与预印本平台平行发展,到接受已经先行发布预印本的作者投稿,再到将预印本服务纳入学术出版体系、提升稿件处理效率的态度转变。Elsevier公司于2016年收购社会科学研究网络(Social Science Research Network,SSRN),通过其“First Look”项目为Elsevier的学术期刊提供投稿稿件的预印本存储与托管服务,并可显示稿件在期刊出版流程中所处的阶段。《柳叶刀》和《细胞》系列杂志已于2018年加入该项目,并将其作为公开评论平台为论文收集更广泛的评审意见[12]。2021年9月,SSRN正式被Scopus索引评价体系收录,SSRN内容的可见性和访问便利性进一步增强。

(2)透明。Taylor & Francis公司于2020年收购了F1000 Research(以下简称F1000),不仅成功实现了传统预印本服务,并且开启了“开放同行评议”新模式。具体地,一旦作者投稿稿件通过了F1000的形式化审核,这篇预印本论文就视为“出版”并可被引用,同时论文进入“开放同行评议”即“后同行评议”阶段,评审者姓名及其评审意见都将面向所有用户开放,作者根据评审意见修改论文并提交修改后版本,随后论文将被索引到Scopus等数据库中[13]。

(3)可信。科学数据的开放共享可供其他研究人员引用或重现实验,一方面避免不必要的重复实验操作,加快研究进程;另一方面助推可信可重复的科学研究。国外学术出版平台已制定并公布相应的科学数据政策,如Elsevier的《科研数据政策》中规定了共享研究数据、获取与复用、数据可用性说明、开发工具和服务以支撑研究者发现、使用和复用数据、数据引用实践,为科研人员、机构和资助者提供有效管理数据所需的结构、工作流和技术等内容要素[14];Wiley的《共享与引用研究数据》中针对数据共享政策、数据引用政策及自动存档数据等方面做出说明[15]。

2.4 融合学术社交媒体,服务于更广泛的用户群体

随着媒体融合的深入推进,国外学术出版商试水社交媒体平台,并实现与自身学术出版平台体系的无缝对接,为更广泛的用户群体提供更多应用场景下的服务。

早在2013年,在综合考虑教育科研正在走向开放与社交的背景下,Elsevier公司收购了曾经的对手——在线学术交流平台Mendeley,并一举囊括了Mendeley已有的全球210万学术科研用户[16]。此后Mendeley实现与ScienceDirect平台的对接,辅助科研人员创建个人主页、定制个人的学术社交网络、实现个人文献资源和研究成果的便捷管理,甚至不断更新研究人员发表与分享研究成果的方式。Mendeley本身也是重要的社交活跃度计量工具Altmetric的重要统计来源。

Springer于2018年投资创立的Research Square不仅是预印本服务平台,同时也是一个活跃的学术社区。2021年6月,Research Square与科研交流服务平台Kudos展开合作,帮助科研作者与团队将科研成果用通俗易懂的话语阐述出来,不仅面向科研界,也面向政府机构以及普通大众等对科研感兴趣的各方讲述科学故事,推广科研成果[17]。

3 国内学术出版平台建设现状、机遇与发展路径

近十年是国内学术出版平台蓬勃发展的十年。在“中国科技期刊卓越行动计划”等国家项目及资金的扶持下,学术出版机构、学术内容集成商及行业技术提供商等各类主体竞相启动学术出版平台建设工作,相继推出可以支撑学术出版全流程业务链条的平台体系。在了解近十年国外学术出版平台发展线路的基础上,笔者梳理国内学术出版平台建设现状,分析其面临的主要问题,探析平台未来发展路径,以期形成合力,把握机会,实现国内学术出版平台跨越式发展,有效支撑科技创新。

In Eq. (2), c stands for the state of candidate directions:if more than one outputs are permitted, c is set to 1, otherwise to 0.

3.1 国内学术出版平台建设现状

盘点现存且有代表性的国内学术出版平台,其建设主体主要包括以下8类:①学术出版机构,如高等教育出版社;②学术内容集成与服务商,如同方知网(北京)技术有限公司;③学术内容生产制作服务商,如北大方正电子有限公司;④行业技术开发商,如玛格泰克科技发展有限公司;⑤知识发现服务提供商,如国家科技图书文献中心;⑥致力于开放科学生态的传统文献服务机构,如中国科学院文献情报中心;⑦新型学术共享平台服务商,如安徽蔻享数字科技有限公司;⑧国外平台解决方案提供商,如Wiley Atypon。“中国科技期刊卓越行动计划”5家集群化试点项目承担单位和3家国际化数字出版服务平台中标单位被视为国内平台建设主体中的中坚力量。多元主体通过自主研发、合作开发、工具集成及购买SaaS服务等方式完成平台建设与服务工作,阶段性目标是为国内“小散弱”的出版单元提供学术出版平台服务。

以上多数建设主体有能力以自建结合集成的方式提供全流程学术出版数字化平台服务,主要包括投审稿系统、生产系统、发布引擎、内容传播与服务系统以及运营管理系统等部分,其中面向全球用户提供学术内容传播与服务的能力主要由内容传播与服务系统实现。长久以来,国内外学术出版机构依托与搜索引擎、索引评价体系、社交媒体及精准推荐服务等第三方平台的广泛合作,将其学术文献的元数据信息按照标准格式输送到第三方平台,由第三方平台将终端用户引流至内容传播与服务系统获取全文(见图1)。

图1 学术出版平台基础结构

经过数年的积累,国内平台已经初步具备提供托管服务的能力,例如截至2022年5月,SciEngine平台已为中国科学院内新增30余种期刊提供了投审稿、结构化生产、发布与传播等试用服务[18]。

3.2 国内学术出版平台现阶段存在的主要问题

在相当长的时间里,国内学术出版平台学习国外成熟平台的先进经验,在业务流程数字化及以XML结构化数据为基础的内容呈现等方面快速成长。近年来,在我国政策、项目及资金的扶持下,国内学术出版平台已取得长足发展,从平台数量和服务质量上都有质的飞跃,但在一定程度上存在同质化重复建设问题,尚未进入大规模推广阶段,尚未出现创新应用。相较于国际领先的学术出版平台,国内平台,尤其是出版机构主导的学术出版平台在规模化服务、深度服务及国际化传播能力方面依然存在一定差距。

在规模化服务方面,由于聚合的学术内容体量有限,大部分学术出版平台缺少规模化服务的实践。一方面,缺少图书、期刊、会议论文等多种学术文献在同一学术出版平台上的聚合;另一方面,同一类型的内容也未能发挥集群效应,以英文学术期刊为例,国内平台虽已初步具备提供托管服务的能力,但国内英文学术期刊长期以来“借船出海”,依靠国外出版商平台提供服务。

在深度服务方面,现阶段大部分平台均已实现基于XML结构化数据的学术内容浏览、搜索、文章结构导航、全文服务、单篇论文评价等基础服务,但是依托算法与数据的深度服务能力还有待提升,例如学术文献的多种版本摘要多由作者完成,相关文章推荐等功能还较多依靠购买国外TrendMD等插件服务实现。国内平台在面向用户提供精准、智能的知识服务方面技术累积不足。

在国际化传播能力建设方面,国内平台近年来已经取得较大进步,逐步建立起与国内外第三方索引收录系统、搜索引擎等平台的数据传输通道,使得学术内容元数据能够实时传递到这些入口级平台,增强内容曝光度和传播能力。由于国内平台起步较晚,且内容体量不大,所以与诸多第三方平台的合作还需要持续推进,尤其是距离成为学术用户的访问入口还有较大差距。

3.3 国内学术出版平台发展路径探析

3.3.1 在开放背景下鼓励我国英文学术期刊回归国内平台

英文期刊是学术出版平台上的重要学术内容。国内英文学术期刊长期以来“借船出海”,其中很重要的一个原因是看重国外出版平台较强的国际化传播能力,借此增强期刊的可见度和访问量。而从国内期刊与国外出版平台合作的具体实践来看,国外平台的国际化传播能力一定程度上是通过第三方平台引流实现的。以高等教育出版社与Springer合作的Frontiers系列英文期刊(自然科学类)为例,从Springer提供的使用统计报告来看,期刊浏览下载数据中70%左右是通过搜索引擎、索引评价体系等第三方平台引流实现的。国外出版平台凭借其资源聚集优势、通过广泛的元数据合作实现第三方平台向其出版平台的全文引流效应,而第三方平台引流用户到国外出版平台的根本原因在于独家版权。第三方平台无法跨越出版机构实现面向终端用户的全文服务及基于全文的深度服务。开放获取环境下,国外出版平台不再拥有版权优势,原有依靠第三方引流实现的学术平台传播能力将被稀释,而国内平台有机会在这一变革中提升自身的传播能力。

本文中,笔者将学术平台传播能力与学术内容传播能力分而论之。简单来说,学术平台传播能力体现了平台聚集用户的能力,包括用户将平台作为直接访问入口,也包括用户通过第三方最终到达平台;而学术内容传播能力代表了平台对学术内容进行分发的能力,平台保证学术内容会触达到指定范围的用户,但不限定用户必须到达本平台访问内容。

国内学术出版平台现已基本具备学术内容传播能力,通过与国际第三方平台进行数据对接,在开放获取环境下完成全文数据提交,借助第三方平台分发学术内容。同时开放获取和开放科学必将助推一批新型开放平台的兴起,这将在学术内容传播能力方面带给国内平台更多与国外平台“并跑”的机会。适时鼓励我国英文学术期刊回归国内平台,给予依托我国自主平台出版服务的期刊更多的政策扶持,将有助于国内平台积累规模化服务能力。

可喜的是,目前已经陆续有英文期刊决定回归或启用国内平台完成全流程出版服务,如《先进陶瓷(英文)》在“借船出海”11年后将于2023年正式回归SciOpen平台[19],“中国科技期刊卓越行动计划”高起点新刊《一体化安全(英文)》启用自主平台办刊[20]。

3.3.2 在我国算法治理体系下推动平台智能计算核心技术应用

智能化属于战略性、需要久久为功的技术,是国内学术出版平台的创新基础和重要推动力,平台面向用户提供的很多深度服务和差异化服务需要依托以算法和数据为核心的智能技术实现。国内学术出版平台建设中尚有很多具有重要意义且极具挑战的课题,例如:通过人机协同实现稿件技术性审查,提高出版效率;通过上下文语境判断引用分类,使引证维度的论文影响力评价更加客观;实现更精准的内容分发和自动摘要,提升科研人员阅读效率;寻找审稿人推荐与隐私保护的平衡点,让同行评议高效可持续发展等。突破其中的任何一个挑战,都会切实提升服务用户的能力。从落地保障措施来看,国家新闻出版署已经启动若干智能相关的“出版业科技与标准重点实验室”,以产学研结合的方式邀请科研界及产业公司共同聚焦出版行业发展的“卡脖子”问题,推动关键核心技术攻关,促进研究成果尽快落地。

需要强调的是,智能技术是双刃剑,算法带来便利的同时也带来了诸如大数据杀熟、算法黑箱、信息茧房、算法操纵等新的社会风险问题。当前我国算法治理的立法体系已初步建成[21]。在顶层设计方面,《法治社会建设实施纲要(2020-2025年)》提出健全算法推荐、深度伪造等新技术应用的规范管理办法[22]。在算法的专门性规范方面,有2021年9月发布的部门规范性文件《关于加强互联网信息服务算法综合治理的指导意见》[23]。2021年12月底,四部门联名签署对外公布《互联网信息服务算法推荐管理规定》,并已于2022年3月1日正式实施[24]。我国学术出版平台建设需要在国家算法治理的总体框架下推进智能技术应用,让学术内容有更平等的被推荐机会,避免形成算法推荐之下的信息茧房;需要持续关注以区块链为基础的Web 3.0等发展中的技术变革,用技术寻找隐私保护与数据归属的突破点。

3.3.3 在媒体融合背景下分阶段实现平台传播能力建设

对于出版机构作为主体建设的学术出版平台,尤其是英文学术期刊平台而言,由于目前依托其提供出版服务的产品有限,很难像国际上成熟平台一样进行每年若干次的迭代升级,也难以对一些前瞻性需要长期积累试错的功能持续投入。为了适应行业快速变革和平台持续发展的需求,应考虑分阶段实现差异化发展。分阶段实现学术内容传播能力建设和学术用户访问入口能力建设尤为重要。

第一阶段先要解决平台学术内容传播能力建设问题。持续发展与传统及新兴第三方平台的数据合作关系,在开放与融合环境下实现即时的内容分发,借助第三方平台及渠道触及客户,完成“为内容找用户”。打消“借船出海”的英文期刊回归本土平台的顾虑,不影响回归后学术内容的国际传播力。在媒体融合背景下,新兴媒体平台在学术内容传播方面已经初见成效。仅以高等教育出版社“中国学术前沿期刊网”平台上的SCI收录Q1区期刊Frontiers of Physics为例,该刊2020—2021年发文总量为156篇,其中通过微信公众号宣传的论文共33篇,占比21.15%;156篇论文在“中国学术前沿期刊网”的总使用量(含HTML浏览量和PDF全文下载量)为58236次,通过微信公众号宣传的33篇论文的总使用量为22728次,即21.15%的论文贡献了39.03%的论文使用量;156篇论文在WOS数据库中的总被引频次为920次,通过微信公众号宣传的33篇论文的总被引频次为382次,即21.15%的论文贡献了41.52%的论文被引频次。同时该刊单场直播在线人数最高已突破1.7万人,学术直播已被更广泛的科研群体所接受。

第二阶段集中解决平台作为全球学术用户访问入口的能力建设问题,实现“为用户找内容”,这是包括国外出版平台在内的很多内容平台的奋斗目标。国内学术出版平台可以充分借鉴国外平台的并购经验,将平台建设与用户拓展合二为一,在找准着力点的前提下通过技术创新布局入口及流量、培育用户黏性、与国内其他建设主体以合作方式最大限度地完成用户积累,在开放与融合大局之下形成具有独特价值的创新应用,提升全球化学术内容与用户聚合能力,掌握学术话语权。媒体融合背景下的一些国内新型学术共享平台健康发展,已逐步涌现出一些新的学术用户访问入口。仅以蔻享学术平台为例,该平台自2018年创建以来发展迅猛,截至2022年6月,平均每天40场次会议直播、100场次单个报告直播,上线学术视频量超过3万个,已培育超过30万注册用户,月活超过112万,总点击量超过3000万次[25]。

以开放促融合,以融合促创新。国内学术出版平台应充分发挥在开放与融合发展方面的政策优势、学者优势及平台经济发展优势,集中解决在规模化服务、深度服务及国际化传播能力方面存在的问题,着力打造新的学术产品形态,发展创新应用,在学术群体日趋多元化的发展形势下努力服务于更广泛的受众群体,在助力科技创新发展的宏伟事业中发挥积极作用。

猜你喜欢
学术融合内容
内容回顾温故知新
村企党建联建融合共赢
学术是公器,不是公地
融合菜
从创新出发,与高考数列相遇、融合
《融合》
如何理解“Curator”:一个由翻译引发的学术思考
对学术造假重拳出击
主要内容
创新需要学术争鸣