马鑫 卢垚 刘洪冰 王新 刘敏娟 王鸑飞
(中国农业科学院农业信息研究所,北京 100081)
随着科学技术的快速发展,科研成果发布数量倍增,使科技出版行业的发展和变革备受瞩目。在数字出版转型不断推进的背景下,科学技术和医学(Science,Technology and Medicine,STM)出版已完成了由传统纸媒向数字化文献资源的转型[1],知识服务已成为STM出版领域新阶段的发展共识[2]。国际知名出版商,如爱思唯尔(Elsevier)、施普林格·自然(Springer Nature)等已经实现了从传统出版商向信息服务提供商的角色转变。新的出版理念、出版技术和新型出版资源正在颠覆原有的科技出版产业。目前,数字资源已成为出版和利用的主流形式。当前,科技的迅猛发展、复杂的外部环境、日益旺盛的文献需求、文献出版业态的巨大变化,以及新冠病毒疫情防控常态化的形势,都给科技文献信息保障带来了新的挑战。《中共中央关于制定国民经济和社会发展第十四个五年规划和二〇三五年远景目标的建议》指出,科技知识资源已经成为支撑科技自主创新的重要战略基础设施和新发展要素[3-4]。国家科技图书文献中心(National Science and Technology Library,NSTL)自2000年6月成立至今,已建设成为较为完备的以印本为基础的数字资源保障体系,成为国内权威的科技文献资源收藏保存中心和科技文献信息服务枢纽,为我国经济社会发展和科技创新发挥了不可替代的支撑作用。因此,了解目前国际STM的科技出版变化,掌握用户多元化的文献需求,顺应新形势下科技出版业的发展趋势,制定相应的文献资源建设策略,才能确保NSTL在“十四五”期间为国家科技创新提供有力的文献信息支撑和保障。
近年来,STM协会及相关市场情报权威机构会定期发布报告,针对全球科学和技术出版行业的新趋势、出版形式和学科市场等进行全面概述,以此探讨学术出版面临的趋势、问题和挑战。根据辛巴信息公司(Simba Information)发布的《全球科技出版报告》[5-6]可以了解2016—2020年科技出版市场总体状况(见图1):期刊作为市场最大的科技出版类型一直保持稳定增长,到目前为止占科技出版市场销售额的50.9%;在线内容(包括电子资源数据库、标准、数据管理平台、研究分析工具等)2020年较2019年增长5.6%,涨幅最大,首次取代图书成为位居第二大市场的出版类型;图书市场明显萎缩,2020年比2019年降低8.9%,位列第三;摘要和索引(Abstracting and Indexing,A&I)服务的用户需求稳定,因此市场较为稳定,略有小幅增长,仍位居第四。
图1 2016—2020年科技出版市场总体状况
1.2.1 期刊
据辛巴信息公司STM Online Services 2019—2023报告[7]显示,截至2019年,超过80%的期刊都实现了数字化出版,绝大多数以电子化方式使用[8],而其最新报告[6]显示,2021年该数据已攀升至90%。通过对2021年国际知名出版社期刊出版情况的调研(见表1),纯纸本期刊已几乎不存在;纯电子期刊(E-only)数量约占出版总量的25%;而纸本+电子的出版模式是目前出版的主流模式,约为出版总量的73%。值得注意的是,各出版商都开始关注OA期刊的出版。国际四大知名出版社(Elsevier、Springer、Wiley、Taylor &Francis)OA期刊数量均已过百种。
表1 2021年国际知名出版机构期刊出版情况列表 种
从学科方面来看,近五年新创办期刊数量排名居前三位的均为在学科分类上较为广泛的交叉学科领域,分别是工程技术(664种),生命科学与农业(310种),地理、空间与环境科学(223种);其次是化学(129种)、数学(65种)、物理(72种)三门基础学科。这说明学术期刊的学科交叉性不断深化,同时基础学科依然是重要的研究领域。
1.2.2 在线内容
目前出版市场增长最快的类型是在线内容,2018年涨幅达到了6.1%[5],2020年增长5.6%[6]。在线内容主要指电子资源数据库软件工具等,但随着技术与内容结合越来越紧密,衍生出更多类型。从部分知名出版社的新型在线出版类型(见表2)可以看出,在线内容还包括数据管理平台、研究分析工具等,其特点是产品类型多样,兼具信息服务的深度与广度。
表2 部分知名出版社的新型在线出版类型
近年来,随着OA业务模式对传统科技期刊订阅模式的冲击,国际知名出版商纷纷重新布局,调整战略,围绕各种在线内容和服务展开了并购及产品研发,表明企业已明显从纸媒转向软件工具、平台和数据库。以Elsevier为代表的国际知名出版机构通过近几年战略性的收购和研发,利用先进的技术结合已拥有的大量底层数据,建成了整个学术研究生命周期和声誉管理的端到端数字化服务平台。将这些服务于科研价值链各个环节的平台和工具整合在一起,已完成从传统的科技期刊出版商转型成为服务于科学研究价值链上每个环节的平台和信息分析服务提供商,为科学研究提供更加精细化和个性化的服务[9]。
1.2.3 图书
随着科技期刊电子化阅读现象的普及,学术图书也向电子化方式迁移,纸质图书的出版和使用都在稳步下降,并且经过几年的快速增长,电子书的增长已经放缓[10]。据美国出版商协会(AAP)统计,2018—2021年美国图书市场数据显示印本科技图书总量在2020年下降了9.4%[6]。受到全球新冠病毒疫情的影响,许多线下学习转向线上,增加了用户对电子图书的需求。虽然学术图书馆仍然是学术内容(包括科学和技术内容)的核心购买者,且预算趋于稳定,但数字化趋势继续推动购买决策。尽管在OA运动背景下出现了重视社会效益的图书开放出版模式,但受出版经费、销售周期等限制,其发展规模仍受到制约[11]。更多的预算流向了数据库、电子期刊等在线内容,而不是图书。但总体来说,电子书支出的增加不足以抵消纸质书支出的减少,是科技图书出版领域整体下降的因素之一。
1.2.4 摘要和索引服务
A&I服务作为二次文献的内容来源,使科研人员能够通过使用一个数据库或平台更有效地进行文献检索和获取,有助于科学研究。在数字化环境中,研究产出高速增长带来的信息超载加重了科技查新与检索负担,增加了科研人员查询文献的时间。在这一背景下,A&I服务能够提供经过深度组织加工的二次文献,提高科研效率,因此对研究人员至关重要,而A&I产品服务的需求预计也将继续增长。目前,人工智能、深度学习等与科技文献情报服务的结合不断深入,如中国科学院文献情报中心在基于科技文献知识的人工智能引擎方面已有一系列实践成果,包括摘要语义识别、关键词识别等,为摘要与索引服务进行了智慧赋能。
越来越多的科研人员希望内容的检索能够实现不同数据库的无缝衔接,而不希望出版商对不同来源的信息设置障碍。例如,IET的Inspec数据库的所有文献都含有目录和摘要,数据以每周大约1.6万条的速度增加,用户可以通过科睿唯安(Clarivate)的Web of Science和RELX的Engineering Village访问该数据库,以无缝衔接的方式获取摘要索引服务。
1.2.5 OA出版
DeltaThink的OA市场规模报告[12]表明:开放获取市场的增长速度继续超过期刊出版基础市场;预计2020—2023年OA论文产量的复合年增长率为14%,OA市值的复合年增长率为17.6%。
根据Dimensions的统计数据[13],2011—2020年OA出版增长速率远大于订阅期刊,每年约以13%的速率增长,2020年全球发表的OA论文数量首次超过订阅出版论文数量(OA出版包括金色OA、青铜OA、绿色OA和混合OA),未来已来,OA出版已经成为主流出版模式[14](见图2)。
图2 2011—2020年全球出版论文数量与订阅出版论文数量统计
随着技术的发展和科研人员更精细化和个性化的信息需求,以数据为基础构建集成解决方案和决策工具将成为STM出版的重要领域,而数据不仅包括科学家自己拥有和授权的数据,还包括越来越多的由资助者授权开放的数据。开放数据将把出版商提供的价值重新转向发现和集成,传统服务也在添加新功能,努力将科研人员更紧密地捆绑在一个平台上。如Elsevier、Springer Nature、Clarivate等通过增加补充性服务来吸引用户,像Mendeley和ReadCube这样的参考管理工具正在成为交互的中心。
随着科技出版技术的不断发展,科研评价理念的改变,如果大学以开放获取引用的数量来判断他们的科学家和科研人员,而不是以影响因子来衡量在高影响力期刊上发表的论文,那么目前的STM期刊出版商业模式可能会改变,并让位于完全开放获取系统。到那时,STM出版的真正商机将是基于人工智能的搜索、数据和动态技术,使在线内容的需求和发展将更加旺盛。
近年来,STM出版界正在发生变化,出版的数字化趋势愈发显著[15]。STM出版商协会2018年发布的报告显示,几乎所有STM期刊都有数字化版本,绝大多数期刊都以电子方式使用,纸本+电子(P+E)形式是目前STM期刊出版的主流形态,纯纸本(P-only)期刊数量正在逐步减少,纯电子(E-only)期刊数量正在逐渐增加。
多年来,纸质图书的销量在不断下滑,而电子图书的销量在持续增长。但由于电子书的基数较小,难以弥补由纸质书销量下降带来的缺口,因此纸质书和电子书的总销量呈现持续下降趋势。受期刊数字化的影响,电子图书的商业模式也朝着电子期刊的方向发展。目前,电子书可按章节甚至段落访问,商业模式不再局限于一次性收购,而是扩展到年度访问、短期借阅、按次付费访问、按章节付费访问和用户需求驱动(Patron-Driven Acquisition)的单本采选[16],在如手机或平板电脑上这样的移动终端单独销售。此外,为了应对读者不断变化的需求,出版商也在不断创新,推出定制出版、按需印刷等商业模式。例如:OUP在北美推出的根据课程要求定制出版物服务;CUP推出结合期刊与图书各自优势,经严格同行评审,并由资深编辑以专题形式编排出版的简洁而权威的原生数字资源,将数字出版的及时性、灵活性和通用性与最高的学术标准结合起来,为科研人员提供动态参考资源[17]。
2.2.1 打造涵盖学术研究生命周期的数字化服务平台
随着2021年5月Clarivate收购ProQuest公司,包括Elsevier、Springer Nature姊妹公司Digital Science和Clarivate三大出版巨头都已形成自己的涵盖整个学术研究生命周期的数字化的服务平台。即从学术研究的构思、写作开始到最后研究成果的出版,形成服务闭环,再结合学科评估、成果评价形成强大的智能化服务能力[18]。这些平台上的产品可独立存在,也可整合到平台中成为平台的一部分,为用户提供精细化的分析服务[19]。
2.2.2 研发有助于深化用户关系的文献管理与替代计量工具
与用户建立更深层次的关系对于出版商来说至关重要。文献管理软件和分析工具可以助其更好地了解用户,并推广相关衍生服务和产品,从而带来巨大的价值和利益。替代指标或替代工具能够实现对更广泛的研究生态系统进行计量分析,不仅限于已发表的研究,还将社会媒体、博客和其他形式的研究交流纳入其中。例如:Elsevier的Mendeley等文献管理软件正在成为出版商与用户互动的重要工具;Plum Analytics和Altmetrics则提供了一种影响因素替代方案[20-21],帮助用户即时收集来自社交网络上多样化学术成果的关注度,从而更全面、客观地评价研究成果的影响力,发现高价值的研究成果。这些工具构成连接用户与出版商的纽带和桥梁,因而至关重要。
2.2.3 搭建支持数据分析和挖掘的科研数据管理平台
对易用性和无缝集成的追求一直是在线服务变革的许多驱动因素的核心。目前,各家出版机构纷纷主动参与到科研数据的管理上,都在自主研发搭建科研数据管理平台,接受和支持多种文件类型,并对这些多源异构数据资源进行整理,使科研人员能够轻松共享、访问和管理数据集,以便更好地管理和传播科研数据,提升科研数据的可发现性和再利用性。IEEE DataPort最高可免费上传2TB数据;Springer Nature的Figshare为上传条目分配DOI便于查找和引用;Elsevier的Mendeley Data是基于云端的模块化平台,可以将5个模块整合以发挥独立功能,也可以和其他科研数据管理解决方案搭配使用,搜索功能可对35个以上知识库的1 000余万个数据集进行索引。Springer Nature的基于大数据理念的新型科研信息数据平台Dimensions,是通过机器学习和文本挖掘等技术对数据进行增强处理,从而统一数据标准,建立跨数据源的关联关系,为科研人员、机构、出版商以及科研经费资助机构提供信息数据服务和决策支撑工具。
2.2.4 实现信息技术与出版的紧密结合
近年来,STM出版商已从传统的内容出版转向提供在线的内容服务、研究工具和解决方案,这就要求出版商更加依赖信息技术,在提升与用户交互能力的前提下,为其提供动态化、智能化、易用性强和无缝集成的更优服务。传统出版商已经通过并购、合作等形式迅速提升了人工智能、机器学习、图像识别、语义标记、搜索引擎优化等方面的技术实力,这些技术被应用在诸多出版流程中,包括投稿、寻找同行评议专家、编辑和出版流程、信息的提取以及推荐阅读文章等。信息技术的应用在帮助用户获得更好的体验、提高工作效率的同时,让出版商从科研论文中提取到更多数据、洞察到更多信息,进而助力科研人员加快其研究进展。例如:Elsevier通过收购Parity Computing Inc.获取其机器学习、自然语言处理和语义技术方面的经验,为Scopus的分析和决策支持功能奠定基础[22];Clarivate与UNSILO建立合作伙伴关系,在论文提交和评审系统ScholarOne上试点人工智能技术,以改善同行评审流程并提高审稿效率[23-24]。
目前,全球发表的OA(金色OA、青铜OA、绿色OA和混合OA)论文数量已超过订阅出版论文数量,OA出版已经成为主流出版模式,增长幅度远远高于传统订阅出版。2020年以来,新冠病毒疫情的暴发对科研成果的开放性和及时获取性提出了更高要求,使预印本迅速成为主流研究发布平台[25]。随着OA出版模式的日趋成熟,许多预印本平台开始与一些商业机构合作。PLOS与冷泉港实验室达成协议,在作者提交投稿之后,经作者同意文章将自动在生物学预印本平台BioRN和化学预印本平台ChemRN上发布,以加速成果传播[26]。随着预印本资源的激增,平台开始注重对预印本进行遴选和主题分类,以帮助用户精准获得高质量预印本资源;还出现了期刊与预印本平台合作,将同行评议的工作加入对预印本的评价中[27],并将研究成果预版本的发布正式纳入期刊出版全流程[28];随着科研人员对开放资源的权益认识及接受度逐渐提升,出版商也在不断探索共享内容的合作方式。2018年,Springer、剑桥大学和德国Thieme出版社与科研社区ResearchGate达成合作协议,在保护作者和出版商权利的前提下,消除科研人员访问、获取、共享高质量学术成果的屏障,以提高学术研究工作的可见性和可发现性,共同致力于促进学术协作网络(Scholarly Collaboration Networks,SCNs)学术研究成果的共享[29-30]。OA资源已成为重要建设内容,制定OA遴选标准,建立OA资源平台和专题资源库,提供开放资源集成发现和一站式服务,从OA论文扩展到OA数据,对于预印本资源本身的内容质量和为用户提供个性化、精细化的服务提升,以及基于开放资源的数据挖掘和再利用等,使科研生态和学术传播途径更加多样[31-32]。
当前,STM出版与数字技术的融合日益紧密,呈现出版类型多样化、服务供给创新化等趋势。面向科技创新和科技体制改革的科技文献保障需求,与西方国家对我国科技信息封锁日益加剧的现状之间存在巨大矛盾,作为国家级的科技信息保障和服务机构,NSTL应把握“十四五”期间的科技信息服务发展机遇,不断完善科技信息资源保障和服务体系,采取以印本文献资源为保障、OA等新型资源为主体的文献资源建设战略。
随着STM出版趋势向数字化方向推进,在馆藏文献数字化的大趋势下,学术图书馆的经费预算将更多从传统印本文献资源向电子期刊、电子图书和在线服务等数字资源倾斜。在图书馆经费增长幅度远远落后于资源价格上涨的今天,各图书馆都面临印本学术期刊的取舍问题。随着数字环境日趋完善,各馆也逐渐将“重用轻藏”的理念落到实处。近年来,国外已有图书馆开始将印本期刊馆藏全部数字化,供更多用户利用;在国内,多数高校图书馆不断缩减印本期刊的费用,同时增加电子期刊的采购经费。在馆藏文献数字化的大趋势下,数字期刊的比重将会越来越大[33]。
由于提供数字资源的数据库商与出版社之间版权协议存在不稳定性,所以数字资源保存和使用也存在一定的不确定性。因此数字资源某种程度的脆弱性,决定了纸质资源和电子资源的长期建设,这是图书馆的社会责任。作为国家级的科技文献信息资源保障机构,NSTL肩负着国家资源战略保障任务,持续巩固印本文献的战略储备和基础保障作用是国家科技信息资源建设的基础性和战略性任务,也是数字信息环境下国家科技文献保障系统完整性和战略安全的最可靠屏障。
在STM出版领域,数字时代已经全面到来,数字资源已成为学术交流中最重要的资源。STM并购活动表明,出版商已明显从纸媒转向软件工具、平台和数据库。NSTL“十四五”发展规划指出:媒体融合时代,在语义出版、数据出版等背景下,文献资源范畴正在发生变化,它包括越来越多的新媒体、科学数据、可视化图谱等新型资源,因此需要强化对富媒体学术、事实型数据、术语型组织、软件型工具等资源建设保障,形成立体化资源保障体系[34-35]。当前,以用户需求为导向的文献资源建设工作,在面向复杂多变的科学研究过程与科技创新环节,用户对信息获取的便捷性、时效性、完整性、准确性提出了更高、更精细化、更细粒度的知识服务需求,在支持用户提问的基础上,帮助用户研判问题、分析数据、挖掘关系、揭示关联、辅助决策[4]。在全面推进面向学术研究的基础上,需要开拓面向产业创新的资源建设,加强市场报告、产业分析、统计手册等资源采集,形成学术信息资源与产业信息资源相融合,适应知识增长和创新需求变化的一体化创新资源体系。此外,在开发利用上,可以在数字平台中融入科技文献内容语义描述模型,推动细粒度的知识发现、共享与利用,满足立体化数字资源保障体系的建设要求[36]。
近年来,国际知名出版商的并购活动围绕各种新型资源展开,这些工具和平台将作者和客户与出版商的内容紧密地联系在一起,更好地了解用户,并温和地引导他们转向其他服务,增加用户黏性。新技术、新商业模式将不断涌现,推动产品创新,更多的工具被开发出来,让机构和科研人员能够存储数据并分享研究成果。这些工具不仅用来分析研究本身的成果和影响力,也用来分析评价科研人员和相关机构。以科研管理平台、数据分析为代表的新型资源是出版机构的发力点,通过精准分析,用于提供高质量科研成果,吸引更多用户使用相关产品和服务,增加出版机构与用户黏性,进而再通过获得大量数据提供更精准的分析服务。因此,加强新型资源的采集,如专利分析、软件工具、科研数据、情报分析、代码等,有利于满足科研人员更精细、更深入的科研需求。
目前,OA出版已经成为主流出版模式,增长幅度远远大于传统订阅出版。我国已经长期积极参与推动开放获取实践,不断优化和完善科技文献资源发现系统,加快推进开放获取符合我国建设创新型国家的需求和实施创新驱动发展战略的核心利益。由于科技文献的获取和共享对提升知识传播利用效益和开放国家创新能力具有重大意义,NSTL主动发挥科技文献资源国家平台作用,联合多家成员单位先后开展了多类型的开放获取工作。NSTL通过对开放资源的遴选、采集、加工、组织与揭示,将不同平台、不同文献类型的资源集成整合,构建了OA集成整合系统;建设了以提供预印本文献资源服务为主要目的的实时学术交流系统——中国预印本服务系统;中国科学院文献情报中心、中国农业科学院、中国医学科学院都建立了具有专业领域特色的机构知识库[37]。图书馆在开放存取中扮演着信息搜集、使用、管理和建设角色,同时承担着维护和存储责任。系统完整地搜集网络OA学术资源不仅包括主流学科、新兴学科、培育学科等的外文期刊、图书资源,还应该包括由政府机构网站得到的开放数据、预印本资源以及地方志、字词典、实用工具软件等。从资源遴选、组织加工到资源服务,不断完善OA资源采集内容和平台建设,为用户提供OA资源服务,真正发挥图书馆作为社会信息资源共享中心的作用[38]。未来,NSTL应在巩固已有OA资源及平台建设成果的基础上,积极顺应数字出版环境与STM出版趋势,以用户需求为落脚点,在资源整合、服务创新等方面加大建设力度,如实现不同数据库资源的互操作,以及通过摘要索引服务促进资源利用。
本文对STM出版态势与现状进行调研,结果表明:期刊、图书、在线内容和摘要和索引服务是STM出版的主要类型;传统资源呈现纸电结合的发展态势,新型资源则更强调内容与信息技术的融合,且开放获取逐渐成为主流出版模式。在当前背景下,互联网、数字化技术的出现给传统图书馆带来了革命性的发展契机,馆藏信息资源结构正在发生变化,文献信息资源建设的重点已经从以往主要以纸质文献为主逐渐转向纸质资源与数字资源同步建设的发展轨道,呈现出由传统文献资源向数字知识服务转移的新态势。因此,作为国家级科技文献保障平台的NSTL应从文献资源立体化、新型化和开放获取等方面着手,努力发挥其在网络化时代科技文献资源战略保障中的作用,把握当前国际科技文献信息出版动态,探索符合NSTL面向“十四五”发展规划对文献资源建设的发展之路,提高科技信息资源的建设和服务能力。