21世纪国外图书馆技术产业的历史考察
——对Marshall Breeding图书馆技术产业报告的分析*

2022-12-15 02:50陈定权袁俊聪吴亦乐
图书馆论坛 2022年12期
关键词:技术产业共词图书馆

陈定权,袁俊聪,吴亦乐

0 引言

图书馆是“最积极的信息技术采纳者之一”[1]。早在1964年美国国会图书馆就开始研制机读目录(Machine-ReadableCataloging,MARC),并于1969年发行[2],为图书馆自动化系统奠定了基础。20世纪末美国图书馆完成引进商业化集成管理系统、网络化电子信息服务和数字图书馆3个自动化发展阶段[3],图书馆自动化发展进入短暂的平静期。进入21世纪后,在资本推动下,技术供应商继续深耕图书馆市场,推出了电子资源管理系统(Electronic Resource Management System,ERMS)、资源发现系统(Discovery System)和图书馆服务平台(Library Service Platform,LSP),图书馆自动化市场呈繁荣之态。无论是20世纪的图书馆数字化建设,还是当前的智慧化转型,都跟高度商业化的图书馆技术产业有着莫大关系。美国著名图书馆系统独立顾问马歇尔·布汀(Marshall Breeding)长期跟踪和研究图书馆自动化市场和技术产业,在国际上引起了广泛关注,他发表的各种调查报告和评论性文章被业界视为图书馆技术市场风向标,帮助图书馆掌握市场发展趋势和主流产品,是图书馆信息化建设与图书馆技术研究的重要信息源。本文分析2002-2022 年布汀在《图书馆杂志》(Library Journal)和《美国图书馆》(American Libraries)刊发的图书馆技术产业系列报告,从中梳理出图书馆技术产业的变化规律和发展趋势,为我国图书馆技术产业发展和当下的智慧化建设提供借鉴。

1 研究进展

一般而言,图书馆技术是指在图书馆进行应用的包括计算机和互联网等在内的信息技术[4],其中又以图书馆自动化系统为核心。图书馆技术产业是图书馆赖以生存的基础设施[5],为图书馆提供商业化的产品和服务。我们关注和研究图书馆技术产业有三大考量:发达国家的图书馆技术产业对落后国家的发展具有重要参考价值[6];有助于图书馆选择最合适的技术应用,市场因素是技术应用普适性最直观的体现[7];有助于梳理出图书馆技术发展脉络,深刻理解技术在图书馆发展与转型过程中的角色和贡献。

20世纪70年代末80年代初,国外图书馆自动化系统开始商业化[8],图书馆自动化产业盛极一时。美国学界有着长期跟踪研究自动化市场的传统。Joseph在《图书馆杂志》开设图书馆自动化专栏[9];布汀延续Joseph的工作,从2002年开始,连续21年评述图书馆技术产业发展[10];John也在1989-1994年持续调查过英国图书馆自动化市场的增长和供需情况[11]。

早在1988年,陈源蒸就指出,在图书馆自动化比较发达的国家,都有专门研制自动化系统的公司,我国自动化发展要走商业化发展道路[12]。陈勤等在1989年关注到以美国为主的国外图书馆自动化市场的繁荣景象[13]。后续有学者分别从市场发展状况[14]、市场特点[6]、国内外市场比较[15]等角度剖析其发展历程,但并没有引起我国广泛关注,研究的持续性不够。最近10年得益于布汀的《图书馆技术指南》(Library Technology Guides,LTG)网站(https://librarytechnology.org),我国学者可以第一时间了解国外图书馆技术产业发展,开展了系列研究。温汉荣译介了布汀对图书馆自动化市场新趋势的判断[16],肖铮等翻译了2019-2021年图书馆系统市场报告[17-19],李娟[20]、李伟超[21]等则基于布汀的图书馆感知调查数据来分析研究国外自动化系统产品。

然而,若要把握图书馆技术变化规律和发展趋势,须将图书馆技术产业置于宏观的历史视角下考察。Richard回顾了1960-1980年代图书馆自动化的技术演变历程[22]。Martha基于市场数据分析指出,1980年代随着技术成熟、成本降低和图书馆自动化需求增加,图书馆自动化市场规模迅速壮大[23]。陈定权等从市场角度将美国图书馆集成系统历史划分为5个阶段[7]。邸雅静基于布汀系列报告,总结2010-2020年美国图书馆技术产业的竞争形势、细分市场动态和技术演进[5],这与本研究主题相似,但研究方法、时间跨度和研究重点有较大不同。

2 资料收集与分析

本研究收集布汀发表的图书馆技术产业系列报告,经进一步规范整理后,采用共词分析法,借助Gephi可视化工具,以网络图谱方式呈现共现结果,为后面做进一步深入分析提供基础。

2.1 资料来源

LTG 网站的“图书馆技术产业报告”(Library Technology Industry Reports)栏目下有21篇报告,时间跨度为2002-2022年,前后21年。这21份报告分为两部分:一是2002-2013年发表在《图书馆杂志》上的图书馆自动化市场年度报告(Automation Marketplace),共12篇;二是2014年后在杂志《美国图书馆》上以“图书馆系统报告”(Library System Report)为名发布的9篇文献。这两类报告内容体例大致相同,都包括产业市场概览、总体销量和盈亏、行业内关键的并购案例、上一阶段的产业发展特点和未来的产业发展趋势。因此,本研究将这两种报告一并作为研究资料。

2.2 数据处理

报告由两部分组成:正文和介绍性资料。为尽可能体现出布汀对技术市场的判断,删掉介绍性资料和正文中的表格及相关注释性文字,仅保留有研究意义的文字。本研究使用宾夕法尼亚大学开发的nltk自然语言工具包[24]对原始文本进行清洗和预处理,步骤如下。

(1)去除文本标点符号,并根据空格将文本切分成单个单词(word),再去除停用词。

(2)词汇规范控制。首先,进行词性标注,根据词性标注的结果,将动词、复数、进行时、过去时等词性的单词规范成名词形式,如对“migrate”迁移规范成其名词形式“migration”。其次,剔除副词、介词等无意义词、高频词和在图书馆语境下无关的词汇,仅保留最能体现图书馆、技术、产业等主题的词汇。

(3)使用 n-Gram 算法发现新词组(words)。由于英文的语言特性,词与词之间有着天然的分隔符,导致大量有意义的词组被拆解了,因此按照n 为2、3、4 分别统计出现次数较多的单词搭配,人工从中筛选出有意义的词组,如“Ex Libris”“kuali ole”“world share management service”,并对意思相近的词组进行规范,如“library system”和“library software”需规范成“library automation system”。接着将这些词组,或缩写或用“_”临时合成为一个新单词来参与统计分析。

(4)词频统计。统计所有单词出现的次数,最终得到含有884个有效词的词频统计词表。

2.3 资料分析方法与工具

为反映文本内容的内在关联,本研究采用了共词分析和可视化呈现技术。常见的共词分析是以文档为分析单元,统计词语同时出现在同一个文档中的次数,共现次数越多,词间关系越密切[25]。本研究待分析文档数量少,以文档为分析单元难以清晰呈现词间关系,故选择以段落为分析单元构建共现矩阵,统计结果更能反映词间关系,并选择Gephi作为可视化工具[26]。

3 基于共词的可视化分析

近20 年图书馆技术产业有两个标志性事件:一是2005年提出的图书馆2.0[27];二是2012年图书馆服务平台概念的兴起[28]。在网络2.0理念和技术冲击之下,图书馆界积极反思图书馆自动化系统,寻找创新突破口,适时提出图书馆2.0 概念并推出图书馆系统。例如,充分体现了图书馆2.0 元素的资源发现与传递系统(Resources Discovery and Delivery System,现在简称为Discovery System 或Discovery Service)后来成为图书馆服务平台的三大来源组件之一,另外两个是传统的图书馆集成系统(Integrated Library System,ILS)和 ERMS[29]。图书馆服务平台的出现则是颠覆性地改变图书馆自动化系统的部署模式和供应模式,推动图书馆技术供应市场的新一轮繁荣。本研究以图书馆2.0和图书馆服务平台的出现时间为参照,结合市场主要活动,将图书馆技术产业发展历程大体分为3 个阶段:系统迁移浪潮阶段(2001-2005)、网络2.0转型阶段(2006-2011)、云平台化阶段(2012-2021),且对每个阶段的文本分别进行共词分析,使用Newman的模块化算法[30]得到共词社区分布并用颜色标识,用节点大小表示词频,边的粗细表示共现强度,节点的距离反映彼此的关联程度,并以共词网络图谱揭示出不同阶段的发展重点或关注焦点。

3.1 系统迁移浪潮阶段的可视化分析:2001-2005年

本阶段基于2002-2006 年的5份报告统计分析,共词网络图谱见图1。图中节点均为相互共现次数5 次及以上,共得到5 个共词社区模块,解析度为1.0,模块化得分为0.490。从图1看出本阶段有5个社区模块:Innovative Interfaces公司、Sirsi公司、Dynix公司、Unicorn系统、Horizon 系统等;艾利贝斯公司(Ex Libris Group)、元搜索、SFX技术、链接解析等;迁移(migration)、遗留系统(legacy system)、顾客、公共图书馆等;图书馆自动化、图书馆自动化系统、Sagebrush公司、Follett软件公司、学校、地区等;学术图书馆(academic research library)、电子资源管理系统、电子资源、供应商(vendor)、联盟(consortium)等。

图1 2001-2005年共词网络图谱

从技术产业视角分析可视化结果,发现这一阶段的主要活动是系统迁移。在历史遗留系统暴露出缺失用户界面、不支持新的技术协议和服务需求的弊端,供应商也将暂停以往产品的更新支持[31]的情况下,又经过20世纪“重设计”影响,一批更成熟的集成系统产品进入市场,引发美国图书馆界系统迁移的热潮[7]。从共词社区分析结果也看到,艾利贝斯公司以SFX、元搜索而一枝独秀,且SFX、元搜索与学术图书馆关系密切;学术图书馆开始关注电子资源管理;Innovative Interfaces公司、Sirsi公司和Dynix公司都是迁移浪潮中的市场巨头,三者关系极为密切,2005年Sirsi 公司和Dynix 公司合并为SirsiDynix 公司[32]也充分说明这一特征。三大市场细分在此阶段初显端倪,公共图书馆、学术图书馆和中小学图书馆的自动化需求日渐分化,引导企业采取差异化的产品策略以应对市场竞争。

3.2 网络2.0 转型阶段的可视化分析:2006-2011年

本阶段基于2007-2012 年的6份报告统计分析,共词网络图谱见图2。图中节点均为相互共现次数6 次及以上,共得到5 个共词社区模块,解析度为1.1,模块化得分为0.393。从图2看出本阶段有5 个社区模块:开源、公共图书馆、Koha系统、Evergreen系统、应用程序接口等;艾利贝斯公司、Innovative Interfaces 公司、SirsiDynix公司、Horizon系统、Symphony系统等;图书馆自动化、OCLC公司、收益、竞争者、WorldCat发现产品等;电子资源、发现服务、软件即服务、传递等;Sagebrush公司、Follett软件公司、K-12学校、学校图书馆。

图2 2006-2011年共词网络图谱

图书馆2.0运动推动了开源软件和资源发现系统的发展。开源是图书馆2.0特质之一[33],以Evergreen 和Koha 为主的开源系统开始规模化加入图书馆自动化市场,尤其是在公共图书馆市场,ByWater Solutions和Equinox Software等凭借为开源系统提供技术支持而异军突起,从专有系统厂商手中抢占了大量订购合同。同时,在OPAC2.0化改造和联邦搜索的基础上,技术供应商纷纷推出含网络2.0元素的资源发现系统或发现服务,代表性的产品有艾利贝斯公司2006年推出的Primo、Serials Solutions公司在2009年推出的Summon和EBSCO于2010年推出的EDS等。

技术供应商的市场地位进一步强化。在上一阶段,形成学术图书馆、公共图书馆、学校图书馆三大细分市场,本阶段则在三大细分市场基础上,供应商的市场地位进一步强化,逐渐形成艾利贝斯公司、Innovative Interfaces 公司和SirsiDynix公司三大巨头,在营收、系统安装数量、市场销量等数据上始终名列前三甲,构成行业第一梯队。OCLC公司则是引领图书馆技术产业的第二梯队。OCLC原是非营利性组织,但在这一阶段收购Fretwell-Downing、Openly Informatics等自动化公司后,大张旗鼓地加入自动化市场竞争。

从图中还看出艾利贝斯公司跟学术图书馆的关系更紧密,继续延续电子资源管理领域的优势,在资源发现领域表现更突出。本阶段还有一个子社区模块值得注意,相邻的关键词包括部署(Deployment)、SaaS、托管(Host)、下一代(next generation)等,暗示下一代图书馆自动化系统正孕育而生,即基于云的平台化的图书馆集成系统。比如,OCLC 公司2010年便率先推出WMS(Web-scale Management Services,后来更名为WorldShare Managemet Service)产品并试点运行[34],艾利贝斯公司2011年正式推出Alma[28],Innovative Interfaces公司2011 年4月宣布研发Sierra Service Platform[35]。

3.3 云平台化阶段的可视化分析:2012-2021年

本阶段基于2013-2022年10份报告统计分析,共词网络图谱见图3。图中节点均为相互共现次数14次及以上,共得到7个共词社区模块,解析度为0.88,模块化得分为0.463。从图3看出本阶段有7个社区模块:公共图书馆、图书馆系统、客户、资源共享、基于网络等;学术图书馆、艾利贝斯公司、OCLC 公司、ProQuest 公司、 Alma 系统、 图书馆服务平台等;Innovative Interfaces 公 司 、 SirsiDynix 公 司 、Polaris 系统、Sierra 系统、Symphony 系统等;平台、整合、资源、发现、界面等;开源、Koha系统、联盟、迁移、Evergreen 系统等;学校、学校图书馆、特殊图书馆、K-12学校、Follett软件公司等;EBSCO 公司、FOLIO 平台、EBSCO发现服务等。

图3 2012-2021年共词网络图谱

随着艾利贝斯、 OCLC、 Innovative Interfaces 旗下的平台化产品Alma、WMS 和Sierra2011-2012年纷纷投入市场,图书馆系统云平台化全面拉开序幕。图书馆服务平台融合编目、资源统一管理、发现服务等功能于一体,引起市场关注,但主要需求和目标市场还是学术图书馆,学校图书馆和公共图书馆需求不够突出。公共图书馆仍比较依赖已有的集成系统,但通过网络组件拓展更多功能,如SirsiDynix 的BLUECloud云平台组件。

开源系统依然是市场上不容忽视的力量,虽然目标市场仍集中在公共图书馆,但随着开源图书馆服务平台FOLIO 崛起,开始引起学术图书馆的强烈关注,尤其是FOLIO的微服务技术架构和生态环境[36],以及社区治理模式。FOLIO开放共建的特点进一步推动了图书馆服务平台向安全可控、自主性、开放性发展。

学术图书馆、公共图书馆和学校图书馆三大细分市场进一步得以固化,但学校图书馆市场被边缘化,市场活力和关注度下降,这或许跟学校图书馆创新性不够,难以成为市场宣传的亮点有关。

4 国外图书馆技术产业发展的特征

国外图书馆技术产业在上述3个阶段中各有发展的侧重点,每个阶段的演进都是当时市场需求、技术环境和社会环境等市场因素共同作用的结果,反映出特定时期内产业发展的特征。纵观近20余年发展历程,国外图书馆技术产业的特征越来越清晰。

(1)形成研究型图书馆、公共图书馆和其他类型图书馆三大细分市场,且研究型图书馆市场最具有生机和发展活力。这些细分本质上是不同类型图书馆对资源管理和用户服务需求的分化。学术图书馆更看重电子资源管理、资源发现和获取,资源发现系统、图书馆服务平台无不是响应其需求而诞生,所以纷纷过渡到云服务平台阶段,艾利贝斯公司Alma在美国研究图书馆协会中有高达62%的市场占比[37]。公共图书馆仍以印刷型资源为主,传统系统供应商如SirsiDynix旗下的Symphony系统在美国有8,200个以上的安装量,约40%是公共图书馆贡献的,Innovative Interfaces 的 Polaris 系 统 和 Sierra 云 平 台 也 有6,000 个以上的安装量,公共图书馆占比约80%[38]。其他类型图书馆包含学校图书馆和特藏图书馆,这类图书馆规模较小,适用成本更低的轻量级系统,Follett是该细分市场当之无愧的霸主,其Destiny产品占据美国K-12学校一半以上市场[39]。这背后反映出产业结构的精细化、产品策略的差异化和企业技术道路的多样化。

(2)兼并收购推动产业从分散走向整合,图书馆技术市场得以繁荣。早期图书馆自动化市场结构是碎片化的[40],不仅未形成细分市场,企业也大多各自为战。快速迭代的技术环境和多变的市场需求导致激烈的竞争,企业不得不通过兼并收购来获取协同效应[41],典型例子有2005年Sirsi和Dynix 合并创建SirsiDynix。技术供应商们在各自的赛道上收购竞争对手,整合资源,扩大优势,进一步促成巨头公司的诞生,使产业结构从一盘散沙向三大细分市场聚拢。企业兼并收购往往也预示着图书馆技术市场的发展方向。自2015年ProQuest收购艾利贝斯开始[42],行业整合就不仅仅是对直接竞争对手的收购,而是数据内容企业与技术企业深度合作。2019年12月,艾利贝斯宣布收购Innovative Interfaces[43],两者同属于ProQuest公司。如果说ProQuest前后收购艾利贝斯和Innovative Interfaces 暗示着“内容为王”,那么2021年科睿唯安(Clarivate)进一步收购ProQuest[44]则暗示着服务的重要性超越内容,“服务为王”时代到来,这将进一步重塑图书馆技术产业。无论如何,服务供应商、内容供应商与技术供应商的结合加强了产业整体协同效应,意味着图书馆技术产业将能够为图书馆提供从技术、资源到服务的一整套完整解决方案,这也体现了资源和服务占主导地位的发展趋势,技术的工具性更加明显。

(3)市场理念逐渐从以“技术为主”向“服务为主”转向。具体而言,这有3个方面的内涵:一是技术产品从依赖硬件环境的本地安装向基于云端的软件即服务或者服务平台化方向转变,并具备了平台经济所具备的一切特征。二是租赁或购买服务彻底颠覆技术供给模式,市场生态得以重构。无论是内容,还是技术,都以服务形式来供给,如内容产品、数据迁移、平台建设、情报分析。三是“资源为王”时代逐渐过渡到“服务为王”时代。云计算重构了技术应用模式,技术产品能像水电等基础设施一样,以较低成本向顾客提供,图书馆和用户已不再在乎技术的细节问题,在乎的是资源和服务,“技术不再重要”[45],其工具属性得到普遍认同。

(4)开源系统持续发力,成为技术市场的新兴力量,一定程度上冲击了业已形成垄断的技术产业市场。图书馆技术领域开源运动兴起的背景有两点:一是许多图书馆经费受限[46];二是随着行业整合,图书馆技术市场垄断趋势增强,市场选择囿于少数昂贵的专有系统,且功能难以满足实际需求。2006年开源系统Koha完成重大功能更新,同年Evergreen 推出,支持共享图书馆目录、联合查询和输出读者报告等原先封闭式系统不具备的功能[47],开启了第一次开源运动高潮。自此,开源系统凭借低成本、灵活部署、版本稳定等优点[48],迅速成为美国乃至世界各地图书馆系统迁移的一种可行的替代方案,其市场份额也持续增长。2016年开源云平台FOLIO的推出则掀起第二次高潮,为打破Alma、WMS 在图书馆服务平台的垄断格局提供了契机。FOLIO 的出现将助力打造一个多方参与、共创共建的技术社区,形成图书馆技术应用生态[49],让图书馆在技术运用中享有更多自主权。不可否认,开源系统是图书馆技术产业良性发展的关键要素,在打破垄断的同时,也有助于推动图书馆技术产业朝更加开放、共享、协作、个性化的方向发展。

5 启示

由于我国图书馆自动化起步较晚,20世纪90年代初至21世纪初图书馆系统才进入商业化发展阶段[50],慢慢形成了以深圳市科图自动化新技术有限公司(以下简称“深科图”)、江苏汇文软件有限公司、广州图创计算机软件开发有限公司三大厂商为主的产业格局。进入21 世纪以来,我国图书馆技术市场发展后劲明显不足,自动化系统难以跳脱传统业务范畴的困境[51],在电子资源管理、资源发现、图书馆服务平台上缺乏进取心,在云服务平台方面几无建树[50],与国外产品的差距逐渐拉大。因此,我国图书馆技术产业的可持续发展应该关注以下几点。

(1)图书馆技术不只是图书馆集成系统,也不能只聚焦于图书馆传统的业务,而应该是一切可能的业务和服务。国产图书馆集成系统在早期还能跟上技术更新的步伐[52],然而进入21世纪后,国内厂商仍然在图书馆传统业务上精耕细作,如同“内卷式”的小农经济。反观国外公司,总能及时根据市场需求调整业务线,推出联邦搜索、ERMS、发现系统、图书馆服务平台等新产品。根本原因在于我国市场化程度不高和技术研发能力较弱,技术实力跟不上市场需求的变化,无形之中就将国内高端市场拱手让给国外公司,如国家图书馆、清华大学图书馆、上海交通大学图书馆、北京师范大学图书馆。如今又处在人工智能、区块链甚至元宇宙等新兴技术冉冉升起的窗口期,市场需求存在新变化和不确定性,我国图书馆技术产业应加大泛在互联、数据采集与挖掘、深度学习[53]等技术方面的研发投入,推出新产品、新系统和新应用。

(2)平台化是当下和未来的技术主流。无论是技术角度,还是平台经济学角度,平台化业已成为主流。有学者判断,FOLIO或许是图书馆智慧化建设的理想平台[54],尽管有失偏颇,但可以预见FOLIO是未来图书馆技术产业的潜在变革因素,尤其是“十四五”期间正在推进的图书馆智慧化转型过程中,作为“大脑中枢”的智慧图书馆管理系统[55]必将是平台化的系统。在“十四五”智慧图书馆建设期间,将会有更多图书馆从图书馆集成系统迁移到图书馆服务平台。平台化深入应用将会进一步淡化信息系统的概念。例如,发现系统演变为发现服务,图书馆只能购买或租赁发现服务。从经济学视角来讲,平台化发展让图书馆技术供应市场具备了平台经济的一切特征,平台化运作的FOLIO也将遵循着平台经济的运行逻辑,作为数字基础设施向图书馆提供应用服务,但需要警惕的是平台经济具有天然的垄断性。

(3)高度市场化是产业持续健康发展的动力。深科图ILAS系统的早期成功,尽管得益于计划经济,但走市场化才是其持续发展的根本原因。经过几十年发展,我国图书馆技术产业市场化程度不高,图书馆技术企业较少,创新意识和创新能力不足,较少出现收购或兼并的市场行为。反观国外,技术企业通过兼并收购不断整合产业资源,市场结构从分散走向协同,促进了产业整体的健康发展。因此,我国图书馆技术产业亟需重构市场结构关系,企业可以“强强联手”,组建集团企业[51],尤其是内容供应商与传统技术供应商之间或兼并或协作[52],应发挥产业协同效应。传统的技术供应商与内容供应商都有着推动我国图书馆高质量发展的历史使命,为推动图书馆智慧化转型贡献力量。

(4)在功能需求上,图书馆应是技术产业的“掌舵者”。我国图书馆曾是自动化系统研发与运用的先行者、实践者[56],虽然如今已将系统研发让与市场,但作为图书馆技术产业的最终用户,图书馆依然应该通过与商业公司的深度合作,继续引领其发展方向。2016年重庆大学图书馆与重庆维普资讯有限公司签署合作协议,共同开发建设新一代智慧图书馆系统[57];2021年上海交大图书馆与江苏嘉图科技有限公司宣布深度合作,共同探索面向未来的图书馆智慧服务[58],它们都是图书馆与商业公司深度合作的典范。我们期待未来有更多的具有创新精神的图书馆在人工智能、区块链、元宇宙等方面与商业公司深度合作,探索研发新产品,为我国图书馆智慧化建设发挥示范效应,掌握一定的市场话语权,把控图书馆技术产业的发展方向。

猜你喜欢
技术产业共词图书馆
浅谈新时期企业劳动竞赛的实践与创新
基于突变检测与共词分析的深阅读新兴趋势分析
电子信息工程技术的发展应用研究
电子信息工程技术的发展应用研究
图书馆
浅论我国信息通信技术产业的经济增长效应
图书馆与档案馆信息公开研究重点及趋势比较研究
基于Matlab的共词矩阵构造
去图书馆
基于GEPHI的共词可视化分析:以文献计量学作者合作关系为例