国外数字学术出版初探

2016-11-10 06:49韩小亚徐变云
出版科学 2016年5期

韩小亚 徐变云

[摘 要] 介绍4种国外数字学术出版模式,分别是虚拟图书馆模式、数字仓库模式、学术文集模式、学术社区模式,并分析各种模式的优点和弊端。指出数字学术出版模式处于发展变迁状态,其发展经验与前景为:数字学术出版市场主要集中于院校机构,而非个体消费者;数字学术出版物的发行并不会分流纸版书的销量;数字内容版权的不确定性、不透明性严重影响该领域的发展进程;学术期刊出版和学术专著出版有重叠领域,值得开发;出版商的生存和发展取决于所出版图书的价值和数字化系统开发。

[关键词] 数字学术出版 虚拟图书馆模式 数字仓库模式 学术文集模式 学术社区模式

[中图分类号] G239 [文献标识码] A [文章编号] 1009-5853 (2016) 05-0097-06

A Review of Digital Academic Publishing Patterns Abroad

Han Xiaoya Xu Bianyun

(Xianyang Normal University Library, Xianyang,712000)

[Abstract] The article introduces four kinds of digital academic publishing patterns abroad,namely the virtual library, the digital warehouse, the collection of academic essays and the academic community. Each kind of patterns has its advantages and disadvantages, and is still in a state of development. The experiences and prospects from their development are as follows: digital academic publishing market mainly concentrated in universities and colleges rather than individual consumers; digital academic publishing has not decreased the sales from the print publications; the uncertainty and opacity of the digital contents copyrights has influenced the progress of the field seriously; academic journal publishing and academic monograph publishing have lots of overlap areas and are worthy of development; publisherss survival and development depends on their publications values and systematically digitalization.

[Key words] Digital scholarly publishing Virtual library mode Digital warehouse model Collection of academic essays mode Academic community pattern

1 引 言

从20世纪90年代中期开始,受期刊出版网络化及学术专著出版日益困难的影响,国外学术出版商和第三方机构热衷于投资学术图书的数字出版试验。到90年代末,伴随学术专著销售的持续下降,学术出版领域很多人都在关注 “学术出版的数字解决方案”[1]。出版商认为学术专著数字化出版能够降低生产成本,避免滞销危险。同时,数字出版能够将出版商从印刷媒介的限制中解放出来:书的厚度和篇幅将不再是困扰出版商的重要问题;读者可以更好地使用插图;出版商可以在出版物中添加动态元素,可以向文本中添加声音和视频。简而言之,学术专著将在数字时代获得重生[2]。1995年至今是学术专著数字出版试验频繁的一个时期。学术专著数字出版的基本模式有四种:(1)虚拟图书馆模式;(2)数字仓库模式;(3)学术文集模式;(4)学术社区模式。

2 虚拟图书馆模式

“虚拟图书馆”模式是指学术中间机构创造和保存数字图书馆藏及其他内容,读者可以参考和阅读这些内容而不需要购买的模式[3]。数字馆藏的创造和保存涉及学术中间机构(包括第三方组织),它们使用出版商提供的内容并将其转换为合适的数字形态。这种模式通过向读者销售虚拟图书馆中内容的使用许可,最终获得收益。虚拟图书馆首要的消费者为大学图书馆或私人企业,内容本身存放在第三方服务器上,并且由密码机制或者用户标识系统(如IP控制或者URL认证)来管理。下面介绍3个颇具影响的虚拟图书馆,即网络图书馆(netlibrary)、Questia在线图书馆和电子图书馆(ebrary)。

2.1 网络图书馆

网络图书馆于1998年秋天在美国科罗拉多州波尔得成立,其业务模式是从出版商手中获得书籍内容,将其转换为合适的数字形式,同时添加一些功能如全文检索功能,然后将它推销给图书馆或者其他机构客户[4]。电子书存放在网络图书馆的服务器上,合法授权的图书馆用户通过用户识别系统验证后可以获取相关内容。网络图书馆则向出版商支付销售额30%—50%不等的费用。网络图书馆备受争议的做法是它将电子书限定为一次只能允许一个人使用。采用这种限制性模式的主要考虑是减少网络销售带给出版商的不确定性和顾虑。但是,这种限制破坏了虚拟图书馆的真正价值,不能让用户轻松地获取书籍。

网络图书馆将市场定位于院校图书馆市场,并不发展以个人终端用户为目标的单本电子书销售模式。其创始者认为在学术出版领域,大学图书馆将会成为电子书最有活力的市场。然而,尽管网络图书馆着眼于院校市场的做法具有前瞻性,但其模式和方法也有一定的缺陷:一、作为一个第三方学术内容集成商,网络图书馆依赖于出版商提供内容授权。由于电子书市场的不确定性,以及担心可能对印刷书本销售所产生的冲击,很多出版商不愿将他们最新的图书和热销的书目给网络图书馆。这样造成的结果就是网络图书馆投入了大笔资金进行数字化,却很难符合院校图书馆等机构的需求,而这些机构正是他们的核心市场。二、网络图书馆采用单次阅读模式导致图书馆员的不满。同时允许多人共同使用是网络环境下的虚拟图书馆的最大优势之一,但限制使用的做法使图书馆员无法接受。三、网络图书馆的第三个主要问题在于它想建立的虚拟图书馆中,所有内容都可以转换成具有一致外观和高度精准性、功能性的格式,使用可扩展标记语言(XML)工作,并承诺自己出资进行大批书籍的数字化。但是,免费数字化承诺的弊端很快显现,即资金难以为继。

然而,尽管网络图书馆遭遇到许多困难,但它成功地证明了学术书籍的网上传递市场是真实存在的。在被其他公司收购后,网络图书馆商业模式和工作实践从根本上发生了转变。现在网络图书馆接受PDF格式文档,并且也在积极争取和出版商就一次多用户模式重新谈判。

2.2 Questia在线图书馆

Questia传媒有限公司成立于2001年1月,创立目的是为高等院校学生提供网络资源。Questia组成专门团队筛选图书,利用OCLC数据库发掘高频率使用书籍,浏览图书馆预购书单、教授推荐书目。通过各种途径构建人文社科方向学生所需要书目[5]。

Questia的商业模式由两部分组成:一方面,以页数为基准向出版商交付版税;另一方面,向学生收取订阅费以获取利润。这个方式建立在为学生提供直接服务的基础上。Questia订阅模式具有很强的灵活性:用户可以选择包年订阅(149.95美元)、包月订阅(19.95美元)甚至短期48小时订阅(14.95美元)——学生急需写作论文时所需[6]。Questia的商业模式存在以下三点主要问题:一、承诺内容数字化,用XML标注,增加搜索和参考功能,这使得其书目获取计划的执行代价昂贵。这个方式远远超出了它从用户那里赚取的利润。二、Questia商业模式的根本缺陷在于它将利润、收入来源完全定位在个人终端用户身上(比如学生),而不是院构机构。但事实上,这个定位是错误的,个人用户很少会愿意支付订阅费用。三、Questia的第三个问题在于它的收藏多而不精。为了在人文社科方面提供优质服务,它追求书目收录覆盖高等教育不同学科、专业所有年级的课程。用有限的书目去满足所有高教课程的需求,很容易在不同院校、专业的学生寻求所需资源时陷入捉襟见肘的困境。

2.3 电子图书馆

电子图书馆(ebrary)的发明者是克里斯·活诺克。电子图书馆的基本构思是允许任何人都可以免费浏览图书全文,只有当用户想要买书或者买部分书的时候才需要付费[7]。网络图书馆需要图书馆或者其他机构付费后,才有权限获得电子书;而电子图书馆允许所有人免费获得图书馆中的任何图书全文。Questia定位于学生,需要学生订阅服务后才能获取内容;而电子图书馆只有在终端用户想要使用某些功能(如复制、粘贴或者打印)的时候,才会收费。它的模式是建立在终端用户享有免费浏览全文、不使用不收费的原则之上的。

电子图书馆区别于网络图书馆和Questia的另一个重要方面就是电子图书采用PDF格式,而不是XML格式或者专用格式(比如网络图书馆)。PDF赋予电子图书馆双重优势——美观性和经济性。这意味着电子图书馆无须在内容的转换上投入大笔资金,因为原则上出版商的大部分新书都有PDF文档。

电子图书馆2001年7月正式运营,其用户群体分为3种:学术团体;医疗、工程领域的专业人员;大众消费者。电子图书馆没有像Questia那样直接对终端用户进行市场营销,它采用的是企业对企业的B2B模式,而不是企业对客户的B2C模式,将自己定位于有自己顾客群的在线内容服务提供商的角色[8]。本质上来说,它以顾客为导向。然而,事实很快证明,这种微交易方式并不能产生预期的财政收益。到2001年9月,电子图书馆改变方向,将业务重新定位于图书馆市场[9]。为图书馆提供包年购买全文数据库的服务,订阅费用根据“FTE价格(学校全日制教职工人数)”模式确定,赚取的利润根据出版商在数据库中书籍数量的多少进行分成。电子图书馆成功转型,从以个体顾客为基础的微交易服务到以大学图书馆和公司客户为对象的数据库服务。但与网络图书馆不同,电子图书馆提供的是全文图书数据库,以包年订阅为基础,而不是以普通订购为基础的个体电子书服务。电子图书馆的数据库服务可以允许用户同时在线使用,而不像网络图书馆那样使用的是对图书馆员毫无吸引力的限制性模式。

然而,电子图书馆产品亦存在弊端。它同时服务于3种用户群体,产品比较混杂,数据库的专业广度和学术深度都不够。因为数据库只有精选学科领域,提供大量高质量内容,才能吸引图书馆员青睐。从虚拟图书馆曲折的发展史中可以总结一系列经验教训,最重要的有两条:一、虚拟图书馆的市场绝大部分集中于院校机构。这个市场主要由大学图书馆构成,其中也包括某些特定领域的收藏者、企业、政府部门和其他机构。另一方面,以商业模式为基础的虚拟图书馆想要从个人终端用户处寻求利润,无论是订阅还是使用付费制,均以失败告终。二、获取专业性强、让院校图书馆用户高度满意的内容,是成功的关键。从虚拟图书馆发展的历史中可以发现,高质量的针对专门学科的电子书肯定有市场,但是这个在网络环境中传递学术书籍的图书馆市场能否在未来依然生气勃勃,什么样的传递方式才能经久不衰,仍然是个未知数。

3 数字仓库模式

虚拟图书馆是从出版商处获得内容许可的第三方媒介,通过内容准入路径或者内容使用收费来获取收益。数字仓库模式是指学术出版商以独资或者与技术伙伴合作的形式创建“数字仓库”,然后将其应用于电子书内容供应[10]。顾客可以在出版商或者其他电子零售商网站的电子书商店里下订单购买。在这个模式中,数字仓库具有和实体图书仓库一样的功能:它储藏出版商的内容,是以数字文档的形式而非包装好的实体书的形式。数字仓库或者在出版商所有的服务器上,或者由第三方技术合作搭档主管。

在学术出版商中,建立在数字仓库模式基础上的公司有泰勒·弗朗西斯(Taylor & Francis Group,T&F)、蒂姆电子图书(Thieme E-book)等。2000年,泰勒·弗朗西斯与技术搭档维萨维尔签订协议,创建由后者来管理的数字仓库。数字仓库模式有不少吸引出版商的特点。尤其地,它使出版商能够保留对书目内容控制权。在虚拟图书馆模式中,出版商将自己的内容递交给第三方,许可第三方出售这些内容的准入权或者使用权,然后从第三方获得的利润中分得比例适中的一部分。但是在数字仓库模式中,出版商保留书目内容控制权;他们可以和第三方技术搭档合作,但并不授予第三方内容使用权[11]。因此,对于出版商来说,数字仓库模式提供了一个通向电子书市场的低成本、低风险的准入途径,同时又可以使出版商保留其对内容的控制、整合与销售。

然而,数字仓库模式还是存在不少问题。最重要的问题是商业模式和利润收入。数字仓库商业模式主要定位于个人客户的消费、交易式。这些个人客户可以是学者、学生或者专业人士,他们或是想购买整本书籍,或是打算购买部分书籍,或者想打印一些页面。这个模式设想会有充足的个人消费者需求来驱使其前进。但实践证明,个人消费者对于电子书(整本或是部分)的实际需求并不高,个人用户需求一直处于低迷状态。拥有数字仓库模式的学术出版商通过电子书销售所得的利润远远不及预期目标。

4 学术文集模式

另一个在线传递学术书籍的方式是创建一个学术书籍内容文集,在订阅的基础上收取准入费。这种模式与虚拟图书馆和数字仓库模式的不同之处在于:虚拟图书馆建立的基础是第三方不拥有内容,但可以作为整合者行使权力。学术文集模式建立的基础是出版商本身,是一个出版商驱动模式,由出版商控制内容;但是不排除出版商从其他同行或者来源获取内容,对已有内容进行研究增补[12]。这种学术文集的创建需要出版商为内容存放建立数字储藏室。这个储藏室不同于数字仓库,需要对逐本电子书(或者逐章)下订单。学术文集模式是一个以内容文集形式出现的、建立在准入订购基础上的在线搜索型数据库。订购者主要是院校机构如大学图书馆,但在某些情况下个人用户也会进行订购。学术文集模式有以下几种类型。

(1) 单一出版商文集。在这种情况下,由单一的出版商用自己所有的版权进行内容整合。这个类型的优势在于可以将版权纠纷最小化,利润分配简单化,因为出版商拥有全部图书内容的版权。劣势在于文集的广度和深度受到限制,毕竟很少有出版商在所有学科领域都拥有充足的内容,来独立创建一个综合数据库。这方面的典型例子有牛津在线学术(Oxford Scholarship Online,OSO)、剑桥图书在线(Cambridge Books Online,CBO)等。

(2) 跨出版商文集。克服单一出版商文集限制性的方法之一,就是与一个或者多个其他出版商合作,建立联合数据库。这个方式的吸引人之处在于它可以使出版商共同出力创建一个更全面的数据库,任何个体独立创建的数据库都难以望其项背。这个方式的主要问题在于出版商很难和另一个同行进行合作,因为在很多方面都存在竞争。学术出版跨出版商文集的典型案例有人文学科在线资源中心(The Online Resource Centre in the Humanities,TORCH)、美国学术团体协会人文科学电子图书(American Council of Learned Societies Humanities E-Book)等。

(3) 出版商合作、基金赞助文集。这个混合模式很大程度上是一部分慈善基金组织——以安德鲁·W. 梅隆基金为代表资助的产物。梅隆基金用各种不同的方式,为学术书籍内容合集的创建试验提供资助。这些项目通常包括大学出版社的参与。这类项目启动最大的困境在于是否能够在之后确保充足的订阅量,来继续维持启动资金用完之后的运转。这种类型的代表包括哥伦比亚国际事务在线(Columbia International Affairs Online,CIAO),谷腾堡计划(Project Gutenberg)和美国学术团体协会历史电子书项目(American Council of Learned Societies History E-bood Project)。

(4) 单一出版商、复合内容文集。这是另一种混合模式,介于单一出版商学术文集模式和第三方虚拟图书馆模式之间。和虚拟图书馆一样,这种混合模式包括对其他资源内容的融合,资源出处来自其他出版商和版权所有者,或者公共领域。但是和单一出版商学术文集模式一样,这种混合模式主要由一家出版商创立,通过创造新的内容增加文集的附加值,并通过建立前后参照和超链接、增加功能如搜索工具等来使其整体化。在学术出版领域,这种混合模式的代表有以剑桥大学为基础的数字出版商——查德威克-希利(现更名为ProQuest,被美国公司贝尔豪收购)、美国机械工程师学会(American Society of Mechanical Engineers,ASME)、德文法学数据库(Beck-online)等。

5 学术社区模式

如上所述,各种不同的数字学术出版模式本质上组成了一个数字内容集合。这个集合具有各种功能,如搜索、前后对照和引用能力。来自于数字化的学术书籍的部分或者全部内容组成一个数据库,通过各种不同功能的管理来收费。这些模式和另一种在线学术内容传播的方式有所区别——即学术社区模式。学术社区模式建立的思想基础是建立一个交互的学者团体,提供某些服务,包括学术内容准入权限[13]。

学术交流领域该模式最引人注目的尝试之一来自20世纪90年代的麻省理工学院(MIT)出版社。《比特之城》在线出版的成功为MIT出版社营造了跃跃欲试的气氛。出版社看到了将开发传统印刷产品与建立在线团体结合起来的机会。它用专业百科全书作为切入点,试图在认知科学领域创建认知科学的在线社区——CogNet。CogNet其基本想法是建设一个学术社区品牌,依靠成员的相互咨询和解答进行发展[14]。1998年10月,CogNet投入使用。网站最初的部分内容都由百科全书项目提供,虽然其本意是通过MIT为在认知和脑科学领域的图书添加其他相关内容包括参考文献、学术专著和期刊等,来建立一个灰色文献(工作报告、会议记录)档案,并提供大规模的定制服务。CogNet最初阶段的注册是免费的,注册会员可以免费浏览网站内容。同时,CogNet还向会员提供各种服务,如学科热点、论坛、工作列表、个人工作空间。2000年10月,免费会员制被收费准入所替代,CogNet开始向机构(主要是图书馆)和个人出售站点许可权,并最终获得了丰厚利润。这说明学术社区模式存在一定的发展空间。CogNet是该领域中的先驱,采用类似模式的美国心理学会(American Psychological Association,APA?)、美国植物生物学家学会(American Society of Plant BiologistsASPB)也从图书馆订购中赚到了可观收益,收回了全部或大部分成本。

当然,具有自给自足的能力并不是这种类型模式唯一的评价标准,通过帮助特殊学科领域兴趣相投的读者建立一个虚拟社区,会加强出版商在该领域内的领导位置,就像CogNet对帮助MIT出版社巩固了其在认知科学领域内的领导地位一样。它可以帮助出版商与当前学科发展形势保持同步,同时提供一个建立学科网络的最佳方法。这一网络有助于出版社组稿。学术社区模式能够帮助在某个领域里有特殊兴趣的用户获得更多关于书的信息,包括新书和再版书目。这种模式甚至可能会刺激印刷版本销售。通过各种方式,在线社区的发展能为投资其中的出版商带来较多无形收益。

6 经验、问题和前景

学术出版的数字革命处于发展变迁之中,但是仍然可以从其过去的主要发展模式中总结一些经验、教训,为学术书籍数字出版的发展提供一些借鉴。

数字形式的学术书籍市场主要集中在院校机构,而非个人消费者。通过向个人出售学术书籍内容来获利的模式,不管是采取订阅还是虚拟图书馆(Questia)模式,或者是销售整本或部分电子书(数字仓库模式),都没有成功。相反,院校有专门的预算来购买数字形式的学术书籍,甚至在预算紧缩的情况下,比起个人消费者,院校机构仍然是更重要的用户。图书馆员已经习惯于采购数字形式的内容,而且大部分都能够接受购买在线学术图书。对于专业学术内容,除了大学图书馆之外,还有院校组织、公司企业、研究型实验室、专业团队等市场。总之,定位在院校市场具有更大的成功可能性。

而最大化在线学术内容附加值的最佳方法,就是将单本书籍作为有规模、有选择、有重点的数据库或者学术文集的一部分。文集很重要,因为它能使终端用户最好地利用搜索和相互参考功能。规模很重要,因为它能为终端用户提供既有学术广度,又有学术深度的收藏。选择性和重点性很重要,因为它们可以确保终端用户在数量和质量两方面都得到保障,即内容与其需求相关,且文集中不是过时、边缘的、无聊的低质量内容。早期虚拟图书馆的一个巨大错误,就在于意图包括所有领域,以绝对规模在市场上确保一席之地。这计划不但极其昂贵,而且导致文集缺乏重点和选择性。学术文集的发展,是由出版商独立经营还是选择相互合作,抑或是通过第三方内容集成商,仍然是一个未解决的问题。因为上述几种方式都有自己的优势和限制。对于出版商来说,自己独立发展学术文集的优势在于可以保留对版权和利益的控制,缺陷在于成本很高;单一出版商很难依靠自身版权实现规模化和综合化。对于终端用户而言,局限于单一出版商产品的文集几乎没有优势可言。这种类型文集的部分价值来自本身的规模和特定学科领域的综合性,也来自跨文集搜索能力和其他相关资料准入途径的提供。

出版商对于销路分流的问题一直都存在担心。20世纪90年代中后期,大部分出版商担心实体书销路被抢,都不情愿将版权许可给数字图书馆使用,还有一部分出版商只愿意将旧的再版图书授权。然而,在这个领域进行数年的试验之后,没有任何结论表明数字发行会分流纸版书的销量。事实上,在线书目获取的实现,反而促进了纸版书的销售量。即使在线书籍发行并不能创造一个巨大的利润空间,它还是可以作为纸版书的营销工具增加读者对于读书的兴趣,进而诱导读者购买,就如同在实体书店买书一样[15]。困扰数字出版领域发展的另一个问题是版权。出版商也不太确定他们是否有权利将内容数字化后进行传播,或将之授权给第三方。很大程度上,早期与作者签订的合同并没有预见到数字传播的可能性,因此相关条款并没有明文规定。另外一个问题是,怎么处理“嵌入版权”,也就是说书中出现的具有版权的材料,即那些并不是作者原创的作品,而是一些引用、插图等。这些数字环境中关于版权问题的不确定性、复杂性和不透明性严重时影响到数字学术出版领域的发展,如果能建立清晰和可接受的政策指导,会极大地推进该领域的发展进程。

学术期刊出版和学术专著出版两者有一个很有潜力的重叠领域,值得在将来进一步探索、开发。在这两个领域都表现活跃的出版商很可能使得学术期刊和学术专著在线协同配合。牛津在线学术就是该方面一个很有想象力的尝试:把学术专著当作期刊对待,每部都由离散的章节组成,而章节同样可以产生元数据。下一步应该就是在相同学科领域内,在学术期刊和学术专著之间建立更密切的联系,建立以学科为基础的文集,将学术期刊和学术专著的内容结合在一起,使其具有相互参照和搜索的能力。

学术专著纸质图书作为特定学科学术成就的基石,职称评审、升职和学术认可的主要依据,可能在其他形式学术成果的冲击下,上述固有价值慢慢褪色。互联网作为学者交流、交换研究成果的工具,已经起到越来越重要的作用。在它的带动下,其他新型学术交流方式肯定也会慢慢出现,在学者传播作品的时候发挥越来越重要的作用,至少在某些特定的学科或者学科分支产生重要影响。数字资源在研究型图书馆以及图书馆从书籍仓库向信息服务和资源提供方的转型中,受到越来越多重视。

在各种出版模式有利有弊的前提下,学术出版商至少应该做两件事情。第一,思考出版什么以及为什么要出版。出版商能否生存取决于其获得和开发的图书价值。这条基本准则在网络和印刷环境中同样有效。第二,学术出版商应该开发系统和工作流程,用适当的数字格式将出版的内容集中储存起来,包括建立数字档案,并通过全面考虑来决定是否进行在线传播。

注 释

[1][2][6][15][英]约翰·B. 汤普森.数字时代的图书[M].南京:译林出版社,2014:330,335,376

[3]张丹丹.虚拟图书馆的概念界定及其类型[J].图书馆论坛,2009(3):59-61

[4]涂斌.数字网络图书馆研究与应用[J].兰台世界,2013(1):101

[5]http://www.lvse.com/site/questia-com-2396.html

[7]王群.美国图书馆电子书服务经验及对我国的启示[J].图书情报工作,2015(10):94-99

[8]谢艳芳.《国际图联图书馆电子借阅原则》解析[J].图书情报工作,2015(1):136-140

[9]史艳丽.国外大学图书馆电子图书利用研究综述[J].图书馆论坛,2015(7):122-127

[10][11]孙启存. 数字图书馆建设中的数据仓库技术应用分析研究[OL].[2015-12-26].http://www.taodocs.com/p-34586013.html

[12]章光琼.电子图书出版模式及其版权保护探析[J].出版科学,2012(6):89-91

[13]魏蕊.国外开放获取图书出版模式研究.《文献情报中心组织的学术会议》,2013

[14] Marney Smyth. The Community is the Content[J].Publishing Research Quarterly,Winter 2001:3-14