段双喜
(华东师范大学图书馆)
以适当的方式采购电子书进行数字资源建设,是当前图书馆业务转型的关键之一。纸质书与电子书的配合是近年图书市场的热门话题。I(文学)类图书是出版物的重要类别,据国家广播电视总局数据,2013-2016年间,文学类图书出版种数分别占全国出版总数的10.55%、10.46%、10.44%、10.90%,仅次于G(文化、科学、教育、体育)类。[1]在图书馆馆藏中,文学类馆藏比重大、借阅量多,因此,图书馆对文学类电子书的需求逐渐增多,而对图书馆馆藏资源的纸电配合的探讨也变得非常必要。
国外电子书发展较快,纸、电配合开展较为普遍,各种理论研究比较深入。Lewellen在马萨诸塞州立大学阿默斯特分校针对ProQuest电子图书馆进行案例研究,从学科、种族、性别、在校身份等角度了解多媒介环境下电子书和印本使用特征和属性。[2]Kohn对坦普尔大学图书馆2014-2015年间13,043种图书进行分析,探讨读者可接受的电子本时滞,认为电子本迟于纸本发售一周是可以接受的。[3]Fry从学科和购置方式方面评估学术馆同时段采进的非参考书纸质本和电子书的使用率,发现2008-2009年间购进的书籍中,74%在前六年内使用,2008-2014年购进纸本馆藏的27%在2013年7月至2014年11月间使用过。在同样的17个月内,只有12%的电子书在2008-2014年间被使用。[4]Moulaison等对美国传统图书和电子书供应商两个平台(Coutts’OASIS和Smashwords)所提供女同性恋、男同性恋、双性恋、跨性恋主题的小说进行对比,以窥探不同平台图书的供应重点。[5]
国内相关研究早先集中于超星、书生之家、方正Apabi、爱如生等包库电子书。许继新用书目对比法对纸质书与超星、方正Apabi进行测评。[6]2016年后,研究者开始关注单种馆配电子书业务,顾洁和郑琪对畅想之星[7]、芸台购[8]进行介绍,仲明对“畅想之星”与超星进行比较研究。[9]肖婷、张军对全国90家核心出版社进行调研,分析出版方对电子书零售的意向。[10]刘艳武基于电子和纸质书借阅量的分析,探讨地方高校电子书与纸质书的协调。[11]
综上所述,当前对图书馆馆藏资源的纸电配合的探讨存在三方面问题。
(1)概念笼统。业界使用“电子图书(电子书)”和“馆配”这些概念,“电子书”只能表现媒介性质,“馆配”只揭示销售对象,两者都不能显示电子书的计费方式、发售频率与数量特点,无法区别当前电子书市场的不同销售类别,更无法准确对应中文电子书单种馆配发售业务的特征。概念的笼统,反映出电子书馆配业务本身的不成熟和理论界反应的滞后。由此,笔者认为有必要使用“单种馆配”一词来概括当前中文电子书馆配业务的新种类,并对相关概念做出梳理。目前“纸电配合”论题中的“电子书”,应指经正规出版机构编辑加工,获国家出版许可发售的产品。从目标客户与服务对象来看,电子书发售方式可分为馆配与非馆配两种。前者主要是面向机构用户——图书馆、资料室等发售图书,如,北京人天、湖北三新、浙江新华等;后者主要面向个人用户,如,亚马逊中国、当当、京东等。从发售频率、计费方式看,可分为包库发售与单种发售,前者指只以数据库形式一次性打包捆绑、统一计费的方式,如,超星、爱如生、书生之家、方正API等;后者则可以提供单种发售服务,如,北京人天、湖北三新、浙江新华、中图易阅通等。相对而言,单种馆配电子书比较灵活,图书馆享有更多自由,读者需求更能得到满足,是馆藏资源“纸电协调”的理想形式。
(2)研究范围狭小,缺少对电子书全局性的考察。研究者对馆配电子书中的包库、零售、纸本和非馆配平台都有过类内比照或者两两比较,但没有将这四类数据放在一起深入分析。
(3)研究多为提出方向性建议,缺乏细致的分析,没有可供借鉴的具体案例。如,张建民认为大学出版社可以在纸电同步方面做尝试,对不同图书用不同出版策略,[12]但并没有具体说明如何操作。中文图书数量巨大,出版社及产品类别、层次众多,各馆情况不一,若结合具体情况做实证性分析,探讨纸电配合的时机、原则与范围,将有切实可行的示范效果。
本文还涉及到文学类馆藏借阅分析。这一论题已有多文论及,其中有少数谈到电子书。如,职珂珂等将纸本馆藏与超星平台H、I类同题名图书进行比较,但未涉及单种馆配业务。[13]此外的研究都是从纸本借阅数据出发,很少涉及纸电配合,不再赘述。
以用户驱动(Patron Driven Acquisition,PDA)方式实现纸电配合,是当前国内文献资源建设者的理想。当前国内图书馆建设经费紧缺、物理存储空间压力日益增加,迫切需要实现资源转型。电子书购置不仅是资源建设问题,也关乎着图书馆的全局发展。据2017年7月27日,第四届教育部高等学校图书情报工作指导委员会第五次工作会议的研讨结果,“数字资源量”被纳入高校评估体系。[14]2017年8月,中华人民共和国教育部发展规划司出台通知,将电子书作为馆藏资源纳入学校办学评估指标。[15]相比包库,单种电子书的购买不需要一次付出大额经费,灵活易行,会有较大业务增长。
近年来,中文电子书单种馆配市场蓬勃发展。2015-2016年,北京人天书店“畅想之星馆配中文电子书平台”发布的《中文电子书目录》上线;浙江省新华书店集团“芸台购”上线,湖北三新公司推出“田田网”,又开发出“云田智慧平台”;2017年9月,“全国馆配数字联盟”成立,《全国馆配数字联盟章程》出台,[16]但实际上电子书单种馆配业务仍处于拓荒阶段。市场规范不足,缺乏权威销售平台,电子书发行滞后,与英、美等国90%的同步率存在很大差距。[17]目前,出版社技术模式、营运平台也没有针对机构用户设计,即使有些馆利用平台采购,但规模有限,没有结构性意义,高校馆中文电子书是“无源之水”。[18]有学者以“云田智慧图书馆”“畅想之星”“芸台购”为对象,调查用户驱动纸电一体化馆藏建设的现状,发现目前还没有纸电同步采购的成功案例。[19]
制约电子书单种馆配的瓶颈还没有被打破,但并不意味着纸电配合工作的探索无法进行。单种馆配只是电子书业务的一种,能与纸本形成补充、配合的电子书有多种,采选人员可以综合现有单种馆配、包库和非馆配电子书的情况,确定纸本的种类、复本政策,探索电子本采进的时机与节奏,尽量达成经费与空间上的最佳效果。同时,图书馆是电子出版物产业链的重要环节,若主动探索,积极引导,促使形势发展有利于馆配,也具有积极意义。
通过对华东师范大学图书馆文学类纸质馆藏与当前一些电子平台书目的分析,以发现纸本使用特征,探讨电子书补充馆藏纸本的可行操作步骤。分析过程中考虑以下几点。
(1)纸电配合的探讨须以纸本分析为依据。当前,出版社中文书的出版策略是纸本早于电子,何种图书需要使用电子本,必须以纸本使用数据为标准。馆藏书目有使用记录,特别是借阅记载,相比单纯的供应商书目,能更清楚地揭示纸本使用情况及其不足,为电子书的选购提供依据。借阅数据注意两组指标:最近时段(2016-2017年)借阅次数、年均借阅次数。最近借阅次数能衡量入藏已久的图书当前的使用状况,弥补系统无法提供各年度借阅记录的不足。“年均借阅”能兼顾图书的借阅次数和入藏时间,比单纯的借阅总数多出一个维度,较为科学地反映图书的总体使用状况。目前,大多数高校馆普通图书借阅期限为2个月,除去寒暑假时间,每本书年均流通4.5次。年均借阅率如果高于4.5次,一本复本不够,若能补充电子本,将是较好选择。因此,后文重点统计年均借阅4.5次以上的图书情况。
(2)文学类图书作为样本数据,有较强的典型性。文学类图书是高校馆和公共馆都需要的类别,其借阅种类多、借阅量大,也是读者使用的主要文献。同时,文学作品社会影响深远、发行量大,是出版商设计发售策略的重点,其使用、供应特征、问题及解决方案,能为解决其他类别电子书问题提供借鉴。
(3)华东师范大学文科具有较强的优势,中国语言文学学科在全国高校具有较大影响,对该馆文学类馆藏的研究,也能兼顾学术型电子本的馆藏建设。由此,下文对图书进行功能类型上的区分。
研究采用书目比较法,进行四类书目的比较:馆配包库电子书目(下文称A类)、馆配单种电子书目(下文称B类)、非馆配电子书目(下文称C类)、华东师范大学图书馆馆藏纸质书。
A类产品供应商有书生之家、超星、方正、爱如生等公司,本文选择一家作为代表;B类有浙江新华、湖北三新、北京人天、中国图书进出口公司等,从中选择三家,将其可供电子书目合并成总书目;C类有京东、亚马逊、当当、淘宝等,从中选择三家进行分析。为省去不必要的麻烦,文中各供应平台名称以字母代替,同时,笔者申明,字母顺序与本段提及公司名称顺序不相对应。
笔者登录华东师大图书馆数据库(登录日期:2017-04-10),整理出A类公司中文电子书目1,234,355条。登录该馆管理系统(数据输出日期:2018-01-01至2018-01-02),获取馆藏3,001,439条,去重归并后得到有借阅数据的图书465,727种,有借阅记录的I类图书88,760种。其中,年均借阅次数高于4.5次的文学类图书(下文称“高借阅图书”)13,159种,年均借阅次数高于27次的特高借阅图书398种。笔者又从B类供货商获取数据349,520条(数据截止日期:2018-02-02)。其中 B1、B2、B3分别提供 219,427、79,835、50,257条,经过查重后,得到不重复书目277,097种。将纸本与电子书目进行匹配后得到I类图书20,132种,年借阅次数高于4.5次以上文学类纸本图书匹配2,753种。
(1)相关图书分类号所包括的图书种类区分。将图书按照年均借阅0、4.5、9、18、27次以上五个档次,统计各分类号下图书及其占比。22个分类号中,B、G、I、K、O、T类下各档图书种类较多,其中T类各档种数占同档借阅总种数的百分比分别为10.9%、15.4%、14.9%、9.1%、3.9%。但I类书在五档种数分别占比19.1%、21.4%、24.5%、30.2%、35.6%,远远超过T类。而且I类年均借阅27次的图书种数占同档总数的35.6%,超过三分之一。可见文学类图书借阅种数最多,且年均借阅率越高,图书占比越大,是最应引起注意的馆藏种类。
统计I类相关类号所包括图书的种数,得到20个小类下图书72,955种,占所有被借图书的82.19%,是有借阅图书的集中区域(见表1)。
这20个分类号中,中国文学相关的占了13个,图书总量达到55,106种,不包括“总论”类中的中国文学部分。其中,中国当代小说和中国当代散文种数最多,约占图书总种数(88,760)的四分之一。其后是各国各代各题材的文学批评与研究。
(2)不同功能性质图书的占比分析。对有借阅记录图书的功能性质进行统计,得到具有作品性质的图书64,916种、研究性质的图书23,729种、教材性质的图书1,672种、资料性质的图书479种、工具性质的图书422种(其中,各种性质有重复,因为一种书可能具有多种性质)。I类被借图书绝大部分是作品,占比73.14%,但研究型图书数量也很可观,占比26.73%,其他性质的图书类型很少。可见,文学类被借图书主要是用于欣赏性阅读,专业性研究次之。
(3)被借图书的出版社占比分析。对被借图书的出版社进行各项统计,数据见表2。
表2 各出版社图书借阅情况
人民文学出版社被借图书种数高居榜首,其后是上海译文、作家等专业性文艺类出版社,综合性研究类出版社如中国社会科学、北京大学与古籍类出版社如中华书局、上海古籍种类也比较多。
统计与有借阅记录I类88,760纸书相匹配的电子书,得到A类图书12,272种,B类8,647种,分别占I类有借阅总种数的13.8%与9.7%。A、B两类之间共同匹配20,132种(其中,重复匹配1,575种),在有借阅图书中占比23%。统计与年均借阅4.5次以上的高借阅纸本(13,159种)相匹配的电子书目,得到A类图书1,579种,B类1,272种,分别占I类有借阅总种数的11.9%与9.67%。A、B两类联合匹配电子书2,753种(其中,重复匹配198种),在所有文学类高借图书中占比20.9%,匹配比例更低。
(1)馆配包库电子书目(A类)数据。将高借阅纸本书目与以数据库形式提供的电子书目(A类)进行匹配,将排位较为靠前分类号下图书的情况列如表 3。
表3 部分分类号高借阅纸本与包库电子书匹配情况
由表3可知,包库电子本对高借书的满足率,只有I206、I207类高一点,且都属于研究型图书。
统计匹配电子书目下出版社的情况,将种类较多的出版社列如表4。
表4 部分出版社高借阅纸本包库电子书匹配情况
高借阅文学类图书里,包库书满足率最高的是北京大学出版社,最低的是中国社会科学和新星出版社。
对所匹配电子书进行功能统计,发现作品性图书10,318种,匹配电子图书1,107种,匹配率10.7%,研究性图书2,841种,匹配电子书473种,匹配率为16.6%。可见包库电子书中,研究型文献的满足比例高于作品类。
(2)馆配单种电子书目(B类)数据。将单种馆配(B类)方式提供电子书目与高借阅纸本书目进行匹配,将排位较为靠前分类号下图书的匹配情况列如表5(本表与表7各类“纸本数”信息同表3数据,从略)。
表5 部分类别高借阅纸本单种馆配电子书匹配情况
与包库电子书的满足情况相比,单种馆配平台研究性电子书满足比例较低,如,I207下B类电子书供给比例(9.7%)低于A类(15.4%),I206下B类电子书供给比例(8.7%)低于A类(16.6%)。两种电子书作品性纸、电满足比例则大致持平。
统计电子书目下出版社的情况,将书目较多的出版社列如表6(本表与下文表8各社“纸本数”信息同表4,从略)。
表6 部分出版社高借阅纸本与单种馆配电子书匹配情况
对比表4和表6,发现两种发售方式提供的电子书数量参差不齐。从出版社数量来看,A类方式供应电子书种数多于B类的出版社有12个,B类种数多于A类的有14个,大致持平。人民文学、上海文艺、江苏文艺、南海、北京十月文艺等文艺类出版社目前都是A类图书多于B类;上海古籍、中华书局、中国社会科学等其他性出版社是B类多于A类。前几类出版社多是中外文文学作品,尤其以现当代文学作品居多。
对匹配图书的功能进行分类统计,发现作品性图书10,318种,单种馆配电子书平台匹配978种,匹配率为9.5%;研究性图书2,841种,匹配294种,匹配率10.3%。可见单种馆配电子书中,研究性文献满足率仍稍高于作品类,但低于包库电子书研究性图书的满足例(16.6%)。
(3)馆配包库电子书目和馆配单种电子书(A、B)两类数据。将两种馆配书目进行去重汇总,得到馆配电子图书联合目录,先列出分类号情况如表7。
表7 两种馆配平台电子书联合目录部分类别情况
从表7所列数据看,两种方式联合,大致能保证一至三成左右的高借阅电子本,高于任何一种馆配方式单独保障的比例。在经费许可的情况下,可采取两种方式保障馆藏资源。
以下将联合保障情况下出版社情况列如表8。
表8 两种馆配平台电子书联合目录部分出版社情况
从表8可以看出,人民文学、上海译文两家权威文艺类出版社电子书的总体匹配不高,二线出版社如湖南文艺、江苏文艺比例较高,研究型出版社如北京大学出版社电子本比例也较高。
对联合目录中电子书功能进行统计,发现作品性图书10,318种,匹配电子图书2,026种,匹配率19.6%;研究性图书2,841种,匹配电子书709种,匹配率为25.7%,研究性电子书匹配率仍然高于作品性图书。
通过上文数据可知,有借阅数据的文学类纸本图书通过两种馆配渠道,大体可以得到约10%至30%左右的电子图书。但这个比例是笼统的,需要加上时间维度,才能了解读者需要图书的时段特征及各类平台可供电子本的供应时效。
(1)最近借阅图书时段分布。整理2018年1月1日输出的2016-2017年有借阅记录的文学类书目记录。将图书出版时间分为1949年及以前、1950-1979年、1980-1989年、1990-1999年、2000-2009年、2010-2017年六个时段,发现最近两年被借图书各时段出版种数分别为 1、19、41、33、201、8,158种,可见当前使用的文学类图书大多为2010-2017年间的出版品。进一步统计2010-2017年间各年度出版的有借阅记录文学类图书种数,得到的借阅数量分别为81、100、105、225、1,762、2,331、2,254、1,300 次,可见近四年出版图书的借阅种数最多。
对2010年至2017年年均借阅4.5次以上的纸质书种数进行统计,发现其数量分别为23、22、17、30、385、522、613、609。用两种馆配方式进行联合匹配,发现各年度电子本的匹配种数分别为3、1、5、10、100、88、34、21。所匹配的电子图书中,A类平台提供的电子书很少,只有2013-2015年中的9种(1、5、3)。B类供书种数分别为 3、1、5、10、98、88、34、21,匹配比分别为 13.0%、4.5%、29.4%、33.3%、25.5%、16.9%、5.5%、3.4%。
(2)借阅图书总体时段情况。对13,159种高借阅文学类纸本电子书的匹配种数进行统计,将1950年至今的分布情况列如表9。从表9中可以看出,在高借阅纸质书中,2000年后出版的比例较大。2010年以后单种馆配书匹配比例较高,之前的匹配比例均低于包库书。两者各有长处,配合使用,可以保障五分之一左右的高借阅纸本图书。
表9 高借阅纸书电子本保障情况
对2000年以来文学类高借阅电子本的配比种数与百分比进一步做年度统计,数据见表10。
可以看出,2009年之后,单种馆配平台高借阅电子书配比量开始超过包库平台,2012年以后,包库平台高借阅电子书已经很少了。但最近两年,即使是单种发售平台,电子书数量也很少,不能满足读者需要。作为最近几年电子书的主要保障手段,单种馆配电子本要到纸本出版后的第四年才能满足高借阅文学类纸本书的五分之一。
表10 近年高借阅文学书电子书配比数据
笔者先后三次登录华东师范大学图书馆管理系统,整理出近六年的I类图书年均借阅4.5次以上的种数与同时段文学类图书种数,数据见表11。
表11 文学类图书近六年内高借阅图书与入藏数量
(1)由表中可知,年借阅4.5次以上的文学类图书在所有图书中的比重不会超过15%。笔者曾对国内单种馆配平台可供电子书进行检索发现,一年内基本无法得到纸书的电子本,部分出版社第二至四年内可能会渐次发售电子本,建议学术馆采取以单纸本为基础的馆藏政策,图书首次出版购买一本纸本,后续根据馆藏使用情况和电子书供应进展订购电子书或另添复本。[20]采访员需要对高借阅纸本的出版社、作者特征进行有针对性地采访。[21]对文学类作品而言,15%左右的图书在入藏的第一年可能就会有较高借阅量,需要较多复本,且还需要对图书的年代特征进行分析。
(2)中国古代文学图书的电子本比较容易解决。表7数据显示两个古代文学分类号I222(中国古代至近代诗歌、韵文)、I242(中国古代至近代小说)各有高借阅图书312、302种,合起来数量仅占高借总数(13,159)的4.66%。古典文学作品整理比较慢,增幅不大。现有较多古籍平台能够提供电子书,支持文献的检索、阅读和编辑。迪志公司的四库全书、书同文的四部丛刊、爱如生的中国基本古籍数据库、时代瀚堂的瀚堂典藏、翰海博雅的鼎秀古籍库等平台收录较多的古代文学作品资料。中华书局《中华经典古籍库》“古典文学基本丛书”系列也涵盖了很大部分。这些数据库能解决古代文学电子本的很大问题。
(3)中国现代文学作品情况分两类,作者于1967年之前去世的,到现在作品已进入公共版权领域,各种非权威出版社电子本多有问世,各大电子书平台也有公版书供免费阅读。1967年之后去世作家的作品,公版免费电子书不多,但若是经典作品,图书经过多次再版,图书馆采取多复本政策,纸质本有复本在藏,一般性阅读问题也不大。
(4)难以解决的情况出现在外国文学和当代文学。2000年后,特别是2013年后的图书,电子本比纸本有一定程度的滞后期,通过两种馆配渠道都难以得到小时滞的电子本。若购置较多复本,又会对馆藏空间产生很大压力。这是文学类图书纸电配合问题最主要的部分,也是当前电子书馆配业务的最大症结。表10中2016、2017年高借阅电子书只能匹配到6.3%和3%,需要考察其他渠道。
限于时间与精力,笔者采取抽样方式,选择三家主流非馆配电子书发售平台(当当、京东、亚马逊),对2018年1月1日导出书目中年借阅次数在27次以上的398种特高借阅品种信息进行检索(时间:2018年2月17日至20日)。采取两种匹配办法,其一,是模糊匹配,主要是题名、主要责任者匹配,其二,是精确匹配,要求题名、主要责任者、出版机构都能匹配。以精确匹配计,三家非馆配电子书平台分别能保障100、73、128种电子本(品种有重复),归并去重得到157种电子本。将馆配、非馆配平台匹配品种一起归并去重,得到191种,在特高借阅纸本数种占比49.1%。以模糊匹配算,非馆配平台匹配种数分别为199、172、211,共匹配246种,其中涵盖了两种馆配平台28种的10种。将馆配、非馆配平台匹配品种合并计算,共得到特高借阅文学类图书256种,占比65.8%,效果明显加强。
从非馆配电子书商中挑选一家有明确上架日期的平台,针对其中模糊匹配的电子书,将上书日期减去出版日期(出版日期未精确到日的,均以每月1日为准),得出电子书上架时滞。对该平台211种图书按时段排列,列数据如表12。
表12 特高借阅纸书非馆配电子书平台上书数及时滞情况
由表12可知,2009年以后,特高借阅品种非馆配可供电子书的种数总体上逐年增长。2006-2009年可供总数为74种,2013-2015年间上升到95种。但近两年内热门电子书种数不足,2016-2017年间仅有42种。近5年可供电子书的同步率均高于2012年前。同时,滞后发售电子本的平均时滞逐步下降,电子本平均时滞不到40天。
样本数字显示,非馆配平台文学类电子书的可供比例与时效情况高于馆配平台。这种情况下,图书馆和馆配供应商都应该考虑如何利用非馆配平台配合纸质本,以避免用户流失,对读者的吸引力进一步减弱。
(5)本文以文学类纸本书借阅数据为重点,通过与电子书目的比对和统计,分析了当前文学类图书馆纸质文本使用趋势,对当前纸电配合形势进行了描述。当前研究型文学类电子书比作品类容易获得,出版时间较长的电子书包库供应比例较大,近几年出版图书则主要以单种发售方式较多,但纸本发售的一两年之内,电子书很难获得,尤其是权威文艺出版社的图书更不容易得到。文献资源建设可以利用已有电子资源进行一些纸电配合的工作。图书首次可采取单纸本政策,后续可先考虑打包购进电子书,以保证电子古籍或2000年前的电子书,然后考虑单种馆配电子书平台。对借阅量较大的图书,非馆配电子书平台上书时滞较小,如果有适当的合作方式便于管理,可以作为电子书的有益补充。
文学类图书是高校和公共馆都需要的图书种类,本文数据所反映的情况具有典型性。当然,文学类图书所涉及的问题很多,如,经典作品纸本的再版和重印情况比较突出,时隔3-5年会重印或再版,这对纸、电配合工作有何影响,限于篇幅,本文无法一一考察,今后有待进一步细致讨论。