丁洋 白晶
摘 要:大数据时代的到来,为高校图书馆创新和拓展资源建设模式带来了前所未有的机遇和挑战。以读者需求为中心的读者需求驱动采购,是高校图书馆馆藏建设的发展方向,体现出以人为本的服务理念。大数据环境下,针对高校图书馆文献资源建设面临的问题和困难,探讨大数据技术应用于读者需求驱动采购中的方法和意义。
关键词:大数据;读者需求;高校图书馆;文献资源建设
维克托·迈尔·舍恩伯格在《大数据时代》中指出大数据的核心是预测,人们对于数据的认识发生了转变,数据的获取不再是随机样本,而是所有数据;在庞大的研究数据面前,放弃对精确度的追求,不再热衷于寻找因果关系,而是更加关注相关关系。并展示亚马逊如何利用用户的购买和浏览历史数据进行有针对性的书籍购买推荐。
大数据思维和技术在高校图书馆文献资源建设中的应用,是时代发展的必然要求,将创新和拓展高校图书馆信息服务的方式和内容。大数据环境下的读者需求驱动采购是图书馆采访人员在信息技术的支撑下,把原本较难收集和使用的各类与采购有关的数据,如读者行为数据集合起来,以读者需求为中心,再依据馆藏数据和学科专业数据,通过大数据技术处理,对各类结构化数据和非结构化数据进行智能化的挖掘,发现数据之间的关联,从而指导文献采购工作。
一、高校图书馆文献资源采购现状
1.传统采购方式仍占据主导地位
以哈尔滨师范大学图书馆为例,文献资源采购为政府采购,采购方式以订单采购和现场采购为主,读者荐购为辅。从文献传递、馆际互借,到读者荐购,再到目前研究较多的读者决策采购,高校图书馆一直在探索能够不断满足读者愈加多元化的文献信息需求的采购方式,但依然存在较多问题,以哈尔滨师范大学图书馆读者荐购为例,见表1。
表1 哈尔滨师范大学图书馆2013年至2020年读者荐购图书统计表
哈尔滨师范大学图书馆从2013年开始读者荐购工作,通过填写“读者荐购表单”、网上订单采选、电话和邮件等方式接收读者荐购书目,对符合馆藏要求的图书开辟“读者荐购绿色通道”,由工作人员采取线上电商和线下书店两个渠道直接采购。到书时间基本保证在一个星期左右,能夠及时满足读者的阅读需求。2015年起实行政府采购,图书馆所有图书采购必经馆配商来做,因经费使用权受限,2016年、2017年读者荐购工作暂停。2018年开始,读者荐购工作重新启动。2020年因疫情原因学校推迟开学,也影响了读者荐购工作的开展,所以数量较少。从表1可以看出,除了特殊年份外,读者荐购数据呈增长趋势,但在整个馆藏建设中所占份额较少,采购量最多的2019年仅占到当年总购书册数的3.4%。不能充分发挥读者的决策作用,以读者为中心的采购模式尚处于起步阶段。
2.传统图书采购方式的弊端
订单采购是由工作人员根据本馆的馆藏方针有计划、有选择地选划图书,再将订单发送给馆配商。其弊端在于书目信息汇集的不完整,图书采购范围完全受馆配商限制;现场采购时间受限,采购人员工作量增大。另外,以上两种方式都是基于采访人员的个人经验,因此很多图书在专业性和需求程度上很难满足读者的要求。读者荐购在目前还是一种辅助采购行为,由于读者推荐的图书必须通过馆配商购买,图书订到率和到馆时间得不到保证,往往等读者看到其所荐购的图书时已经过了需求的最佳时机,更无法对读者的阅读起到推荐和引导的深层作用。而针对电子图书部分,则完全是由电子图书书商提供内容,图书馆根据经费情况进行订购,读者很难参与其中,严重影响读者积极性。另外,传统的读者荐购方式,荐购书目要经采购人员收集、审核、下单,到馆后还要单独验收、加工、联系读者借阅,工作量明显增加。
二、大数据环境为优化读者需求驱动采购提供了可能
1.国内外的理论和实践
国外,读者决策采购模式最早兴起于美国,1999年美国科罗拉多研究图书馆联盟与电子书整合平台NetLibrary协商,并进行了基于读者驱动的电子书采购实验,这被认为是读者决策采购的开端,之后读者决策采购风靡全美高校图书馆,成为馆藏建设的主导模式,无论是纸质文献采购还是数字文献采购,其应用环境和运行模式都相对比较成熟。国内,2011年张甲、胡小菁把读者决策采购模式推送给图书馆界,内蒙古图书馆和南京图书馆先后给予了很好实践,内蒙古图书馆自主研发的“彩云服务平台”,“借、采、藏”一体化,即读者可以在内蒙古图书馆合作的实体书店挑选图书,持图书馆读者证即可在书店前台办理借阅手续,无需任何费用即可当场带走;南京图书馆“陶风采”活动,吸引了5万多名读者参与推荐图书,“推荐图书总码洋45万余元,占当年中文购书总经费的21%。”
2.网络采选系统的出现
2004年中国图书进出口(集团)总公司推出了“海外图书采选系统”(简称PSOP),外文图书的采购首先迈入了网络采选时代。教师可通过账号进入该系统,在系统提供的书目信息中选划自己需要的图书,然后由图书馆采购人员审核决定是否购买。2020年在疫情常态化的情况下,北京人天书店搭建线上采书平台,在2020年10月和2021年3月,举办全国馆配商联盟线上图采会,数百家出版社参加,20余万种新书跃然网上,读者选择图书馆登录,输入用户名、图形码即可登录。荐购方式简单明了,包括检索图书、高级检索、纸电检索和我的荐购四种形式。平台展示分主会场、分会场、论坛、新闻区、销量排行榜和留言板,交易会设计科学、合理、方便宜检,为线上采购提供了模板,为读者决策采购提供了可能。
三、大数据环境下读者需求驱动采购的实现
1.树立大数据意识
尽管目前高校图书馆实行读者需求驱动采购面临较大的挑战,但大数据时代的到来,现有图书馆采购方式的变革是一种必然,业内人士在这种大趋势下所能做的是抓住机遇、迎接挑战。意识是赋予现实心理现象的总体,是个人直接经验的主观现象。大数据时代,图书采购作为图书馆文献资源建设的主阵地,必须树立大数据意识,重视大数据意识的培养,学会理解数据类型的多维性、数据采集的多途径、数据统计的规律性及数据处理的科学性等问题,以大数据为依据,构建图书馆读者需求大数据研究中心。收集、整合、分析、统计校内外读者的阅读行为和购买行为,进而制定出科学、合理的图书馆采购方案,提高图书采购质量,使图书馆的文献资源更好地服务于师生,服务于社会。
2.培养大数据使用能力
大数据技术含量很高,又是新事物,不被大多数工作人员所熟悉和掌握,所以要注重工作人员大数据使用能力的培养,图书馆应组织工作人员开展深入、系统地学习,掌握如数据采集、存储、分析、挖掘等方面的技术和工具,工作人员要多学习、多关注大数据的发展状况,确保有足够的能力适应相关工作。要建立完善的数据管理系统,高校图书馆应设立数据馆员岗位,专门负责数据的管理和服务工作。
3.养成大数据思维习惯
大数据思维就是需要全部数据样本而不是抽样,关注效率而不是精确度,关注相关性而不是因果关系。高校图书馆图书采购是政府采购,采购数量由学校投入经费的多少来决定,采购种类由采购人员制定的采购方案确定,采购方案的依据是采购原则、馆藏结构、读者需求,其中馆藏结构和读者需求的来源主要是数据分析,利用数据之间的关联性,通过收集读者在图书馆的自动化管理系统上的查询、借阅等行为数据和监测读者在移动图书馆、微信公众号等平台上的交互数据,预测读者需求,制定科学合理的采购计划,确定采购数量和资金分配,并为读者提供个性化的藏书推荐,挖掘读者潜在的隐性需求。所做这些,均要求工作人员具有大数据思维,把大数据的潜在价值转化为最大利益,大数据思维为读者决策采购提供了理论指导。
4.利用大数据技术
(1)大数据采集功能
大数据采集是指对各种来源的结构化和非结构化海量数据进行的采集,包括馆藏资源数据、学科建设数据、读者身份数据和读者行为数据。馆藏资源数据包括馆藏书目数据、馆藏数字化资源数据;学科建设数据主要涉及本校学科专业设置、重点学科专业、专业师生人数,以及与之匹配的馆藏种类与数量;读者身份数据包括姓名、年龄、职业、学历及专业、研究方向、兴趣爱好、读者级别等;读者行为数据指读者在使用馆藏资源和各种网络平台的过程中所产生的时间、位置、检索、下载、借阅、荐购、关注、评论等行为特征,以及对读书环境的满意度、对工作人员的满意度、对荐购图书处理的满意度、对图书馆整体的感觉和认可度等心理活动。
(2)大数据预处理功能
大数据的预处理是指在数据分析之前,先对采集到的原始数据进行“清洗、填补、平滑、合并、规格化、一致性检验”等操作,以此提高数据的质量。图书馆读者需求的數据来源,主要来自移动互联网、图书馆网站、图书馆自动化管理系统、实地调研等,这些结构化和非结构化的数据是零散的、孤立的、异构的,利用这一功能对事先采集到的数据进行科学、合理的梳理,将不同来源、不同格式的数据进行有机集中,以支持多样数据源与其他组件间的输入和输出,平滑运行。
(3)分析挖掘功能
是指从可视化分析、数据挖掘算法、预测性分析、语义引擎、数据质量管理等方面,对杂乱无章的数据,进行萃取、提炼和分析的过程。图书馆从读者需求的角度,对数据进行分析挖掘主要表现在:依据读者在利用图书馆资源的过程中所产生的各种行为数据,综合考虑来自图书内容和读者需求的影响,找出读者对图书馆数据平台中各种内容的偏好规律,基于对读者检索、阅读电子书、所访问网页等数据所显示的读者偏好分析,从而判断是否满足采购条件,以保障实现图书的读者驱动采购。
四、大数据技术对高校图书馆文献资源采购的意义
1.实现了图书采购的时效性
大数据环境下,数据价值的时效性特征愈加凸显,利用大数据技术对图书馆数据库中存储的海量数据信息进行实时的收集和分析,从而快速及时地获得读者在最近时间段内对图书馆资源的利用情况,指导文献资源采购工作,提高图书采购质量的时效性。
2.实现了图书采购的主动性
在传统的文献资源采购模式中,图书馆工作处于比较被动的位置,其原因之一是工作中缺乏科学数据的支撑。影响文献资源建设的因素纷繁复杂,将大数据技术与高校图书馆藏书采购有机结合,以数据为支撑,深入挖掘与采购相关各因素之间的关联,可以使采访人员在工作中做到有的放矢,科学决策。在藏书采购过程中及时了解资源内容与读者需求之间的关系,实现个性化的采书推荐和有针对性的采购,避免因被动盲目造成资源的浪费。
3.实现了图书采购的预测性
大数据的核心价值是预测,通过对相关数据的深入挖掘,发现读者的兴趣偏好,预测读者的需求,从而做出准确的采购决策和信息推送。读者需求驱动采购是以读者为中心的采购方式,一方面读者可以直接代替图书馆采访人员做出订购决策,读者选择了该书,只要符合图书馆预设的订购条件,即可自动进入订购环节,因此需要工作人员根据数据分析结果做好前期的预测工作,设定科学的订购条件参数,并为读者提供精准的信息推送服务;另一方面采访人员可以根据数据分析结果,从数据的角度量化读者需求与文献资源之间的关系,预测读者需求,制定采购决策,增强馆藏建设的针对性。
4.实现了传统采购模式的新突破
大数据环境下的读者需求驱动采购的工作要点是以用户需求为中心,以大数据技术为手段,搭建起以各类数据为支撑的智能化的文献采购数据管理平台,让读者积极参与到图书馆资源建设中来,改变传统图书馆馆藏建设中存在的主观、被动、盲目的弊端。大数据技术与高校图书馆馆藏采购工作的结合,突破了传统图书馆资源建设的藩篱。
五、结语
高校图书馆是构建学习型社会的主力,大数据环境下的读者需求驱动采购,是根据学校学科设置、馆藏结构优化和读者需求导向等各项数据,深入挖掘其相关性,从而指导文献资源的采购。图书馆需要从人才、技术、管理等方面综合建设,建立健全相关制度,引进数据专业人才,运用大数据技术,根据馆藏特点和采购原则,整合、分析各类读者的需求数据,制定科学、合理的采购方案,优化采购流程和资源配置,建立以读者需求为导向的资源建设模式。
参考文献:
[1](美)维克托·迈尔·舍恩伯格.大数据时代[M].杭州:浙江人民出版社,2013
[2]孙冬雪.大数据环境下省级公共图书馆图书采购模式研究[J].图书馆学刊,2016
[3]徐春艳,许丽丽,洪艳霞.大数据在高校图书馆信息资源建设中的应用探析[J].农业图书情报学刊,2017
[4]王芙蓉.大数据环境下基于读者决策的图书馆文献资源采购模型研究[J].图书馆学研究,2017
[5]刘海英.大数据时代高校藏书采购模式发展探索[J].大学图书情报学刊,2017
[6]曹树金,刘慧云,王连喜.大数据驱动的图书馆精准服务研究[J].大学图书馆学报,2019
(作者单位:哈尔滨师范大学图书馆)