张银玲 张光照
(贵州财经大学图书馆 贵阳 550025)
为更好的服务读者,现代图书馆已经从传统的重视实体纸质资源的提供向重视数字化、信息化资源服务与管理的现代图书馆转变,又以服务泛在与精准定位的下一代智慧图书馆、“互联网+”图书馆为目标[1]。图书馆服务在不断的扩展,不仅包括传统的实体空间服务,同时包括新型的信息网络服务。无论是“智慧图书馆[2]”,还是“互联网+图书馆[3]”,都需要以大数据、云计算和物联网为技术支撑,以最终实现服务泛在与精准定位,其中,数据作为核心支撑起所有的应用。近年来,由于数字化与信息化的快速发展,图书馆积累了各种各样的数据,这些数据来源于读者的历史行为,能够反映出图书馆读者的行为特征。
吴蛟鹏[4]对图书馆读者行为数据进行分类并分析了读者行为数据的应用;李莉[5]利用读者的个人历史借阅数据,采用推荐算法向读者推送图书馆资源等。当前图书馆界对读者行为数据进行分析的方法理论研究较多,但真正应用却较少且基本是利用读者浏览行为与阅读内容进行个性化推荐[6-9]。本文以贵州财经大学图书馆为真实案例,对图书馆的各类数据进行分析研究,通过不同的主题进行分类与统计分析,最终采用图形化的方式对结果进行展现,真实、准确与形象客观地为图书馆决策进行支撑,以辅助图书馆制定如图书资源采购、开闭馆时间调整、个性化推荐、相关宣传活动方案等,从而更好的服务广大读者。
上世纪末,皮埃尔·布迪厄提出了场域的概念:“一个场域可以被定义为在各种位置之间存在的客观关系的一个网络(network),或一个构型(conf i guration)”[10]。这些特定的位置在高度分化的社会里,便细分成了各种具有自主、有合适社会功能的小世界,每个小世界就是具有自身逻辑和必然性的客观关系的空间,即一个场域,如经济场域、艺术场域、宗教场域、教育场域等。处在场域当中的各行动者(agent),因为各种客观条件与主观意识会形成一定的行为习惯与性情倾向,布迪厄将之称为“惯习”,即场域当中行动者的惯常行为的总和。与习惯不同,惯习深刻地存在于性情倾向系统中,是在长期的实践活动中形成,又不断地发挥实践作用。
场域可以说是一种关系思维方式,将主观意识与客观社会条件通过一定的关系形成联系,并最终形成一个空间系统。场域是各种形式的社会网络,是人的活动结成的关系或发生的场所,图书馆作为一个提供知识与阅读服务的空间网络,也可以看成一个场域——图书馆场域。吴红[11]首次以场域的角度分析大学图书馆,认为:“大学图书馆的角色首先在于在大学中开出一片空间或场域,这种场域提供了一种可能,使得大学的教学与科研乃至服务在此能实现在大学建制的其他场域中所无法实现的可能性”,但并未对图书馆场域作详细的解释与定义。倪代川在《布迪厄场域理论视域下的大学图书馆场域探析》一文中,以布迪厄场域理论为基础,初步界定出大学图书馆场域概念,并以场域理论为基础,从空间场域、关系场域、文化场域、信息场域等方面分析了大学图书馆场域内涵和特征[12]。此后,以场域角度分析图书馆相关的文化、信息、服务[13-16]等的研究出现,但从场域角度分析图书馆场域当中的各角色及其行为惯习的研究尚未出现。
本文从图书馆场域中的行动者出发,研究读者相关的行为惯习特征,对读者的惯习进行统计分类,最终用于图书馆场域中的管理者制定相应的决策。
图书馆场域中包括了多种行动者(角色),如提供资源的书商、提供软件产品的软件厂商、图书馆教职工、广大读者以及相关的管理工勤人员等。其中,最重要最普遍的行动者为图书馆读者,读者是图书馆服务的核心。读者的行为受限于图书馆客观条件的约束,如开闭馆时间、馆藏资源、图书馆地理位置、空间容量等,读者的惯习又反作用于图书馆场域,使得管理者作出相应的调整,如资源采购、座位调整、流量控制等。
读者与图书馆之间的关系已经由原来简单的资源获取与资源提供的关系转变为现在复杂的服务与知识的双向流通关系。当今图书馆不仅要为读者提供相应的资源与服务,同时应从读者处获取各类反馈信息并将这些信息转化为相应的需求,为图书馆新增或变动服务提供依据,形成一个循环的过程,才能为读者提供更精准、更优质的服务。而在图书馆中,读者的任何行为数据都可以成为相应的反馈信息,通过对这些数据的分析挖掘,可以形成有价值的现状分析及趋势判断,从而为图书馆制定决策所用。白广思[17]首次提出将图书馆的数据归纳为14大类,包括各类结构化数据和非结构化数据,这些数据由近百个小类组成,来源也多种多样。当今图书馆,最重要的是从用户的行为当中获取有价值的信息,从而调整图书馆相关的服务。
本文主要对读者与图书馆相关的各类行为进行分析研究,得到几类主要用于支持决策的数据,如表1所示。
表1 部分图书馆场域数据
3.1.1 读者基本信息数据 为保证读者信息的真实准确与一致性,节约数据录入时间,在高校中,图书馆读者的基本信息通常来源于学校其他应用系统,如学校一卡通数据中心。本文读者基本信息是按照定时同步的方法从本校的一卡通数据中心获取,保证了全校学生基本信息的一致性。图书馆只需获取必须的几个字段,如学生的学号、姓名、性别、年龄、学院、专业、班级等信息。读者基本信息数据基本上为结构化数据,存储与管理都比较简单,可方便进行相应的分析挖掘操作。
3.1.2 馆藏资源基本信息数据 图书馆馆藏资源是图书馆的核心数据,这里泛指图书馆拥有的全部资源,包括纸质的书目和期刊资源,电子的书目与期刊资源,以及相应的学习课件、音频视频等资源。馆藏资源数据类型多样,既有结构化数据,也有非结构化数据。
3.2.1 读者进出图书馆的门禁数据 进出图书馆的读者及其他人员都必须通过图书馆的门禁系统,实现安全扫描,在这个扫描的过程当中,读者进出图书馆的行为被永久地记录了下来,这些记录对图书馆的开闭馆时间调整、座位数设置、图书馆活动时间安排、读者流量分析等都有着十分重要的价值。
3.2.2 读者检索记录数据 我馆采用金盘图书馆集成管理系统进行管理,图书馆内部所有的纸质资源都可以通过该系统进行查找、借阅与归还。读者在该系统中的检索馆藏资源会被记录下来,这些记录数据一定程度上能够反映出读者的阅读爱好。同时,当前各图书馆均订购了不同种类的数据资源,如知网、维普、万方等,供读者浏览与下载,系统能记录用户的浏览与下载行为,统计点击量与下载量等数据信息。各系统当中的这些历史数据信息对图书馆的资源采购与资源调整可发挥重要的参考价值。
3.2.3 图书借还记录数据 图书馆的纸质资源通过借阅行为发生流通,产生价值。合法读者可以在图书馆内查找任意存在的资源并通过图书馆相关的系统实现借阅操作,将纸质图书资源带离图书馆进行更长时间与更深入的阅读,阅读完成后再将图书带回图书馆并通过系统进行归还操作。整个借还过程被系统完整的记录下来,这些记录数据在时间的积累下越发产生价值,可以用于分析读者的阅读爱好、图书的通流与使用情况等。
3.2.4 读者消费历史记录数据 我馆提供了相关的自助消费服务,如自助文印系统,自助饮水系统等。自助文印系统可供读者打印、复印、扫描相应的资源,这类资源通常是无法借阅和带离图书馆的重要资源,读者也可自带资料或从网络上下载相应资源进行打印。各图书馆提供的自助收费项目根据图书馆特色而不同,但这些消费记录数据,对分析用户的行为具有重要意义。
3.2.5 应用系统日志数据 读者与图书馆除了在实体物理环境中发生的各种行为会产生相应的数据记录外,在图书馆外也产生着各种各样的行为记录。读者通过图书馆网站、图书馆公众号及其他应用系统等访问、阅读与下载相应的图书资源会产生相关的记录信息。总之,只要是通过网络访问图书馆相关系统就会产生行为记录,而这些行为记录信息都蕴含了巨大的价值。
决策支持系统的概念是在20世纪70年代由J.D.Ltitle提出[18],指管理决策者通过对数据、模型和知识,以人机交互方式进行半结构化或者非结构化决策的计算机应用系统。OLAP(Online Analytical Processing)技术则是一种很好的方式,能使分析人员、管理人员或执行人员从多种角度对从原始数据转化出来的、能够真正为用户所理解的、并真实反映企业特性的信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术[19]。本文通过对图书馆各应用系统当中的各类事务数据、历史数据和日志数据等进行ETL(Extract-Transform-Load)操作后建立一个数据中心,利用数据中心当中的各种主题数据进行OLAP分析,最终以图形化的方式将分析结果展现给用户,以支持相应的决策制定,其模型如图1所示。
通过将图书馆现有的如金盘图书管理系统,门禁系统,各类应用系统中的事务数据、历史数据和日志数据等通过ETL进行清洗,转换后加载到数据中心当中的数据仓库系统中,再组织好对应的主题数据,利用不同的主题数据及之间的关联关系便可进行多维度的全方位分析操作,最终得出客观、真实的分析结果。
图1 决策分析模型
通过分析读者的相关历史行为,可以了解图书馆读者相应的惯习特征。这些惯习可以用于图书馆进行多种决策,进一步完善图书馆管理,提高读者服务质量。基于篇幅问题,本文仅以部分应用效果图进行示例。系统提供不同的条件进行分析,分析结果可以在线打印,也可以导出后进行其他操作。由于我馆是新馆,自2013年正式启用,数据自2013年开始至今。
5.1.1 流量控制及座位调整 系统记录了图书馆内部读者的流通情况,反映了读者进出图书馆的历史行为轨迹,我馆通过对门禁系统历史数据的分析,获取了图书馆最大读者流量与不同时刻图书馆读者流量情况。基于门禁数据实施了流量实时监控、座位管理等,这些数据对图书馆基础设施的建设有着重要意义。
(1)通过对读者进出图书馆的门禁历史记录数据的统计分析,可以了解高峰期时的读者数量是否超过图书馆的最大容量,是否需要引入智能选座系统或增加图书馆座位数量等。
如图2所示,我馆座位容量约为4 00个,而图书馆工作日每天的读者数量都超过4 00,周末读者更多,因此可考虑引进座位管理系统。
图2 读者到馆周统计
(2)我馆通过对读者进出图书馆的门禁数据进行实时统计,分析图书馆实时读者流量,将该数据通过图书馆网站、图书馆微信公众号、电子显示屏等实时公布可方便读者调整进出图书馆计划,规避高峰期使用图书馆所带来的不便。
5.1.2 采购调整及个性化推送 读者的浏览、检索、借阅等行为历史数据的统计分析,可在图书馆资源采购、资源宣传及个性化服务方面发挥重要作用。
(1)通过统计不同类别的图书的历史借阅情况,可以了解图书资源的利用情况,用以辅助图书馆进行图书采购决策,如增加高借阅量与高借阅频率的图书资源种类及数量、对比较冷门的图书制定特定的宣传方案、减少或舍弃“零借阅”的图书资源订购等。
如图3所示,我馆当前200余万馆藏资源中,有部分图书从来没有被借阅过,如经济类(F类)图书“零借阅”量高达7万多册。对于这部分“零借阅”图书,我馆采取针对性宣传,在图书馆内部的显示屏上与公众号上定期进行书目介绍。在今后的采购中,除去必要的收藏书目外,考虑减少相应的采购数量。
图3 “0借阅”图书统计分析
(2)通过对读者的借阅数据进行统计分析,可以了解读者的当前、历史借阅情况,统计分析读者阅读爱好,从而进行个性化推送。
我馆通过微信公众号建立了读者“个人图书馆”,通过个人图书馆,读者可方便查阅个人当前借阅与历史借阅,图书馆可通过微信公众号向读者推送与读者借阅相关的各类图书资源。
(3)针对图书馆各应用系统的访问与检索情况进行统计分析,可以知道读者的浏览爱好,从而进行个性化推送与辅助采购决策等。
5.1.3 阅读激励 由于各种因素的影响,图书馆读者的阅读热情与阅读需求存在差异,为了更好的鼓励读者到图书馆学习或利用相关资源,提高图书馆资源的利用率以及提升学习氛围等,我校图书馆利用借阅排行与到馆排行来鼓励与刺激读者。
(1)对读者到馆历史与借阅历史按照一定的条件(学院、部门、专业等)进行统计分析,将不同学院、专业、年级等的到馆与借阅情况通过图书馆网站向全体读者展示,以实现相互激励作用。
如图4、图5所示,通过每月进行借阅与到馆统计,可知不同读者群体的借阅情况与使用图书馆的情况,将统计结果通过图书馆网站、微信公众号进行展示,期望对广大读者形成激励。
图4 图书馆11月借阅排行
图5 “0到馆”读者统计
(2)通过对读者的借阅数据进行统计分析,可以掌握读者违规超期等借阅行为,建立个人借阅信用档案。
(3)利用读者的消费记录数据,统计消费偏向,可针对性提供相应的服务。
5.1.4 趋势判断 按照不同的时间(年、月、周、日)等进行读者流量与借阅等的分析,可以进行相应的趋势判断,便于图书馆制定相应的管理措施与活动方案等。
(1)通过对读者的到馆情况进行统计分析,可以总结出读者使用图书馆的时间性规律以及对资源的利用情况等规律,从而判断相应的趋势。
(2)通过对读者进出图书馆的历史门禁数据进行统计分析,可以掌握读者的历史到馆总量以及到馆规律,帮助图书馆管理层制定相关的管理决策,如高峰期增加图书管理员并减少开展图书馆活动次数,冷淡期开展相关的图书馆宣传活动等。
(3)通过对当前图书馆所有资源的历史借阅进行分析,可以掌握读者借阅图书的趋势,如在借阅高峰期,增加相应的管理人员,增加图书整理的频率,保障读者顺利获取并借阅相应的图书资源等。
图6为本学期开学时,用近三年的借阅历史数据进行分析统计,从前两年的借阅历史情况判断接下来的借阅基本走势,从而安排相应的图书馆工作。从图中也可形象的看出历年来各月的借阅高峰期与低谷期,从而可以辅助管理者进行工作人员的调配,保障读者快速成功的借还图书等。
众所周知,每年的三月与九月,由于是开学季,图书馆的读者数量与借阅次数会急剧上升,但具体的数字却无法通过经验而只能通过统计分析而得。如图所示,除三、九月以外,十一月也是我馆读者借阅的高峰期,在高峰期的时候,图书馆需要保障人力、资源的充足与设备、系统的正常运行。有了相应的历史数据作为支撑,图书馆即可提前预判相应的趋势,做好相关的准备工作。
图6 趋势判断
在信息化不断深化的当今,图书馆数字化程度越来越高,使得越来越多的数据沉积在不同的应用系统当中,并蕴含了更多的使用价值。我馆从最初对图书馆数据的简单统计分析[20]到如今多角度全方位图书馆场域行为数据分析,并将分析结果采用友好的图形化的方式进行展示,实现了更加全面便捷的辅助图书馆相关决策。各图书馆可利用各种数据分析技术对图书馆中已有的各类数据做相应的统计分析,掌握图书馆及图书资源的使用现状、图书馆空间的利用情况、读者的惯习特征等,从而有依据的制定相关的管理决策与个性化服务等。
在开展数据的分析与应用中应注意以下几点:①选择合适的数据分析与展示技术:根据本馆目前的数字化程度,选择合适本馆数据量的数据分析与展现技术;②建立合适分析模型:结合本馆服务特征、服务对象等建立对应的数据分析模型,确定数据分析主题与维度等,使得分析结果最终真正服务于本图书馆及图书馆读者;③提高数据分析决策应用类型:图书馆数据分析不仅能服务于图书馆决策,也可服务于读者决策,部分数据分析结果可通过一定的平台(微信公众号、APP、网站等)实时公布于外界读者,辅助图书馆决策的同时也可辅助读者做相应的决策。
实现图书馆业务的全流程管理,是国家数字图书馆建设的重要目标与特点[21],数据将是核心与关键。图书馆需完善技术支撑环境,加强数字资源建设与服务能力,培养数据分析人才,充分挖掘并利用图书馆数据中的价值,获取读者需求,提升图书馆各项服务能力。