数字人文环境下图书馆读者需求与行为统计分析实践

2018-04-13 09:26陆康
新世纪图书馆 2018年3期
关键词:马斯洛需求层次理论高校图书馆

摘 要 在数字人文环境下,面对读者多元化的信息获取方式和多元化的信息需求,图书馆基于读者需求开展精准服务,是提高资源利用率、降低服务成本的有效方法之一。论文基于马斯洛需求层次理论和高校图书馆读者的需求层次,对馆内各应用系统中的读者行为和资源利用的多源数据进行采集、统计,采用关联算法、探索性分析等分析与挖掘技术,对高校图书馆“小数据”可视化分析与挖掘进行了策略设计,构建了一套以行为学监测为主的统计分析系统平台,实现了对读者行为特征规律需求的监测。

关键词 高校图书馆 读者行为科学 马斯洛需求层次理论

分类号 G252.0

DOI 10.16810/j.cnki.1672-514X.2018.03.007

Abstract Under the digital humanities environment, facing the readers diversified access to information and diversified information needs, the library carries out precision service based on readers needs, which is one of the effective ways to improve the resources utilization rate and reduce the service cost. Based on Maslows hierarchy of needs and hierarchy of user needs in academic libraries, this paper collects and statistics the readers behavior data and resources utilization data in the application system of the libraries. And then it conducts a strategy design for the visualization analysis and mining of “small Data” in university libraries using the methods of association algorithm and exploratory analysis, and constructs a set of statistical analysis system platform based on behavioral monitoring, which realizes the monitoring of the characteristics of readers behavior.

Keywords University library. Readers behavioral science. Maslows hierarchy of needs.

信息社會发展至今,多元化的信息获取的途径已经逐步改变读者的信息获取习惯[1-2]。高校师生利用图书馆进行学习与科研,可以归纳到马斯洛的需求层次理论中的自我实现需求。面对读者多样化的需求,掌握读者对图书馆资源需求、空间需求、服务需求等特征是解决知识与服务之间矛盾的前提。在高校图书馆这个较为封闭的管理层面下,对多应用系统进行应用关联,汇聚读者的各种资源应用与空间应用等数据,分别从宏观资源与微观读者两个层面分析读者对资源的利用情况与读者的特殊需求,才能很好地开展个性化服务,为图书馆实现精准服务提供可能。

1 数字人文数据挖掘的研究对象

读者需求内容的挖掘与可视化已经成为数字人文中行为学研究的重要手段。在“大数据”概念盛行的时代,“小数据”同样具有一定的研究与实用价值。小数据是以人作为个体为中心,围绕不同个体采集有关人的思想、行为、个性、偏好等个性化特征的数据[3]。结合图书馆与读者之间的服务关系,本文认为图书馆中“小数据”挖掘就是指以读者为中心,动态分析读者在不同时刻的资源需求、服务需求和空间需求等,以及与图书馆活动相关的社会关系等信息,进行全方位的数据采集、处理、计算、分析与应用的过程。

高校图书馆处于一个较为封闭的网络运行环境中,其封闭性也给数字资源的访问控制与管理带来一定的便利,例如以数字资源访问统计为目的的数字资源统计分析系统[4-6],以远程访问和域外访问为目的的电子资源远程访问系统[7],基于位置感知的书目推荐系统,这些系统在一定程度上都可纳入到计算机系统管理层面[8-9],在多系统运行环境下构建一套以读者为研究对象的,关联图书馆的资源、服务、空间的日志数据的采集系统,用以进行读者行为的分析研究,也可以用以宏观分析图书馆的运行。

人文领域研究从最初以计算机工具辅助到“互动式学术”即模拟模型、参考工具、空间历史实验室项目[10],以及数字人文和计算化社会科学,都属于数字人文的研究类型。现代图书馆数字人文研究领域从研究对象划分,主要包括两个方面的内容:一是资源研究,例如古籍、特色资源库研究等;二是读者行为学研究,例如读者资源行为研究等。由于资源和读者都是图书馆的重要组成部分之一,所以数字人文的研究必须围绕着图书馆的性质进行。本文数字人文研究,主要是针对读者行为学方面的研究,通过对读者行为分析推断出读者的资源需求、空间需求、服务需求等;根据需求理论,指导图书馆的资源建设、空间管理、服务提升等业务。

2 读者行为可视化分析挖掘思路

2.1 高校图书馆读者行为分析

高校图书馆的服务质量一般与读者行为联系在一起,也就是说服务质量的直接表现形式是读者行为[11]。而进行读者行为学研究的目的也是为了提升图书馆的服务质量。在信息社会的环境下,读者的多元化获取资源的方式造就了其多样化的需求,其对图书馆的资源、服务等反馈的行为也不尽相同。所以,对研究对象的分类细化,获取读者的行为方式、空间轨迹方式、服务需求内容等,是进行精细化服务的基础。这些信息的获得,往往通过图书馆的各种系统实现。系统日志信息记录着读者以及与系统支持相关应用行为数据,这些与读者行为有关的数据,在马斯洛需求理论中,也就是自我实现的需求。根据高校读者利用图书馆的目的,归纳出高校图书馆需求理论模型,如图1所示。

如图1所示,不同读者由于目的不同,其对图书馆的需求层次也有多样性。由左往右、从低层次到高层次,分别为学习需求、科研需求、创作需求、设计需求与规划需求。这是高校读者在学习、科研、创作、设计与规划中的层次等级细化。高校读者的学习能力、科研能力、创作能力、设计能力与规划能力等可在图书馆等相关业务部门的协助下得到不断提升。在此过程中,图书馆与读者之间需要建立一种动态沟通机制,除了传统的信息服务工作以外,研究分析读者的学术与科研动向,采取与其相适应的资源建设、服务推送等工作,才能够真正的帮助读者在学习、科研等工作中得到提升。图书馆读者需求层次模型的建立,有助于建立科学化管理的理论基础,也能够帮助图书馆在日常的资源建设、空间管理、服务管理工作中提供决策依据,避免资源浪费,空间混乱,服务低下的现象发生。

2.2 需求理论与读者行为关系

人的价值分为社会价值、个人价值和自我价值。人的自我价值是指个人自身既为主体又为客体自我认识、反省、调节和实践以达到社会和他人无法给予的自我满足[12]。人的价值的实现就是人们对马斯洛所提出的人的五个层次需求的奉献和索取。而人在第一层次至第四层次需求的过程中无法实现自身满足,需要自我认识、调节;人要实现最高的第五层次需求才能自我实现需求,使自己越来越成为自己所期望的人物。在高校读者群体里,图书馆的价值是实现人的最高的第五层次需求,即实现自我需求。

读者对图书馆的需求反馈,主要是通过图书馆各项业务使用过程的感知来评价。例如资源的借阅量、空间的使用量等,不同的资源,不同的空间,其数值是相同的,也客观反映读者的偏好。读者需求与行为反馈的关系如图2所示。

如图2所示,读者在追求自我实现需求的过程中,对图书馆所能提供的资源、空间、服务提出一定的要求,这些要求直接体现在资源的借阅量、空间的使用量与服务的满意度方面。因此根据量化的方法,对借阅量、使用量和满意度进行分析研究,可以获取到读者的真实需求,掌握读者的偏好,用以提升读者服务工作。

3 读者行为可视化分析策略设计

高校图书馆的多系统、多应用环境为读者行为研究提供了原始数据基础。源数据准确性与可靠性,直接影响读者行为分析结果的真实性。减少中间环节,直接从源系统中获取数据,是提高分析效率和统计准确性的基础。高校图书馆的应用系统建立在资源、服务与空间管理上,而各种应用系统运行都围绕着这三个方面进行。资源、服务、空间直接或者间接与读者活动相关,根据这个原则,设计读者行为可视化策略,并逐步实施,如图3所示。

高校图书馆的多系统分别包括空间管理系统、资源管理系统、电子资源远程访问系统、服务管理系统等。空间管理包括涉及与空间相关的系统,例如座位管理系统、门禁管理系统、无线管理系统等。资源管理包括纸质资源管理的图书馆管理系统,例如汇文图书馆管理系统等;数字资源管理系统,例如复旦光华、信安之星的电子资源统计分析系统。高校图书馆为了方便域外读者访问数字资源,提供VPN系统或者类似的电子资源远程访问系统,例如汇文的电子资源远程访问系统。服务管理包括多媒体阅览室的管理系统,自助打印设备的管理系统等。高校图书馆的读者行为数据可视化分析与挖掘,需要从上述各系统中采集源数据,进行多重数据清洗,提高数据的准确性,以此提升行为分析的准确。

对于在多样化的应用系统中的源数据,一定要以读者行为数据为基础。在空间管理层中,基于读者座位选择与无线网络热点聚类,从涉及读者、位置的关联数据中汲取;在资源管理层中,进行文本分析,从双类型数据、文献-关键词数据中进行文献聚类和关键词聚类,从而获取读者对资源的偏好信息;在服务管理层中,基于服务系统数据库,关联读者、多媒体阅览室、自助设备等服务系统之间的相互联系,进行利用率统计聚类与读者身份信息聚类[13]。只有这样才可以较为全面掌握读者资源、空间、服务动态。对于采集到的数据,通过关联算法、探索性分析和基于案例学习等分析与挖掘方法,进行实时分析才可实现对读者对象性、多样性、周期性、历史性等四个方面特征的需求进行监测,以辅助图书馆决策者在资源与空间管理中发现新的现象、需求、趋势。

4 读者行为可视化分析与挖掘研究实践

4.1 行为数据的关联算法

基于要采掘的数据库中的概念层次和发现单一概念层次中的关联规则的算法,主要有Han等人的ML_T2L1和R.Srikant等人的Cumulate、Stratify算法。如在讨论同一字段的值之间的关系时,即可运用在单维或者维内的关联规则,这些规则一般是在同一数据库中挖掘。例如大三、大四的读者,职业是学生,那么该读者就会访问学术期刊网下载论文。该规则的表达方式如下:

年级(X,“大学三年级—大学四年级”)+职业(X,“学生”) →访问(X,学术期刊网下载论文)

另外,由各系统提供的座位管理的读者选择座位的信息,读者无线网络访问与登录点位置信息,门禁系统提供的进馆信息等,都是从点方面获取读者信息来研究分析。而不同系统的应用统计分析数据,则是从面上对各个系统运行状态进行研究分析。4.2 探索性分析

探索性分析也称为探索性因子分析法(Exploratory Factor Analysis, EFA) ,是一项用来找出多元观测变量的本质结构、并进行处理降维的技术。因而,EFA能够将具有错综复杂关系的变量综合为少数几个核心因子。对于主因子分析法来说,不存在异常值、等距值、线形值、多变量常态分配以及正交性等情况[14]。EFA能够将将具有错综复杂关系的变量综合为少数几个核心因子。因子分析法是验证性分析和纯粹的探索性分析两种分析形式的统一体。英国的心理学家Charles Spearman在1904年的时候,提出单一化的智能因子(A Single Intellectual Factor)。随着试验的深入,大量个体样本被分析研究,Spearman的单一智能因子理论被证明是不充分的。同时,人们认识到有必要考虑多元因子。20世纪30年代,瑞典心理学家Thurstone打破了流行的单因理论假设,大胆提出了多元因子分析(Multiple Factor Analysis) 理論。Thurstone在他的《心智向量》 (Vectors of Mind, 1935) 一书中,阐述了多元因子分析理论的数学和逻辑基础。在运用EFA法的时候,可以借助统计软件(例如SPSS或者R语言) 来进行数据分析。

高校图书馆探索性因子分析法的运用一般在读者满意度调查、服务质量调查、特殊需求测试、市场划分识别、 读者、图书馆资源和服务及相互关联行为分类等五个方面进行。

一个典型的EFA流程如下[14]:(1) 辨认、收集观测变量,如读者行为、服务质量、资源动态等。(2) 获得协方差矩阵(或Bravais-Pearson的相似系数矩阵)。(3) 验证将用于EFA的协方差矩阵(显著性水平、反协方差矩阵、Bartlett球型测验、反图像协方差矩阵、KMO测度)。(4) 选择提取因子法(主成分分析法、主因子分析法)。(5) 发现因素和因素装货。因素装货是相关系数在可变物(列在表里) 和因素(专栏之间在表里)。(6) 确定提取因子的个数(以Kaiser准则和Scree测试作为提取因子数目的准则)。(7) 解释提取的因子(如或解释为“潜在资源需求”,或“服务需求”等)。

4.3 数字资源访问系统数据挖掘与分析系统实践

多维度的读者信息行为数据获取,能够提高读者偏好分析的准确性,是系统研究读者行为的基础,也是研究的重点。动态获取读者的资源行为,可以掌握资源建设与读者服务的主动性,能够实现想读者所想,供读者所需。在复杂多变的互联网环境下,实现精准服务,能够吸引读者回归图书馆,充分利用图书馆的资源、空间与服务,侧面体现了图书馆的价值。

域外(校园网外) 远程访问的数据主要通过电子资源授权访问系统进行挖掘和分析,该系统提供了数字资源统计汇总数据,同时也提供读者使用排行,热门资源排行与读者登陆人次。整个系统为读者资源行为分析提供了决策数据。校园网内数字资源访问监测是基于旁路监听方式进行,统计分析结果较为准确,解决了在多系统、异构性环境下,获取利用率等数据的复杂性。

域外(校园网外) 远程访问与域内(校园网内) 数字资源监测体系的构建,可以全面对数字资源的利用率和读者的数字资源行为作出24小时全方位的动态监测,实现了对读者对象性、多样性、周期性、历史性等四个方面特征规律需求进行监测。对象性主要是指不同类型的读者和不同的资源库;多样性主要是读者的多样化的需求,以及不同资源之间的关联性;周期性主要是反映读者的近期需求和长期需求,根据自身学习研究的动态性,形成对资源需求的周期性;历史性主要是利用保存的行为数据,在一段时间内,以小数据的思维,分析、挖掘读者资源总体需求以及资源利用率情况,用以指导资源建设、服务工作。

5 读者行为可视化分析與挖掘面临问题以及解决方案

5.1 读者数据隐私保护策略

通过应用系统获取读者行为数据,从读者隐私角度分析,如果使用不当,势必造成对读者隐私的侵犯[15]。高校图书馆各种系统中,记录着读者的各种行为,例如资源系统记录着读者借阅图书资源的信息,而这些信息直接反映了读者研究动态,间接的反映了读者思想、立场等信息。诸如此类的数据,如果不能够良好的进行保护,万一被不法分子获得将会对读者在生活学习造成不利的影响。所以,高校图书馆在进行读者行为轨迹挖掘分析的同时,必须要制定一系列的策略,对读者隐私数据进行保护。例如采用信息混淆隐私保护策略,引入第三方认证技术,设计并实现读者隐私保护模型,避免在信息服务中对读者隐私的侵犯。同时进行权限分级管理,数据匿名指代化,避免读者核心数据泄露。

5.2 多系统异构数据归一化

在图书馆的多系统运行环境下,解决异构系统归一化问题,是进行数据挖掘与分析的基础[16]。可以将不同数据库(如SQL、ORCALE等) 数据转换成同一种数据库数据,实现对同一数据源进行访问。异质关联数据的聚类,是由超过两种类型以上的数据对象组成。现在图书馆等多系统异构数据,往往属于异质环境。在此环境下,多类型数据相互联系形成一个K部异质关联图。运用迭代算法思想,对一个K部异质关联图创建一个RSN,构建一套关联网络模型,解决多系统异构数据归一化问题,其流程见图4。

5.3 空间管理与服务管理系统需要整合

空间管理需要涉及读者空间位置的各个管理系统的配合,例如座位管理系统、无线定位系统等。通过读者空间位置感知的管理系统,可以在定位读者的同时,获取读者的空间行为轨迹,进一步分析出读者的空间偏好。同时,复杂的、多样的服务管理系统,需要进一步进行应用关联与整合,其工作量较大,部署与实施细节较为繁杂,往往因为各高校图书馆的环境不同,其实施方案与部署的条件不一。所以,在此当前环境下,需要各个图书馆技术部门、规划部门对基础系统数据库类型进行归一化处理,做进一步整合,才能够为部署KaaS的小数据系统,提供硬件基础环境。

5 结语

资源、空间、服务是高校图书馆读者工作的基本内容。图书馆外部环境不断改变,互联网、移动互联网已经逐步改变读者的各种行为方式。如何抓住读者的行为习惯,利用读者学习生活特征,开展各项读者工作,是图书馆需要认真面对的问题。构建资源监测评价体系,规划空间管理服务体系,搭建服务数据分析平台,运用动态数据,指导图书馆日常业务工作,是提高图书馆运营效率的一个有效措施。在信息技术多样化的时代,图书馆缺的不是技术支持,而是运营的思路、理念。只有时刻围绕读者与图书馆两个对象,开展一系列针对性的研究与实践,才能够避免图书馆在发展中被逐渐边缘化,以技术支持管理的理念来提升图书馆的实用价值乃至学术价值。

参考文献:

陆康,陆兴华,刘慧.基于读者行为追踪的智能服务研究:以帆布指纹识别与CNZZ为例[J].现代情报,2016(7):107-112.

陆康.网络行为读者需求分析运用探讨[J]. 现代情报,2015(5):94-97,104.

马晓亭,陈臣.基于可信小数据的图书馆个性化服务研究[J]. 图书情报工作,2015(4):70-75.

陆康.高校图书馆数字资源统计系统建设研究[J]. 现代情报,2015(9):140-145.

周欣,陆康. 基于图书馆数字资源访问系统的读者行为数据挖掘研究[J].现代情报,2016(1):51-56,73.

刘慧.基于网络行为的图书馆数字资源评价方法研究[J].现代情报,2015(2):62-66.

周欣,陆康,张迎春.数字资源校外访问及统计分析系统探讨[J].中华医学图书情报杂志,2016(6):39-44.

邓志文,都平平,穆亚凤.基于位置感知的图书馆主动信息服务系统设计[J].现代图书情报技术,2016(2):102-110.

李胜,王叶茂.一种基于本体和位置感知的图书馆书籍推荐模型[J].现代图书情报技术,2015(3):58-66.

MICHAEL AKELLER,王宁.数字人文和计算化社会科学及其对图书馆的挑战[J].现代图书情报技术,2014(10):1-3.

王频.图书馆服务质量与读者行为关系研究[J].图书馆论坛,2008(4):113-114,149.

胡万钟.从马斯洛的需求理论谈人的价值和自我价值[J].南京社会科学,2000(6):25-29.

LONG B, ZHANG Z F, YU P S. 关联数据聚类-模型、算法及应用[M].北京:科学出版社,2015.

探索性因子分析法[EB/OL].[2016-11-24].http://www.psychspace.com/psych/viewnews-7168.

陆康.网络信息环境下读者隐私保护策略研究[J].现代情报,2016(6):119-123,153.

曹畋.大数据环境下的图书馆异构数据统一访问与转化系统[J].图书馆理论与实践,2016(2):80-84.

陆 康 南京晓庄学院图书馆系统技术部主任、副研究馆员。江苏南京,211171。

(收稿日期:2016-11-24 编校:刘 明)

猜你喜欢
马斯洛需求层次理论高校图书馆
需求层次理论视野下的杰克·伦敦小说《马丁·伊登》
基于马斯洛需求层次理论对在校大学生志愿服务的几点思考
基于马斯洛需求层次理论对在校大学生志愿服务的几点思考
高职院校贫困生资助育人探析
高校图书馆阅读推广案例分析
微信公众平台在高校图书馆信息服务中的应用研究
高校图书馆阅读推广活动研究
试论高校图书馆在网络环境冲击下的人文建设
高校图书馆阅读推广实践探讨
高校图书馆电子资源的宣传与推广