摘 要:随着大数据的应用与发展,图书馆如何利用大数据来提高公共文化服务水平,是所有公共图书馆面临的问题,读者大数据可视化平台是基于各图书馆核心业务数据库系统之上,经过接口协议进行大数据采集,经省级图书馆汇总后把各维度数据汇总分析,并以图形化的方式实时展示在不同终端上,便于图书馆员利用数据分析指导业务调整。通过实时图书借还数据、图书借还排行榜等服务,引导读者利用数据来提升图书阅读服务体验。
关键词:大数据 图书馆 公共数字文化服务 读者服务
中图分类号:G252 文献标识码:A
Abstract: With the application and development of big data, how libraries use big data to improve the level of public cultural services is a problem faced by all public libraries. The reader data visualization platform is based on the core business database system of each library, carries out big data collection through interface protocol, after being collected by provincial libraries, summarizes and analyzes all dimensions of data and displays it on different terminals in a graphic way in real time, which makes it easier for librarian to use data analysis to guide business adjustment, and guides readers to use data to improve their book reading service experience through real-time book borrowing and returning data, book borrowing and returning ranking lists and other services.
Key Words: Big Data; Library; Public digital culture service; Reader service
1 項目背景
河北省图书馆是河北省唯一省级综合性研究型公共图书馆,国家一级图书馆,是全省公共文化服务的核心骨干力量,全省图书馆事业高质量发展和智慧化转型的引领者、推动者。其致力于图书馆事业发展研究,承担全省基层图书馆的业务指导与培训;开展文献信息资源的收藏、保护、研究和利用,推动全民阅读,面向党政机关、企事业单位、社会各界及公众提供文献借阅、数字资源、决策参考、讲座展览等服务,着力建设成为服务人的全面发展和面向未来的终身教育机构。改扩建后,新馆总建筑面积5万m2 ,设计藏书量330万册,阅览坐席3 070个,信息节点4 000余个,年接待读者200余万人次[1]。目前文献总藏量为360万册(件)数字资源总量150 TB,随着大数据信息技术的广泛应用,国家互联网+计划重大项目的部署推进,大数据成为我国文化事业产业发展的重要支撑,在推动河北省公共文化服务发展方面起着日益重要的作用。但是,由于大数据在河北省图书馆行业运用相对较少,全省各级图书馆的读者数据缺乏统筹管理,并且多头建设易造成财政的浪费;读者数据缺乏有效的收集、汇总、分析手段,造成数据的浪费。
该馆研发的“河北省图书馆读者大数据可视化平台系统”可为上述问题提供理想的解决方案,对汇总的读者数据不再以结构型和非结构型数据存在于数据库中,而是使这些数据可视化,即以柱状图、饼状图、线型图等图形的方式展现数据,让图书馆工作人员可以更高效地了解读者进出馆信息、读者借阅信息、数字资源获取、各级图书馆读者分布情况等重要信息和细节层次。对实现全省图书馆行业各项文化服务的跨越式提升具有重要意义。
2 需求分析
目前,公共数字文化建设工作框架基本建立,覆盖全国的服务网络基本成型,资源库群初具规模,服务模式不断创新,政策标准逐步完善,保障水平明显提高,对构建现代公共文化服务体系发挥了重要的支撑作用[2]。与此同时,各市产生了很多读者信息,其中包括读者借阅信息,资源检索习惯、读者身份信息、读者进出馆信息等数据。但这些数据采集系统比较独立,依据地理因素及服务器因素形成了数据孤岛,无法发挥其价值,更无法为图书馆的管理提供高效的支撑。要提高图书馆的运行管理效率,发挥数据价值,更好地为图书馆的领导决策提供辅助支持,需要解决以下几个问题。
(1)全省各级图书馆信息系统互相独立,数据格式不兼容,每个系统都产生大量的数据,但是无法互联互通,更无法实现整合,无法实现统一的数据分析和处理,从而大大限制了这些数据的应用范围,造成了数据浪费。
(2)传统的读者借阅系统、进出馆系统的管理系统仅提供了数据的原始界面,非系统开发人员不易快速理解数据的规律和含义。需要将数据进行可视化方式进行表达,以人类最自然、最喜闻乐见的方式把数据的深层含义和变化规律展现在公众面前。
(3)全省各级图书馆相互独立的平台构建模式忽视了用户多样化的信息需求和使用方式,对具体使用而言,其更需要的是一站式服务中心,而不是在不同系统平台间的反复跳转与学习。
综上所述,河北省图书馆行业管理人员需要一种平台,能够有效整合全省各级图书馆读者进出馆、图书借阅、资源浏览等各项数据,并及时进行分析和汇总,以提供更准确高效的数据支持。有助于优化公共数字文化资源结构、推动公共数字文化资源共享、创新公共数字文化发展模式,推动公共数字文化服务的持续、创新发展。
3 建设目标
河北省图书馆读者大数据可视化平台系统,是建立在云计算应用的基础上,对全省各级图书馆海量结构化、非结构化数据整体利用,深度对业务数据做各维度的分析,联合其他平台数据对读者行为做挖掘分析,进行读者聚类、自动定义标签、阅读倾向研判等,为读者更加个性化的阅读服务,将图书馆的服务向精准化转型,为未来全省图书馆运营提供科学化的参考。同时实时了解全省公共文化服务需求、类型、分布、预期和现状,动态体现全省公众公共文化服务需求的变化趋势,通过项目开展建立全省图书馆行业统一数据标准及数据接口,数据提供方按照统一标准上传数据信息,有效实现全省读者数据资源根据数据提供机构级别、数据类型等内容进行汇总、分析,并可以完成系统对数据有针对性地进行整合及使用。通过对全省读者所有数据汇总进行数据整理、分析与预测,在挖掘大数据、数据融合后,可以实现对全省图书馆行业中的服务、资源、效能等多维度的关联展示[3],为河北省图书馆对全省各项图书馆类公共文化服务工作的规划和指导提供有力帮助。
4 系统设计及技术指标
数据分析系统采用BS架构,不需要安装客户端,即可通过Web网页进行操作,分辨率为2048×832。系统底层采用MySQL+Redis数据库,满足大量的数据处理需求,保证在多用户同时使用时运行稳定。数据分析系统的功能架构图1所示。
“河北省图书馆读者大数据平台可视化平台” 整体设计建设主要实现以下内容。
4.1 人数流量数据
进出馆读者数据实时展示,可按年/月/日不同维度统计分析。读者数量统计(进出馆)、当天入馆人数、当前在馆人数。
4.2 借阅情况分析
今日借还情况、借阅册数、还书册数、借阅量分布情况、借阅时段分析、人均借阅量、分类借阅情况、图书分类借阅排行榜、读者证分类等。图书馆借阅数据:(1)以统计图展示本数据,主要有总图书数、总借出数、总归还数这3种状态;(2)展示当日借出数、当日归还数。借出归还统计:以折线图的形式,交叉展示,并且定时切换当日、最近每日、每月维度展示。
4.3 读者分析
包括读者新证情况、活跃读者分析、读者總量、读者性别比率、读者性别借阅量情况、读者年龄群体比率、各专业借阅情况等.阅读方式统计:阅读方式统计(留馆、借阅),当日留馆阅读人数、当日借阅阅读人数。
4.4 图书分析
包括被借阅过的图书排行、新书入库情况、新书分类入库情况。(1)热门图书借阅统计:按借阅热度统计近1年以来最热门的借阅书籍,以及被借阅的次数;(2)借阅实时动态:展示借出状态,借书人名称、书籍名称、借阅时间。
4.5 数字资源使用量分析
数字资源总量、数字资源类型数量及分布、每类数字资源的使用情况,实时使用情况,每周、每月、每年等。图书推荐展示:热门书目类别展示,并且展示该类型下的热门书籍进行推荐,书目类别滚动展示。
以上所有功能展示设计内容如图2所示。
河北省图书馆读者大数据可视化平台的主要功能是从其各市读者认证服务器提取共享数据,把各地市县不同应用的图书馆业务系统、相互不一致的数据进行数据融合处理;基于统一接口、数据字典对实时数据和历史数据进行重组,以保证数据间关系的统一性、正确性、可理解性并避免数据冗余;维护读者基础信息、图书借还动态业务数据以及系统管理配置参数;支撑系统的网络构架、信息安全、网络管理、业务流程管理、数据库维护和备份等运维能力。整合协同平台根据功能可分为两个部分:第一部分,业务基础数据和共享数据的汇聚交换服务和路由流程管理,该部分是交换平台的基础,包括:静态交换数据、动态交换数据、图形数据及表格、统计资料等属性数据;第二部分,各系统之间的接口实现,根据事先制定好的规范、标准,实现各子系统之间的数据共享和传输操作。在接入中心平台时,应按系统集成要求设计系统结构,各类数据接口遵循系统集成规范[4]。“河北省图书馆读者大数据可视化平台”可实现与相关信息资源进行跨平台数据资源对接与共享。
5 建设内容及实现结果
河北省图书馆读者大数据可视化平台系统采用云服务模式进行构架与建设,并遵循“统筹规划、分步实施;层级管理、数据融合;安全可信、先进可靠、灵活方便;统一标准、统一规范”的指导思想。平台面向该馆及各市图书馆提供服务,同时通过系统及时分析与统计汇总为河北省图书馆对全省图书馆各项阅读服务工作进行全面实时管理,有效提升河北省图书馆公共文化服务体系建设步伐,全面提高全省各级图书馆公共文化服务供需的匹配程度,为公共文化服务措施的制定提供依据,切实增强全省图书馆行业公共文化服务的群众满意度,更好地满足人民群众精神文化生活新需求。平台可以通过大屏幕实时展示各种相关数据。同时,通过数据统计分析汇总,转化为图形化直观展示,以挖掘读者与数据间关系,提高数据利用方面相关性,根据大数据分析展示结果,提高数据利用程度,达到利用大数据服务提高读者服务效能问题。平台数据实际共功能展示界面如图3所示。
河北省图书馆读者大数据可视化平台系统是建立在全省各级图书馆数据基础上的一种新型生态系统,它全面采集和分析各种资源,通过大数据的手段,为读者提供更好的个性化服务,帮助读者完善个人知识体系;为图书馆提供各种统计分析报告,深度挖掘分析数据价值,帮助图书馆充分利用各种资源,加强资源流动,优化资源配置,提高图书馆服务质量,为管理、服务改善提供有力依据[5-6]。平台系统支持图书馆行业标准协议,采用了先进的大数据存储技术、快速准确的数据挖掘分析算法,具有表格、图形等直观的可视化人机交互界面,操作简便,能满足各层次的人员使用。平台通过分析读者各类行为获取数据,借助数据库技术、数学建模及知识服务等基础理论,抽取出每个读者的普遍性需求和个性化需求。同时平台还可根据区域范围、用户类型等筛选条件查阅全省各级图书馆的阅读服务概况,统计所筛选的图书馆整体数据,生成对于该图书馆的分析报表。河北省图书馆读者大数据展示揭示系统可以通过数据统计,对读者进行有效的阅读行为分析,挖掘读者与阅读时间、阅读地点、阅读内容等方面的相关性,为全省读者阅读趋势研判提供数据支撑,同时也将为公共文化资源智慧化利用,公共文化服务提升提供有效的数据保障。
6 经验总结
“河北省图书馆读者大数据可视化平台系统”项目实现了对已有管理系统的数据接口的对接,及对图书馆各类管理系统的历史数据进行数据挖掘整理、分析预测、数据融合等操作。同时还实现了全省各级图书馆主要数据管理与展示,并可根据区域与权限设定分级控制。文献借阅数据统计分析、读者数据统计与分析与全省各级图书馆各项热点动态、读者数据、借阅数据的综合分类展示,并可根据管理层级进行数据查看与管理。此系统利用大数据、云计算等先进技术,整合零散数据流,实现全省图书馆的入馆读者数据集合,以科技手段提升读者服务满意度,为今后智慧图书馆发展,功能的扩展完善积累经验奠定基础。
参考文献
[1]贾东琴,牛佳宁,柯平.中国图书馆事业法制史编年[J].图书情报研究,2019,12(1):33-40,14.
[2]文化部.文化部关于印发《文化部“十三五”时期公共数字文化建设规划》的通知[EB/OL].(2017-07-07).https://zwgk.mct.gov.cn/zfxxgkml/ghjh/202012/t20201204_906376.html.
[3]汪泽. 数字人文视域下历史档案资源知识库构建研究[D].长春:吉林大学,2022.
[4] 谭靖,彭松,王海月,等.一种基于林业数据共享服务平台的数据共享方法及装置:CN201911370226.X[P].2020-05-08.
[5] 黄亚平.大数据与人工智能环境下的高校图书馆智慧服务探索[J].办公室业务,2022(9):184-186.
[6]陈心怡. 基于大数据的高校图书馆智慧搜索服务模式研究[D].天津:天津理工大学,2022.
作者简介:王小培(1980|—),男,本科,馆员,研究方向为公共文化服务、信息化建设。