探究大数据对图书馆业务应用与服务创新驱动

2019-11-24 05:35辽宁财贸学院孙冰洋
办公室业务 2019年24期
关键词:馆藏数据挖掘学科

文/辽宁财贸学院 孙冰洋

大数据的发展对人们的阅读方式产生了较大的影响,传统的纸质书籍阅读逐渐转变为纸质书籍阅读与电子书阅读并重的阅读模式。图书馆需要认识到人们阅读方式的转变,对传统业务和服务进行创新,使其符合大数据时代读者的阅读需求,保障图书馆功能和作用的充分发挥。

一、大数据对图书馆业务应用与服务创新的影响

大数据技术的发展营造了泛在知识环境,人们能够通过互联网进行数据信息的传播,传统纸质书籍阅读方式逐渐被取代;再加上商业搜索引擎的推广,对图书馆的OPAC服务造成不利影响。由此可以看出,大数据的发展对图书馆的业务应用与服务创新提供了更高的要求。虽然大数据对图书馆的生存发展带来了挑战,也为图书馆提供了发展机遇,图书馆管理人员需要充分利用大数据技术的各项功能,对图书馆业务开展和提供读者服务过程中产生的数据信息进行采集与整合分析,明确图书馆发展中的薄弱环节,为图书馆业务的完善和服务水平的提升提供参考资料。

二、大数据对图书馆业务应用与服务创新驱动

(一)大数据驱动平台的构建。在应用大数据技术进行图书馆业务应用与服务创新时,图书馆首先要做好大数据驱动平台的构建,整合图书馆的相关大数据,为大数据挖掘和应用提供支持。一般来说,大数据驱动平台主要包括大数据采集、大数据建模及大数据分析三个维度。在大数据采集方面,主要通过图书馆流通日志、OPAC日志、系统层面或者图书馆网络底层进行用户访问数据的采集,包括用户信息行为数据和用户访问行为数据两类大数据,为后续大数据建模与分析提供数据支持;在大数据建模方面,技术人员可以通过多事务队列解析原始HTML数据的方式,对大数据进行初步处理,并将初步处理的数据存储于目标数据表,完成数据建模,并将其存储于用户数据库;在大数据分析方面,技术人员通过大数据挖掘技术整合有价值的用户数据,对其进行深入统计分析,为大数据业务应用及服务创新提供参考。需要注意的是,在图书馆网络与应用系统中,图书馆工作人员的管理权限有所差异。针对具有管理权限的数据,技术人员可以通过管理程序代理的方式,实现进程级别数据的管理;针对没有管理权限的数据,技术人员可以通过模拟访问进行应用系统运行数据的获取,并分析系统服务状态是否有效。在获取图书馆网络与应用系统的相关数据后,技术人员可以通过隐马尔可夫模型明确数据中的异常数据信息,实现图书馆网络与应用系统的有效监控,在图书馆网络系统的CPU使用率或者内存使用率等数据信息出现异常时,及时发现与报警,保障图书馆网络系统的稳定运行。

(二)基于业务应用的平台功能创新。在图书馆业务管理与应用中,图书馆管理人员可以通过大数据技术进行决策支持系统和统一统计分析系统的开发,实现图书馆业务应用的创新。在不同子系统中,大数据技术的应用方法和实现功能有所差异。

1.决策支持系统。在图书馆业务应用创新中,图书馆管理人员可以通过大数据技术的引进,对图书馆业务系统的大数据进行整合分析,结合大数据挖掘内容,为图书馆业务决策提供参考资料。技术人员需要构建大数据平台,对图书馆现有馆藏数据、OPAC检索日志数据以及流通数据等数据信息进行整合,通过数据的深入挖掘,为业务应用创新提供帮助。在馆藏数据挖掘方面,技术人员可以通过大数据技术进行图书馆藏相关数据的分析,对不同学科大类和二级学科的图书数量及占比进行分析,并通过饼形图、柱状图和表格等方式,对图书馆馆藏数据进行挖掘。在此基础上,大数据平台可以根据图书的年份、分馆、学科和语种等因素实现图书馆馆藏的整合分析,图书馆管理人员能够以此明确馆藏的薄弱环节,有针对性地进行图书资源的引进,丰富图书馆馆藏,有助于图书馆业务的完善。在OPAC检索日志数据挖掘方面,大数据技术可以保障日志数据挖掘的有效性,明确读者资源利用和图书馆馆藏资源间的匹配度,该内容与图书馆业务水平联系密切。大数据平台需要具备结构查询及关键字频次查询功能,使图书馆人员明确检索效率高,但是检索结果为0的内容,该内容为图书馆馆藏的空白区域,需要管理人员进行补充。由此可以看出,OPAC检索日志数据的挖掘,能够为图书馆业务开展提供指导。在流通数据挖掘方面,图书馆可以通过大数据平台对读者的借阅数据信息、预约信息数据进行挖掘。通过学科、出版社等参数分析读者借阅状况;通过年月、分馆和院系等参数分析读者续借状况及读者预约状况;通过学科、借阅日期和入库时间等参数分析零借阅状况分析。基于上述大数据挖掘结果,图书馆管理人员可以明确图书馆馆藏的使用状况,为图书馆业务的改进提供参考。

2.统一统计分析系统。在图书馆资源统计分析方面存在数据异构和应用异构问题,对图书馆数据信息的保护产生影响。在此基础上,技术人员可以通过大数据平台构建统一统计分析系统,开展有效资源管理及使用统计分析工作,明确图书馆资源的应用状况,为图书馆业务应用管理提供帮助。在图书馆资源管理方面,大数据平台的应用可以实现图书馆资源的有效划分,将其划分为平台、网站、数据库以及电子期刊等内容,并通过学科种类进行数据库和电子期刊的进一步细化,实现资源管理工作的精细化。具体而言,大数据平台可以将资源管理工作细化为电子期刊管理、学科分类管理以及读者分组管理等内容,实现图书馆业务管理的有效开展。在图书馆使用统计分析工作中,大数据平台主要对读者使用与资源使用两个维度进行分析。在读者使用统计分析方法中,大数据平台通过读者相关大数据的整合与分析,明确读者使用行为、读者访问文献以及读者分组管理等内容,并对读者分组下的读者使用资源、行为统计和应用数据库统计等数据进行整合分析,明确图书馆读者的阅读需求,为图书馆服务的创新提供参考;在资源使用统计分析方法中,大数据平台通过图书馆资源应用状况,明确数据库、电子期刊的使用状况,并根据相关使用数据构建报表,为图书馆业务完善提供参考。

(三)基于图书馆服务的平台功能创新。在图书馆服务创新方面,大数据的驱动主要是通过读者大数据的挖掘,为其提供个性化图书馆服务。具体而言,图书馆在获取读者网络底层数据信息的同时,利用大数据挖掘技术对大数据中的检索、浏览、下载等相关日志数据进行整合分析,以此归纳读者在图书资源检索、浏览和下载方面的特征,结合其时间维度,分析某一时期读者较为关注的学科,并通过关联分析方法、社会网络分析方法与聚类分析方法,预测学科热点及关联交叉学科,事先做好图书资源整合,在其他读者检索或者浏览时,为其推荐相关图书资源,有助于图书馆服务水平的提升。以高校图书馆为例,高校图书馆需要充分发挥自身的学科情报服务作用,定期采集各个学科师生在某个时间段的中国期刊网检索、浏览及下载日志数据,并通过关联分析法,明确学科热点和关联交叉学科。比如,某高校图书馆管理人员指导图书馆馆员应用情报分析专业知识,通过大数据挖掘技术及高校图书馆的文献信息资源优势,编制了多份学科分析报告,指出图书馆在学科情报服务方面的不足,对图书馆业务创新提供指导。

三、结论

综上所述,大数据对图书馆发展提出了较大的挑战,也为图书馆提供了发展机遇。通过本文的分析可知,图书馆管理人员需要构建完善的大数据驱动平台,基于该平台进行业务应用及服务创新,提升图书馆的业务水平,为读者提供信息化与个性化的图书馆服务,提升图书馆的市场竞争力,促进其健康发展。

猜你喜欢
馆藏数据挖掘学科
【学科新书导览】
改进支持向量机在特征数据挖掘中的智能应用
名家书画:浙江省文史研究馆馆藏书画作品选刊
馆藏高句丽铁器的显微共聚焦激光拉曼光谱分析
馆藏几件残损《佚目》书画琐记
土木工程学科简介
探讨人工智能与数据挖掘发展趋势
“超学科”来啦
软件工程领域中的异常数据挖掘算法
借问学科哪家强?尽言洄服有良方