基于大数据理论的图书馆个性化服务探究

2018-08-24 08:23
河南图书馆学刊 2018年8期
关键词:功能模块检索个性化

晏 青

(汕头市图书馆,广东 汕头 515041)

1 背景

大数据时代,图书馆的数据信息来源更加广泛,信息类型也变得多样化,信息内容更为丰富。就信息载体而言,以往图书馆主要是一些纸质文献,如图书、报纸等。随着信息技术的快速发展与革新,数字化数据信息所占的比例不断增加。数字图书馆和手机图书馆建设工作的不断推进,使图书馆的信息资源逐渐朝着多元化的方向发展。因此,图书馆应更加重视对用户行为数据信息的梳理与分析,尽可能挖掘出数据信息中隐藏的潜在价值,充分应用大数据技术,不断革新图书馆服务模式,确保读者能够获得优质的个性化服务。

2 大数据条件下图书馆个性化服务系统构建的可行性分析

2.1 数据信息来源极为丰富

要利用大数据信息挖掘与分析技术,数据信息只有达到特定的储存量级,才能获得较为理想的信息挖掘效果。在互联网和社交网络快速发展的过程中,图书馆也开通了微博账号、微信公众号以及读者论坛等,在图书馆与读者进行沟通与交流的过程中会产生海量的数据信息。另外,读者在登录图书馆网站时形成的一些行为信息均被记录与储存起来,这些数据信息的数量也是非常巨大的。因此,图书馆在个性化服务系统构建过程中,利用大数据信息挖掘技术具有较高的可行性。

2.2 实时掌握读者个性化需求

图书馆要想为读者提供更为优质的个性化服务,首先应当掌握读者的个性化信息需求。要想全面掌握读者的个性化需求,图书馆只有对读者的行为信息加以深入分析,才能提取到更为准确的用户需求信息[1]。图书馆的读者群体较多,不同时间段内读者对于信息的需求也会发生较大变化,如何更加及时地了解读者的个性化信息需求,确保图书馆能够为读者提供实时的信息支持,是图书馆开展个性化服务工作中的关键问题。利用大数据技术,图书馆能够对读者的行为信息,如检索信息、浏览信息等进行实时跟踪,再采用大数据分析技术挖掘出用户潜在的信息需求,确保图书馆能够为读者提供有针对性的信息服务,从而有效改善图书馆的个性化服务水平[2]。

3 基于大数据理论的图书馆个性化服务系统功能模型

根据图书馆现有的信息资源以及网络平台,同时结合大数据自身特征,笔者认为图书馆个性化服务模型应当包含以下功能模块:读者接口功能模块、数据检索功能模块、数据过滤功能模块、信息集成功能模块、信息规范化功能模块、信息分析功能模块、信息匹配功能模块、数据推送功能模块、读者评价功能模块以及读者数据库功能模块等,具体功能模型如图1所示。

图1 基于大数据理论的图书馆个性化服务功能模型图

3.1 读者接口功能模块

该模块的主要功能是连接读者设备端和图书馆系统。读者登录图书馆个性化服务系统时,需要在该功能模块中输入正确的账户以及密码,以完成读者身份验证。读者也可以通过接口输入需要检索的信息,系统会依照用户需求完成信息检索,并结合读者信息库中的信息,为读者提供精准的、有针对性的信息服务。读者还能通过该接口对图书馆个性化服务进行反馈,为图书馆和读者之间搭建一座交流与沟通的桥梁。

3.2 读者信息库功能模块

读者经由读者接口功能模块完成系统注册以后,系统会要求读者输入相应的个人信息,这些数据信息属于结构化信息,系统会将其储存至读者信息库中。另外,读者在使用图书馆个性化服务系统过程中所提供的一些反馈信息同样也会被储存至读者信息库中。因此,图书馆就能通过对这些数据信息的分析,更加全面地掌握读者信息需求,主动向读者提供有较强针对性以及精准性的个性化服务。

3.3 数据检索功能模块

当读者输入相应的检索信息以后,系统就能够根据读者的信息需求,利用智能检索方法自动为读者检索图书馆信息资源。当完成信息检索以后,系统会把得到的数据信息反馈到该功能模块中,如果未能检索到符合要求的数据信息,系统会在网络中继续进行信息检索,再将寻找到的数据信息添加至图书馆数据信息库中,并把得到的数据信息反馈到该功能模块。

3.4 数据过滤功能模块

在数据信息检索完成以后,所得到的数据信息将被输送至数据过滤功能模块。在该功能模块中,系统会完成对数据信息的筛选,并结合读者提供的检索信息,对收集到的数据信息按照相关度进行排除,从而获得与读者检索信息具有更高相关性的信息资源。

3.5 信息集成功能模块

图书馆读者群体成员构成具有一定的复杂性,读者的行为信息也分别储存于图书馆的各个系统之中,同时,图书馆自身的资源系统也相对较多,如读者行为数据信息库、电子资源信息数据库以及网络日志数据库等。因此,要想确保读者能够获得更为全面的数据信息资源,图书馆只有把上述不同来源、不同格式、不同含义的数据信息进行逻辑层面上的集成,才能确保读者能够获得范围更广以及更精准的数据信息。

3.6 信息规范化功能模块

通过大数据处理技术,图书馆能够更加深入地挖掘用户行为信息的潜在价值。而在这个过程中,图书馆应当确保数据信息在格式方面的一致性。由于信息集成功能模块所得到的数据信息来源非常广泛,信息的属性也会存在较大差异。数据信息规范化处理过程主要包含四个不同工序,其流程示意图如图2所示。

图2 大数据技术中数据信息规范化处理流程示意图

3.7 信息分析功能模块

该功能模块承担的主要任务是对信息规范化模块传输过来的数据信息加以分析与处理。由于图书馆的数据信息包含非常多的半结构化以及非结构化数据信息,因此图书馆只有利用信息分析功能模块完成对数据信息的分析,才能确保数据信息匹配的准确性,使读者能够获得更为优质的个性化服务。

3.8 数据匹配功能模块

在得到读者信息资源需求模型以后,系统也完成了数据信息的规范化处理。该功能模块会把得到的读者信息资源需求模型和检索的数据信息进行匹配处理,对检索的数据信息进行更深层次的筛选,选择具有更高相关性的数据信息并传输至数据推送功能模块,将匹配好的数据信息反馈给读者。

3.9 数据推送功能模块

该功能模块通过对智能代理技术的应用,依照不同读者的差异性信息需求,把一些读者感兴趣的信息资源经由读者接口功能模块主动推送至读者客户端。如:系统依照读者行为信息的挖掘与分析结果,在读者进行信息检索的过程中,主动为读者提供与检索有关的信息内容,或者推送读者没有意识到的一些潜在信息。数据推送功能模块还会依照读者定制的内容,实时向读者推送相关信息资源。

3.10 读者评价功能模块

系统会将一些信息资源推送至读者客户端,读者在收到这些推送信息以后,能够经由读者评价功能模块对图书馆所提供的信息服务加以评价,而读者做出的评价信息同样会被储存在读者信息数据库中。对读者评价数据信息进行分析与挖掘,能够为构建读者需求模型提供更加精准的参考,同时还能作为图书馆提供个性化服务的重要参考,确保图书馆个性化服务能够满足读者的信息需求。

4 基于大数据理论的图书馆个性化服务系统应用中存在的问题及解决方法

4.1 数据信息来源受限问题及解决方法

图书馆在应用大数据技术开展读者行为数据挖掘与分析工作时,能够获得读者信息资源需求模型。但是,要想确保得到的模型具有较高的可靠性,图书馆就应当具备大量的样本数据信息,同时也应达到数据挖掘的技术要求,不同数据信息应当存在相应的耦合度,只有这样才能确保得出的结果更加准确与可靠[3]。现阶段图书馆获得的读者数据信息基本上都是从图书馆所构建的系统中采集的,而系统外部读者的一些行为信息是缺失的,这将导致信息挖掘与分析得出的结果的准确性偏低。针对这一问题,图书馆应当加强与移动、联通和电信等运营商之间的合作,确保图书馆能够获取更为全面的行为信息,打破图书馆信息来源受限的局面,从而保障所建立的读者需求信息模型更为精准。

4.2 软硬件设备水平差异问题及解决方法

图书馆在利用大数据处理技术的过程中,要完成对海量数据信息的存储以及分析,因此应当具备较高容量以及较快运算速度的软件与硬件设施[4]。受到政策以及经济发展水平的影响,图书馆在软件与硬件设施上和大数据的技术要求存在较大差异。图书馆要想更好地利用大数据技术,就需要购入先进的软件以及硬件设备,但是这需要大量的资金,一般图书馆很难承受。图书馆可以与大数据技术企业合作,如:厦门大学图书馆采用阿里云服务重构站内的搜索体系,不仅能够利用企业拥有的先进大数据技术,还可以减小硬件设施的资金投入。图书馆可通过这类合作实现更多功能,满足读者的个性化信息需求。

猜你喜欢
功能模块检索个性化
个性化护理干预在老年带状疱疹中的应用效果
CNKI检索模式结合关键词选取在检索中的应用探讨
坚持个性化的写作
瑞典专利数据库的检索技巧
2019年第4-6期便捷检索目录
英国知识产权局商标数据库信息检索
商业模式是新媒体的核心
基于ASP.NET标准的采购管理系统研究
高校二手交易网络平台功能及技术框架分析与设计
同桌宝贝