大数据时代数字图书馆个性化服务研究

2018-01-24 19:36白琳琳
山西档案 2018年6期
关键词:数据挖掘个性化图书馆

文 / 白琳琳

随着大数据时代的来临,人们对于信息需求量越来越大,要求也越来越高。同时,在信息技术快速发展的带动下,用户对于信息资源的需求也越来越个性化。[1]当前,我国数字图书馆信息资源个性化服务已经有了一定的进步,但仍有诸多不足,如难以满足大数据时代背景下用户对于数字图书馆个性化服务的需要;由于发展时间短、经验欠缺,依然存在不少制约数字图书馆个性化服务的因素。本文拟探讨大数据时代数字图书馆个性化服务的问题,并提出相应的对策。

一、大数据时代数字图书馆个性化服务的问题

在大数据时代,用户对于数字图书馆的个性化服务有了新的理解和需要,也有了更高的要求。但实际发展中,由于建设时间较短,在数字图书馆的管理运营中依然存在着一些制约个性化服务发展的因素和问题。

(一) 未形成统一的信息共享机制

发展时间短,实践经验少,是导致当前我国数字图书馆运行机制较为落后、未能完全满足大数据时代数字图书馆个性化服务发展需求的主要原因。这主要表现为,我国数字图书馆没有形成一个统一的信息共享机制。例如,各大图书馆数据库的端口并没有相互开放,无法从某一数据库链接到其它数据库。这导致各数字图书馆之间的信息资源共享很难实现,给图书馆信息资源个性化服务的发展带来了巨大的阻碍。不同数字图书馆考虑到各自的社会效益、经济效益,不愿共享数据,阻碍了数字图书馆个性化服务的开展,导致用户能够检索到的数据量较少,降低了数字图书馆在个性化服务方面的水平和质量。

(二)数据标准化缺乏规范

根据笔者的调查,在大数据时代各数字图书馆依然难以做到信息共享的另一大制约因素是数据标准化问题。这一问题主要体现在两个方面。第一,数据存储方式。在资料数据的标准化方面,我国数字图书馆仍然缺乏规范性,不同数字图书馆由于采用了不同的数据存储方式,在调用对方数据时常常出现数据不兼容的情况。第二,数据格式。不同数字图书馆所采用的技术也有不同,有些图书馆是基于物联网和RFID标签技术,对纸质文献的扫描来建立数字图书馆;而有些数字图书馆则完全基于网络数据库来构建数字图书馆。这导致数字图书馆的数据格式并不同一,难以实现信息共享,降低了个性化服务的质量。

(三)数据挖掘能力不足

在我国现阶段,数字图书馆普遍存在数据挖掘与分析能力不足的问题,这极大地制约了数字图书馆个性化信息服务的质量。我国数字图书馆在实际的用户使用中,仍然存有诸多限制,如使用平台的限制、网络状况的限制等。我国大部分的数字图书馆服务系统都是以门户网站为基础,以此开展资源的组织、管理和检索等服务,虽然少部分数字图书馆将服务范围进行了延伸和扩展,大力创新和发展基于移动互联网的数字图书馆服务。由于在数据挖掘和分析能力方面尚有欠缺,数字图书馆功能水平低下,用户操作复杂。

(四)版权问题

随着我国对知识版权愈加重视,版权问题成为数字图书馆发展过程中的一大难题。在信息资源个性化服务中,需要对信息资源进行分类、整理之后提供给用户利用。虽然这种对信息资源的分类整理和加工是对原始文献的创造,具有一定的自主著作权,但对这些信息资源进行归类整理之后,以专题的形式借助数字化信息资源进行再编辑和出版,将直接关系到原著的演绎权,而只有作者才有编辑权。因此,数字图书馆在汇编出版有关作品的时候需要得到作者以及有关出版单位的同意,这就牵涉到作品版权问题。[2]

(五)用户隐私泄露

在大数据时代,数字图书馆在为用户提供信息资源个性化服务的时候,需要用户提供一些个人的信息资料,以便更好地与用户建立联系,更好地为用户服务。然而,随着互联网技术和大数据技术的发展,各类先进设备和信息技术在为数字图书馆信息服务提供支持和帮助的同时,也使得更多的用户数据变得更加脆弱,进一步增加了泄露个人用户隐私的风险。如系统安全风险、管理员操作不当的风险以及用户自身在实际使用过程中不规范操作导致的其它风险等,甚至发生更加严重的侵权纠纷。[3]

二、完善大数据时代数字图书馆个性化服务的具体策略

大数据时代,基于客户需要为客户提供个性化的信息服务,是数字图书馆信息服务的主流发展趋势,不仅关系到数字图书馆服务的水平,也关系到用户对数字图书馆服务的评价和体验。如何更好地为用户提供个性化服务,满足用户需求,是至关重要的。针对上述大数据时代数字图书馆个性化服务的各种问题,笔者认为可以从五个方面来完善相关服务。

(一)促进数字图书馆间的信息资源共享

从前文对数字图书馆制约因素的分析可知,当前我国数字图书馆的管理和建设都是相互独立的,各个图书馆之间都是各干各的,互不联系,缺少统一协调机制和个宏观调控机制,这就使得信息资源的共享很难实现,对图书馆信息资源个性化服务的影响极为不利。因此,这需要在全国范围内建立一个统一的协调管理制度,统一调度全国的图书馆信息资源管理,从而真正实现各个图书馆之间的信息资源共享和合作。[4]此外,要充分利用当前发达的网络技术和网络信息资源传播优势来实现馆际间的信息资源共享。这就需要各个图书馆加强网上信息资源共享建设,对接相互之间的数据平台,开放端口和数据库,使用户不管从哪个数字图书馆登陆,都可以方便地查询、检索自己感兴趣的信息,从而为用户提供个性化的信息资源服务。

(二)发挥行业组织作用,统一数据存储方式与数据格式

针对前文提到的数据标准化缺乏规范的问题,笔者认为,中国图书馆学会应当发挥行业组织的作用,规范各图书馆数据标准化问题。中国图书馆学会是一个依法登记和成立的全国性、学术性社会组织,不以盈利为目的,是一个旨在推动图书馆事业发展进步的行业组织。中国图书馆学会在遵从自愿的原则下,吸收来自全国图书馆及其相关行业和其他科技工作者作为成员,为图书馆与党和政府之间的联系及交流搭建了桥梁,是促进我国图书馆事业发展和创新的重要力量,也是引导图书馆行业发展、建立图书馆行业标准的一个组织。因此,中国图书馆学会应当尽快研究和落实数据标准化问题,尽快统一与规范图书馆的数据存储形式和数据格式。

(三)构建基于数据挖掘和分析的个性化信息服务

在大数据时代,数字图书馆应不断提升数据挖掘与分析的能力。具体来说,这可以从四个方面入手。一是明确数据挖掘目标。在数据挖掘中,必须站在用户实际需要的立场上,结合实际,建立细化和清晰的目标,并根据用户的兴趣爱好,精确计算,为用户提供个性化服务。二是数据挖掘。结合挖掘目标和数据特点,选择合适的算法,对已经处理和转换好的数据集进行数据挖掘。在数据挖掘中,要首先确定数据挖掘的算法,然后再对数据进行挖掘、搜索,或者对兴趣较高的模式、数据集进行分析和评估,以此实现对数据挖掘知识模式的检验。三是分析与运用。数据挖掘的结果主要是运用,因此,在数据模式的检查中,借助预先和可信的知识进行检查,最终促使其转化为可被用户理解和使用的知识,将其融入到实际的运行系统中。

(四)高度关注版权问题

针对前文提到的版权问题,在大数据时代,随着信息化的发展,数字图书馆的信息服务出现了新的模式,更加开放和便捷。但在此过程中,版权问题成为了一个新的突出矛盾,且不再局限于图书馆的发展过程中,大的方面来说它是一个社会性问题。因此,如何做好版权的保护,妥善解决版权问题,不仅需要图书馆去解决和探索,更需要社会的发展和进步,以推动版权的保护。这要求完善版权相关的法律制度,进一步推动版权信息利用机制的确立,加快探索网络技术对于版权信息的保护和利用。随着时代的发展以及对于版权问题的愈加重视,在大数据时代图书馆个性化服务中,版权问题也将得到妥善解决。

(五)提高用户隐私的安全保护强度

在大数据时代,用户隐私信息的保护愈加重要。数字图书馆在发展和建设的过程中,应该根据信息服务中的资源建设模式和用户隐私保护需要,依法完善用户的隐私安全防护,构建多层次、多体系的隐私信息安全防护架构,在各个环节对涉及用户隐私信息的数据进行加密处理。数字图书馆应当进一步从数据存储、审计、管理等层面,选择合适的技术和网络设备,对信息服务中的用户数据进行全面防护,尤其要进一步构建涉及用户敏感信息的安全保障机制。在系统的登录过程中,除了要采用密码登录、口令登录外,还要融入更多用户权限认证的方式和方法,对用户进行类别划分,使不同层次的用户在访问馆藏数据时对应不同的权限,同时进一步加强数据资源的管理和使用,以切实保障用户隐私信息的安全。

三、结束语

综上所述,大数据时代,数字图书馆信息服务必将朝个性化服务的方向发展。新时期一定要明确发展目标,妥善解决发展过程中出现的难题,进一步加强数字图书馆的信息资源共享,统一数据存储格式与数字格式,不断提升数据挖掘与分析的能力,时刻注意版权问题,提高用户隐私的安全保护强度,加强对馆员的信息素养和个性化服务意识的培训,以提高大数据时代数字图书馆个性化信息服务的质量和水平。

猜你喜欢
数据挖掘个性化图书馆
改进支持向量机在特征数据挖掘中的智能应用
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
坚持个性化的写作
图书馆
软件工程领域中的异常数据挖掘算法
上汽大通:C2B个性化定制未来
同桌宝贝
满足群众的个性化需求
去图书馆