数字图书馆的应用研究

2018-04-04 09:27黄新博
魅力中国 2018年46期
关键词:信息检索聚类检索

黄新博

摘要:近年来,数字图书馆在逐渐发展中,且数字图书馆常常为人们提起。那么数字图书馆就是一个利用数据服务器为读者提供全面有效信息的平台。本文首先解释了数字图书馆的概念,然后介绍了语义技术、数据聚类技术、信息分析技术和检索技术在数字图书馆的应用。

关键词:数字图书馆;应用;研究

一、数字图书馆的概念

数字图书馆是利用互联网技术,实现跨区域、跨国家的多个数字化图书馆之间的有效连接,使读者在何时、何地都能通过统一的界面来获取数字图书馆所提供的信息[1]。数据图书馆是应用各种平台的数据服务器,通过虚拟化技术对这些信息进行整合,并加快应用速度,提高可靠性和安全性能。由此可知,数字图书馆不是单纯意义上的一种新型图书馆,而是一个综合的、全面的系统工程。

二、数字图书馆的应用

信息时代,数字图书馆技术在数据处理上实现了一个质的飞跃,数据处理对象从传统的区域范围变成了广域处理。这些改变不仅对数字图书馆的开放性服务产生了极大影响,而且将对整个数字图书馆的结构组成、知识范围、应用技术等造成变革。因此,如何在大数据时代将数字图书馆与大数据技术有效的互相融合,是数字图书馆发展过程中必须仔细考量的难点。

(一)语义技术

语义技术在大数据和网络数字化环境中发挥着重要作用,该技术可实现全方位的信息整合将大量的复杂数据进行串联。数字图书馆则要思考的关键是如何将数字文献中相关信息与书本和词典中的语义进行融合,能够极大方便读者理解文献资料。利用人工处理这些繁杂的数据来实现释义是不现实的,因此需要借助AI与语义分析等技术对数据间的语义关系进行自动的识别和处理,使其语义连贯完整。语义技术因其准确反映出所要表达信息的特性,可扩大所收录资源的知识和来源,进而最大化的增加资源信息之间的共享。

(二)数据聚类技术

聚类是指根据数据的内在性质将数据分为一些类别,每一类别的数据尽可能具有相同特性,不同类别的差异尽可能大。聚类分析的目标就是减少研究对象的数目,分析不同数据之间的相似性和差异性,按一定的规律将数据进行合理归类。

在数字图书馆中通过对该技术的运用,人们在图书馆中能够更加便捷、快速的使用信息的分析和整理服务。聚类技术根据按照数据的相似程度划分类别,因而使数据与数据之间分割得更加明确,使同一类数据的相同性达到最大化,使不同类数据的差异性达到最大化。大数据时代下充斥着各种各样的信息,但是海量信息中的可利用数据少之又少。聚类分析技术可以有效的把些有效信息筛选和利用起来,将数据资源和信息进行聚类分析可以将其划分成多个子数据集合,这些子数据集合即相互关联又存在本质区别,非常适合面向问题需求。方便用戶对所需信息的检索、选择和分析。

(三)信息分析技术

信息分析是通过对社会信息的收集、整理、鉴别、评价、分析、综合等系列化的加工过程,形成一种新的的信息产品,最终成为一项为大众人民服务的具有科研性质的智能活动。信息分析技术应该是大数据时代的数字图书馆建立的根本和技术基石[2]。

(四)检索技术

信息检索是指通过输入关键词在一个文档集合中查阅用户所需内容的方式。目前大多数数字图书馆的检索方式是基于分类主题和关键词匹配两种方式来进行用户所需信息的查询。信息检索在数字图书馆的建设当中已经起到重要作用。

在信息检索中只要输入关键词,则系统就可选定范围内进行检索,并将检索结果呈现给用户。信息检索技术能方便得运用于信息的管理中,可以提高管理效率,减轻管理人员的工作量。在石油开采、桥梁修建等大型项目中数据十分庞大,运用信息检索技术能让工程师或管理者方便、快捷地查找相关信息。

此外,考虑到数字图书馆在使用过程面对的对象,都是普通民众,对于操作检索的方式都是自助式检索。为了达到通俗易懂,简明扼要的目的,必须把检索方式设置成便捷的、通用的的方式,更还要设置语言语义的模糊搜索,语义匹配搜索等方式,包括硬件上还要考虑到残疾人、弱势群体的使用便捷性。

结束语:

随着大数据时代到来,数据逐渐成为这个时代最重要的组成部分。数字图书馆是以公共服务为目标的服务平台,当前数字图书馆的建设应当是以数字化、信息化为主要任务。本文首先介绍了数字图书馆的概念,然后分别介绍了在语义技术、数据聚类技术、信息分析技术和检索技术四种数据挖掘技术在数字图书馆中应用。通过本文让人们开始了解大数据时代数字图书馆的潜在的重要应用价值,以改变人们对数据的看法和认识。同时通过撰写此篇论文让我了解了大数据时代中数字图书馆的重要,以及其在数据挖掘中的相关应用。

参考文献:

[1]张兴旺,李晨晖.数字图书馆大数据知识服务体系协同设计研究[J].图书与情报,2015(03):61-70.

[2]陈传夫,钱鸥,代钰珠.大数据时代的数字图书馆建设研究[J].图书情报工作,2014,58(07):40-45.

猜你喜欢
信息检索聚类检索
浅析开源情报信息检索与信息鉴别
CNKI检索模式结合关键词选取在检索中的应用探讨
通过实际案例谈如何利用外文库检索提高检索效率
基于模糊聚类和支持向量回归的成绩预测
瑞典专利数据库的检索技巧
英国知识产权局商标数据库信息检索
基于流形学习的自适应反馈聚类中心确定方法
基于密度的自适应搜索增量聚类法
高职院校《信息检索》课程教学改革研究
中外档案网站信息检索功能比较研究