鲁 昉
(中共贵州省委党校 信息管理处,贵阳 550025)
大数据环境下的数字图书馆关键技术研究
鲁 昉
(中共贵州省委党校 信息管理处,贵阳 550025)
在大数据环境下,大型的数据技术在信息提取等方面得到广泛的应用,并对信息资源进行有效的管理,但在大数据环境中蕴藏着海量的数据信息,这些信息多样,而且较为零散、复杂,因此,为信息的存储和管理等工作增加了不少的难度。在大数据环境下,数字图书馆的发展面临众多挑战。本文围绕大数据环境下的数字图书馆关键技术进行分析。
大数据环境;数字图书馆;关键技术
随着计算机技术、网络技术等的发展,图书馆也已经进入到了数字化发展阶段,在图书馆信息资源整理和管理等工作中,也加大了对数字化技术的应用,促进了信息化服务和数字化服务的实现。数字图书馆使用数字技术、网络技术等构建信息应用系统,对信息数据进行存储、检索、保存等,从数字图书馆自身进行分析,其各项功能的实现都是在以下这些关键技术的支持下完成的,数字图书馆利用这些关键技术实现新时代的信息化服务。
在数字图书馆中储存技术,主要是将信息数字化之后的文件保存,在实际工作中,纯文本的信息资源,如果只是对数字化技术和信息组织技术应用,根本无法对目前的数字图书馆需求满足。当前与数字图书馆相关的数据技术,包括有多媒体数据技术、面向对象数据库技术等,这些数字化技术的特点如表1。
表1 数字图书馆的关键数据库技术比较
数字图书馆的文本智能检索技术,可以实现跨地域、跨文库的实现信息资源的检索,并按照用户的要求,实施精密文本信息。文本检索技术可以根据用户的实际信息需求,对信息进一步进行分析,制定信息检索方案,根据信息的检索方案对用户需求的文本信息先进行分布式的检索,其次实施精确检索,提高文本检索的质量以及文本信息检索的准确性。常见的文本格式为DOC、TXT、RTF、PDF,图像格式为BMP、TIF、GIF、WMF、PICT、PCD、 TGA、JPG等,动画格式为ANI、FLI、FLC,视频格式为AVI、MOV、MPG等,音频格式为WAV、MID、AUD等,程序格式为COM、EXT。数字图书馆技术运用这些技术,进行文本信息、图像信息、音频信息等的检索、获取等,先进行相似性检索,然后直接从内容中选取相应的文本信息特征,进行信息检索。
在大数据环境下,数字图书馆成为先进技术应用的一个代表,在数字图书馆中,数据挖掘技术的应用,可以从大量的数据信息中,挖掘出抽象的、潜在的信息,发现数字图书馆中数字数据库中的核心,为大量数据的有效利用提供帮助。
人与人的兴趣、爱好存在差异性,在数字图书馆发展的过程中,每一个用户都有自己感兴趣的信息和内容,但是用户自己想检索的文本信息等内容存在局限性,此时,利用识别技术,对用户感兴趣的内容进行识别,获取用户可读的信息,同时,提高上数字图书馆的信息获取效率,更好的为用户提供服务。
数字图书馆是在网络技术、计算机技术等的支持下实现的,所以,其自身的递送网络技术是一种网络体系结构,通过该技术,实现各种信息资源的缓存、复制、发送等。递送网络技术的控制可以采用动态流量分配实现,在用户访问请求下,引导用户实施就近访问,对网络运行中存在的网络堵塞问题处理,提高用户的访问响应速度。
数字图书馆的一大特征就是知识信息量大而且丰富,这些特征也进一步的说明,信息的知识产权保护是一大难题。当前,产权保护是全社会都在关注的问题,并受到社会结构、伦理等的影响,为了保证数字图书馆中信息资源的安全性,其知识权保护技术,按照网络浏览版权法,对用户的访问范围进行合理的设置,在一定程度下,还可以为用户提供浏览服务,但是不提供复制服务。
主要参考文献
[1]陈臣.大数据环境下数字图书馆安全威胁与对策研究[J].图书馆工作与研究,2014(11):34-38.
[2]郑沁.数字图书馆的发展及关键技术[J].海峡科学,2012(12):73-74,83.
10.3969/j.issn.1673 - 0194.2015.06.134
G250.76;G252
A
1673-0194(2015)06-0212-01
2015-02-05