大数据环境下数字图书馆的信息组织策略研究

2016-12-19 10:06刘钊
创新科技 2016年2期
关键词:数字图书馆大数据

刘钊

[摘要]大数据时代的到来,给数字图书馆的信息组织提出了新的挑战。本文主要分析了数字图书馆信息组织在新环境下面临的问题和困境,并探讨和提出了如何应对这种困境的信息组织策略。

[关键词]大数据;数字图书馆;信息组织

随着科学技术和互联网的不断发展,信息、数据呈现爆炸式增长的趋势,推动着大数据时代的到来。大数据,又称为巨量资料,指的是所涉及的数据资料量规模巨大到无法通过人脑甚至主流软件工具,在合理时间内达到攫取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。大数据作为一种信息资源和资产,数量大、种类多,变化丰富,所蕴含的价值也大,它的挖掘和处理必须依托云计算的分布式计算架构来进行。大数据的这些特点决定了它与数字图书馆之间有着深刻的关联,数字图书馆作为网络环境下出现的不同于传统图书馆的产物,是海量的“知识空间”,是优质知识资源的集散地。它以资源建设为核心,采用人工智能检索、信息海量存取、多媒体制作与传输、自动标引、数字版权保护、电子商务等现代信息技术成果,形成超大规模的分布式体系,以实现超时空、无障碍的传播。从定义和特点上来看,二者都是以拥有海量信息为基础,以分布式体系为手段,对信息进行挖掘处理以供使用。从数据范围来说,数字图书馆属于大数据的一部分,是其重要载体,并为大数据技术提供了应用和试验的空间。同时,面对新的网络环境,数字图书馆的信息组织对象也在发生变化,数字信息在内容、范围、价值、更新方式等方面也都有了不同,大数据时代也给数字图书馆建设带来了许多挑战。

1.大数据时代数字图书馆在信息组织上面临的挑战

1.1数字图书馆信息对象的变化

数字信息和资源是数字图书馆的立足之本,是提升其服务和水平的基础。当前,数据大爆炸时代,电子出版物、网络信息以及各种数据库的数量大大增加,已经远远超过各种图书馆传统馆藏资源的数量。而数字图书馆的内容主要包括馆藏资源数字化和社会资源馆藏化两个方面,它不可能涵盖全部社会信息资源,只可能对部分社会信息资源进行组织。这就涉及对数字图书馆信息对象的选择问题,面对海量的社会信息资源,我们该如何选择?如何确定标准?是基于图书馆本身所处的行业性质选择,还是根据该图书馆的主要用户需求去选择?是根据图书馆的数据挖掘和处理能力选择,还是以符合图书馆的服务水平去选择?在确定选择对象之后,还要考虑对象信息的准确性、及时性、实用性和可获得性等种种因素。因此,信息对象的变化和选择是大数据时代数字图书馆面临的首要问题。

1.2数字图书馆信息价值的鉴别

数字图书馆对信息资源的整合不仅仅包括收集和整理,更要注重对信息资源进行数据挖掘和深度加工,以期获取信息的现实价值和潜在价值。同样的,我们会面临一个困境,那就是如何来界定信息的价值,以及我们对信息的加工到何种程度能够最大限度地发挥其价值。用户对信息都有自己的评价标准,图书馆应该如何获取这些评价指标,并将其组合起来确立全馆的评价体系,这是基于用户需求方面需要迫切解决的价值鉴别问题。

此外,就信息本身而言,数字信息的许多优点,比如流动性强、信息与载体相分离、可随意复制更改、更新换代快等,虽然在信息的传播和转移上提供了许多便利,但却对图书馆进行信息鉴别和处理时产生不利影响。因为信息很有可能在传播过程中被随意更改后失真,或者出现信息不断更新造成的信息冗余等情况,这就需要信息组织人员具备较高的信息鉴别能力,了解信息处理的各项技术知识,通过数据恢复等方法还原信息的本义,以确保信息的准确性和可靠性。

1.3个性化信息服务质量的需求

传统图书馆在信息服务方式上,基本以提供文献信息服务为主,参考咨询服务为辅,大多是被动的、等待式的服务,只在用户表达需求时提供,或者只是提供信息资源,由用户自己去寻找信息。传统图书馆时代,用户获取信息的渠道单一、成本高,人们沟通交流的机会较少,信息需求不高。但随着信息时代的到来,用户通过电脑、手机等各种移动设备获得了更多的交流机会和社会信息,大大缩减了信息获取的成本和时间,这激发了用户获取信息的需求,并且这种需求也越来越追求个性化和独特性。面临这样的信息现状,被动式服务显然不能满足人们个性化信息的需求。在各种社会数据丰富数字图书馆信息的同时,数字图书馆的服务方式也需要进行改善。这种改善反馈在信息组织上,即要求图书馆在组织信息时要构建合理便捷的用户界面,增加对用户个人信息倾向的追踪,有针对性地主动推送,强化定题服务等等。

另外,还要发展数字图书馆的数字化参考咨询服务,使其不仅仅是数字化,更要向智能化发展。面对网络用户千差万别的信息需求,数字图书馆首先要树立信息服务意识,改变以往被动服务的态度,其次通过各种技术手段,如构建交互式共享平台,提供个性化推送服务等等方式来改善服务质量和水平,争取获得更好的用户体验。

1.4信息安全和公民隐私问题

信息时代的到来和网络的日益发达,给用户带来方便和快捷的同时,也让用户不由自主地将个人信息关联到互联网上,这就引发了有关于信息安全和公民隐私保护的问题。每个提供信息服务的主体,无论是图书馆、档案馆、社会机构、商业企业等,都在努力发展自己的用户数据库,那么如何在充分利用这些数据的同时保护用户隐私,这是每个服务主体需要认真解决的问题。近些年,用户信息泄露的事件频发,社会对此的关注度提高,用户对个人信息的敏感度和自我保护意识也有所加强,这无疑给信息服务机构提出了新的挑战。

此外,数字图书馆在进行信息加工时,不仅要关注信息本身,还有一种非文献资源需要得到重视,那就是用户行为的信息资源。用户行为的相关信息集中反映了该用户在信息需求上的喜好和倾向性,这是数字图书馆进行知识服务和知识推荐的参考基础,也是数字图书馆进行用户行为研究的基石。深度挖掘这些数据,并将其有机组织起来,将用户行为与馆藏文献资源密切联系,使其能够充分的为知识推送服务。

2.大数据时代数字图书馆的信息组织策略

2.1确立信息选择的原则和标准

信息选择是数字图书馆信息组织的第一步。所谓选择是在浩瀚的信息海洋里发现并确认具有组织、整理和保存价值的信息。由于数字化信息具有易于生成、复制与传播的特点,因此,在信息生成阶段,缺乏像传统印刷型信息生成所具有的一个完善的选择、评价制度。数字化信息的质量和价值参差不齐,这就要求数字图书馆在信息组织时,首先要确立信息选择的原则和标准,对信息进行有效的评价和筛选,因为只有有价值的信息才可能被有效组织。

信息组织的目的是为了服务用户,因此,数字信息的具体选择原则首先要依据特定主体面对的用户需求来决定,以用户为导向,实现效益的最大化。同时还要注重信息组织的系统性和标准性,这是数字图书馆持续存在的基础。系统性原则要求数字图书馆在整合信息资源时,站在一定的高度来开展工作,把握全局,保障信息效用的充分发挥。而标准有序化的信息资源,则能够改善信息混乱无序的状态,为信息管理提供统一标准,使其能更好地为用户服务。

2.2扩大信息资源整合的广度和深度

大数据环境下,用户不仅仅会满足于数字图书馆文献型信息资源的提供,他们在工作、生活、社交等各个方面都有信息需求。这就要求数字图书馆改变过去以传统文献资源数字化为主的信息搜集方式,而要广泛收纳社会信息资源来丰富数字馆藏,要将社会资源、政府资源、文献信息、网络信息、用户数据等内容有机整合,拓宽数字图书馆的信息渠道,尤其是将用户所关心的各种社会信息纳入到自己的数据库中。

另外,在丰富馆藏数量的同时,要提高馆藏信息的质量。因为新的网络环境下,用户不会满足于只是知道信息而已,他们更希望的是数字图书馆能够帮助他们直接解决实际问题。所以,我们不能简单地将信息相加,而是要从决策角度出发,合理整合并深度挖掘信息资源,使其能为解决复杂问题提供决策支持。同时,我们还要注重构建用户信息数据库,研究用户的信息行为,了解用户信息需求倾向,有目标有步骤的推送信息和知识服务,使馆藏信息达到效用最大化。

2.3建立特色资源数据库

特色资源数据库是数字图书馆资源建设和发展的核心方向,是其区别于其他信息中心的标志性产品。图书馆应遵守计划性、时效性、完备性、标准性的特色资源库建设准则,实现信息的共享。特色数据库能够充分反映本单位在同行中具有文献和数据资源特色的信息汇总,是图书馆在充分利用自己的馆藏特色基础上建立起来的一种具有本馆特色的可供共享的文献信息资源库。特色数据库的建设是个系统工程,要依据本单位的实际情况出发,从质量控制、流程控制、技术控制三个方面做好质量保障工作。从源头上严格把关,规划、论证都要秉持科学严谨的态度,设计过程中要注重技术的采用,为用户提供一站式服务。

目前,很多特色数据库的建设中都存在着重复建设、缺乏特点、更新慢等现象。作为数字图书馆,我们要根据自身依托的单位,找准自己的方向,建设可持续发展、有潜力的特色数据。在确定数据库选题后,要认真调研,全面考虑自身馆藏特点、历史沿革、学科特色以及用户需求等因素,重点关注某一领域,将有关的高价值信息收录进来,在该领域做到“全”且“精”,在保证数量的前提下追求质量,以体现数据库的专题性和独特性。

2.4提供个性化信息服务

随着数字图书馆建设和网络技术的高度发展,数字信息越来越多,人们获取信息的渠道和资源也越来越多,用户需求的多样性和专业化决定了个性化信息服务是数字图书馆发展的首要趋势之一。个性化信息服务实际上包含了两层意义:一是用户根据自身的需要定制信息服务;二是数字图书馆根据用户的需求倾向,主动地推送信息服务。从信息组织的角度,我们在这里主要强调数字图书馆对信息用户的主动推送服务上。

在大数据环境下开展信息组织,关键的步骤是获取信息用户,通过各种调查研究、数据挖掘和分析等方式,收集目标用户信息,构建用户行为数据库。然后对用户行为进行分析统计,进一步了解用户的信息需求,把握其行为特征和需求倾向,同时还要为用户创建和管理自己的信息兴趣群,并为其提供管理和服务。在此基础上,我们还要优化信息服务方式,将其向更深层次发展,即提供个性化知识决策服务,这类服务强调的是运用先进的数据挖掘技术,并联合语义网络和知识发现等方法,对适用于用户的信息进行更深层次的分析整合,从而给用户提供可用于支持决策的知识服务模式。

3.结语

大数据时代,数字图书馆的信息组织工作是一项复杂的工程,它不仅涉及数字图书馆自身馆藏建设的问题,还与用户行为和需求紧密相关。目前信息资源在现代社会中发挥着越来越重要的作用,这也意味着信息组织工作也会获得长足的发展。数字图书馆是国家信息化建设的重要组成部分,而大数据则开启了数字图书馆的重大转型。我们应该充分利用这次技术契机,转变观念和思维模式,在资源建设、技术应用和用户服务等方面进行思考,用大数据的思维看待问题,促进未来数字图书馆内涵和服务的不断发展和完善。

猜你喜欢
数字图书馆大数据
高校图书馆的未来发展模式刍议
浅析“互联网+”时代的图书馆管理
基于云计算的数字图书馆建设与服务模式研究
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索
刍议数字图书馆计算机网络的安全技术及其防护策略