大数据对图书馆信息咨询服务的影响及对策

2014-06-12 01:18袁红军
新世纪图书馆 2014年3期
关键词:信息安全大数据

摘 要 基于大数据和图书馆信息咨询服务的内涵与特点的分析,探讨大数据对图书馆信息咨询服务产生的影响,并从树立大数据时代的图书馆信息咨询新思维与新理念、强化国家层面战略设计与不同领域的合作、搭建信息安全机制与开发数据密集型计算方法、加强相关大数据的人才队伍建设、构建多维信息咨询服务形态等方面着手,提出迎接大数据冲击与挑战的措施。

关键词 大数据 图书馆信息咨询 信息安全 数据密集型计算

分类号 G252.6

Abstract Based on the analysis of the connotation and characteristics of big data and the library information reference service, this paper discusses the impact of big data to library information reference services, and proposes the measures from setting the new thinking and new ideas of the library information reference service of the era of big data, strengthening the national level strategic design and the cooperation of different areas, setting up the information security mechanism and developing the data-intensive computing method, strengthening the talent team construction of related big data, constructing multi-dimensional information reference service form to meet the impact and challenge of big data.

Keywords Big data. Library information reference.Information security. Data-intensive computing.

1 大数据

大数据是一个术语,目前未能形成一个统一的定义,可以说也是一种理念及其相关技术构成的复杂系统。Gartner Group是一家信息技术研究和分析的公司,专门负责开展大数据研究工作。Gartner Group认为:大数据是指需要研发新处理模式,达到超强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产[1]。维基百科上也指出:大数据不外乎是网络公司日常运营所生成和积累用户的网络行为[2]。百度百科上定义为大数据又称巨量资料,与数字图书馆的数据仓库应用相比较,具有数据量大、查询分析复杂等特征[3]。事实上,大数据是指从海量、多样性的数据中,快速获得有价值的信息,蕴含深厚的文化基因和整合营销新的方式和理念。大数据本身是结构化数据、半结构化数据与非结构化数据的总和。但是,大数据不是简单的数据存储,而是强调数据获取数量与数据复杂处理能力。大数据的出现正是迎合现代社会信息化、网络化高度发达趋势。大数据呈现的特点主要包括海量的数据、多元化、高速、灵活与复杂等。其中,多元化表现为结构化数据(业务)、半结构化数据(网页)和非结构化(视频、音频)等多样性数据。由于多元化数据的大量存在,其存储容量、处理和分析方式存在较大差别,数据的时效性较强,这就要求对海量、复杂的数据进行快速、灵活的处理,以适应大数据发展的需求。

信息咨询服务是图书馆的一项核心业务工作,也是信息管理活动的出发点和归宿,是信息管理学研究的重要内容和领域,是用不同的方式向读者提供所需信息的一项活动[4]。毋容置疑,图书馆信息咨询服务也是一种基于网络技术的帮助服务机制,与大数据有许多相似之处。二者都是一定网络技术发展的产物,拥有大量的数据,并具有数据分析能力,无处不在,可随时随地满足目标读者的知识需要。主要差异在于目前图书馆信息咨询属于低层次数据存储与处理范畴,而大数据则强化海量的、多样化的、高速大数据存储与处理,技术、人员、成本要求更高。

通常情况下,图书馆信息咨询业务流程是:问题接收—提问解析和分派—咨询馆员作出答案—答案发送—跟踪,该业务流程与大数据应用的四个步骤(捕获—组织—分析—决策)存在着明显的关联性,而其中“提问解析和分派”是图书馆信息咨询工作的核心部分。信息咨询对接收到的读者提问进行一定的分析、筛选和评估,并首先查询先前的问题和答案,保存文档,查询较为合适的答案,或按照一定的规则发送至专家库,以寻求最合适的专家回答问题,然后进入答案发送与跟踪工作程序。信息咨询中“提问解析和分派”这一工作流程涵盖了大数据应用的四个步骤,执行毫秒级的响应请求以确保信息咨询服务的成功,这些需求需要新的系统架构以及相应的大数据处理和分析能力提供支持。信息咨询知识库中全部数据涵盖了大量需要处理的数据,数据以散落、零星、低密度形式存在,通过融合、遴选,以高度并行的方式组织和提取,或对非关系型数据使用分布式的技术手段进行异质性分析处理可用的大数据,并转换为容易分析的内容,再重新整合成的知识体系,高速充实到信息咨询数据仓库,通过可用的数据精确分析与挖掘,根据读者咨询问题表现的实时数据,咨询馆员快速作出决策(答案发送)[5]。

2 大数据对图书馆信息咨询服务产生的影响

图书馆信息咨询服务涉及的异构数据源主要包括以结构化数据呈现的各类型电子资源,BBS、留言板、表单咨询、E-mail咨询、图书馆博客、微博等读者咨询等出现的大量半结构化数据,在线咨询、QQ咨询等浏览历史、搜索方式、行为痕迹、存储信息行为以及出现的视频和语音信息代表的非结构化数据。另外,还可以收集从手机、平板电脑等诸多设备中收集到读者的个人信息、位置信息、浏览信息等各种不同的数据,共同构成了图书馆信息咨询完整的大数据[6]。这些数据量正在逐年增加,并对图书馆信息咨询产生深远的影响。

2.1 图书馆信息咨询中的数据存储问题

随着网络技术的快速发展,人们利用互联网的节奏逐渐加快,虚拟化、音频、视频、图片、自动分析和生成等内容的文件增多,日积月累,多种格式文件的大小和容量增大,造成知识库超载问题日益严重。因此,信息咨询有效合理管理大数据文件日渐提上日程。在大数据条件下,有别于管理以往数据文件方式,主要是因为存在以下三个问题:(1)由于数据容量大,以往信息咨询存储解决方案无法解决高性能共享的问题;(2)由于文件数量增大,整个数据传输网络的性能将受到其分级、归档、备份和保护等制约,存在明显的文件管理和保护问题;(3)大量重复的数据文件难免占据空闲的存储资源造成信息咨询中重复数据问题。

2.2 图书馆信息咨询中数据处理问题

现阶段,信息咨询引入了云计算,利用云计算技术解决了部分海量数据存储与处理的问题。大数据的来临,使信息咨询服务创新看到了希望,而大数据的处理能力令传统的信息咨询组织能力、分析能力和储存能力相形见绌。因为大数据时代的多种数据处理超越了传统信息咨询系统对交互、输入、输出、搜索行为的理解程度。

2.3 图书馆信息咨询中信息安全问题

大数据与云计算一样,也存在信息安全问题。在信息咨询管理与政策方面,大数据时代下各种数据融合与流动,涉及到图书馆等机构、咨询馆员、读者各自持有的知识交融与共享,机构组织的知识产权、个人的知识产权、个人隐私等信息安全问题亟待解决。这种信息安全有别于以往的信息安全问题,而是一种全新的安全观,需要充分考虑大数据时代的开放、高速与保护的彼此平衡,以及考虑知识产权、隐私权与读者使用信息咨询大数据利益的最大化。

2.4 图书馆信息咨询中大数据理念与人才问题

大数据的冲击,促使信息咨询必须开展全方位的革新。其中,最核心的冲击就是信息咨询知识生产方式和传播方式的变革[7]。面对海量的、多元化结构化数据汹涌而起,信息咨询知识库犹如沧海一粟,难以应对扑面而来的知识冲击,如果不改革单一的知识生产与服务方式,可能会加快信息咨询走向没落的步伐。由于大数据是由人的行为造成的,每一个人均可通过互联网交流与沟通,创造出大量非结构化数据。繁杂的数据需要高层次的IT技术人员进行分析和管理,但是,具有大数据背景的高效理解、运用与决策的经理和分析师人才缺口极大,而图书馆领域中基于大数据对信息咨询服务的分析和管理人才也相对匮乏。

3 改进方略,从容应对大数据时代的到来

3.1 树立大信息咨询服务新思维与新理念

大数据内容丰富,不仅大量新技术应用,而且蕴含了文化基因和营销因素。大数据时代的提出正是基于对当下社会信息超载现象的宏观描述。海量信息的极速扩张迫使人们的思维和技术发生革新。继续沿袭既有图书馆信息咨询的思维方式(局部数据和定量观测)难以适应对浩如烟海的信息进行整理和准确测度。在大数据时代背景下,信息咨询需要转变思想观念,牢固树立一种全新的大数据理念,以大数据思维颠覆信息咨询固有的思维定势。这种思维要求超越此前有限信息时代对于信息的确定性与精确性的追捧。正如大数据思维提倡者认为,执迷于精确性是信息缺乏时代和模拟时代的产物[8]。因为大数据更强调数据的完整性和芜杂性,在很大程度上能够拓展图书馆信息咨询视野,在更广、更深的范围内发现读者咨询问题的答案,为读者解决实际问题。因此,大数据时代下图书馆信息咨询,转变思想观念,以大数据理念与思维统领信息咨询服务,从容应对大数据的冲击。

3.2 强化国家层面战略设计与不同领域的合作

在国家层面战略设计方面,美国较为典型。2011年,美国总统科技顾问委员会提出了政策建议;2012年3月29日白宫科技政策办公室发布了《大数据研究和发展计划》,并组建“大数据高级指导小组”。在我国,与大数据联系密切的国防部、工信部、文化部、新闻出版总署、国家图书馆等部门,应该从国家层面战略高度出发,制订战略计划,以适应大数据的要求。至于图书馆信息咨询项目,建议由国家图书馆牵头,依托不同类型图书馆的知识资源,尽快开展大数据战略的设计、规划与实施工作,具体设计可由各个领域专家学者通力合作。针对大数据时代下的高通量数据与多种数据形式并存,图书馆应保持清醒的思维,围绕读者的咨询问题,找出可用数据和数据组织方式的最佳组合,有针对性地区分数据的结构形式(结构化、半结构化和非结构化),并实时地抉择某些数据的去留问题。这种数据处理方式在很大程度上也需要IT专业人员、图情专家、资深咨询馆员和目标读者的协作与互动。

3.3 搭建信息安全机制与开发数据密集型计算方法

图书馆信息咨询根据情况设置安全机制,采用第三方信息安全审计,并明确规定信息咨询数据的使用权利与义务。首先需要整理与信息咨询相关的数据资产,包括自身持有的数据、共享共知的数据、读者个人信息的数据,然后公告利用这些数据可能创造的潜在价值,与此同时,从信息咨询内部建构一个数据驱动型组织,制定相应的图书馆信息咨询战略,最后再解决隐私和安全性方面的数据政策问题。同时注重个人隐私,建立有效的知识产权保护体系。

在大数据时代,图书馆必须重新考虑数据密集型存储、整理、使用的一整套科学安全方法,确保知识库不会负担过重,安全运行。信息咨询可以承接尽量多读者访问这些数据,利用新型的基础设施和先进的科学计算方法,在保证高效性和高速性前提下,有能力处理海量的数据;同时信息咨询还需要在计算分析方法上进行投资研究。

图书馆开展的大数据分析服务业务,即是图书馆自身建设所需的大数据分析,如对馆藏资源、读者借阅方式、行为爱好等现有数据对象进行分析与挖掘。对读者所需的大数据分析,依靠的大量数据可能并非图书馆所拥有,诸如信息情报参考、竞争情报分析等。随着可以分析使用的数据增多,分析出来的结果可能有所不同,此时信息咨询应坚持科学的研究方法,不断做出调整,获取更多更好的高质量数据,在最短的时间内解决读者的实际问题。信息咨询可以采取大数据的新技术,提高图书馆服务的智能化程度[9],例如针对海量信息数据采取智能抓取、关键词抽取等。总之随着图书馆服务内容、手段的智能化程度的提高,智能化技术、工具、平台的服务实践经验积累,所需的图片、视频、文本等信息都将能轻易获取,而对于个体信息,如社交信息、生活数据等大量的非结构、半结构化数据也都将能为图书馆信息咨询的智能化决策提供分析参考作用。

3.4 加强相关大数据的人才队伍建设

海量与多样性的数据,使得传统意义上的咨询馆员难以应对、不能满足读者的知识需求,因为目前的技术工具、简单的定性定量数据分析无法发挥应有的作用。人才是研发与掌握这些技术工具的关键,因此大数据时代的图书馆信息咨询需要重视人才的培养。多层次、多渠道地聘请IT专业人才、图书馆学、情报学等学科人才,或对现有咨询馆员、计算机技术人员开展教育培训(短期培训、学历教育、专题讲座、学术交流等),进而构建完备的人力资源库,制定有关政策制度留住人才,才能提升或维持图书馆信息咨询高效运行。由于读者信息行为也产生许多数据,所以也不能忽视读者研究问题,包括读者教育培训、读者个人隐私保护等。

3.5 构建多维图书馆信息咨询服务形态

图书馆信息咨询的数据处理、融合和分析挖掘能力将直接关系到图书馆核心竞争力的培育[10]。从数据融合的视野考察,大数据的价值在于延伸了信息咨询服务形态,即数据细化、弹性、深度的服务形态。(1)细化。信息咨询的数据服务自身主要是提供一些资源服务和数据能力服务,诸如数据的保存、读者信息行为数据的留存等。大数据时代,可以通过一些专业维护(如基于数据加工的容灾能力),将海量的数据汇集到信息咨询平台,最大化地满足细化的数据存储需求。(2)弹性。获取资源的检索方法需具有灵活性与弹性。在传统数据检索过程中,是通过数据库与拷文件系统命名实现信息咨询,但由于数据库表结构定义存在不一致性和标准缺失,或影像文件超过了文件系统的厚度,难免遇到一些障碍,降低检索与查询的命中率。大数据时代,信息咨询基于新的大数据架构,通过网络对象的索引技术,将图像文件通过标准的协议转化成缩略的数据封装起来,在很大程度上也就解决了文件共享、统计分析和查询等诸多问题,能够提供弹性服务。(3)深度。深度的知识服务即是知识咨询。传统的信息咨询服务在内容上注重知识库的数据数量,例如增加资金,加大电子资源的采购,盲目追求各种数据库的规模,而忽视了其他资源的收集与整理,造成知识利用处于低级阶段。大数据时代,在数据服务和信息加工的基础上,数据融合开始体现出价值,兼顾了多样化的数据汇集、融合、重构,通过信息数据分析技术,实现信息数据的增值服务,从而实现低层次服务转变为高层次、深度的知识咨询,高效地解决读者的实际问题。

4 结语

大数据时代,不仅带来了大数据存储与处理的技术,更多地强调以人为本以及人力资源的重要性,达到了人才与新技术的完美融合。图书馆信息咨询应本着多年服务实践经验,面对各种网络技术的冲击,与时俱进,熟悉、适应、习惯与掌握大数据多样性的数据模式与处理分析方法,借助大数据的东风,主动有序地突破困局,做到游刃有余,从容应对,这样才能在面对读者、满足读者多样化信息需求时,大幅度地提升图书馆信息咨询服务绩效。

参考文献:

[ 1 ] [美]家炜.数据挖掘:概念与技术[M].范明,译.北京:机械工业出版社,2012:13.

[ 2 ] 维基百科·大数据[EB/OL].[2013-06-10].http://zh.wikipedia.org/wiki/%E5%A4%A7%E6%95%B0%E6%8D%AE.

[ 3 ] 百度百科·大数据[EB/OL].[2013-06-10].http://baike.baidu.com/view/6954399.htm.

[ 4 ] 张宇杰,方燕虹,赵凡.世界著名大学图书馆信息服务最新进展研究[J].图书馆学研究,2012(19):93-97.

[ 5 ] 王捷.大数据时代下图书馆开展信息服务的对策[J].现代情报,2013(3):81-83.

[ 6 ] 姜山,王刚.大数据对图书馆的启示[J].图书馆工作与研究,2013(4):52-54,79.

[ 7 ] 张涛甫.大数据时代的出版困局及其突破[J].编辑学刊,2013(2):6-10.

[ 8 ] [英]维克托·迈尔-舍恩伯格,肯尼思·库克耶.大数据时代[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2013:12.

[ 9 ] 韩翠峰.大数据时代图书馆的服务创新与发展[J].图书馆,2013(1):121-122.

[10] 李奕.大数据应用方式:从数据服务、信息服务到知识服务[N].中国计算机报,2012-07-09(24).

袁红军 郑州师范学院图书馆副研究馆员,河南郑州,450044。

(收稿日期:2013-09-15 编校:刘勇定)

猜你喜欢
信息安全大数据
信息安全不止单纯的技术问题
基于模糊综合评价法的信息安全风险评估模型
基于模糊综合评价法的信息安全风险评估模型
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索
2014第十五届中国信息安全大会奖项
信息安全管理