基于大数据的图书馆业务流程再造研究*

2014-10-10 05:40:12
新世纪图书馆 2014年6期
关键词:馆员图书图书馆

陈 艳

1 大数据在组织应用的成功案例

据报道,美国政府利用大数据成功地预测出2012年总统选举的结果。奥巴马团队通过分析数据,投入小规模电视广告,并确信会获得部分潜在选民的关注,最终赢得了大选。2007年沃尔玛通过对消费者的购物行为等非结构化数据进行分析,创造了“啤酒与尿布”的经典商业案例。国外的电子商务网站Amazon、eBay和CDNow等利用推荐系统主动向消费者推荐商品,让商品直接找上门来,以此获得与消费者保持密切联系。在医疗领域,谷歌设计人员通过不同地区的人输入关于流感的关键词,设计了“谷歌流感趋势”系统,2013年1月13日美国通过“谷歌流感趋势”发布了流感发生地区预警,波士顿在700例流感得到确认后,宣布进入公共健康紧急状态。在教育领域,为科研工作人员科研数据保管带来巨大影响力的数据监护(Data Curation)岗位的设立,预示着大数据为科研工作者保管和利用前人的科研成果数据带来了福音。在美国,已有图书馆使用大数据决策工具——大数据处理引擎,为用户及所属服务机构提供数据分析与决策。通过数据分析可以直接而真实地展示用户的性格、偏好、意愿等,帮助图书馆感知知识服务的市场、用户的需求、未来的发展形势等,以便图书馆对价值评估、服务能力和服务水平等做出更科学的决策[1]。

2 图书馆业务流程再造设计

2.1 流程化管理的概念

流程化管理是指以流程为主线的管理方法,是管理大师哈默提出的,要求重视顾客(服务的对象)和服务的整个过程,强调顾客(服务的对象)的重要地位是该管理思想精髓[2]。近年来,以用户为中心、读者至上的服务理念是众多图书馆管理者坚守的信条,但因为技术等原因,实践起来往往有一定的困难,吃力不讨好的事情也时常发生。随着大数据时代的来临,数据处理能力不断提高,服务对象的信息行为与需求之间的联系将不再是雾里看花,而是可以直接关联和预判的。

2.2 传统的图书馆工作流程

图书馆传统的机构设置分为:采访编目部、流通阅览部、信息技术部、参考咨询部等部门。服务的起点是图书采购,服务的终点是图书被借阅或信息被使用,如图1所示。

图1 传统的图书馆工作流程

近年来,尽管有学者意识到这一流程的弊端,并对此进行了改进和调整,有人提出将图书采购到馆后先流通一段时间,再进行精细加工等,但仍旧没有撼动以采购为起点的图书馆工作流程。

2.3 改进后的图书馆工作流程

随着网络化和智能化的发展,到馆读者的人数在下降,图书借阅量呈下滑趋势。有识之士为适应社会各层次人员的信息服务的需要,加强阅读推广,在图书馆岗位设置上,提出了进一步的细分,如提出“管理策划馆员、数据编目馆员、咨询馆员、系统管理及维护馆员、学科采访馆员、网络导航馆员、阅览推介馆员、流通导读馆员、心理沟通馆员”的岗位设置[3]。图书馆依托大数据,建立起以读者为起点,大数据分析决策为核心,读者服务为终点的全新的图书馆业务流程。改进后的图书馆工作流程如图2所示。

图2 改进后的图书馆工作流程

大数据时代的来临,读者的信息行为是可以分析和预测的。图书馆将在数据存储、数据挖掘、数据分析等方面面临着巨大的挑战与考验,复杂数据的处理也将成为大数据时代图书馆发展的主旋律,通过大量的非结构化数据、半结构化数据寻找隐藏在数据背后的世界,进而为图书馆的服务模式、未来发展趋势提供分析与预测,将成为大数据时代图书馆的一大主要服务内容[4]。图书馆在大数据环境下,工作流程将围绕大数据的信息获取、信息存储、信息分析、分析决策系统展开,紧密围绕读者的需求,指导和开展图书馆的一系列服务工作。

3 图书馆业务流程再造的实施

图书馆通过业务流程再造,改变传统的基于“文献采购为起点,读者借阅为终点”的图书馆工作流程,建立起以读者为起点的,大数据分析决策为核心的,读者服务为终点的图书馆工作流程,将大数据分析决策的结果应用到图书馆全盘工作中去。

3.1 图书馆大数据的信息获取

以大数据为核心的图书馆业务流程再造离不开“数据”。据IDC监测显示,全球数据量大约每两年翻一番,2020年全球预计将拥有35ZB的数据量。图书馆大数据往大的说是全球范围内的所有可获取的数据,往小的说,主要是与图书馆领域相关的数据。这一部分数据主要有:通过图书馆联盟获得与同行交流的信息、图书馆内的读者及图书等信息及图书相关行业的信息。

网络化和国际化促进了图书馆联盟(Library Consortium),联盟的目的是资源共享、协同合作。当前,我国已经建立起众多全国性的专业或综合性的图书馆联盟及地区性的图书馆联盟。以CALIS为例,2008年底,文献数据总量达180TB,2010年达到480TB,全国文化共享工程的数字资源总量达108TB[5]。围绕这些文献产生的联合编目、馆际互借、文献传递、资源评价等数据非常巨大。图书馆联盟在文献信息的共享和服务的协同合作方面起到了非常重要的作用,并将成为大数据分析的重要来源。

图书相关行业的信息存储主要指电子商务网站、图书出版机构、论坛及其他有关的社交网络媒体的数据存储。这些数据主要是用户在社区网络中的足迹、点击历史、浏览历史、信息反馈等信息。这类数据的特点是非结构化的数据、数据量庞大及参与人员复杂多变等。

3.2 图书馆大数据的信息存储

数字时代的来临,图书馆信息存储能力面临前所未有的挑战。以往的图书馆信息存储主要指数字资源的长期保存,实现读者对数字资源的访问和下载。基于大数据的信息处理系统,不仅要求图书馆自身馆藏数据的存储,还要求对读者信息、图书借阅、资源下载和评价、社交网络数据等信息存储。图书馆自身的馆藏资源逐年增长,以一个小型高校馆为例,在校生一万人以内,图书馆产生的借阅数据、电子数据访问、下载、评价等数据每天有上万条。目前,这些数据的获取来源除了通过RFID射频数据、传感器数据获取外,社交网络交互数据及移动互联网数据也是数据的重要来源。社交网络交互数据与移动互联网数据往往是非结构化数据为主,也是近年来增长速度最快的数据源。这一部分数据呈现出种类繁多、流量巨大、容量剧增、隐藏价值大等大数据的核心特点。

云存储技术是解决大数据存储的重要手段。云存储是在云计算概念上延伸和发展出来的一个新的概念,是指通过集群应用、网格技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。除此外,单靠一个图书馆的能力无法完成如此巨大的数据存储,应当适时发挥图书馆联盟机构的作用,实现联盟机构之间数据共享。

3.3 图书馆大数据的信息分析

信息分析就是根据特定问题的需要,对大量相关信息进行深层次的思维加工和分析研究的过程,最终形成有助于问题解决的新信息。通过以用户的特定需求为依托,以定性和定量研究方法为手段,对整理后的信息进行深层次加工,形成新的、增值的信息产品,最终为科学决策服务的智能活动。信息分析的好坏直接决定信息能否产生促进生产力发展、有效解决问题等系列应用价值。

目前,新技术、新思想不断对现有系统产生影响,并促成现有系统不断发展,精准营销生态系统进入新的阶段[6]。图书馆相关的大数据分析技术以hadoop为代表,个性化推荐系统的出现为读者提供了一个解决Web信息过载问题的强大工具,承担了在识别读者阅读倾向和偏好的基础上,模拟图书馆工作人员向读者推介图书信息和建议,帮助读者获取信息服务,从而使读者避免信息“超载”所带来的麻烦,顺利完成文献信息资源获取的过程[7]。目前,图书馆大数据分析技术还处于发展和探究阶段。大数据带来的问题,不仅是数据的存储和获取的困难,更多的是大数据的分析过程及指导管理者决策的价值体现问题。

3.4 图书馆大数据决策支持系统

图书馆建立在大量数据基础之上的,通过云存储和联盟机构信息共享等实现数据的存储,使用大数据分析技术,最终为决策者提供所需的数据、信息和背景资料,帮助明确决策目标和进行问题的识别,建立或修改决策模型,提供各种备选方案,并且对各种方案进行评价和优选,通过人机交互功能进行分析、比较和判断,为决策提供必要的支持。

3.4.1 管理策划

图书馆管理者的决策依托大数据,通过决策支持系统制定图书馆宏观的建设目标和工作方向,为实现战略决策而对图书馆内部管理进行有效的组织和协调。

决策支持系统强调的是对管理决策的支持,而不是决策的自动化,它所支持的决策可以是任何管理层次上的,如战略级、战术级或执行级的决策。图书馆管理者的决策依托大数据,通过决策支持系统指导图书馆采购、宣传、服务、管理、咨询等各个环节。

3.4.2 参考咨询

大数据时代来临,图书馆参考咨询工作既是机遇也是挑战。图书馆学科馆员依赖其在科学数据的信息搜集和管理的优势,将有助于提高学科馆员在科研团队中的重要地位。在国外,图书馆设置了数据监护(Data Curation)等相关的数据分析岗位[8]。麻省理工学院的一个研究项目表明,图书馆员在数据分析这一项工作中主要承担数据保存标准的制定、进行数据搜集、分析数据、数据管理规划、经验分享、数据服务等[9]。图书馆学研究者也嵌入到许多的研究项目当中,包括为促进标准化运动而开展的“语义网社区与关联开放数据运动”(Sematic Web community and Linked Open Datainitiative)等[10];部分机构如美国维吉尼亚州立大学开始组建科学数据咨询小组,而图书馆员和数据管理者则为学者们充当了咨询顾问的角色[9]。

在大数据环境下,通过机构数据库的建立和共享等,图书馆可以监测科研数据,担任起科研人员的情报站,建立科研数据库,预测科研发展的方向,提早做好文献准备工作,整理好专题报告,方便科研人员查找和阅览相关文献和数据。

3.4.3 资源建设

通过对大量读者信息的分析和处理,及时动态地监督采购图书的特点与读者契合度,有助于图书馆进一步完备图书馆采购需求,规范图书馆采购制度。目前的图书馆纸质图书采购主要分书单采购和现场采购。书单采购只能看到图书书名和出版社等信息,现场采购除了翻看图书外,主要是查重处理。采访人员在图书采购的时候,往往偏主观而不够科学严谨。而在大数据环境下,图书信息的发布和点评是非常及时快捷的。采访人员可以通过大数据决策支持系统,按照条件匹配,系统自动输出推荐图书;采访人员通过该系统,可以查阅某书或某作者受欢迎程度,预测资源的受众读者,正确规划资金分配制度。

3.4.4 采购评估

数字资源采购已经占居图书馆资源采购的半壁江山,与纸质资源分庭抗礼。数字资源具有不占用图书馆建筑面积、提供24小时服务、允许多次下载且可以同时阅读等特点。然而目前数字资源缺乏完善的效益评估机制,随着数据库商逐年涨价,经费有限的图书馆将骑虎难下。依托大数据分析,这一问题将迎刃而解。通过数据分析,图书馆可以掌握读者信息行为动态,了解资源的受欢迎程度及读者需求,并根据经费和使用等情况,选择购买全部、或分库购买、或放弃购买、或联合采购等方式。

3.4.5 阅读推广

近年来,图书馆阅读人数呈现下降趋势。图书馆在宣传推介方面,苦于没有相应的数据作支撑。在已开展的图书宣传和推介的图书馆里,我们发现阅读推广仅限于书目推介、图书展览、读书沙龙等内容,且这些工作的开展取得的效益无法评估。图书馆通过管理系统、社交网络等掌握了一大批读者的信息,包括读者的年龄、性别、学科、年级等重要信息,通过数据分析,我们可以发现在特殊的时期读者的特定需求。以高校为例,大一的新生比较迷茫,部分同学往往喜欢看励志类的图书;大二的学生专业课程压力较大,对所学专业有一定的认识,在专业知识获取方面更加渴望,专业图书比较受欢迎;大三的同学面临出国或考研,对托福考试、四六级考试等英语书籍方面有较多的关注度;大四的同学面临毕业,对面试、择业和管理类的图书较关注等等。在大数据环境下,图书馆可以通过本馆或其他馆的同类型的读者对该类图书的借阅量、读者评价、社交网络工具的信息进行判断,发现热门图书、畅销作家、热点研究,进行集中的有针对性的推介。

3.4.6 读者教育

图书馆作为信息服务和信息教育的重要部门,承担着读者教育的重要职能。图书馆应根据不同社会群体在年龄、知识层次、学科种类、从事职业等的不同,有针对性地提供培养读者信息处理能力有关的培训服务。目前这一类工作的开展,在目标群体的选择上过于笼统,在培训内容上个性化不足,工作人员的培训工作过于被动。图书馆在大数据决策支持系统的指导下,可以开展多样化、灵活化的读者教育工作。无论线上或线下、电子或纸质、授课或活动等多渠道地满足不同读者、不同时段的培训需求。

3.4.7 舆论监督

以读者需求为指导的图书馆工作流程,更强调读者满意度。通过及时有效的处理客户投诉,主动联系有需要的读者,最终建立起图书馆与读者之间的良好关系渠道。通过大数据分析,发现读者投诉密集的服务项目,及时改进服务策略,提高读者满意度。由于了解读者信息及时,通过有针对性的向目标群体发布信息,图书馆可以提高与读者的粘合度,增强在读者心中的美誉度。

4 结语

大数据时代的来临,图书馆数据异常丰富和复杂,如何应对这一变化,需要我们对数据分析引起足够的重视。在大数据环境下,图书馆需改变传统的工作流程,建立基于大数据的崭新的工作流程、服务的模式和组织管理流程。

[1]郭自宽,张兴旺,麦范金.大数据生态系统在图书馆中的应用[J].图书资料工作,2013(2):23-28.

[2]百度百科.流程化管理[EB/OL].[2013-12-25].http://baike.baidu.com/link?url=HuWY8o3EpyNvM5-XQ29 ZQY-gfVxeE790lF2cprD9jOBvQQ2MFumNgWjk3xLq cSddMc-vC1_S3UClnIH0x9PvW2tuUginuJRa52SZ71k bwKsDupBtBK7K9OL8_hy355Ga.

[3]佚名.浅谈完善图书馆馆员制度 促进和谐图书馆的发展[EB/OL].[2013-12-25].http://www.xswkj.com/lear ninginfo-22-580.html.

[4]韩翠峰.大数据带给图书馆的影响与挑战[J].图书与情报,2012(5):37-40.

[5]杨海燕.大数据时代的图书馆服务浅析[J].图书与情报,2012(4):120-122.

[6]傅强.应用大数据能力:当当网在个性化推荐&精准营销方面的探索 [EB/OL].[2013-12-19].http://wot.51cto.com/2012/ppt/day2_01/fuqiang.pdf.

[7]阿里巴巴创业.基于协同过滤算法 打造精准的营销平台[EB/OL].[2013-12-19].http://info.1688.com/detail/1090699951.html.

[8]张文彦,武瑞原,于洁.大数据时代的图书馆初探[J].图书与情报,2012(6):15-21.

[9]Heidorn P.The Emerging Role of Libraries in Curation and E-science[J].Journal of Library Administra-tion,2011(7-8):662-672.

[10]Cassidy R S,Ding Y,Thewall M.Library and Information Science in the Big Data Era:Funding,Projects,and Future[a panel proposal][EB/OL].[2013-12-25].http://www.ischool.drexel.edu/faculty/mkhoo/docs/12_asist_panel_description.pdf.

猜你喜欢
馆员图书图书馆
图书推荐
南风(2020年22期)2020-09-15 07:47:08
欢迎来到图书借阅角
青海省人民政府关于转聘谢承华、斗尕馆员为荣誉馆员的决定
青海政报(2018年1期)2018-07-09 05:50:56
图书馆
小太阳画报(2018年1期)2018-05-14 17:19:25
班里有个图书角
青海省人民政府关于转聘谢佐等3位馆员为荣誉馆员的决定 青政〔2017〕32号
青海政报(2017年7期)2017-07-24 14:14:41
飞跃图书馆
去图书馆
浅谈图书馆青年馆员职业生涯规划
河南科技(2014年19期)2014-02-27 14:15:53
论图书馆馆员领导及其角色
图书馆界(2013年6期)2013-03-11 18:50:34