李新亮 徐家毅 张建华(上海商学院图书馆 上海 201400)
大数据背景下高校图书馆的生态重构
李新亮 徐家毅 张建华(上海商学院图书馆 上海 201400)
随着互联网技术的发展,“大数据”对作为信息技术主要应用场所的图书馆提出了生态体系重构的要求,本文从高校图书馆的发展理念、资源、平台、服务、馆舍、架构等方面提出了重构高校图书馆生态体系的设想。
大数据 高校图书馆 生态重构
大数据已经深入到我们生活的各个方面。2011年,全球著名的咨询公司——麦肯锡公司在《McKinsey-Big data The next frontier for innovation, competition, and productivity》报告中,最早提出了“大数据时代的到来”[1]。自此,“大数据”逐渐成为新时代的主题词,大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型[2]。
高校图书馆,如何在大数据背景下,通过数据的收集、管理和应用,更加洞察用户,建立共享协作机制,提供更精确、主动的服务,从而改变高校图书馆原有的生态系统,就成为一个值得研究的问题。
高校图书馆是信息技术的主要应用场所。在关注高校图书馆结构化信息资源需求的同时,大数据技术在高校图书馆中的应用则意味着可以经济高效地分析非结构化数据。将大数据引入并应用到图书馆服务中,需要以下几个流程:
1.1数据采集
高校图书馆的存储资源丰富、数据种类繁多,不仅有纸质资源、数据库资源、光盘资源等结构化信息,还有论文、课件、读者信息、服务信息等半结构化和非结构化数据。即使是一所高校图书馆内部,这些数据的编码方式、数据格式、应用特征都无法统一。为了更好地利用这些数据,必须对这些数据进行抽取和集成,并对抽取和集成后的数据进行清洗。另外,随着用户获取信息方式的不断变化,图书馆的信息服务功能也在相应地不断提高,高校图书馆为了满足用户的需求,必须对大数据进行有效的采集。
1.2数据管理
大数据应用的关键不在于拥有数据量的大小,而是对数据价值的再发现。数据价值再发现的前提则是高效的数据管理。由于高校图书馆数据库中包含大量信息,且信息间价值密度低,因此,对大数据的管理要根据不同的应用目的进行不同分类。
现在高校图书馆数据一般可分为结构化数据和非结构化数据。结构化数据可以利用传统的关系型数据库进行管理,非结构化数据则可以依据数据价值建立分级管理。把数据的来源、格式、流向、信息等方面的差异性作为非结构化数据分类管理的依据,并依赖搜索引擎技术、智能分类技术、分词技术、大众分类技术以及影像分析、检索、识别技术等,对非结构化数据进行自动提取检索信息,建立非结构化数据的索引表,实现对非结构化数据的管理[3]。
1.3数据应用
大数据背景下,高校图书馆的海量数据并没有形成真正的知识源以供研究人员利用,还需要数据化的过程。大数据的应用可以分为三个层面:收集信息;把信息转化为知识;借助于分析工具和其他子系统获得预测和判断的智慧。通过数据清洗、抽取、集成、组织、备份等方式对大数据进行管理,通过数据挖掘、统计分析、机器学习等分析技术对高校图书馆海量数据进行深层次的挖掘和分析,甄选出隐藏在这些数据里的有价值的信息,利用数据挖掘技术对大规模的海量数据进行分析并提炼出用户需要的、真正有价值的知识,要能够把知识转化为决策智慧,找到大数据和高校图书馆信息服务的契合点。例如:一个高校图书馆的数据来源有很多,既有来自于高校图书馆本身馆藏文献的基础信息、指导图书文献进行组织和分类等有序化工作的方法和技术的信息、根据图书文献有序化的指导信息产生的衍生信息等内部数据,还有通过学校各种信息系统收集的用户个人的外部数据。但这些数据一方面相对孤立,使用率不高,使高校图书馆的资源利用远远低于购买的价值。另一方面,师生用户对高校图书馆的信息化要求不断提高,这种张力就是现在高校图书馆面临的严峻课题。
在这种情况下就需要把这些海量数据通过统计分析提炼出“规律”,把这些繁杂数据转化为知识。利用这些提炼出的知识,学校和图书馆管理层就可以获得预测和研判的能力,为其提供决策的依据,把知识转化为智慧。例如:可以通过门禁系统、图书借阅系统、教务系统等多个系统对接交互而提供的多维度数据进行分析,找出学生成绩与来图书馆的次数的关系,图书购置、电子资源购置与图书馆资源的利用频率之间的关系,为管理层在“图书馆在学校中的定位”、“高校图书馆资源的购置范围”等问题的决策提供依据;再如:将馆藏信息、新购置图书信息、电子资源应用信息与用户行为信息结合分析后,可以对某个专业、科研方向,甚至某一个特定用户进行有效的信息推送、私人定制等进行决策。总之,在大数据背景下,基于大量结构和非结构数据的收集、管理和应用,不仅能推进高校图书馆数字化建设,而且可以为高校图书馆带来极大的辅助决策价值。
2.1洞察用户
大数据的使用,使高校图书馆精确掌握用户的信息需求和实现个性化服务成为可能。通过对用户年龄、性别、工作性质、知识结构、教育背景等基本信息的搜集和整理,并与用户的行为信息如浏览信息的方式、发表的学术成果、使用的社交工具等相结合,高校图书馆能够为用户建立用户专门信息库,利用大数据挖掘技术对用户信息经过发现、采集、去重等处理后,发现用户真实和潜在的信息需求,为用户提供页面定制、信息推送服务、学术信息导航服务和参考咨询服务等个性化的信息服务。
2.2协作共享
大数据背景下,高校图书馆为网络用户提供信息服务,它的内部业务和对外服务都需要网络。换句话说,高校图书馆的运转依附于数字通信网络,图书馆的数字化信息是通过网络来流通的。另外,每一个高校图书馆都有自己的特色,而单个高校图书馆无法采集到全部的文献资源。这样,高校图书馆就可以通过跨地域、甚至跨国界的虚拟联合体提供资源共建的协作化与资源共享的快速化,这种协作共享模式将会突破原先信息资源共享的壁垒,打破“数字鸿沟”,优化了传统高校图书馆那种用户泛在式、嵌入式、无缝服务的模式,使高校图书馆用户无时间、地域、空间的限制对资源进行访问,开创了信息无障碍共享的新时代,实现了信息资源共享无处不在的目的,成为全社会图书馆服务现代化进程的推动力。
2.3精准式主动服务
对用户行为信息如浏览的网站、检索的痕迹、下载的数字化信息资源、分享的信息资源、评价信息等的挖掘,是发现用户信息需求的基础。在此基础上,再结合用户按照学科、职业等细分的专门数据库,为用户建立与其需求相匹配的专门资源库,帮助用户从海量的信息中迅速找到其所需的信息,从而可以探索个性化、精确化和智能化地进行推送服务,使得高校图书馆传统的被动式信息服务变为主动式信息服务,也就是以用户为中心、以用户需求和行为习惯为主导、根据用户的信息需求提供个性化信息服务的全新服务模式,从而提高高校图书馆服务水平和用户的满意度。此举能够帮助图书馆赢得更多和更准确的用户群,大大提高高校图书馆的核心竞争力。
3.1用户理念
首先,在传统高校图书馆中,“为读者服务”、“读者第一”是图书馆不断强调的宗旨,但“读者”更多地体现了“以自我为中心”的理念。通过大数据,高校图书馆能够洞察用户及其需求,树立“用户为中心”的理念,从根本上转变了“图书馆本位”的旧观念。
其次,在传统高校图书馆中,图书馆和读者之间是单向的关系,读者仅作为信息需求者。在大数据背景下,用户则变成了信息的重要贡献者,甚至是信息的管理者。
第三,传统高校图书馆的服务对象相对固定,这种固定读者群的形成与读者的年龄、性别、兴趣爱好、教育背景、知识结构、阅读习惯等有关。其一,通过大数据应用,改变了用户获取信息的需求和方式,用户获取图书馆的信息资源受时空限制变小,信息服务对象的范围更广;其二,图书馆对用户的理解是立体、全方位的,可以依据不同标准来进行用户群体细分,便于提供更为准确和精细化的服务,也会吸引更多的用户;其三,由于用户不仅是信息的需求者,还是信息的提供者和管理者,在高校图书馆统一的平台上,不同时空的用户可以根据不同的维度自行组织成一个虚拟团体,使用户的范围得以扩大。
3.2资源
传统高校图书馆的资源主要是纸质版书本、报刊等文献资料。大数据背景下,高校图书馆资源种类繁多、形式多样:不仅包含馆藏纸质文献、数字资源等的信息资源,还包括构建于云上的存储资源、网络资源等;用户上网产生的信息,包括浏览图书馆网站,检索图书馆的数据库等信息资源也会成为高校图书馆资源的重要组成部分,网络上的资源都可以成为高校图书馆的信息对象。
“开放”是高校图书馆迎接大数据时代的最佳选择,增加多触点及外部通路是大数据时代高校图书馆的生存之道。资源的分享将会成为高校图书馆资源再生产的主要方式,分享第三方数据、同时向第三方开放数据,才可避免自己变成“信息孤岛”。
随着计算机技术的发展,高校图书馆的数字化信息资源会越来越多,资源的收集和储存在大数据背景下不再是一件很困难的事情。高校图书馆资源的提供者也不仅仅限于专业的信息供应商,甚至用户本身也可变成资源的提供者。孤立的数据缺少价值,因此,把非结构化的信息进行挖掘才是最重要的工作。
3.3平台
大数据时代,平台为王。在大数据背景下,数据量快速增长、个性化信息推送服务、智能搜索引擎、智能化交互共享等都是基于大数据技术的智能平台,所以,高校图书馆必须通过云计算环境把分散的图书馆软硬件设备、信息资源、图书馆管理、业务处理与用户联系在一起,为用户提供一个统一界面的高校图书馆服务平台。
3.4人才
传统高校图书馆馆员主要搜集、整理和保存信息资源以满足读者的信息需求,是资料保管员。但大数据时代,除了平台等硬件要跟上之外,数据挖掘与深度分析的专业人员更不可缺,这要求高校图书馆员除了要像传统图书馆员那样,熟练掌握图书馆学、情报学、信息管理学等专业知识,还要具有数据开发和分析的能力。其次,随着高校图书馆用户理念的树立,图书馆也从“馆藏为主”过渡到“参与为主”,需要图书馆馆员具备相关学科专业背景和知识基础,这也对大数据分析具有帮助作用。最后,高校图书馆馆员负责知识推广和用户信息的维护等工作,需要其具有一定的法律背景,能够处理知识产权和用户隐私等法律问题。
总之,高校图书馆的人才建设观念要发生变革,要建立具有大数据思维的“云馆员”队伍。
3.5服务
大数据背景下,高校图书馆的服务对象、服务模式和服务技术都是对传统图书馆的提高和完善。随着计算机、智能手机、平板电脑的普及,人们更倾向于通过网络终端、移动设备来阅读信息,这就使高校图书馆的用户打破了时空限制,也改变了用户的年龄结构、学科结构、学历结构等。在这种情况下,高校图书馆信息服务的对象有所改变。
高校图书馆服务模式也在不断变化,从传统的“以图书馆馆员为中心”、“以资源产品为中心”的服务模式向“以用户为中心”的服务模式转变;从传统的根据馆藏为读者提供信息服务到根据用户个性化信息需求而进行的信息服务。大数据数量大、结构复杂、类型繁多、生命周期短,所以,建立在大数据技术上的高校图书馆信息服务模式要从数据、信息、知识、智慧四个层次展开,包括:基于数据整合的一站式资源服务、基于数据分析的学科知识服务、基于数据应用的信息可视化服务和基于数据挖掘的智慧服务[4]。
大数据背景下高校图书馆服务主是建立在对大数据分析、处理基础上挖掘出用户的实际信息需求和潜在的信息需求,然后有针对性的为用户提供信息服务。这需要服务技术上有所革新,第一需要客观的技术,也就是需要数据化的技术和数据分析、挖掘技术;第二需要馆员的服务技术,也就是馆员要掌握这些新技术和服务专业技能,满足用户的各种信息需求,并能够应用到服务实践中。
3.6馆舍
高校图书馆的馆舍是图书馆主要的硬件构成,传统高校图书馆馆舍设计考虑的重要功用是文献资料的储存。大数据时代,由于资料的易得性和交互的虚拟性,高校图书馆在某种程度从固定的馆舍、馆藏转变成云图书馆,因此高校图书馆馆舍的功用也应更多地考虑互动(包括网络互动)和分享空间的设计。
3.7机构
传统高校图书馆的组织架构基本是基于纸质文献的采购、编目和流通而设置的,大数据时代下则应围绕着数据的采集、分析和应用而设置,这就要求负责大数据的“数据管理与分析”部门位于图书馆的核心地位,以“数据驱动”来实现对现有组织架构进行重组。传统架构将被“数据采集部门、平台维护部门、数据分析部门、数据应用部门”四大类取代。在实际的操作中要防止各部门间组织结构的割裂情形,以免数据呈现离散与孤立状态,要尽力打通数据,让数据自由流动,发挥多重效能,这是组织架构很重要的方面。
数字信息的爆炸式增长催生出“大数据”概念。在大数据背景下,也催生了高校图书馆数据的搜集、管理与应用的全新技术体系。在“数据驱动”下,高校图书馆生态也将渐渐得以重构,这将对高校图书馆的知识服务的拓展和深化带来重大影响。
[1] James Manyika, Michael Chui, Brad Brown, et al. Big data: The next frontier for innovation,competition, and productivity[R]. McKinsey Global Institute,2011.
[2] 维克托·迈尔-舍恩伯格.大数据时代[M].周涛,译.杭州:浙江人民出版社,2012.
[3] 王红.图书馆大数据管理与分析[J].现代情报,2014(8).
[4] 苏蓉.基于大数据的数字图书馆信息服务研究[D].武汉:华中师范大学,2014.
李新亮 馆员,上海商学院图书馆。