“大数据”时代图书馆生态系统的解构与重构

2015-02-13 00:23胡文静沙勇忠兰州大学图书馆兰州730000
图书馆理论与实践 2015年9期
关键词:生态系统大数据图书馆

●胡文静,沙勇忠,郭 玮(兰州大学图书馆,兰州730000)



“大数据”时代图书馆生态系统的解构与重构

●胡文静,沙勇忠,郭玮(兰州大学图书馆,兰州730000)

[关键词]大数据;图书馆;生态系统

[摘要]在阐释“大数据”和图书馆生态系统内涵的基础上,从建筑、资源、技术、管理、用户、服务、耗散7个方面重新审视了大数据时代图书馆生态系统,为图书馆构建适应大数据背景、可持续发展的良好生态系统提出了导向性策略。

2007年,计算机图灵奖得主吉姆·格雷(Jim Grey)在美国国家研究理事会计算机科学和远程通讯委员会(NRC-CSTB)的演讲报告中提出了科学研究“第四范式”即以数据密集型计算为基础的科学研究范式。[1]2008年9月,《科学》(Science)杂志发表文章“Big Data:Science in the Petabyte Era”,提出“大数据”(Big Data)一词,随之得到了广泛的传播。[2]2011年5月,易安信(EMC)举办了主题为“云计算相遇大数据”的会议,“大数据”概念正式诞生;6月,国际数据公司(IDC)编制的年度数字宇宙研究报告“Extracting Value from Chaos”(从混沌中提取价值)发布,奠定了大数据概念的理论基础。同年,麦肯锡研究院在“Big data:The next frontier for innovation,competition,andproductivity”(大数据:创新、竞争和生产率的下一个前沿)的报告中提出“大数据”时代已经到来。[3]

1 大数据及图书馆生态系统的内涵

大数据是一个抽象的概念,各个领域的专家学者由于关注点的不同,对大数据有着不同的定义。美国英领出版公司(O'Reilly Media)的市场研究总监马格拉斯(Magoulas)对大数据的定义作出了得到广泛认可的概括性描述:当数据的规模和性能要求成为数据管理分析系统的重要设计和决定因素时,这样的数据就被称为“大数据”。[3]在此定义中,除数据规模外,数据查询与分析的复杂程度也是界定大数据要考虑的因素。在麦肯锡的定义中,“大数据”是指大小超出了典型数据库软件的采集、存储、管理与分析能力的数据集。该定义指出,符合大数据标准的数据集大小是变化的,会随着时间推移、技术进步而增长,不同部门符合大数据标准的数据集大小会存在差别,范围从TB到PB不等。[4]IDC从计算机技术角度将大数据定义为对新一代的技术和架构体系的描述,通过高速采集、发现或分析,提取各种各样的大量数据的经济价值。Velocity(生成快速)、Variety(模态繁多)、Volume(体量浩大)和Value(价值巨大但密度很低)即4个V是大数据的主要特点,这一观点得到了广泛的认同。[5]

生态系统(Ecosystem)概念是由英国植物群落学家Tansley于1935年首次提出,用于强调各种不同事物间的联系。之后,生态的概念被广泛应用于经济、文化、教育等领域。在图书馆领域,Donley (1957)提出图书馆是一个有机生态系统,其发展受到文化、经济、地理因素及数字化技术等因素的影响。[6]我国对图书馆生态系统的研究起步于90年代初,1993年侯晓军提出了图书馆系统是一个生态系统,该系统是图书馆生态学的研究对象。图书馆系统与其各组成部分以及图书馆系统各组成部分之间的关系,图书馆外部环境与图书馆系统之间的相互关系是图书馆生态学的主要研究内容。[7]

运用专业知识对数据进行加工、处理、保管、传递,对人类知识和信息进行组织、整理,促进其交流和利用是数字环境下图书馆职业实践活动宗旨,[8]从行业定位角度与数据具有天然和紧密的联系。通过选择和构建良好的生态系统,使图书馆系统的各个方面与大数据环境下的需求相适应,是图书馆提高核心竞争力,获取持续竞争优势的重要途径,也是图书馆克服服务内容、服务模式上的局限性,获得创新突破的关键。

2 大数据背景下图书馆生态系统的再审视

胡唐明从系统平衡的角度把图书馆生态系统分为基石、元素、驱动力、交互四个逻辑范式,并细分为建筑、资源、技术、管理、用户与服务、耗散六个维度。[9]本文将用户生态与服务生态分开讨论,从七个维度对大数据背景下的图书馆生态系统进行再审视。

2.1建筑生态

(1)全面的感知空间。与物理性空间不同,数字空间的本质是流动的。信息可以以位的形式任意穿梭于物理空间中,然后再以文字、影像、声音等各种可感知的媒体重新构成一个整体。[10]麻省理工学院的媒体实验室(Media Lab)提出了“互动空间”的概念,互动空间在模拟真实空间的基础上,将人的行为考虑进去,人的行为将会在虚拟空间中引起某种变化,这种变化又会反映到现实空间中。[10]大数据时代,随着无线传感器技术在图书馆建筑中的广泛使用,构建了一个全面的感知空间。图书馆可通过对用户需求信息的收集、分析重组位信息,实现个性化的信息获取和传递,完成高质量的交流。

(2)泛在的信息空间。从1999年美国北卡罗莱纳大学图书馆负责人DonladBeagle提出信息空间(IC)概念以来,信息空间理念在国内外很多图书馆设计中得到了实践。[11]此概念从各种角度强调了物理空间的信息功能,在大数据时代这个概念将得到进一步的延伸。实体环境与数字环境界限模糊,物理空间与信息空间共生,是大数据时代图书馆建筑生态的一大特征。无线网络的覆盖与社交网络的普及在网络层面推动了这一趋势发展;多媒体技术的发展、大数据分析工具的使用、专业化信息服务团队的建设在技术层面支撑了这种融合;跨越物理空间界限的智能信息推送、移动图书馆、实时互动交流等新应用则是泛在的信息空间在应用层的表现。

2.2资源生态

(1)资源类型的多样化。大数据时代,用户信息资源与图书、文献、多媒体资源一样,成为图书馆资源的重要组成部分。数据分析人员可利用数据挖掘技术对用户数据进行分析处理以获得潜在的用户行为特征,以此为依据为用户提供个性化的信息服务。图书馆可获得的用户信息资源包括用户基本信息、流通历史数据、信息咨询记录、Web日志数据等。[12]

(2)资源的内部整合与外部共享。发现系统为数据量激增的图书馆内部资源整合带来了解决方案。通过对资源的整合与分析,可实现精准搜索、展示知识关联、立体引文分析、揭示学术趋势等新功能。组织边界的模糊化使图书馆可获得的资源跨越了物理界限,数据的开放与共享为大数据时代的图书馆带来了更广泛的资源来源。开放获取(OA)与行业联盟是图书馆行业实现资源共享的两种模式。有数据表明,截止2014年4月,在世界范围内的开放获取机构知识库数量已达到2620个。[13]行业联盟模式也在世界范围内得到了普及,最具代表性的为美国的OCLC、中国的NSTL。

2.3技术生态

2012年,美国国家医学图书馆在奥巴马政府的支持下成为国家“大数据研究和发展计划”重要组成部分,要求其提高从大量数据中访问、组织、收集发现信息的技术水平及提供大数据归档、保存、传播和其他数据服务的能力。[14]根据大数据的处理流程,在数据获取阶段,RFID射频数据、传感器数据、移动互联网数据及社交网络交互数据将会成为大数据时代图书馆的主要信息来源。在数据存储与组织阶段,关系型数据库与云存储方式的有机结合将成为最佳方案。大数据组织可以充分利用Hadoop的数据组织机制提供系统的容错性、扩展性和灵活性,解决大数据处理的横向扩展问题;利用关系数据库实现数据的查询和存储机制,解决性能问题。[15]在分析阶段,实时数据分析与离线数据分析并存,一方面满足用户的实时体验,一方面通过大数据分析平台实现深度挖掘与精细服务,最终将大数据转换成可操作、可视化的知识以支持各类用户的决策。

2.4管理生态

大数据时代,组织内部呈现出工作更加协同、绩效更加透明、弹性工作网络的广泛使用等特征;[16]同时,组织外部环境变得复杂,组织与外部环境的联系也越来越紧密,组织将更多注意力转移到寻求外部效率的提升和挖掘,组织与组织之间的无边界化与虚拟化趋势也日益明显。人在组织中的所有关系可通过深度挖掘数据展示出来,用可视化的方式来清晰呈现,用可量化的方式来进行评价。组织内外环境的变化与技术的进步使大数据环境下的管理是有多种选择方案也有备份措施的可控行为,其风险程度也将大大降低。[16]在管理体制上实现从碎片化到网络化的转变;在管理方法上主张用数据说话;在管理模式上执行动态实时管理;在管理方式上遵循基于数据的决策。

2.5用户生态

用户行为可计算,是大数据时代图书馆用户生态的主要特征。2009年2月《Science》提出社会计算科学(Computational social Science)概念,指出人们已经能够收集和分析大规模的人类行为数据并从中发现个人和群体行为的模式。[17]大数据时代,用户行为计算的特点主要有以下4个方面。[18](1)数据的丰富性和自主性。用户行为数据包含了用户的行为习惯、需求、偏好、情感因素等,这些数据无需引导用户参与调查,可直接获得。(2)减少研究的“未知”视角。传统用户行为分析有一定的局限性,在调查设计时会忽略自己的“未知”,大数据背景下则容易挖掘用户行为的隐含模式。(3)数据实时化。大数据背景下可实时采集、分析用户的行为数据,第一时间确认理解用户的反馈。(4)数据低投入。大数据背景下用户行为分析较省时省力,是一项低投入高回报的项目。图书馆可从用户的黏性(访问频率、访问间隔时间)、活跃度(平均停留时长、平均访问网页数)、产出(借阅量/下载量、借阅/下载类型)等角度入手,对用户行为进行分析:①用户分类,利用分类技术将用户归属为一个特定的类;②用户特征分析,找出各类用户的行为特点;③关联分析,发现用户行为之间关联规则;④预测分析,通过建模预测用户行为。

2.6服务生态

大数据时代的图书馆服务是基于知识发现的智慧服务。智慧服务是依托智慧的专业馆员和优质、多元的信息资源,在互联、智能技术驱动下,提供主动灵活、无处不在、形式多样的能有效支持用户知识应用和知识创新的服务。其核心是在为用户提供经过提炼加工而成的知识产品的同时,还致力于培育用户驾驭知识、运用知识和创新知识的能力,帮助用户从“有知识的人”成长为“有智慧的人”。[19]从服务理念的角度,数据理念将得到进一步深入。一是信息技术要前倾,充分利用现有信息技术打造数据环境,利用数据探索用户需求,用信息技术引领服务,使服务更有针对性;二是数据分析要前移,从数据中来,到服务中去,把服务前移到用户来到前,制定好服务的流程与服务措施。从服务模式的角度,求解服务模式将得到广泛的应用,用户不再需要参与到具体的数据处理活动中,只需等待数据服务者提供解决方案。求解模式解决的问题通常是常规数据应用不能解决、需要以大数据做支撑通过特定地分析处理来解决的问题。[20]

2.7耗散生态

耗散生态指图书馆的外部生态,与内部生态的联系主要体现在交互上。在横向联合方面,网络化使大数据环境下行业内部各合作伙伴之间的数据传递和信息共享更加频繁,虚拟图书馆、行业联盟等合作模式使图书生态系统的开放程度更高。在纵向整合方面,产业链上下游行业之间的知识溢出、技术创新呈现出相互学习、相互促进的局面。数据生产者、服务提供者、用户将以数据为纽带更加紧密的联系起来,实现分工协作、互利共生,从而实现供应链向价值链,进而向多方共赢生态圈的转变。图书馆生态系统正是通过这样一种与外界的交流机制,完成了大数据环境下系统平衡—不平衡—平衡的过程,得到了进化。

3 大数据时代图书馆生态系统的构建策略

3.1打造适应大数据环境的基础设施

大数据环境下的图书馆生态系统必须构建良好的数据处理和知识共享环境,畅通生态系统的数据交流渠道。一方面,要提高处理数据的效率,建设高效的网络覆盖、传感器网络数据存储和处理系统、云计算平台等硬件系统;另一方面,要运用科学的软件系统获取、处理、挖掘数据,进行决策支持;此外,还要结合实际应用开辟新媒体渠道、协同工作平台等数据交流与共享的渠道。

3.2构建有效的用户关系管理系统

以用户为导向是当今图书馆的服务发展方向,而图书馆生态系统中最不确定的因素是用户需求。构建有效的用户关系管理系统,对用户的信息进行全面的分析和处理,预测用户实时的、动态的、个性化的需求是大数据时代图书馆提升服务质量的关键。适应大数据要求的用户关系管理系统应该具有如下特征:[21](1)能够对结构化、半结构化以及非结构化数据进行处理,提供全面、丰富的个性化用户信息并拥有海量的存储能力;(2)能提前预判用户实时变化的需求,通过持续跟踪、监控用户的状态和行为,有效弱化需求变动的影响;(3)综合应用数据库、数据仓库、数据挖掘、图形用户界面等先进技术,向服务人员提供操作简单、功能强大的数据处理功能。

3.3以“数据”为核心资源的服务创新

(1)服务产品创新。引入新的或显著改善的服务,包括在服务技术特性、构成要素等方面的显著改进。在大数据时代,服务创新更多体现在利用数据挖掘技术推进新服务的提供,用户分类服务与用户定制服务成主流的服务模式。

(2)服务方式创新。一是服务界面要简洁,服务流程要简化。后台数据做加法,前台呈现做减法,在传统服务上以用户自助服务替代繁琐的人工服务。二是提高服务效率,实现从微观精确到宏观呈现的转变。数据量非常少,就必须极精确地、高质量地来处理以及呈现它们。拥有了大数据,可适当忽略微观层面上的精确度,不再需要花大量时间追求通过精确的数据来寻找结果,只要掌握大体的发展方向即可,这样会让用户在宏观层面拥有更好的洞察力。

(3)服务营销创新。大数据时代的图书馆营销创新更多体现在用户细分、精准信息推送、差别定价等方面。一方面,借助社交媒体保障与顾客的长期沟通,建立稳定用户群体,获取用户个性化需求;另一方面根据庞杂的用户数据,按照横纵多维方式对用户群体准确分析,并且准确传达用户所需信息,确保实现精准营销。

3.4培育适应大数据环境的图书馆文化

大数据时代的图书馆变革是一个牵一发而动全身的复杂过程,同时需要生态系统内所有成员参与数据的管理和控制,这就需要培育重视数据处理与应用、适应大数据环境的图书馆文化。

(1)重塑观念。稳定持久的惯性文化理念是大数据变革的绊脚石,建立一种数据导向型的文化是大数据时代图书馆变革取得良好效果的先决条件。这些观念包括:协同的工作理念、客观的评价标准、创新的意识形态、开放共享共赢的发展战略。

(2)制度保障。重点构建数据安全保障制度,尤其是个人隐私的保护制度,同时也包括数据获取、存储制度,数据传播、共享制度等。在数据公开或共享时,严格遵循用户信息有效保护原则、数据对等交换原则、信息价值可衡量原则,保证所有涉及到用户信息的使用必须建立在用户主动、自愿和授权的基础上并保证用户的隐私信息绝对安全;数据分享后要完成回流、增值、再沉淀的过程,使得分享和交换的双方共同受益;在数据合作前一定要制定客观的价值评估体系,确保合作公平和公正。

(3)人才培养。麦肯锡公司预测美国到2018年需要深度数据分析人才44~49万人,缺口14~19万人。[22]在中国,理解与应用大数据的创新人才更是稀缺资源。重视馆员培训,培养深入了解图书馆业务运作细节、具备数据勘探等统计应用知识、熟悉数据分析工具操作的大数据人才队伍,是图书馆在大数据时代可持续发展的关键。

4 结语

大数据是一种资源、一种技术、一种工具、一种环境、更是一种趋势。[23]一方面基于大数据的创新或变革浪潮势不可挡,为图书馆的发展带来了新的机遇;另一方面价值与风险并存是大数据的两面性,对图书馆的各方面带来新的挑战。洞悉大数据时代图书馆生态系统的变化,对图书馆应势而变,不断创新具有启发性和导向性作用,而如何将生态系统的构建策略转变为行之有效的具体措施是当前和今后需要继续思考和解决的问题。

[参考文献]

[1]周晓英.数据密集型科学研究范式的兴起与情报学的应对[J].情报资料工作,2012(2):5.

[2]Nature.Big data:Science in the Petabyte Era[EB/OL]. [2012-11-04].http://www.nature.com/nature/journal/v455/n7209/edsumm/e080904-01.html.

[3]Big data:The nextfrontier for innovation,competition, and productivity[EB/OL].[2011-05-27].http://www.mckinsey.com/insights/businesstechnology/bigdatathenextfrontierforinnovation.

[4]Manyika J,etal.Bigdata:The nextfrontier for innovation,competition,and productivity[R].McKinsey Globalinstitute,2011:1-137.

[5]Gantz J,Reinsel D.Extracting value from chaos[R]. IDCiView,2011:1-12.

[6]Donley J,Albert M.Library Ecology and Electronics [J].American Documentation,1957,8(4):300-305.

[7]党洪莉.我国图书馆生态学研究综述[J].情报探索,2009(8):39.

[8]于良芝.图书馆学导论[M].北京:科学出版社,2003:17.

[9]胡唐明,等.基于系统平衡的图书馆生态指标体系构建[J].情报杂志,2009,28(8):89-90.

[10]李晓锋.信息技术影响下的建筑空间嬗变与再诠释[D].武汉:华中科技大学,2005:53-54.

[11]于丽凤.国外大学图书馆信息共享空间理论研究与实践[J].图书与情报,2008(3):31.

[12]王伟.基于数据挖掘的图书馆用户行为分析与偏好研究[J].情报科学,2012,30(3):393.

[13]知识库和社会化媒体融合现状与策略[EB/OL]. [2014-07-21].http://media.people.com.cn/n/2014/0710/c14677-25266028.html.

[14]张兴旺.图书馆大数据体系构建的学术环境和战略思考[J].情报资料工作,2013(2):14.

[15]郭自宽,等.大数据生态系统在图书馆中的应用[J].情报资料工作,2013(2):25-27.

[16]徐敏亚,等.大数据对组织变革的影响[J].企业管理,2013(9):106-107.

[17]Lazer D,etal.Computational social science[J].Science,2009,323(5915):721-723.

[18]大数据与市场研究[EB/OL].[2013-06-12]. http://www.emarketing.net.cn/magazine/adetail.jsp?aid= 2380.

[19]许春漫,陈廉芳.高校图书馆智慧服务模式下智慧馆员队伍的建设[J].情报资料工作,2014 (1):87-88.

[20]文峰.对几种典型数据服务模式的对比分析[J].科技信息,2013(25):105.

[21]资武成.“大数据”时代企业生态系统的演化与建构[J].社会科学,2013(12):56.

[22]2014中国大数据发展分析报告[EB/OL].[2014-11-13].http://www.ciotimes.com/bi/bzjgd/96563_3. html.

[23]任广见.基于“大数据”的商业模式创新及启示[J].现代商贸工业,2013(20):172.

[责任编辑]邵晋蓉

[收稿日期]2014-11-27

[作者简介]胡文静(1983-),女,硕士,兰州大学图书馆馆员,研究方向:图书馆组织文化,信息计量;沙勇忠(1968-),男,博士,兰州大学管理学院教授、博士生导师,兰州大学图书馆馆长,研究方向:信息资源管理、网络信息计量;郭玮(1983-),女,硕士,馆员,研究方向:信息素养教育,图书馆服务创新。

[文章编号]1005-8214(2015)09-0001-04

[文献标志码]A

[中图分类号]G250.15

猜你喜欢
生态系统大数据图书馆
图书馆
生态系统理论视角下医院志愿者角色和功能的研究
生态系统视角下:农村留守幼儿情绪问题的形成
基于价值共创共享的信息服务生态系统协同机制研究
基于大数据背景下的智慧城市建设研究
网络空间的生态化治理研究
去图书馆