石艳丽 刘欣
摘要: 基于大数据认识和六大特征上,探讨大数据环境下信息分析工作模式,分析大数据时代信息服务的机遇和挑战,从机遇和挑战两个方面讨论大数据对图书馆信息服务的影响,应用大数据思维开展信息服务的三个方向,诠释大数据思维下信息服务的新功能。最后提出要用大数据思维创新信息服务模式,并从培养大数据思维、实施数据开放合作战略、统一标准等方面思考大数据环境下的图书馆的信息服务。提出如何应用大数据思维构建图书馆信息服务,以提高图书馆创新服务与管理能力。
Abstract: Based on big data understanding and six characteristics of big data, the paper discussed the mode of information analysis in large data environment, and analyzed the opportunities and challenges of information services in the era of big data. Then it discussed the impact of big data on library information service from two aspects of opportunity and challenge, three directions of information service based on large data thinking, and explained new functions of information services under large data thinking. At the end of the paper, use big data thinking innovating information service mode was pus forward, information service under the environment of big data from aspects of cultivating big data thinking was thought about from aspects of implementing data open, cooperation strategy and unifying standards. How to use big data thinking to construct library information service was pus forward in order to improve library innovation service and management ability.
关键词: 大数据思维;信息服务;图书馆服务与管理
Key words: big data thinking;information service;library service and management
中图分类号:G251 文献标识码:A 文章编号:1006-4311(2018)17-0114-03
0 引言
近年来,互联网进入了飞速发展阶段,伴随而来的大数据时代也走进了人类世界。2008年9月《自然》杂志发布了大数据,首次提出了大数据概念,专辑主要介绍了大数据问题的产生及对各个领域的影响[1]。美国奥巴马政府于2012年 3月29日提出“大数据研发计划”,在此项目中投资了超两亿美元,希望能够提高从庞大的数据中提取知识的能力,从而为政府解决更多的问题,并鼓励研究大数据核心技术,以便促进和加快人类对大数据的探索脚步,同时这也意味着人类社会发生了巨大变化,过去是信息和知识时代,未来将向智能时代迈进。2014 年3月全国“两会”期间,我国多位相关专家和学者建议把大数据加入到国家发展战略中。关于大数据的应用研究开始被越来越多的企业重视,尤其是一些大型企业,比如腾讯、百度等,纷纷出资建立自身的大数据存储与处理中心[2]。由此我们发现,社会各行各业都意识到了大数据研究及应用的重要性,图书馆界亦是如此,通过转变自身观念,在图書馆管理及运营中加入大数据技术,大大提高了图书馆运行效率和质量。基于此,本文结合大数据特征,在分析大数据对图书馆信息服务的影响的基础上,提出用大数据思维指导信息服务发展的新趋势,同时针对在此过程中存在的问题采取有效的应对措施。
1 大数据认识
1.1 认识大数据
大数据至今为止并未有一个统一的说法,它并不是一个新概念,它是伴随着近年来庞大的信息增长而来的。当前社会无时无刻都充斥着各类信息,在互联网上,每天淘宝网站的交易数高达千万笔、百度每天的搜索请求量大约高达几十亿次、新浪微博的每天用户发博量会超过一亿条等等,这些都是大数据,但大数据究竟是什么?并没有一个统一的说法,一般是指涉及的资料量巨大,无法在合理时间内用当前的主流软件工具撷取、管理、处理并整理成为供决策参考的资讯。
大数据的来源主要有三类:一是各类数字设备产生的数据,包括智能手机、物联网设备、各类传感器等;二是网站用户创造的信息,包括人人、推特等社交网络;三是服务器生成的数据,比如各类日志文件等,大数据是超过通常数据库系统处理能力的数据。
一般情况下,大数据具有四个“V”的特征:一是Volume(海量)。体量巨大的数据,TB级别跃升到PB 级别;二是Variety(多样性)。类型形式更加多样,包括电子商务(淘宝、支付信息)、即时通讯(QQ、微信、飞信)、社会网络(微博、SNS)、网络日志、传感器网络、链接、位置、视频、音频、图像、文本等,不仅包括结构化数据,也包括非结构化数据,其中超80%的数据是非结构化数据;三是Velocity(高速)。一秒定律,处理速度极快;四是Value(价值)。价值密度低,商业价值高。比如视频,在无数个监控视频中有用的数据可能只有一两秒。
所谓大数据技术是指从各类类型的数据中快速获取有价值信息的能力。大数据技术的发展、推进对于信息技术领域而言跟云计算、物联网同样重要,大数据作为一种先进的数据分析技术,未来将在多个领域发挥巨大影响力,包括政治、经济、文化等[4]。
1.2 大数据的应用
关注大数据应用的目的是分析如何通过利用数据来更有效地解决现实问题,预测是应用的核心,对庞大数据的获取、分析和应用能力是关键。相关资料表明,我国的大数据应用还存在巨大的进步空间,当前仅处于起步阶段[5]。当前社会应用大数据技术最广泛的领域有市场营销、公共服务及商业智能等。最先开始应用大数据技术的用户是一些互联网巨头企业,比如腾讯、百度、淘宝等,其利用方式主要是基于自身开源软件自主开发大数据应用。之后大数据技术开始被广泛应用到银行业和电信行业中。现阶段互联网广告营销是大数据应用最成熟的领域,我们经常发现自己在搜索或浏览网页时出现的广告基本就是自己需要的或者自己可能喜欢的,这是因为广告商利用大数据技术对我们个人上网记录进行了分析,在掌握了我们个人需求的基础上进行的广告精准投放。
大数据在我国还处于起步阶段,这意味着每个人都在起跑线上,人人都有机会,就看谁做好了准备。早在2012年Harvard library便开始尝试将大数据服务引入图书馆。对于公共文化服务体系而言,图书馆是其不可缺少的组成部分,为适应高速发展的社会,通过将大数据技术应用在图书馆中,不仅拓展了图书馆服务范畴,更对提升图书馆信息服务能力存在巨大推动意义,同时创新了图书馆资源建设,十分有助于图书馆的长效发展[6]。
2 大数据对图书馆管理与服务带来的机遇
人们在阅读研究、实验操作等期间都会产生信息及数据,随着大数据时代的来临,这些信息和数据会被数字化记录下来,通过分析和处理这些数据可重构信息服务模式。本文在讨论大数据对图书馆管理与服务带来的机遇时重点讨论了Web2.0和云计算技术。
2.1 信息分析服务
在Web2.0环境下,网络用户协同创作与资源共享是最受欢迎的运营模式之一。社交媒体每天都在生产大量的数据,这些数据必然具有重要价值,如何找到并利用其价值是一门重要课题,大数据分析愈加重要,正在成为一种新的服务内容和方式。关于该趋势美国有位学者达文波特对此进行过研究,达文波特提出应将分析嵌入产品生产与服务的过程[7]。近年来,信息分析的发展越来越快,且呈现愈加细致的趋势,基于此,笔者提出应以信息分析人物或项目为导向,通过建立大数据分析处理平台,结合情报机构知识库和专题情报分析,建立一种大数据环境下的信息分析工作模式,如图1所示。但需要注意的是,该工作模式并不是一成不变的,它需要依据任务或者项目的实际情况,随机应变,灵活应对各项操作,构建适宜自身实际情况的信息分析模式。
2.2 多源信息服务
云计算作为一项网络服务,其两大特征是高度虚拟化和高度可扩展性,它兼具数据存储和数据分析的功能,但同时将该两项功能变的更加便捷[8]。图书馆需要对获取的庞大信息资源进行有效整合,为提高整合效率和质量,应建立类型多样的数据库和知识系统,构建功能全面的云计算平台,从而实现资源共享,为用户提供更好的知识服务。
2.3 决策辅助
随着智能分析技术和数字技术的不断发展和完善,为掌握个人及群体需求提供了便利及工具。情报机构应充分利用先进信息技术,将用户的真正需求挖掘出来,有的放矢的采取相应运营决策,以便为用户提供更优良的服务。
3 大数据对图书馆管理与服务应用的挑战
3.1 图书馆如何获取数据资源
当前社会无时无刻都在生产信息,且信息来源十分复杂,在指数级增长的数据大背景下,大数据技术应运而生,其目标便是从庞大的数据中挖掘信息、判断趋势、提高效益。大数据时代,图书馆的管理和服务离不开大数据的支持,只有做好大量数据的收集、整理、分析等工作,才能真正掌握数据,同时掌握自身与其他行业的竞争优势。对于图书馆而言获取数据资源的方式众多,图书馆收集的数据既包括结构化数据,比如网络资源、数字资源、文献资源等,同时也包括一些非结构化数据,比如用户信息行为数据等,只有在充分分析各類数据信息的基础上不断挖掘数据信息背后的价值,才能促进图书馆的长远可持续发展。然而,需要注意的是图书馆目前对非结构化数据的收集存在一定限制,无法完整的收集相关数据信息。为获取更多更优质的数据资源,图书馆应考虑以下几个方面:一是全面收集各类、各途径数据信息,包括非结构化数据和结构化数据等;二是实现整个图书馆行业的数据资源共享;三是与图书馆相关行业的各类关联数据资源,包括出版社相关数据资源、图书馆所在地区网络运营商的相关数据资源。不可否认当前社会大数据技术的存在为图书馆发展带来了良好机遇,但要想把握住机会,图书馆必须重视数据资源的收集及整理分析,只有这样才能促进图书馆的长效发展。
3.2 图书馆如何提高现有的技术能力
大数据是一种先进的数据分析技术,将大数据技术应用在图书馆中益处颇多,但同时大数据对图书馆的数据计算能力和存贮能力有较高要求,因此,如此提高自身的现有技术能力是图书馆大数据应用的当务之急。现阶段多数图书馆较为擅长对结构化数据的组织和管理,对非结构化数据的组织和管理能力有限,但非结构化数据和半结构化数据占到数据总量的80%以上,基于此,图书馆必须采取相应措施弥补自身短处,加大资金投入,加强图书馆专业人才培养,提高自身现有技术能力。
3.3 如何为数据集创建元数据
大数据的益处显而易见,但如何真正充分有效的利用大数据是一项重大课题,为优化、保护及利用大数据,应采取大数据治理计划,关注譬如如何创建可靠的元数据,避免数据重复标引等问题,因为不同的名称存储在不同的存储库里势必会造成浪费。图书馆的优势是整理和标识信息或数据,但同时其劣势是现有技术无法满足大数据需求,因此应思考如何借助新的技术手段来进行数据加工、整理和标识。
4 用大数据思维创新图书馆信息服务模式
维克托·迈尔·舍恩伯格在自己的《大数据时代》中将大数据理念的革命精髓归结为三点:一是更关注相关性,而不是因果性;二是更关注数据的纷繁复杂,而不是数据的精准;三是全部数据,而不是抽样数据。随着社会的发展,庞大的数据及信息每天接触而至,随之而来的还有数据鸿沟、信息孤岛等问题,如何利用大数据技术提高图书馆信息服务的效率和质量是其重要课题。有资料显示,当前人类生产的数据仅有5%是结构化,被用于传统数据库分析和挖掘,其余的大部分信息都被认为是没有价值的,事实上任何信息都必然存在一定价值,区别在于是否被发现价值,大数据技术利用各信息的相关关系分析,可使所有信息都发挥了其价值,从而实现了其预测功能,因此应加强基于关系网络的创新服务模式研究。
4.1 要进行知识超网络环境下的深度开发
本文所指的知识网络是指信息网络和社会网络的有机结合,它是一种侧重多层次、多主体关联结构的超网络。该超网络包括三个层次,分别是知识资源网络、人际关系网络、技术网络,其优势是知识数量丰富,但劣势是知识整理偏低。基于此,应进行知识超网络环境下的深入开发,将知识共享和知识优化结合起来,为在丰富的基础上为用户提供更加优质的知识共享服务。
4.2 知识服务要注重对“弱信息”的挖掘
“弱信息”是指随机的、隐性的、非主流的信息。当前时代网络化、数字化明显,科研人员在分析重大复杂的科学问题时通常都会选择“战略性阅读”来帮助自己解决问题。但需要注意的是“战略性阅读”并不是为了解决某个具体知识问题,其作用主要体现在通过学术检索可让科研人员从海量的数据信息中获得“元知识”。而“元知识”的增长可更新科研人员的知识结构体系,提出科学假设。因此挖掘“弱信息”至关重要。
4.3 个性化信息服务应关注用户兴趣
大数据背景下,“感知”是信息服务的关键。通过对海量实时数据进行分析,可感知到信息服务热点问题,从而预测用户的信息需求,然后利用信息需求的多层次细分,将自身的信息服务能力提高,使自身的信息服务更具有针对性。因此,为提高用户的服务体验,应采取合理方式引导用户信息需求,通过建立互动体系,提高个性化信息服务,增加用户粘性。
总而言之,大数据背景下的信息服务应关注关系网络,注重用户体验,尽量满足用户需求;通过信息技术将信息价值充分发挥出来。如图2所示,其信息服务功能如下:核心层是决策支持功能,通过“数据驱动决策”实现信息服务需求满足;支持层则保障核心层和表现层功能的实现,其功能主要包括系统安全保障、跟踪反馈、深入分析、深度挖掘、信息检索等;表现层是核心层与支持层功能的外在和具体表现,其功能主要包括趋势预测、自动推送、信息可视化、智慧服务等。
总而言之,随着社会的进步和技术的发展,图书馆发展面临的机遇和挑战共存,大数据技术在为图书馆发展带来变革式有益影响的同时,也对其现有技术和服务提出了更高的要求。基于此,图书馆应与时俱进抓住時代和技术发展的契机,不惧挑战和困难,积极完善自身服务方式和大数据创新,从而提升图书馆的综合竞争力。
参考文献:
[1]陈超.图书馆如何迎接大数据时代?[J].图书馆杂志,2014(1) : 4-7.
[2]容春琳.公共图书馆应用大数据的策略研究[J].图书馆建设,2013(7):91-95.
[3]姜山,王刚.大数据对图书馆的启示[J].图书馆工作与研究,2013(4):52-54,79.
[4]何毅.资源发现知识导航--大数据时代图书馆的数字资源建设与服务[J].中国索引,2013(4):23-27.
[5]刘炜,夏翠娟,张春景.大数据与关联数据:正在到来的数据技术革命[J].现代图书情报技术,2013(2):8-9.
[6]张信学.网络环境下情报信息基础建设[D].中国国防科技技术信息学会,2015(6):126-128.
[7]胡大海.网络信息时代情报研究工作滞后的思考[J].科技视界,2012(9):52-53.
[8]焦健,李琦.一种分布式网络情报框架的模型[J].计算机应用研究,2012(8):54-55.