大数据时代,收集信息不是大数据的主要目的,大数据要发挥应有的作用,就应该从巨量数据信息中分析和整理出有价值的信息。数字图书馆保留了大量数据,基于这些数据,人们可以获得一些潜在价值,收集和分析这些数据资源是数字图书馆未来面临的重要问题。
新时代,人们积极构建拥有论文、参考书目、期刊等信息资源的数字图书馆,其目的是实现资源共享,即资源的共同使用,使用户方便快捷地访问、获取不同类型的信息资源。当前,数字图书馆却面临发展困境:和实体图书馆藏书资源和用户具有同质性、存在半结构化或非结构化数据缺口、缺乏创新激励、大数据应用无法满足新的研究需求等。笔者认为,要想实现持续发展,数字图书馆必须改善资源结构,在大数据的基础上丰富服务内容,提高图书馆员素质。
一、大数据时代的数字图书馆
随着互联网的发展和数据信息容量资源的变化,大数据时代应运而生。事实上,收集信息不是大数据的主要目的,大数据要发挥应有的作用,就应该从巨量数据信息中分析和处理出有价值的信息。
2009年,基于网络通信技术和数字处理技术的应用,为提高互联网信息的可访问性,欧洲一些数字图书馆与科研机构合作来研究图书馆和信息科学的关系。为应对大数据时代的挑战,美国2012年正式启动强制政府与大学、公司合作的大数据研究与发展计划。近年来,国内外数字图书馆蓬勃发展,取得了丰硕成果。许多图书馆,如哈佛大学图书馆,开始使用大数据定期发布关于读者阅读偏好和习惯的大数据成果报告,并密切开展大数据存储、研究和分析,以更好地满足不同需求。但是,国内外数字图书馆仍然存在不少缺点,如复制传统的图书馆功能、缺乏突出特征、信息共享能力不足等,数字图书馆只有不断突破自身的局限,才能实现快速发展。
二、大数据背景下数字图书馆面临的困境
(一)数字图书馆和实体图书馆藏书资源和用户的同质性
音频和视频信息的转换、数据资源的数字化和存储等是数字图书馆关注的问题,但其往往缺乏数据收集意识和对海量数据的深度处理和管理。为防止数据缺乏制约长远发展,数字图书馆要打造以数据资源为主导的发展模式。从发展趋势来看,数字图书馆必须深入开展数字资源的深入挖掘、收集并分析初始数据,解决图书馆藏书资源的同质性问题。在用户同质性领域,当前数字图书馆馆藏资源的主要内容是图书馆既有资源的数字化内容,再加上一些数字图书馆的系统也不能完全走出物理图书馆的服务范围,无法完成不同信息领域用户的共享和使用,导致存在用户同质化现象。
(二)存在半结构化或非结构化数据缺口
数字图书馆的数据可以分为存储在数据库中且可以通过二维表结构表达的结构化数据和网上的常见电子邮件、办公文档和各种形式的信息为代表的半结构化或非结构化数据。目前,随着物联网技术等新渠道的发展,大量的数据日志、电子邮件和网络新闻等半结构化或非结构化数据信息资源分类涌入数字图书馆,数字图书馆予以收集并处理图书借阅情况。
部分数字图书馆专注于文献数据库的建设,使得半结构化或非结构化数据明显不足。统计结果显示,到2012年,互联网数据的75%左右是非结构化数据,然而数字图书馆结构化或非结构化数据明显不足,缺乏大数据信息资源使数字图书馆分析技术发展滞后,再加上这些存储在数据库中且可以通过二维表结构表达的结构化数据没有经过足够的大数据分析,使得数字图书馆难以有效地渗透到企业或融入用户的详细服务中。为满足新时代数字图书馆发展的需要,更准确地满足用户需求,数字图书馆要优化资源结构,进一步发展非结构化数据,并分析这类大数据,找出传统渠道无法确定的重要关系,增强对用户的理解,采用智能解决方案更深入锁定用户,实现快速发展。
(三)数字图书馆缺乏创新激励
当前,国家高度重视以市场为导向的产学研结合的技术创新体系。使任何人都能在任何时间和地点获得必要的知识是数字图书馆存在的主要意义。但是,目前基于门户网站服务是大部分存在于象牙塔中的数字图书馆的情况,移动通信、电视网络、开放的移动图书馆和其他网络平台等服务功能,很少有数字图书馆能将其服务范围扩展至此。我国的数字图书馆仍然缺乏创新思想、活力和创新指导,未能建立与业务高度融合的真正服务机制,未能及时跟踪用户需求和习惯的变化。数字图书馆无法名副其实地存在。
(四)数字图书馆在大数据应用方面无法满足新的研究需求
随着协作创新和第四范式等新概念的出现,研究需求侧重于用数字和模拟技术面向问题的本体和数据驱动的探索,对创新有更高要求和对数据科学更为依赖的科研模式的转变自然对数字图书馆大数据利用的效率提出了更高的要求,在大数据的背景下,数字图书馆需要关注并研究大量数据,以不断满足新的研究需求。但是,目前数字图书馆在大数据应用和大数据利用效率方面存在缺陷,难以满足对对创新有更高要求的科研需求。
三、大数据时代数字图书馆发展出路
(一)改善资源结构
现阶段,一些数字图书馆专注于文献数据库建设,使得半结构化或非结构化数据明显不足。重视结构化数据的作用、相对缺乏非结构化数据的管理是信息社會发展下数字图书馆建设的弊病。数字图书馆建设当前无法实现各个方面信息资源的数字化,为了实现信息资源的系统化和合理化,保证数字图书馆信息资源的质量,满足用户对文化资源各个方面的需求,数字图书馆应该以用户需求为核心调整信息资源,注意信息资源的数字化整合。在发展过程中,数字图书馆可以以数字资源的形式记录某一主题的相关历史,以数字方式转换和保存历史上重要事件的各种数据,并开放数字资源,予以永久保护。
(二)在大数据的基础上丰富数字图书馆的服务内容
一是提供个性化服务。随着时代的发展,数字图书馆可以根据用户需求提供个性化服务。“个人计算机”与“个人计算”有很大差异,在大数据的支持下,为提高数字图书馆的服务质量,“个人计算”可以根据用户的喜好和特点进行深入分析、预测,推送相应的个性化服务。
二是按需服务。用户的需求是数字图书馆信息服务的导向。在大数据的背景下,数字图书馆应该通过用户需求的反馈而不是图书馆使用的资源,管理数据库资源和网络资源,使用云计算和传感器网络等新技术,创建覆盖快速、检索方便、有利于知识挖掘的图书馆信息环境,传输一般知识和有意义信息。
三是智能服务。用科学算法预测是大数据的核心。数字图书馆可以根据研究课题跟进相关文献资源,基于大数据的预测和分析,掌握该领域的学术趋势和科研趋势,方便用户了解新的热点研究问题。这种真正意义上的智能服务能帮助传统知识聚集的图书馆转变为知识的处理和预测场所,为有针对性的科学研究奠定基础。
(三)注重图书馆员素质的提高
人们需要建立管理数字资源的图书馆管理机构,解决可能存在的知识产权问题。大数据时代,数字图书馆要注重知识版权保护,防患于未然,因此需要具有知识产权保护意识、注重数字资源管理的图书馆管理者。为更好地保护每个公民的基本权利,避免可能存在的知识产权问题,加强对数字资源的保护,图书馆管理者要遵循相关法律法规,规范规章制度,与版权公司合作,以增强图书馆员的知识产权保护意识。
(四)关注资金投入
数字图书馆要想提供数字产品和服务,离不开大量的资金投入,资金短缺在数字图书馆建设中时有发生。大数据时代,健全数字图书馆资本投入体系对数字图书馆的建设相当重要。为促进数字图书馆的可持续发展,政府相关部门可以将其当作公益事业,提供一定的资金支持,以更好地保证数字图书馆的资金收支平衡。社会机构也可为数字图书馆的发展提供一定的资金支持。除了使用公益金外,市场化投资方式也可以为数字图书馆建设与服务模式改善提供充足资金。人们要充分利用各种社会力量,运用各种资金,推进数字图书馆建设,确保数字图书馆实现健康发展。
(成都师范学院图书馆)
作者简介:刘聪彪(1982-),男,河南漯河人,硕士,助理馆员,研究方向:信息资源管理(图书馆学)。