刘 荻
南阳医学高等专科学校图书馆
“大数据”是信息科技领域继web.2.0 和云计算之后又一令人瞩目的热点。本文介绍了大数据的概念和基本特点,指出了图书馆利用大数据技术的必要性,并探讨了图书馆应对“大数据”时代的具体措施。
随着信息技术的快速发展,数据的组成结构、存在形式等越来越复杂,数据量快速增加,社会已步入了“大数据时代”。“大数据”成为信息科技领域继web.2.0 和云计算之后又一令人瞩目的热点。最早提出“大数据”概念的是全球知名咨询公司麦肯锡,它指出“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”大数据时代的到来.意味着我们进入到了一个以密集型数据的相关挖掘、分析、处理来推动社会创新发展的时代。各大IT 公司、研究机构、学术界等相关机构对于大数据开展了大量的研究。但是至今为止,大数据并没有一个统一的定义,但是,对大数据基本有这样的共识:那就是在数量巨大的数据中快速获取有用的信息。
大数据有以下几个特点。
1.数据规模大。大数据一般指的是10TB 规模以上数据量。当今世界,是一个巨大的网络世界。数不清的电脑、移动设备、社交平台、在线交易每时每刻都在产生大量数据。大数据的影响已扩展到各行各业。多个用户把多个数据集集中在一起,数据级别也就发生了变化,从TB 级别上升到PB 级别。
2.数据类型多。大数据背景下,数据已不仅仅是单一的文本形式,数据类型繁多,且多数为半结构化和非结构化数据,包括了网络日志、微博、视频、音频、图片、邮件等。
3.数据处理速度快。传统的数据挖掘技术已无法适应海量的数据环境,只有实时分析,快速处理,才能快速制定合适的应对策略。
4.数据价值密度低。大量的数据信息里,有价值的信息并不多,有很多是垃圾信息,这就需要对数据进行挖掘分析。
近年来,随着信息技术的发展,数字图书馆已成为各个高校图书馆的重点建设项目,到目前为止,已基本完成了数字化建设任务。图书馆现在拥有大量的数字化资源,专业数据库、电子书、各种教学音频、视频、考试题库等组成了图书馆的大数据。同时,学生使用数据库的检索记录、浏览历史等个人信息也构成了大数据的一部分。随着智能手机、高速网络的进一步使用,现有数据量还会呈现快速增长的趋势。身处大数据时代,图书馆要积极行动起来,进一步完善信息服务体系,利用好大数据分析技术,提高为读者服务的能力。图书馆可以将通过手机、电脑等各种设备收集到的读者个人信息、搜索历史进行收集整理,从中获取有价值的信息,分析出读者的阅读偏好与关注热点,为开展跟踪服务、个性化服务打下良好的基础,从而提高图书馆在信息时代的竞争力与影响力。
大数据时代,图书馆的竞争力不仅体现在馆藏资源、服务质量上,还体现在拥有的数据量以及对巨大数据的挖掘与分析能力上。图书馆要紧跟时代的发展步伐,改变传统的服务方式,提高基于云服务平台的大数据采集分析能力,保证图书馆大数据环境的科学性、可操作性、可控性,建立符合读者需求、快速有效的新型服务模式。只有这样,图书馆才能掌握发展的主动权,不至于在新的技术浪潮中落伍。
大数据时代背景下,培养一支懂技术、会管理的专业人才队伍是提升服务能力的重要保证。专业馆员不仅要掌握必备的信息检索、信息分析、信息组织等基本素质,还要掌握大数据环境下的数据挖掘与分析的知识与技能。面对这种挑战,馆员要改变思想观念,树立主动服务的理念,熟悉各种网络工具检索功能,努力掌握数据挖掘与分析技术,通过数据处理技术对信息资源进行整理分析,发现隐藏在数据背后的读者需求,从而制定出准确有效的个性化服务方案,为读者提供深层次的信息服务。图书馆也要要重视馆员的业务学习与培训,努力提高馆员的专业技术素质。
随着网络的普及,图书馆已不是获取资源的唯一途径,读者可以通过其他途径来获取所需资源。因此,在信息技术日益发达的今天,如何将将丰富的信息资源传递给读者,将读者吸引到图书馆来,避免读者流失,是图书馆工作重心所在。大数据技术的成熟,为图书馆开展个性化服务开辟了新的道路。图书馆可以通过收集汇总读者的个人信息、浏览历史等用户数据,对读者的阅读需求与阅读行为进行深度分析,根据分析结果,对图书馆的服务目的、内容、方法做出科学合理的安排,从而开展跟踪服务、推送式个服务,提高信息服务的质量与内涵。同时,还可以利用论坛、微博、微信、电子邮箱等多种信息传送渠道,为读者提供优质服务,提高读者的满意度。
开展大数据评估工作是保证图书馆大数据工作开展的有力保证。只用进行有效的评估,才能更好地发挥大数据在读者服务模式变革、服务模式技术保障等方面的积极作用。评估的重点要放在图书馆的大数据能力上,如:数据采集、数据过滤、快速处理、科学决策等方面,要及时发现在工作中出现的不足,并及时提出解决的方案。另外,还要评估图书馆在大数据环境中服务系统的安全性和稳定性,保证图书馆数据类型和应用过程符合网络安全规范。信息技术的发展,使图书馆服务系统的安全防御难度不断增加。要利用大数据平台等先进技术手段,加强图书馆服务系统的安全性,为用户提供高质量的服务。
为了开展个性化服务,图书馆大数据包括大量读者信息、搜素历史、地理位置等非结构性信息。这一方面促进了个性化服务的深度,但另一方面,也带来了读者个人隐私泄露的问题。图书馆应加大对读者隐私权的保护力度,制定详细的管理员阅读权限和数据保密、数据传输制度。管理员在采集读者数据时,要严格工作流程,科学合理的对读者数据进行分析。同时,也要做好网络安全工作,杜绝非法用户入侵,利用大数据采集和分析读者数据,导致读者隐私外泄。
由于大数据是一项前沿技术,实际操作需要有多学科知识作基础,因此,图书馆开展大数据工作有一定的技术难度。
微软的一位工程师Chistian Huitem a指出,人类要做到从大数据集中熟练提取真正的知识.还需再经历十年以上的时间。现在大数据存在的主要问题在于可靠性、易用性和成本等方面。图书馆采取措施培训专业人才,及时关注大数据发展动向,及时开展探索性实践,以提升大数据技术水平。