谢 松,朱海东,李小华
(赣南师范大学 图书馆,江西 赣州 341000)
2012年7月在第六届上海国际图书馆论坛上,大数据概念第一次被引入了图书情报界,为图书情报界带来了巨大的发展机遇,同时也给信息服务带来了前所未有的挑战。作为学校科研发展的重要支撑部门——高校图书馆,应该努力思考如何利用大数据技术优势,并结合高校图书馆自身的特点,重新进行自我审视和定位,加强自身资源优势,拓展资源建设与服务理念,重视用户数据信息利用行为,从而开创新的服务空间,谋划新的发展之路。
大数据的引入需要图书馆从新的角度去分析和重构信息数据,这就给图书馆信息资源的建设带来了新的挑战,下面结合赣州高校图书馆的现状来分析面对大数据冲击下高校图书馆信息资源建设的几点思考和建议。
大数据的基本特征体现在4个“V”:Volume数据规模大;Variety数据种类多;Velocity生成速度快;Value价值密度低。从数据的角度来理解,大数据是海量、多源、异构、动态的大型数据集,其数据价值密度相对较低,需要进行分析处理和数据挖掘才能得到对用户有用的信息,实现数据价值,这就要求信息资源的共享及高效利用。赣州因为经济政治方面的原因,以及各高校行政管理本身具有非常大的局限,高校图书馆没有对信息数据进行有效的收集整理和共享,没有建立起一个对高校图书馆资源进行统筹、保护、共享的信息化平台,因此,当前的高校图书馆信息资源依然存在利用率较低的问题。
大数据的特质之一就是生成速度快,海量信息以非常快的速度进行聚集更新,这对高校图书馆信息资源建设带来了巨大的冲击。高校图书馆资源建设遵循一定的流程,比如申报、审批、采购、整合等流程,耗时费力,且需要耗费不少的时间周期,这就使得高校图书馆信息资源建设的进度缓慢,从而影响图书馆信息资源建设的时效性。
当前赣州高校图书馆信息资源建设的最重要的制约因素是信息化建设和管理的专业人才太少,图书馆专业人才设置中,图书情报类专业的人居多,而信息技术类的人员非常少。因为信息技术人才应用前景广阔,大量的专业人才都流向了一二线城市,或者流向了政府机关或高校的教学科研岗位,留在图书馆的信息类人才几乎没有。高校图书馆在培养自己的信息专业人才或跨学科复合型人才方面做得也不好,这就导致了赣州高校图书馆信息专业人才方面的匮乏。
赣州高校图书馆人才、设备、资源有限,想要长足发展只能整合现有资源,将几所高校图书馆联合起来建立大数据中心,集中资源办大事。大数据中心要解决的是设备问题和标准化问题。
2.1.1 要整合现有存储设备。大数据的特质是数据规模大,数据生成速度快。各个高校现有的存储设备很难满足大数据存储及处理的需要。大数据中心需要整合升级高校现有存储资源,使其能满足大数据存储需求。此外,还需要升级大数据服务器及文件系统,使其满足大数据计算、挖掘和传输。
2.1.2 要确定信息系统数据标准。大数据的特质之一就是数据种类多,且多为非结构化和非关系型数据,这与图书馆传统的结构化数据大为不同。所以,在建立大数据系统之前,要对收集的数据进行分析和设计,建立相应的数据标准,加强对非结构化信息的收集、加工、存储和挖掘,使信息数据系统实现标准和智能化。还要对图书馆现有的信息资源进行二次开放及整合,使其潜在价值和意义被充分利用,实现图书馆信息资源多元化。
2.1.3 合理选择和使用大数据系统工具。想要搭建高效的大数据信息系统,选择合适的、高性能的大数据系统工具至关重要。建立一个高性能的大数据平台,要从各个方面综合考虑,比如经费、需求、人才、技术、硬件等。自行开发系统显然不可行,那么可以从现有的、比较成熟高效的工具中选择。Hadoop是一个很好的选择,它的核心是HDFS(分布式文件系统)和MapReduce(分布式并行编程模型),且具有可靠、高效、成本低、跨平台等优点,并可以部署在廉价的计算机集群中,完成海量的数据存储和计算。数据库的选用也比较多,有HBase、Redis、HIve等,各有特色。数据可视化工具可以从Easel.ly、Tableau、魔镜、ECharts等工具中选择适合需求的软件。
赣州高校图书馆现有的电子资源种类比较繁杂,有纸质图书的Marc、馆藏、借阅数据,有电子图书(如超星)资源数据,有电子期刊(CNKI、万方)资源数据,有多媒体视频类的资源数据,还有很多其他种类的电子资源数据及网络上一些开源数据库,各个图书馆还有自建的一些特色数据库。一些比较著名的数据库比如CNKI、万方、超星、EBM、人大报刊,赣州的几所高校都购买了上述几种数据库资源,这些资源对高校师生工作学习帮助巨大,但是也造成了资源建设的重复投入。如何高效科学的建设高校图书馆的信息资源,可以从以下几个方面考虑。
2.2.1 几所高校集中人力物力成立大数据中心的前提下,由大数据中心统一购买这些数据资源。几所高校共享,不仅可以节省经费,大数据中心还可以有效的整合资源,开发出更好的图书馆服务平台及手机端移动平台,充分地利用这些数据进行分析统计,更加科学、高效地进行资源建设,同时也为读者提供更加便捷、个性化的一站式资源检索和以用户为导向的精准服务。
2.2.2 大数据中心可以结合赣州的历史风貌及经济发展特点,结合高校的师资力量及科研水平,积极建立一些特色资源数据库。比如客家文化资源数据、红色革命老区数据库、脐橙种植信息数据库及有色金属数据库等等,为高校师生服务的同时也为赣州的经济建设贡献自己的力量。
2.2.3 大数据中心及高校图书馆要想提高自身竞争力,做好信息资源建设,需要有大量的资源和技术,就要开展跨界合作。比如赣州市政府主导的“赣州数字经济发展规划”项目,大数据库中心可以积极参与进去,利用自己的技术及数据优势,更好地为赣州的数字经济发展服务。
大数据技术在高校图书馆的应用,需要图书馆培养一批有图书情报专业知识背景和掌握大数据技术的复合型专业人才。高校图书馆首先要改革人才制度和管理制度,创造适合人才成长的工作环境,设置专门工作岗位及人才培养计划。招聘一些具有计算机专业或图书情报专业的年轻人才,然后开展定期和不定期的大数据专业知识培训课程,使其熟悉、掌握自身学科以外的专业知识,树立大数据与自己学科的交叉领域。同时,图书馆还要积极开展对外交流学习,改革岗位管理机制,增强馆员的资源服务理念,努力为高校图书馆培养大数据管理的发展环境。
传统高校图书馆的服务模式是被动式服务,读者来图书馆搜索、借阅图书,图书馆提供借阅服务。利用大数据技术,高校图书馆可以改变被动服务模式为主动服务模式——精准服务。精准服务是建立在当前图书馆一般性服务的基础上,以用户问题为导向的图书馆服务模式,强调的是,从依据用户共性需求配置资源到依据用户个性化需求配置资源的转变。利用大数据系统综合采集图书数据、读者搜索借阅信息、移动终端位置、读者专业信息等数据,分析读者行为数据,挖掘读者的潜在需求,为读者提供精准服务,将是大数据技术下高校图书馆发展的方向。
图书馆资源建设的评估是高校图书馆资源建设工作必不可少的重要环节。科学有效的资源评价体系是合理配置资源的基础。相应的,在大数据环境下高校图书馆也需要变革资源评价的内容与方法,以指导新形势下的资源建设。高校图书馆利用大数据工具,能够对来自图书馆系统和社交网络等不同渠道的异构数据加以整合,综合运用各种新型的资源评价指标和新兴评估方法,实现更全面的数据分析,促进资源评价效果的提升。
赣州高校图书馆在信息化建设发展过程中存在不少问题,发展相对落后。希望赣州高校图书馆能利用大数据技术发展的契机,不吝投入,积极进行大数据环境下的信息资源建设和人才培养,从资源、技术、管理、人才建设等多个方面共同推进,为赣州高校图书馆未来发展打下坚实的基础。