符润花
关键词:大数据;图书馆;文献信息;资源建设
摘 要:在互联网大数据时代,信息技术和相关数据的重要性越来越受到各个行业的关注,特别是用户数据的价值更是不容忽视。文章针对大数据背景下如何提升地区图书馆的服务水平和资源建设能力,为其所在地区的用户提供专业精准的文献信息服务,以及如何提高图书馆管理人员和技术人员的技术水平、分析能力和资源建设的信息化、科学性进行了研究。
中图分类号:G250文献标识码:A文章编号:1003-1588(2018)05-0115-03
1 互联网大数据的特点
1.1 多样化信息的传播速度越来越快
互联网技术正以一种难以预估的速度改变着普通人的生活方式和思维理念,而大数据作为一种最新的信息技术,开启了信息交互的崭新纪元,为普通用户构建了一个海量信息的平台,同时也颠覆了人与人之间的传统沟通方式。从大数据技术诞生之初,科技精英和普通用户就给予它越来越多的关注,而造成这种结果的主要因素就是大数据时代信息传播的速度越来越快。目前,当社会上出现一些焦点新闻或消息时,普通用户就可以利用移动互联网的各种工具将信息迅速地转发出去,而当政府机构发布一个新的政策时,普通用户也能够以难以想象的速度获得相关的政策信息。与以往传统的传播技术相比,大数据背景下对信息的实时性要求更高了,在一定程度上满足了用户个性化的信息需求。
1.2 信息种类有多样化趋势
从技术概念上理解,大数据是多种多样、类型复杂的各类信息的集合,图书馆在应用该技术时必须事先利用一定的特殊技术对信息进行综合分析,最终才能得出各个用户真正需要的数据信息。而一些使用率较高的网站或信息服务APP,其后台信息服务商每天要分析和研究的信息数据就多达几十个亿。大数据技术不仅能将不同机构的信息数据进行汇聚集合,也能够突破时间和地域的各种限制,甚至能够将其他机构的信息数据发送给有需要的普通用户。大数据传播的信息内容多种多样,而图书馆文献信息服务所传递的信息也需要应用大数据技术。
1.3 大数据技术能提供个性化服务
大数据技术可以有针对性地分析用户的特点和需求,为不同的用户提供他们最需要的服务内容。在文献服务和资源建设过程中,图书馆必须满足普通用户的个性化体验。如:图书资源的大数据平台基于海量信息进行分析,掌握用户需求,根据用户的阅读喜好匹配具体的图书或文章,能提供灵活定制的阅读体验,方便普通用户快速、高效地获得个人需要的、更适合自身的知识产品和信息服务。因此,基于大数据技术的应用,图书馆可以为每一个用户提供个性化的服务,这也是世界发达国家图书馆的服务发展趋势。
2 地区图书馆信息服务面临的挑战
互联网和大数据技术的高速发展,带来了文献信息和資源建设、图书馆用户个性化需求和知识产品产业链的一系列变化,这也给地区图书馆带来更多的挑战,主要表现在以下几个方面。
2.1 地区图书馆的服务理念需要与时俱进
对于地区图书馆来说,互联网和大数据技术的具体应用虽然不像商业数据那样隐含着非常高的商业价值,但图书馆的图书及各种知识产品的信息类型分类和提供给用户的各种信息服务的即时处理能力仍然要加强相关服务建设,这是因为大数据改变了传统信息模式的发展趋势,这种新型信息技术也给普通用户带来新的对地区图书馆的服务要求。只有通过对当前普通用户的海量信息数据进行充分的挖掘和细致的研究,才能明晰目前地区图书馆在服务体验方面存在的问题。而图书馆的传统服务理念也需要由普通用户接受面对面服务、图书馆管理人员对普通用户的文献信息服务进行被动的在馆服务模式,转变为主动的、科学化的、灵活性高的线上服务模式。在这一发展趋势下,地区图书馆的信息技术人员和管理人员应当主动转变传统的服务理念,不断适应大数据技术发展过程中用户的新需求。
2.2 商业化的文献信息服务机构对传统地区图书馆形成挑战
互联网技术的快速发展促进了图书馆等传统知识机构的转型和开放,而当前可以满足人们知识获取的渠道也在日益增多,各种开放性商业信息资源和文献信息服务机构正不断地涌现。信息资源获取渠道的多元化趋势和便利性,以及各种搜索工具的高效应用,使传统的图书馆不再是普通用户唯一的知识服务提供机构,地区图书馆作为知识信息资源中心也难以满足广大人民群众的信息服务需求。随着商业化信息服务机构的迅猛发展,各种调查报告都显示出地区图书馆的用户服务数量和纸质书籍的借阅呈逐年下滑态势,而地区图书馆资源建设的实际情况也难以令人满意。因此,地区图书馆只有强化其传统信息资源中心的角色,建立和完善更独立的发展战略,深入研究新兴的信息技术手段和各种数字化资源,与社会上其他信息资源机构或网站协同发展,实现数字图书信息资源的有效整合,才能提升地区图书馆文献信息资源的利用率和社会各界的关注度。
2.3 多样化的用户需求对地区图书馆的资源建设形成挑战
互联网时代带来了图书馆普通用户新的需求,用户对信息化资源的实时性和个性化需求越来越高。因此,各大图书馆越来重视数字资源的建设工作,具体体现为电子期刊和数字图书的购置经费比例不断增加。但图书馆用户的多样化需求在具体的纸质图书和数字图书方面还存在巨大的差异性,例如:人文社科的用户比较喜欢纸质图书,而理工科的用户对数字化图书和期刊比较偏爱。而某些时间久远的文献资源,如理论基础方面的学术专著数字化建设投入还存在很大的不足。同时,在各种文献价格不断上涨的背景下,地区图书馆还存在采购文献预算不断减少的现实问题,图书馆不但要考虑不同用户对文献信息需求的巨大差异,还要面临以有限的经费满足多样化的用户需求和地区经济发展的知识库资源建设要求。如何合理规划不同学科的资源建设比例,如何优化文献图书结构,实现不同类型资源建设的共同发展,已成为地区图书馆不可回避的现实问题。
2.4 图书馆缺少专业大数据技术人才
在互联网时代,地区图书馆如果要从传统的文献信息服务和咨询转变为大数据时代的个性化服务,并不断满足和完善用户的数据需求和个人文献管理等多样化服务模式,就必须提供能以个性化推荐为特点的深层次文献信息服务。图书馆信息技术人员不仅要具备图书管理服务能力和资源建设能力,还要具备图书检索、分类、资源组织及对应的工具使用等专业能力,更需要学习和了解大数据时代专业的用户数据挖掘、用户画像描述、元数据建设等大数据专门技能。但目前各地图书馆普遍存在缺少专业大数据人才的问题,这是阻碍地区图书馆文献信息服务和资源建设发展的重要问题。
3 地区图书馆大数据技术服务的构建
3.1 研究适合图书馆使用的大数据工具
地区图书馆需要选择科学合理的大数据工具,才能实现对海量的结构复杂的用户个人数据进行获取、分析和整理,在信息技术平台上要有高性能的软硬件设备作为基础。20世纪80年代,发达国家的图书馆就开始建设数字化图书馆,通过不断采购计算机设备、开发或设计各类文献信息服务数字化平台,如图书馆信息化管理系统和文献资源索引系统等,早就具备强大的用户大数据分析能力,同时在大数据应用方面也逐渐淘汰了传统的人工数据分析方法,能够通过互联网技术满足对复杂结构的用户数据进行挖掘和分析的需求。目前,Hadoop是国际上各大图书馆应用最多的分布式系统工具,该平台利用计算机集群对复杂大数据进行分布式存储和分析,具有可靠性高、运行速度快及易于扩展等优点。例如,知名的美国国家图书馆建立了大数据分析Hadoop平台,基本解决了计算设备扩展和用户数据深入挖掘的问题,在文献信息服务中通过语义分析工具和用户画像描绘系统,精准地满足了用户的个性化需求,而且还能根据实际需求指导图书馆的资源建设。我国地区图书馆要积极学习国外知名图书馆的成功经验,改进已有的软硬件平台,与大数据供应商一起搭建符合本馆需求的大数据技术平台。
3.2 加强基础数据的获取
地区图书馆通过大数据可以整理和优化资源建设,还可以获取许多结构复杂的用户基础数据。随着城市经济建设的不断发展,各地都在积极推进手机APP,以替代传统的图书证。手机APP的后台系统能够记录的信息有图书馆用户在馆搜索使用的文献信息和个人喜好,这些数据都能帮助信息技术人员获得用户借阅的文献类型、阅读时长等。而图书馆的网络系统可以建设为重视交互功能和文献信息分析能力的网站,在图书馆网络系统出口加入用户日志获取功能,收集用户的文献浏览信息,这些基础数据非常复杂并且结构庞大,但却是分析用户个性化需求的重要信息。通过大数据技术收集用户信息的速度比任何一种传统媒介都要快捷,地区图书馆要结合基础数据信息和自身馆藏文献数据,与地区内的其他图书馆共同整理分析该地区的用户大数据,以便为用户提供更具个性化的服务。
3.3 用户数据的整理、分析和存储
地区图书馆在构建大数据平台时,必须对海量数据进行整理、分析和存储,而用户数据可以通过手机APP或图书馆网站的相关接口链接到后台数据库,也可以联合专业的大数据技术供应商共同研究面向专业图书馆的数据库,利用爬虫技术主动获取用户需要的文献资源,进而完成对基础用户数据的利用。图书馆文献信息服务要建立基础元数据,经过大数据技术的整理和分析,形成统一格式且兼容性好的可重复利用的数据。图书馆信息技术人员可以采用计算机分布式技术,对海量数据进行分析、挖掘和整理,形成符合地区用户特点的分布式大数据图书馆文献信息服务系统。地区图书馆应以满足用户个性化需求为原则,通过多样化的可视化大数据算法和移动互联网技术,挖掘用户数据和馆藏文献之间的关联规律,使图书馆今后的资源建设规划能够更加有的放矢。
3.4 优化图书馆资源建设工作
地区图书馆传统的资源建设工作要根据文献采购原则及年度建设计划进行,在这个过程中还需要考虑图书价格,并在海量信息中人工选出合适的文献资料,同时图书馆通过咨询专业人士、发放传统的调查问卷等方式分析用户的文献需求,导致每年的资源建设工作往往耗费大量人力,而且相关工作人员的经验对资源建设的准确性影响较大。而大数据平台和技术可以保证地区图书馆资源建设成为可视化的数字过程,在整个资源建设周期内可以比较全面地考虑用户的个性化需求,将图书馆资源建设工作由依靠专家或工作人员的经验转向科学分析用户数据并进行决策的过程,使图书馆资源建设更加科学、客观和准确。同时,除了文献需求分析、资源搜索、图书借阅等基础数据,用户对地区图书馆的各种信息反馈,也可以比较客观地反映用户的个性化需求。图书馆还可以通过微博、微信公众号等移动互联网媒体统计和收集海量用户的阅读行为,通过对区域内不同层次的用户信息、文献服务等数据进行深入挖掘和分析,进行规范化的图书馆资源建设工作,从而可以合理分配年度有限的采购经费,加强文献信息服务的针对性。
3.5 建设不同机构之间的文献信息交流渠道
多元化的文献信息交流渠道是指地区和本地其他机构对该地区所产出的所有文献信息资源进行数字规模化操作,并对这些文献信息进行合并和存储,避免不同机构之间出现重复建设问题。多元化的文献信息数据库的统一整合,可以增强和加快地区图书馆及各种社会商业知识供应商之间的资源建设工作,在交流渠道建设过程中要充分重视文献信息的合并程度和法律问题,在实际开发过程中可以在统一的大数据平台上建立该图书馆的信息账号,图书馆信息技术人员和大数据供应商的技术人员可以帮助用户完善个人的阅读需求。尤其是面对有地区特色的历史和人文文献时,多元化的文献信息数据库的统一整合有利于加强古文献的数字化存储和借阅服务,对发展和提升地区人文历史保护工作也非常有利。
3.6 提升图书馆信息技术人员的大数据技术能力
地区图书馆通过大数据开展文献信息服务和资源建设,需要提升图书馆信息技术人员的大数据技术能力。信息技术人员不仅需要具备必要的数据分析能力,还要掌握大数据平台及信息化工具的使用方法。地区图书馆因普遍缺乏信息技术人员,所以必须积极引进专业的大数据技术人才,同时要大力培养图书馆工作人员的信息化技能。目前,地区图书馆可以邀请互联网技术工程师为图书馆员举办专门的大数据技术培训,并收集和整理相关学习资料,组织员工按时学习,定期选派员工参加有针对性的文献信息服务大数据技术交流活动。地区图书馆管理层还应加強商业大数据公司的专业人员与图书馆信息技术人员之间的合作,不断提高馆员应用大数据技术的能力。
4 结语
新形势下的地区图书馆文献信息服务要主动适应大数据技术的发展趋势,积极转变服务理念,从用户的角度出发,努力提升用户的使用体验,引进先进的互联网技术和工具,创新传统的管理模式,有针对性地提升图书馆的资源建设能力,以满足更多用户的个性化需求。
参考文献:
[1] 苏新宁.大数据时代数字图书馆面临的机遇和挑战[J].中国图书馆学报,2015(6):4-12.
[2] 王宇鸽,邢军,张红.数字图书馆大数据技术的应用架构[J].图书馆学刊,2014(7):113-116.
[3] 郭春霞.大数据环境下高校图书馆非结构化数据融合分析[J].图书馆学研究,2015(5):30-34.
[4] 文淑君.简析新时期图书馆信息资源的开发及利用[J].现代经济信息,2017(19):424.
[5] 王行燕.如何利用大数据技术提升图书信息管理水平[J].中小企业管理与科技(中旬刊),2015(5):230-231.