公共图书馆大数据服务研究与创新

2020-01-09 01:54
图书馆学刊 2020年6期
关键词:数据服务图书馆资源

李 臻

(广西壮族自治区图书馆,广西 南宁 530022)

信息通信技术的发展,推动了大数据在各行各业的广泛应用。如何构建公共图书馆大数据资源和服务体系,利用大数据推动公共图书馆行业的整体发展与协同进步,提高公共图书馆服务的精准度,推动公共图书馆服务转型,逐渐成为业内研究的热门话题。很多公共图书馆还将大数据的理念和方法贯彻到具体的服务中,并取得了初步的进展。如广西图书馆运用数据库访问统计分析结果,对商业数据库采购政策的制定和定价策略的确定提供了支撑。国家公共文化云自2017年12月6日上线投入运营以来,一年间,总访问量达1.61亿余次,日平均访问量达44.33万余次[1]。平台产生的大量数据被广泛应用于全国各文化主管部门及相关机构的决策与管理,在资源配置、项目规划等工作中发挥了巨大作用。目前,在已有的研究与实践的基础上,对公共图书馆大数据服务的研究与应用体系进行分析与研究,已经具备了比较好的条件。笔者首先对公共图书馆与大数据之间的关系进行梳理,阐述了大数据背景下公共图书馆发展面临的重要机遇与挑战,对公共图书馆大数据服务的研究体系进行分析,最后对公共图书馆大数据服务创新问题展开探讨。

1 公共图书馆应用大数据的背景

1.1 现代公共文化服务体系建设与国家大数据发展战略需要

2015年1月,中办、国办印发《关于加快构建现代公共文化服务体系的意见》指出,要加快推进公共文化机构数字化建设;加强公共文化大数据采集、存储和分析处理。2015年8月,国务院印发《促进大数据发展行动纲要》,将大数据相关工作提升至国家战略,提出要在公用事业、文化教育等领域开展大数据应用示范,将“加强数字图书馆、档案馆、博物馆、美术馆和文化馆等公益设施建设,构建文化传播大数据综合服务平台”作为“公共服务大数据工程”的主要任务予以明确。2018年1月《中华人民共和国公共图书馆法》实施,进一步强化了对公共图书馆加强数字化、信息化、网络化建设的要求,公共图书馆利用馆藏资源开展大数据服务已经成为服务创新的重要方向。大数据技术在公共图书馆的应用,特别是在读者需求发现与识别、资源精准匹配与配送、服务精细化等方面将发挥重要的作用。在大数据时代,公共图书馆需要将大数据理论探索与公共图书馆服务创新的融合贯通作为主线和基础,在图书馆资源共建共享、服务数据汇聚分析与挖掘、读者需求发现与分类等方面加强研究并提供理论指导。

1.2 提升公共图书馆服务能力和水平的需要

大数据时代,公共图书馆在提供服务和参与管理过程中会自动生成大量数据:一是业务数据,这些数据记录了图书馆服务的基本情况,包括馆藏资源(古籍、纸本图书报刊、电子资源、音像制品、其他非书资料和书画作品等)基础数据、馆内馆外举办的读者活动(如展览、讲座、书友会、读者参与图书采购决策、影视欣赏)数据、各服务端口(含人工检索服务、网络参考咨询、文献传递、电子借阅终端、阅读器、网站留言区、自动应答系统、微信微博用户互动系统)服务记录数据等;二是管理数据,这些数据体现的是读者的阅读偏好和行为规律。主要包括图书馆内各服务端口采集到的人流(特定时间、特定端口)数据、图书借阅数据、电子资源使用(点击、在线查看、下载)数据、安检数据、位置数据、网络访问数据、读者注册数据等。这些数据结构复杂、载体种类繁多、大小参差不齐、读取方式杂乱不一、数据化程度差异巨大。如何将这些性质、结构、呈现方式大不一样的数据汇聚融合到一起,嵌入图书馆服务活动中,需要运用大数据相关理念和技术加以研究,对图书馆服务进行重构。

图书馆馆员是服务活动的主要策划、实施者,是否具备大数据素养和数据运用能力,是影响大数据相关理念和技术能否嵌入服务活动全流程的首要因素。读者是图书馆大数据生产的又一重要源头,围绕读者服务形成的大量行为数据、管理数据等,是大数据应用的核心。例如,通过馆内无线WiFi系统采集到的读者定位数据,可以迅速判断人员在馆内各区域的分布情况,为加强安保、增加服务人员与设施设备等决策提供依据;同时,通过图书借阅记录分析,对社会大众的阅读偏好与趋势做出判断,可以为图书采访提供更加细致具体的对策支持,提高外借图书的流通率与上架速度。但由于馆员对这些数据的类型、性质、采集范围、分析工具等的认识还不清晰,大多没有按照特定规则进行分类、整序、语义转换等技术处理,使其成为无法利用的“死数据”。如何参考和借鉴其他领域大数据应用的理念、方法、技术和服务模式,结合公共图书馆服务的行业特点、发展阶段和现实需求,研究大数据环境下公共图书馆服务的研究体系与应用创新,推动公共图书馆的转型升级,具有重要的现实和战略意义。

2 公共图书馆大数据服务的理论探讨

2.1 公共图书馆大数据服务的内涵

公共图书馆的主要职责是为读者提供知识查询与获取服务。在大数据时代,图书馆服务呈现出个性化、差异化、人性化和智能化的特征[2]。随着数据大规模采集、存储、传输、处理的技术和物质基础进一步完善,各种结构化、半结构化知识的汇集、分割、清洗、重组技术和数据管理的方法、理念研究取得了重大进展。知识服务需求、大数据资源、专业知识服务人员、知识服务技术平台和知识服务制度规范构成了大数据知识服务的关键要素[3]。秦晓珠等认为,图书馆大数据服务具有“面向智慧服务和自主需求、不确定性、强调用户参与、按需使用和付费、共性技术目标与异性技术特征相辅相成、强调共享和交易、基于群体创新、绿色环保”等特征[4]。

笔者认为,公共图书馆大数据服务是公共图书馆与读者构建知识服务的共同体,围绕满足读者知识服务需求的目标,在大数据理念的指引下,运用大数据技术和工具,基于一定的知识服务与数据规则,对服务读者的各种活动所需要的和所产生的数据进行收割、汇总、清洗、整序和分析,运用数据分析的结果向读者提供精准、个性化服务的过程的总称。面对数据驱动创新的时代背景和数据是第一资源的理念要求,公共图书馆智能书架、自动盘点机、智能感应系统、RFID射频系统、GIS定位系统、WiFi网络连接系统等智能化设备与信息采集系统纷纷投入使用,在提高图书馆自动化水平的同时,奠定了图书馆泛在采集各类信息的基础,读者为图书馆服务贡献数据的途径和机会也因此大为增加,公共图书馆与读者构建图书馆大数据服务共同体的局面已经形成。图书馆的数据存储、汇总、解析、清洗能力的提升,中心机房、服务器、数据分析软件等软硬件设施的完备,为加强公共图书馆大数据服务研究奠定了扎实的基础。

2.2 公共图书馆大数据服务研究体系的框架

以往,公共图书馆服务主要围绕资源建设展开,以资源建设为工作重心和服务原点,将资源保障当作做好读者服务的基础条件。这种服务模式容易产生信息不对称问题,馆藏体系与读者需求的匹配度不高,服务精准性不强,效能低下。大数据时代,公共图书馆由以资源建设为中心转向以读者为中心,读者画像、定制服务、个性化信息推送等服务得到重视,并在用户行为分析、活动理论等研究的指引下得以成功验证。因此,公共图书馆大数据服务研究应当以提高图书馆馆藏资源与读者需求的匹配度为核心,加强读者研究,围绕大数据基础理论、技术、方法、应用等,构建公共图书馆大数据服务研究框架体系。如图1所示。

在这一体系中,读者研究是基础,理论研究、方法研究、技术研究是手段,应用研究是最终目标。读者研究是对影响读者需求与资源匹配的相关因素进行的分析和研究,重点分析读者的阅读爱好、行动偏好、时空规律、变化趋势等,将之与图书馆服务和产品进行匹配和关联,可以提高资源匹配和定向推送的准确性。大数据基础理论研究是运用大数据的理念、方法论和概念范畴的总和,是围绕大数据展开的其他研究的基础;大数据方法体系是如何运用大数据进行决策分析的方法集合;大数据技术理论是关于大数据的采集、存储、清洗、统计、分析、揭示、整合、集成、利用,以及图书馆数据安全保障、传输、共享、分布式处理等一系列技术处理原理;大数据应用研究则是公共图书馆应用大数据技术和方法,实现图书馆资源与读者需求完美对接的具体工具与流程研究。围绕读者需求,引入大数据理论加以分析,提供大数据技术与方法(及其组合),结合对大数据应用场景的分析研发大数据应用工具,是大数据理论在公共图书馆服务工作中的基本形式。

读者需求是公共图书馆服务的终点和新起点,公共图书馆服务大数据理论、方法、技术和应用研究,最终都要聚焦到读者研究上来,为发现、挖掘、预测、实现读者需求提供支撑和解释工具。读者需求激发理论研究,理论研究指引技术创新和方法选择,技术和方法组合后提供服务读者的应用工具,应用满足读者需求,大数据服务研究体系的各个部分在图书馆服务中不断循环运动,推动图书馆服务效率和读者满意度的提高。

2.3 公共图书馆大数据知识服务研究体系的具体内容

2.3.1 公共图书馆大数据服务读者研究

公共图书馆要做好读者服务,首先必须要了解、掌握读者的具体需求和需求层次,有针对性地为读者提供相应的知识服务。公共图书馆大数据服务读者研究主要包括读者行为模式研究,即根据读者在图书馆内的行为数据进行统计和分析,构建读者个性化的阅读习惯模型;读者行为归类研究,即根据数据分析结果对图书馆读者行为进行分类,以便提高对读者群体行为模式的识别效率;读者需求模型研究,即从采集到的读者数据中识别出哪些是判读读者阅读需求的有效数据,哪些是无效或冗余数据的研究,再结合用户隐私数据,构建用户需求模型的理论和方法;馆藏资源精准推荐研究,即根据用户个性化的行为模式或群体行为倾向,对馆藏资源进行分析和匹配,将符合读者需求的资源及时精准推送给读者的相关理论和方法。

2.3.2 公共图书馆大数据服务理论研究

公共图书馆大数据具有一般大数据的共性,公共图书馆大数据服务理论主要研究大数据的基本原理、规律和方法与图书馆服务的融合,提出公共图书馆大数据服务相关概念、标准、规范、准则组成的基本理论框架,为公共图书馆开展大数据服务提供理论和方法论指导。一方面,需要对公共图书馆服务本身的基本特点和理论框架进行分析和改造,梳理大数据与公共图书馆服务活动各个因素之间的融合方式与表现形式;另一方面,要为大数据引入公共图书馆服务活动准备基本的概念和规则体系,探索数据应用的分类与规律。具体而言,首先,要对公共图书馆大数据的定义和边界进行鉴定;其次,要建立数据分类的基本标准和标引规范,形成业务、管理、读者、资源数据库;再次,要形成统一揭示、关联和映射数据的相关理论架构。

2.3.3 公共图书馆大数据服务方法研究

应用大数据可以提高读者的阅读体验,满足读者不断增长的多样化服务需求,提供智能化、高效率的服务,是公共图书馆大数据服务方法研究的主要任务。公共图书馆大数据服务方法主要研究大数据的质性分析原理、数据抽取原则、数据评估机制、数据集成和可视化揭示机制、大数据决策的其他支持体系等,可以从多个维度进行展开。首先,要研究大数据参与行为决策的基本要求,对数据样本采集的量、质、时间、范围等要素配备进行分析确定,确保数据的可靠性。其次,要加强对图书馆大数据的集成研究,研究大数据辅助决策的时空条件与触发机制,提高决策的时效性。再次,要加强对其他行业或领域大数据服务研究的对比分析与引用借鉴,为图书馆大数据服务研究提供更多的外部参考。

2.3.4 公共图书馆大数据服务技术研究

公共图书馆大数据知识服务技术研究,首先要解决公共图书馆大数据服务技术的一般原则和基础标准问题,对数据处理的流程和各种方法进行研究,探索技术规律,提供解决方案。这方面主要围绕数据从采集到利用过程的各个环节的技术要求和方法原则展开,比如数据采集技术、数据标引和分类技术、数据挖掘技术、数据分析技术、数据存储和传输技术、数据清洗技术、数据可视化揭示技术、数据集成技术等。其次,要研究处理复杂、多源、异构数据的相关技术,提出整理和集成各种不同性质的数据的分析框架,研究抽取出有效数据的技术原理和实现路径。最后,还要针对图书馆服务的特点和服务要求,结合读者的个性化需要,为图书馆大数据服务搭建共享平台,开发专用软件或应用。

2.3.5 公共图书馆大数据服务应用研究

通过将读者个人信息与参与的各项图书馆服务活动所形成的行为数据相关联,结合具体的读者和活动情景开展公共图书馆服务的精准推送,为公共图书馆服务的需求开发、资源推荐、项目规划、推广宣传、活动设计、绩效评估、空间调整等提供决策支持,是图书馆大数据服务应用研究的目的。公共图书馆大数据服务应用研究的主要任务是通过对公共图书馆服务大数据的挖掘分析,全面揭示公共图书馆服务发展的趋势和读者享用公共图书馆服务的特点,研究公共图书馆服务的转型方向和战略调整路径,探索公共图书馆服务的新项目、新模式和新产品,研究公共图书馆资源与读者需求对接的新平台、新渠道,提供公共图书馆服务监测和评估工具。

3 公共图书馆大数据服务实践的几个维度

利用大数据可以提高图书馆各项工作和服务活动的效果、为读者提供更好的阅读体验等已经成为广大图书馆员的共识。但是真正利用大数据相关理论和技术改善或创新公共图书馆服务的有关案例尚不多见。图书情报领域需要有从自发到自觉、局部到整体、微观操作应用层面再到宏观政策管理层面的全方位的应对措施,才能有效应对当前图书馆大数据体系构建的社会需求和科研发展带来的挑战和机遇[5]。大数据时代,公共图书馆应当从理念到行动全面拥抱大数据,以读者需求为核心,对标图书馆业务工作流程,构建图书馆、馆员和读者大数据服务共同体,推动图书馆大数据服务创新的跨越式发展。

3.1 构建图书馆、馆员和读者三位一体的公共图书馆大数据服务主体架构关系

读者是图书馆大数据服务活动的受益者、参与者和贡献者。读者的个人数据是图书馆的宝贵资源,在符合法制规定的前提下,图书馆应尽量完整采集读者的个人数据,提高数据的完备性与精确性。公共图书馆应该为读者分享个性化数据(信息)提供基础性的设备、技术、平台支撑。公共图书馆应发展读者信息管理平台(系统),加强读者信息采集和管理;加强图书馆范围内GIS定位系统的应用;强化RFID射频系统、红外感应系统等信息采集工具的使用,建立读者与馆藏资源的位置关联。公共图书馆要推动读者与之在个人数据的采集、存储、使用上形成共识,建立图书馆大数据服务共同体。以读者数据分析为导向,公共图书馆需要对自身在本地区公共文化服务体系中的角色地位、法定任务、图书馆核心价值、读者群体特性、馆藏体系和结构、所处社区位置等进行综合性的分析研究,建立分步、分级实施的策略,建立大数据服务的远景规划和体系,加强大数据相关人才的培养,探索图书馆大数据服务体系的业务模型、服务模型和技术模型等。此外,图书馆员作为图书馆大数据服务的最终实施者,对大数据服务理念的贯彻与应用应起到决定性的作用。图书馆员必须在思想认识、思维理念、技术路线、服务技能与理念等方面向大数据靠近,主动提升大数据业务能力,努力掌握信息通信和计算机科学的最新技术,广泛涉猎心理学、信息学、教育学、行为科学、公共管理学的相关学科知识,特别是要对计算机数据处理、云计算、物联网、数据科学等基础知识加强了解,强化数据分析与应用的意识与行动自觉,加强协同创新观念和合作交互能力,形成个性化的大数据思维模式和行动模型。

3.2 夯实公共图书馆大数据服务的资源基础

资源是图书馆建设和发展的根本,是服务活动有效开展的基础。截至2016年,我国县级以上公共图书馆纸质图书总藏量为90162.7万册(件)[6]。但我国公共图书馆的馆藏资源整体上仍存在馆藏资源的数字化水平和数据化传输能力低下,馆藏资源结构不完善,数字资源大数据服务基础薄弱等问题,难以与广大读者对图书馆数字服务的要求相适应。因此,公共图书馆应做好资源的编目、标引等基本工作,保障基础数据的完整性和准确性;逐步提高馆藏数字化资源的比重,加大电子资源采购力度,避免纸质资源与电子资源重复建设,对于读者需求量大的热门资源,有条件的馆应争取做到纸本和电子馆藏同步提供,其他普通资源特别是文献半衰期短的资源,应主要采取电子资源收藏方式;加大对馆藏特色资源的数字化改造力度,在保障知识产权和信息安全的前提下,尽量为读者提供数字访问和使用的渠道与机会。实现资源的数字化建设与数据化管理,是公共图书馆提供大数据服务的前提。

公共图书馆还应加强资源建设开放性的研究和实践,为读者提供参与图书馆数字资源建设的渠道和平台,使其成为图书馆资源建设体系的组成部分。近年来,许多图书馆都引进了“朗读亭”“留声留影系统”等数字音像采集系统,开放供读者自主使用。读者可以通过这些系统将公共图书馆提供的内容或读者自选的材料录制成音像资源,并保存到图书馆的本地服务器上,经过检查审核后,成为本馆的数字资源,发布给其他读者欣赏和使用。公共图书馆通过这种方式,为读者提供参与图书馆资源建设、展示自己才华、释放表达欲望的机会,在潜移默化中巩固了读者与图书馆的资源建设与服务共同体关系,也为积累读者个性化数据、挖掘个性化需求、分析读者群体行为趋势等奠定了基础,成为图书馆大数据服务创新的一种有效途径。

3.3 完善公共图书馆大数据服务的空间条件

场所空间是图书馆大数据服务共同体存在和运行的支撑,不论是实体空间或是网络虚拟空间,都是图书馆服务大数据按照自身规律开展运动的场所。依托空间,各个图书馆大数据服务的主体在其中往返穿梭,生产、输入、调取、组合、处理和输出数据,各种数据分析工具轮番登场,对图书馆各种资源数据和读者数据进行处理,在完成特定活动任务的同时实现数据的扩容与升华。

公共图书馆大数据服务空间创新,应该以有利于数据采集和处理为原则,调整好空间布局,为读者贡献、使用数据提供更多的支持。公共图书馆大数据服务空间创新,应梳理和把握好空间的诉求,加强对数据服务运行环境的再造,不断提升数据服务空间的精准化服务。梳理和把握空间的诉求,就是要明确数据服务对数据服务空间的诉求,明确读者对数据服务空间的诉求。加强对数据服务运行环境的再造,就是要根据这些诉求不断调整和再造数据服务空间,通过搭建一个运行稳定可靠的软硬件环境,确保数据服务过程的有效顺畅,即数据通道不拥堵,数据交换不走样,以实现数据服务空间更加智慧化。不断提升数据服务精准化服务,一是以读者的使用习惯、阅读偏好和研究成果分布为基础建立精准的研究数据服务方案;二是结合读者利用图书馆的大数据分析报告,精准地掌握他们对数据服务空间的诉求,针对性地提供各项服务;三是加强对读者满意度反馈的搜集,并在此基础上再进行微调改造[7]。

3.4 健全以隐私保护为核心的公共图书馆大数据服务规范

公共图书馆大数据服务规范包括图书馆服务的一般性规范和围绕图书馆大数据所需的专有规范。一般规范方面,公共图书馆大数据服务与普通读者服务无异,关于图书馆与读者之间关系的准则仍旧适用于大数据服务的每一个环节。国际图联《公共图书馆宣言》指出:“公共图书馆的服务以平等利用为基础,不分年龄、种族、性别、宗教、国际、语言或社会地位,为所有人提供……所有年龄层都能找到与其需求相关的资料。除传统资料外,还应包括采用各种适当载体和现代技术的馆藏和服务[8]。”因此,公共图书馆大数据服务首先必须要坚持其服务属性,以弘扬图书馆核心价值为己任,为社会提供平等、开放、公益的大数据服务,促进社会公平和包容和谐。这是公共图书馆大数据服务的基本规则。

大数据与读者隐私保护政策方面,首先,公共图书馆必须建立读者隐私保护规则,加强馆员和所有大数据服务关涉人员的大数据伦理教育工作,规范大数据使用行为,提高数据安全性;同时要完善数据备份机制,建立数据清洗池,赋予读者遗忘权,拒绝第三方非法调取和使用读者数据的请求。其次,公共图书馆应该建立数据采集、使用、发布规则,并提供机会让读者观察数据在图书馆的运行机制,提高读者对图书馆数据安全保障机制的信任度,鼓励读者乐于奉献个人数据。

4 结语

大数据时代的到来,为公共图书馆服务带来了新的发展机遇。依托大数据改造图书馆,推动图书馆服务理论与应用创新,是当前公共图书馆发展过程中面临的重要任务。虽然公共图书馆在数据采集上具有天然的便利条件和资源基础,但受限于理念、技术、经费等诸多方面的原因,我国公共图书馆大数据服务离人民群众的需求仍有距离。为进一步适应时代发展的潮流,满足读者对美好阅读服务尤其是图书馆大数据服务的需要和向往,公共图书馆应以更加积极主动的姿态融入大数据服务,在理论体系搭建和应用创新方面继续加强研究和创新,提高数据使用能力,实现公共图书馆在新时期的跨越式发展。

猜你喜欢
数据服务图书馆资源
大数据时代高校图书馆数据服务的困境及优化路径
地理空间大数据服务自然资源调查监测的方向分析
基础教育资源展示
基于数据中台的数据服务建设规范研究
一样的资源,不一样的收获
资源回收
做好绿色资源保护和开发
图书馆
数据服务依赖图模型及自动组合方法研究
去图书馆