李航
摘 要:文章对“厚数据”和数字资源的相关概念进行了概述,剖析了“厚数据”思维下进行图书馆馆藏数字资源整合与服务的必要性,在此基础上论述了图书馆馆藏数字资源的整合方法,包括资源整合方案、采集终端过滤和互动性资源整合等具体思路,最后提出了相应的服务策略。
关键词:“厚数据”思维;馆藏数字资源;资源整合;服务策略
中图分类号:G250 文献标识码:A 文章编号:1003-1588(2023)08-0128-05
在人类持续不断的活动中,大量有意义的数据从中产生,这便是工业时代步入数字时代的重要保障,这些大数据被广泛应用于各大领域。同时,大数据得到越来越多人的信任与依赖,人们也逐渐倾向于“用数据说话”揭示问题的实质,这就是“大数据”时代。但是,“大数据”思维下过分注重数据之间的相关性,弱化了其中的因果关系,应回归数据意义本身,更好地挖掘数据背后的故事和因果关系。因此,将“人”的因素不断融入数据分析中,这就是“厚数据”思维。本研究将引入“厚数据”思维探讨图书馆馆藏数字资源的整合方法以及服务策略。
1 相关概念概述
1.1 “厚数据”的内涵与特征
“厚数据”起源于人类学科当中的厚描述(Thick description)一词,1990年人类学家克利福德·格尔茨提出了厚描述的概念:“厚数据”包括具体细节、概念结构、具有丰富意义的事实、评论和解释。”[1]根据相关研究,本研究认为“厚数据”(Thick data)是一种能够反映行为内在属性的信息数据,其产生于使用者的行为和活动。换言之,“厚数据”是指能够体现研究对象更深层次内涵的数据,旨在用于揭示数据背后存在的感情和故事。
大数据是以庞大的数量为支撑,并不具备深刻性,也称其为“薄数据”,而“厚数据”是在有限的样本个体中揭示出其背后更深刻的故事[2]。大数据是面,其范围较广;而“厚数据”是点,其范围较窄,具体见图1。相对于大数据来说,“厚数据”能够提供大数据并不具备的数据信息,可以帮助研究者更好地解释使用者的某些行为[3]。国外学者已经对“厚数据”进行了相对深入的研究,涉及城市规划、市场调查和教育等领域[4]。目前,我国对“厚数据”的研究仍处于起步阶段,集中在教育学、公共管理和医疗健康等领域。在图书情报领域,袁曦临提出了智库的研究性取决于多元化的跨界研究与专题化的研究资源建设,“厚数据”成为其揭示事实背后的因果联系和核心意义的重要方法[5]。
1.2 数字资源的内涵与特征
数字资源作为图书馆馆藏资源的重要内容,也常被称作电子信息资源或文献[6]。在大数据等新兴技术不断进步的环境下,数字资源凭借其繁多的数量和种类、受限较少以及支持多用户同时使用等无可比拟的优势,陆续成为各大图书馆信息资源的重要组成部分。
图书馆馆藏数字资源构建于丰富的数字资源基础之上,主要是以数字状态存储和利用的馆藏信息资源[7]。图书馆馆藏数字资源借助于图片与音视频等多种类型信息格式而存在,并以虚拟资源和数据库等为主要的储存形式,具备更为先进和便利的网络检索方式,使用户能够有效利用网络资源开发和共享等方式获取相关信息资源。图书馆馆藏数字资源能够实现共建共享,通过与相关图书馆间的有效联合和购买资源等方式,用以实现馆藏数字资源的共享,更实现了图书馆空间的节约,但对于环境与设备却表现出极强的依赖性,图书馆馆藏数字资源整合与管理难度较大。
2 “厚数据”思维下图书馆馆藏数字资源整合与服务的必要性
2.1 “厚数据”思维契合了图书馆馆藏數字资源的整合需求
大数据时代的数据并非凭空产生,其来源与社会背景、文化背景和个人需求等信息密不可分,而大数据却难以将这些信息用量化的形式表示出来,不能被添加到统计分析模型和机器学习算法等技术中,因此大数据不能在数据产生的背景之外解释数据。在处理复杂的问题时,大数据往往不能用准确的数据对参与者的真实情绪进行刻画,而“厚数据”是对大数据的重要补充,只有引入“厚数据”思维才能克服大数据的局限性,对这一主题的研究将导致信息分析等相关领域特有理论和方法的丰富和发展,契合了数字资源的整合需求。
2.2 图书馆馆藏数字资源整合是信息组织的需要
数字资源整合是信息组织标准化、自动化和动态化的需要[8]。随着科学技术的不断发展,数字资源的自动注解和分类以及数字资源的自动键入是图书馆的关键研究领域。然而,今天的数字资源不仅数量大、种类多,而且构成复杂,使人工整理越来越困难。同时,因特网是一个结合了多种网络的整合体,存在多种杂乱无章的数字资源,不同的网络之间实现多种信息交流需要全方位的技术支持,这就要求有一定的信息整理和加工标准,如有统一的数据格式索引或描述语言等。
2.3 为图书馆馆藏数字资源服务提供技术保障
在整合图书馆馆藏数字资源的基础上,图书馆提供优质的服务离不开先进的信息处理技术,尤其是较为稀缺的光盘和微缩文献等。这些存储技术具有运行稳定性较高等优势,将简易信息聚合技术(RSS)及Web2.0技术等应用于馆藏数字资源工作,可用以帮助图书馆实现用户信息的推送服务、用户个性化的定制服务、扩大检索服务、新书发送服务及相关信息链接的服务等[9]。由于技术支持提供了保障,图书馆馆藏数字资源才有了合适的环境,用户才能根据自身差异化的信息需求获取相应的数字资源服务。
3 “厚数据”思维下图书馆馆藏数字资源整合方法
3.1 构建图书馆馆藏数字资源整合方案
基于“厚数据”思维的图书馆馆藏数字资源整合方案主要分为四个部分,见下页图2。第一部分是“厚数据”资源层,主要体现在故事化的演进过程,讲故事的技术被用来从厚重的数据中创造一个故事,提供了讲故事的背景、进展和逻辑链、解释性与真实性。适当使用讲故事的技巧,将情感融入叙事中,可以增加故事的影响力和感染力,并且故事中所包含的感情也使故事更容易被记忆。故事化技巧还包括故事叙述技巧和故事组织技巧。故事化叙述技巧对讲故事的效果有同样重要的影响,对激发观众的热情和行动至关重要。因可视化是呈现复杂信息的有力工具,可以提高用户的理解力、保持力和吸引力。第二部分是资源过滤和分析层,起到承上启下的作用,主要承担数据特征的提取、类型与格式的判别、数据清洗及数据解析等任务,其根本目的是对所产生的噪音进行及时过滤,从而对数据的格式与类型进行规范,并对数据存储密度等进行相应提升。第三部分是资源整合层,所采用的准则为数据读取与转换,将上一部分所得数据进行转换,并及时存储到主数据库中。第四部分是资源整合与反馈层,利用数据处理分析等技术进行准确评估,进而利用反馈技术实现数据整合与优化等,不仅提高了整体操作水平,还提升了数据的可控性。同时,图书馆会对整合过程进行全程监控,及时发现问题并改正错误,为用户提供可靠的数据服务。
3.2 实现数据在采集终端的过滤
图书馆提供了优质数字资源并整合了用户方方面面的数据,使用终端的监控及数据收集器等设备整理用户使用信息。需要注意的是,这些数据设备的构造都较为繁琐,数据量也较庞大,因此在整理数据时要充分把握数据量和网络负载之间的平衡,在不影响硬件设备正常运行的基础上,尽可能收集所需的信息数据[10]。先进的技术能够最大限度地递减硬件的运载负荷,从而提高数据的分析效率,图书馆应重点对原始数据进行过滤和整合,有效降低噪音并去除冗余信息。
3.3 运用“厚数据”思维实现互动性的资源整合
图书馆馆藏资源建设、借阅服务等各项业务的最终目标都是为了实现读者利益。因此,图书馆有必要了解读者的真正喜好、习惯和需求,找到优化数字资源与图书馆馆藏资源整合的方向,为读者提供更好的服务。基于“厚数据”思维,图书馆应通过开发互动管理服务平台收集更多的用户信息,并结合大数据智能分析技术,全面覆盖用户对数字资源的需求。除了搜索和借阅服务,图书馆应在数字平台上增加互动功能,如:建立一个在线聊天室,为拥有不同兴趣的用户提供互动场所;创建一个留言箱,用户可以在这里留下对图书馆的建议以及他们对数字资源的需求。信息箱里的信息由管理员定期收集,作为图书馆整合数字资源和优化管理服务的重要依据。图书馆应通过“厚数据”和大数据技术分析用户行为,变被动服务为主动服务,通过全方位的分析实现精准的用户定位,为他们提供更高效的服务,扩大数字资源的利用范围。
3.4 应用关联数据进行整合
在图书馆馆藏数据资源的整合过程中应用关联数据,有利于提高数字资源利用率,促进交流共享。应用关联数据进行整合主要分为三种常见模式:将图书馆资源作为链接数据发布、利用链接数据扩展资源发现服务,以及利用链接数据进行数据融合和语义搜索服务[11]。链接数据的应用不仅是为了尽可能提高协作交流,而且是为了建立一个用户之间顺利对话的交流平台,使两个主体——图书馆和用户演变为三个主体——用户、图书馆和用户。简言之,用户与用户之间的交流是另一个新的组成部分,允许用户在检索信息时与其他用户的阅读路径相关联,从而提供新的想法和观点,这给链接数据技术提供了充分的发挥空间,使主题搜索得到拓展,实现了深度整合。
4 “厚数据”思维下图书馆馆藏数字资源的服务策略
4.1 善用技术与工具加快服务进程
“厚数据”思维更关注的是个体的需求与问题的本质,加快图书馆馆藏数字资源的服务进程离不开技术工具的有效利用。源描述与检索(RDA)技术可对数字资源之间的关系进行有效分析,从使用者角度出发明确实体从而识别属性,更注重揭示内在内容,从二维到三维模型确保数据的互操作性,更快地检索信息和更好地访问图书馆的数字资源[12],这也与“厚数据”思维相契合。例如,RDA技术改进了图书馆的开放式公共访问目录(OPAC)导航,用户进入OPAC系统界面实现数字资源的检索,并搜索关键词获取有关内容及其所附加的地址等信息,从某种意义上说增强了其可见度。
4.2 建立“O2O”数字资源服务渠道
随着图书馆馆藏数字资源的日益丰富,其地理分布也呈现出一些离散特点。为了增强数字资源服务的协同性,本着厚积薄发的原则提高圖书馆馆藏服务效率,建设网上服务平台,有效整合数字资源服务势在必行。这种服务渠道需要用户在线注册并签署相关的服务合同,然后才能进入服务平台获得他们所需的数字资源服务。特别是为了满足用户对个性化、专业化服务的需求,图书馆有必要开通一个“O2O”数字资源服务渠道,将线上服务平台提供的资源服务与线下“面对面”的资源服务有机地结合起来[13]。例如,用户在使用数字资源进行在线学习时,除了在线答疑还可以在线下进行讨论和交流,以加深和巩固所学内容;用户在参观虚拟校史馆和在线标本馆时,还可以在现场提供实地考察等线下服务,以加深理解,提高认知。
4.3 提供推荐信息协助用户选择资源服务
面对图书馆馆藏数字资源的复杂性和多样性,本着“厚数据”思维提供相关的推荐信息以帮助用户进行选择,充分满足其服务需求尤为重要。本研究认为,一方面要把图书馆数字资源社会服务平台作为一个“聚合器”,将不同类型的数字资源服务有机地整合起来,如文献借阅和知识传播的整合,以及信息检索、科研创新和技术援助的不断整合和再创新,同时还可以为用户提供一定的分类信息[14]。当用户登录图书馆馆藏平台寻找所需的数字资源服务时,可以利用平台提供的数字资源服务的分类信息,准确、快速地进行定位。另一方面要充分发挥各种“过滤器”的作用,如搜索引擎提供的搜索服务、服务排名中有效利用资源的指导服务、资源服务推荐等,将馆藏的数字资源服务与用户的需求有机地联系起来,有效降低用户搜索数字资源的时间成本。例如,当用户搜索图书馆资源时,可以得到相关的书目、文献下载和排名等推荐信息,指导用户选择相应的数字资源服务;当用户选择课程资源、在线讲座和特色课程等数字资源服务时,可以得到相应的内容简介、教师简介和以往用户的反馈信息,使用户可以获得更详细的信息,有利于用户根据自己的需求做出快速和准确的选择。
4.4 基于群体评测优化数字资源服务
随着图书馆环境的不断进步,加之“厚数据”思维的应用,用户对图书馆馆藏数字资源的服务需求也时刻发生着变化。为了持续满足用户对数字资源的服务需求,图书馆需做出与之相适应的调整与优化。通常情况下,图书馆会对所提供的馆藏数字资源服务进行相应的充实与调整[15],但普遍决策多由对应管理部门进行,如如何调整资源服务、调整哪些部分和向什么方向进行调整等,而对用户的了解情况较少。本研究认为,充分发挥用户的群体智慧至关重要,同时契合了“厚数据”思维中“人”这一关键要素,而用量化的分数、等级或评论评价图书馆的各种数字资源服务,从而在群体评价获得信息的基础上优化数字资源服务,能够更好地满足用户的服务需求。事实上,群体评价已经在图书馆馆藏数字资源服务中得到了应用,如:一些高校图书馆的在线课程数字资源开发者就收集了用户在使用数字资源过程中提出的意见和建议等群体评价信息,以便为进一步优化数字资源服务提供重要依据。
5 结语
“厚数据”思维是图书馆馆藏数字资源整合和服务的一个重要发展趋势,图书馆只有适应时代的变化,才能更好地满足用户的需求。通过技术和其他手段,图书馆可以有效地处理馆藏数字资源,实现数字资源的互联互通,从而大大提高资源利用率,同时应结合“厚数据”思维,善用技术,建立渠道,协助用户优化馆藏数字资源服务,从根本上提高馆藏数字资源服务水平,促进图书馆的良性发展。
参考文献:
[1] 孙智中,张晨.基于“厚数据”的信息分析:內涵与模式[J].情报资料工作,2020(3):69-75.
[2] 李成熙,文庭孝.“厚数据”研究综述[J].高校图书馆工作,2022(1):8-14.
[3] 郑儒雅,汤晓敏,王云.“厚数据”支持下的城市老旧社区公园更新路径研究:以上海松江人乐花园为例[J].安徽农业大学学报,2020(6):986-995.
[4] MAUSETHAGEN S,PR?ITZ T,SKEDSMO G.Teachersuse of knowledge sources in ‘result meetings:thin dataand thick data use[J].Teach Teach,2018(1):37-49.
[5] 袁曦临.制约我国智库研究与发展的瓶颈问题:跨学科研究与专题性研究资源保障[J].情报资料工作,2017(5):99-104.
[6] 陶蕊,叶继元.中美图书馆数字资源统计标准及指标比较研究[J].图书馆学研究,2021(16):35-43.
[7] 杨建波.媒介融合背景下图书馆馆藏数字资源开发与管理浅析[J].新媒体研究,2015(4):47-49.
[8] 王震宇,王宁.大数据时代图书馆馆藏数字资源整合与存储策略分析[J].中国中医药图书情报杂志,2017(3):35-38.
[9] 刘亚莉.大数据环境下数字图书馆信息服务资源整合存储策略研究[J].河南图书馆学刊,2017(11):90-91.
[10] 李振波.大数据时代下云技术在图书馆数据存储中的应用[J].电子技术与软件工程,2018(1):183.
[11] 王杰峰.关联数据在图书馆馆藏数字资源整合中的应用研究[J].农业图书情报学刊,2017(6):40-43.
[12] 李薇,王恒军,王爽,等.论基于RDA技术的图书馆馆藏数字资源知识组织[J].中国中医药图书情报杂志,2018(4):18-21.
[13] 周效章.“互联网+”背景下高校数字资源社会化服务策略研究:基于长尾理论视角[J].图书馆工作与研究,2020(8):28-35.
[14] 王智丽.基于产教融合的职业院校图书馆信息服务研究[D].哈尔滨:黑龙江大学,2021.
[15] 王小琼,朱海涛,屈宏明.高校图书馆数字资源验收实践研究[J].图书馆建设,2019(4):98-101.
(编校:周雪芹)