路厚旺
摘 要:随着大数据时代到来,图书馆知识服务面临两个日益凸显的矛盾,其一是知识爆炸性增长与用户选择能力局限性之间的矛盾,其二是信息量极度丰富和用户感兴趣信息局限性之间的矛盾。图书馆大数据知识服务的个性化推荐技术是图书馆知识服务一个有效工具。图书馆大数据知识服务的个性化推荐是将读者兴趣、知识领域等关联信息加工为能够生动描述读者偏好的知识元,由此来支持数字图书馆各种推荐服务,最终为用户提供满足其个性化需求的知识资源。面对海量的知识资源,用户的需求并非一成不变,会随着其所处的环境与场景 (情境) 变化而发生变化。但目前大多数图书馆对情境因素的感知能力不足,因此难以为图书馆用户提供与其情境最为匹配的精准个性化服务。
关键词:图书馆;大数据知识;服务系统;用户动力机制分析
随着大数据时代到来,图书馆知识服务面临两个日益凸显的矛盾,其一是知识爆炸性增长与用户选择能力局限性之间的矛盾,其二是信息量极度丰富和用户感兴趣信息局限性之间的矛盾。图书馆大数据知识服务的个性化推荐技术是图书馆解决该矛盾的一个有效工具。下问将详细分析怎样进行图书馆大数据知识服务系统用户动力机制建设。
一、大数据思维与用户中心论的有机结合
大數据知识服务是在原有的知识服务概念基础上,引入大数据思维和技术,利用大数据工具和平台,基于大数据知识组织,提供满足用户信息和知识需求的服务模式。大数据思维强调从传统的抽样到全样思维、从过去的精准到容错思维、从单一的因果关系拓展到相关关系。图书馆可以在大量占有用户数据的基础上对用户进行现实和潜在的需求分析; 且人口属性数据、行为数据、态度评价数据等各种数据存在关联性,在数据量保证的前提下产生数据质的飞越,使得对用户的分析从过去的单维度进入到多维度状态,并从过去的滞后发展到今天的实时同步,即无时无刻都在产生数据,哪怕用户沉默无动作也是一种数据传达。图书馆对用户各方数据的收集与存储是全样思维的体现。只有占有足够量的数据才能对事件的全貌有更准确的描述,才能对用户画像进行精准描述,即将用户的方方面面暴露在图书馆面前,这是图书馆提供适时知识服务的基础。正是对各种数据之间的内在联系进行挖掘、分析与预测,使得简单的因果关系逐渐演变成用户行为的影响因素,即相关关系。数据驱动能够降低事物的不确定性,对用户服务的影响因素分析得越多、我们对用户的了解就越深入,智慧推荐就越精准。大数据思维是围绕用户开展收集、整理、组织、存储、发布、传输、应用等各种操作,离开这个中心,大数据思维和行动都将失去目标。以用户为中心具体表现为充分考虑用户的需求、保障用户隐私数据安全、提供优质的知识服务。用户需求存在潜在和现实需求,大数据可以深度挖掘数据之间的关联性,更好地揭示用户没有表达出来的隐性需求。用户隐私安全是指用户使用网络的过程中希望个人的敏感、秘密、不想被其他人知道的信息在自己的掌控之下,在个人技术和专业不及的情况下机构能够给出专业的防护体系。因此,图书馆的大数据收集与分析也是有边界的,在不触及用户隐私的情况下全样收集与分析,在触及用户隐私的情况下如何规避用户损失,提高用户收益是图书馆必须考虑的事情。优质的知识服务是用户使用图书馆的目的,在学习、工作和研究的驱动下,用户寻求图书馆给予更为全面、专业、优良的知识服务; 在知识和体验的双重促进下,用户可实现持续使用的动机和意愿,这是图书馆核心功能建设和发展的根本所在。
二、基于情境对图书馆用户需求的动态感知
读者或用户是在一定情境下开展图书馆行为的。早期情境研究因技术等原因只能集中于单兴趣情境领域,而在大数据的驱动下,多兴趣情境研究也开始出现。刘海鸥等2018年提出一种面向图书馆大数据知识服务的多情境兴趣推荐方法,即通过对用户多情境兴趣的层次划分,利用蚁群层次挖掘的优势来发现目标用户的若干最近邻类簇,然后根据类簇内相似用户对目标项目的评分对未评分项目进行预测,最后结合Mapreduce 化的大数据并行处理方法来进行协同过滤推荐,以此解决单兴趣建模存在的歧义推荐问题,提高多兴趣推荐的宽度和精准性。这表明,用户情境的构成因素是多元的,且每个因素的重要性是不同的,不同情境因素组合后也会呈现不同的用户需求。图书馆可依托大数据、云计算、机器学习等技术和功能,实时动态感知用户的情境因素及对用户产生的影响,进行大数据之间的关联分析与深度挖掘。在情境大数据收集与分析过程中,要注意情境的主体性,即用户个体的服务需求、文化水平、信息素养、行为连贯性与偶然性、情境持续性与突发性等。可将用户需求从显性到隐性细分化,分为五个层次,即清晰表达的需求、行为显示的需求、刺激产生的需求、潜在的需求、无意识的需求。有些需求是由相对固定的群体反映出来的,可以借助静态数据收集与分析来实现,如用户专业不同具有典型的阅读分类。但有些需求只能通过动态数据收集与分析来实现,如某些用户因使用时间、空间、心情、情绪、兴趣、环境等因素不同,相同的图书馆行为也会产生不同的体验结果,这时大数据就需要分析为什么会产生差异结果,哪些情境因素促进用户吸收与体验; 反之,哪些情境因素阻碍用户吸收与体验。
三、保证用户获得的大数据知识服务质量
用户利用图书馆的目的是获得个体无法知道的知识和无法解决的问题。虽然影响用户使用体验的因素较多,但图书馆知识服务的核心功能始终是用户评价的第一要素和核心要素,直接体现为知识服务系统的易用性与可用性。为此,图书馆需要保证用户能够实现或超过原有预期,即为用户提供优质的大数据知识服务质量,将用户原有的简单式经验决策升级为 “大数据式智慧决策”。故此,图书馆首先要保证大数据知识服务系统的数据来源质量,从收集到监控合理设置大数据管理过程。2017年陈臣基于大数据挖掘与知识发现构建了图书馆智慧服务体系。该系统分为数据感知层、数据传输层、数据分析层、智慧服务层 4 个部分,依次实现了图书馆服务的数据化、信息化、智能化和智慧化。该系统既符合大数据的生命周期理论,也符合用户对知识需求的不同层次。同时,遵循实时、动态和可靠原则,对用户各方面数据能够进行最全样的收集、分析与预测,奠定了大数据服务精准、响应与追溯的基础。其次,构建图书馆大数据预警系统,进行风控制、安全对象扫描、安全性审计和安全结果可视化,确保当多个安全事件同时发生时,安全管理系统可依据图书馆服务系统运行和安全威胁的程度,按照安全事件的威胁级别、服务内容等级和读者优先级,在满足图书馆安全管理事件对系统资源需求的前提下,保证读者具有较高的阅读收益率和愉悦感。最后,设计图书馆知识服务质量管理进程表。用户需求处于动态变化中,且需求会越来越高。图书馆应该居安思危,走在用户需求之前,主动设计质量提升管理的规划与进程。质量提升的来源主要有两个方面,一是内部驱动,即图书馆自身积极革新变化,创新服务模式和内容; 二是外部驱动,或是用户反馈与评价中的不足、缺点、弱势等,或是行业内涌现的经典示范,或是相关领域的技术革新等。不论哪个方面,图书馆都应该积极发挥信息行业的敏锐触角,主动提升知识服务的层次和质量。
4平衡大数据管理与用户隐私保护的关系
读者在享受大数据带来便利的同时,也面临着个人隐私泄露的风险。大数据隐私是在静态隐私的基础上进行的精细分析与加工,且各种数据之间存在动态关联,能够进行相互印证,可以说是对用户进行动静结合的精准描述,且具有发展性与预期性。大数据隐私除了基础的身份信息以外,对用户的空间变换、个性、消费观念、价值观、行为习惯等都有覆盖,甚至能够非常清晰、高概率地预测一个人未来的行为及自主决策的各种可能性,对人产生全方位的监控,使得每个人的隐私在大数据技术之下变得完全公开透明,逐渐使人丧失个体的自由度和自主性。马晓亭等2016年指出,读者个人隐私可能会面临 “被肆意收集”、“大数据不完全脱敏”、“隐私权法律界定不清”、“被二次分析与使用”等风险。的确,大数据作为一种快速发展的新事物,由于法律、制度及个人信息管理的缺陷,导致用户在处理大数据分析与用户隐私二者的关系中处于弱势地位,图书馆不同于其他商业机构,公益性决定其更应该关注用户隐私保护问题,不能以大数据智慧推荐为理由牺牲用户的隐私。图书馆可以通过两个方面处理二者关系,一是基于生命周期理论分析大数据开发不同阶段的特征,以及容易产生用户隐私泄露的可能途径。大数据生命周期管理流程分为大数据产生与发布、大数据采集与传输、大数据云存储、大数据计算与分析、大数据应用决策五个阶段,图书馆应对应设置隐私安全动态监控、动态评估、隐私安全管理技术、安全事故审计问责制度、隐私保护法律与行业规定等。二是调查分析图书馆用户对隐私泄露的态度和容忍程度,处理好大數据收集、分析、应用与用户个人隐私保护的平衡关系。实证研究发现,图书馆用户隐私泄露容忍度总体偏低,读者对个人隐私信息持保守态度,隐私关注度高。信息类型敏感性方面,读者最关注交流隐私,即最不能容忍自己的通讯方式、聊天记录等隐私被披露或窃取; 信息接收敏感性方面,不能容忍图书馆随意采集并披露自己的借阅记录,尤其不能容忍图书馆通过网络远程追踪、后台监控等互联网技术手段了解用户使用图书馆的情况; 在信息使用敏感性方面,对与其他图书馆、书商、网络服务商、软件开发商等第三方的数据共享持比较谨慎和保守态度。此外,职业、受教育水平、年龄等个体差异都成为用户隐私泄露容忍度的影响因素。
参考文献:
[1]贾凤旭.基于大数据的信息知识服务系统构建研究[J].图书馆学刊,2017,39(04):114-117.
[2]谭黔林,卢艳兰.大数据时代高校图书馆知识服务模型研究[J].农业图书情报学刊,2016,28(11):157-160.
[3]张宏.我国高校图书馆大数据研究现状分析[J].图书馆工作与研究,2016(07):46-50.
[4]刘桂锋,卢章平,化慧.图书馆大数据知识服务生态体系及其动力机制研究[J].国家图书馆学刊,2016,25(03):52-60.