小数据视角下知识服务的体系建构与伦理反思

2024-08-07 00:00:00柏忠贤季诚钧
编辑之友 2024年7期

【摘要】知识服务智慧化是国家教育和文化数字化战略的重要组成部分,在近年来的大数据技术热潮下,研究者亟须冷静思考小数据的价值。文章首先分析了潜在期、成长期、成熟期和衰退期四类小数据用户,阐释了其个体独特性、实时动态性和适度可控性三方面特征,归纳了包括静态数据、动态数据以及第三方数据在内的三类小数据来源及结构。其次在数据与知识双轮驱动的第三代人工智能思想指导下,以知识图谱为基石,以用户画像为核心,构建了小数据视角下的知识服务体系,提出新型的知识服务需融合多模态数据提高用户画像的精准性,以知识图谱为引擎促进知识管理的认知性,坚持应用为王增加知识服务的多样性。最后,从价值观、正义观、自由观三方面审视小数据视角下知识服务面临的伦理挑战。

【关键词】小数据 知识图谱 用户画像 知识服务 体系建构 伦理反思

【中图分类号】G230 【文献标识码】A 【文章编号】1003-6687(2024)7-045-08

【DOI】 10.13786/j.cnki.cn14-1066/g2.2024.7.006

2022年5月,中共中央办公厅、国务院办公厅印发《关于推进实施国家文化数字化战略的意见》,要求统筹推进国家文化大数据体系、全国智慧图书馆体系和公共文化云建设,增强公共文化数字内容供给能力,提升公共文化服务数字化水平。智慧知识服务是国家文化数字化战略的重要组成部分,在知识服务智慧化形态转化过程中,大数据提供了坚实的技术支撑,但也在社会文化、技术、学术等领域带来诸多挑战。因此,部分学者开始在大数据的狂热浪潮之下,冷静思考小数据对知识服务的重要价值。清华大学人工智能研究院院长、中国科学院院士张钹等学者指出,人工智能已经迈向第三代,其发展的思路是把第一代的知识驱动和第二代的数据驱动结合起来,利用知识、数据、算法和算力等要素,构造更强大的AI,[1]而知识图谱是第三代人工智能的核心技术。本文从小数据思维出发,将用户小数据特点同知识服务过程相结合,以知识图谱为引擎、用户画像为核心,重构小数据视角下的知识服务体系,并对其中存在的伦理问题进行审思,以期增强知识服务系统的鲁棒性和可解释性,提升知识服务的智慧化、个性化、多样化水平,推动智慧知识服务平台建设与发展。

一、用户小数据

随着大数据得到广泛关注和应用,关于大数据的研究逐步兴盛,数据科学、数据思维渗透到人们学习和生活的方方面面。小数据被看作是与大数据相对的概念,关于小数据的研究伴随着大数据的兴起而发展。2013年Estrin正式提出“小数据”概念,指出小数据是全部关于“我”的数据,认为从用户数据中提取的具有个性化特征的数据,将有效揭示用户行为模式和规律。[2]从这一观点出发,我国学者陈臣、马晓亭提出图书馆小数据是以读者个体为中心开展的数据采集、处理、分析和决策活动。[3]曹霞综合多位学者的定义,认为小数据是一种基于个人或单个团队的新兴数据,是具有选择性的、可靠的、可控的、增值的数字化信息。[4]小数据具有关联性大、真实性高、操作性强三大特点。[5]相对于大数据重预测、感知及相关性的特征,小数据更强调精准、个体和因果关系。[6]大数据分析普遍规律,小数据分析独特个性;大数据解决普遍问题,小数据解决个性问题。[7]目前对小数据的研究遍及理、工、农、医以及教育学、图书馆学、情报学、新闻传播学、经济学、管理学等领域,本文主要探讨小数据在知识服务领域的创新研究与应用,以期阐释和厘清认知智能时代小数据的发展新方向。本文认为,小数据思维和 “以人为本”的知识服务理念相契合,在新一代人工智能的驱动下充分挖掘用户小数据的价值,将进一步推动知识服务走向个性化、精准化、智慧化。

1. 小数据用户的类型

知识服务的关键是发现用户的个性化需求。作为面向社会大众的公共机构,知识服务机构需要充分了解用户群体,才能在后续提供的服务中增强与用户间的黏性。本文根据用户不同程度的知识需求,结合生命周期理论,将知识服务用户分为潜在期知识用户、成长期知识用户、成熟期知识用户和衰退期知识用户。

(1)潜在期知识用户。这类用户通常表现为没有明确体现出知识需求或未采取相关的知识行动,但他们具有利用公共机构设施的资格、使用知识资源的能力以及潜在的知识需求。[8]潜在需求和潜在用户存在的原因是多方面的,或是用户对获取渠道或信息质量存在顾虑,或是用户本身没有意识到自己的潜在需求等。这类用户具有较大的开发潜力,是知识服务机构不能忽略的潜在服务对象。

(2)成长期知识用户。这类用户通常对自己的知识需求会采取一定的行动,并产生相应的检索、浏览、借阅等动态数据。根据McClure提出的用户生命周期模型,获得用户之后需要先激活用户,潜在期用户被激活后会从被动获取信息逐渐发展为主动搜索的成长期用户。一般来说,成长期用户是知识服务用户类型中占比较高的一类,他们往往会主动参与到知识活动中,并在此过程中保持一定的信息交流行为。

(3)成熟期知识用户。这类用户通常会积极满足自己的知识需求,同时产生较多的互动数据,具有一定的稳定性。他们是知识服务中最有活力和生命力的一类用户,具有较强的信息需求,能够熟练利用资源和服务。他们在各自的社交圈层内具有一定的影响力,会直接或间接为知识服务平台带来新用户和新价值。

(4)衰退期知识用户。这类用户通常表现为对知识服务的兴趣衰退、热度骤降,在知识服务过程中信息活跃行为有所减少或停止,在连续一段时间内保持沉默状态。他们在心理上不再积极期待新功能和新服务,甚至产生一定的负面情感,在行为上表现为节制、停止、替代、抵制。[9]导致用户兴趣衰退并出现流失现象的原因不仅包含用户个人的主观因素,也包括资源、系统、服务、环境等客观因素。

2. 用户小数据的特征

与大数据不同,小数据鲜明的个体独特性、高度的实时动态性和适度的数据可控性,能够解释用户行为背后的驱动因素,包括人们的态度、决策过程、使用体验等,有助于更精准更深刻地挖掘用户潜在需求,提升个性化知识服务效率,实现知识服务智慧化转型。

(1)揭示个体独特性,便于精准把握用户。小数据以个体为中心,围绕不同个体采集有关人的思想、行为、个性、偏好等的个性化特征数据,[10]开展数据处理、分析和决策活动。在小数据的支持下,平台可以通过个人行为数据发现和预测个人需求特征,破解服务精准程度不足的难题。[11]在知识服务智慧化转型过程中,基于小数据视角进行数据采集、挖掘、分析、融合等,有助于深入理解用户的独特性,发现用户细粒度特征,更精准地绘制个体用户画像,构建小而精的知识图谱,实现个性化资源推荐、适应性路径规划等功能,从而提供更加个性化的服务或产品。此外,处理小数据的用户量较少,在隐私泄露方面的风险较低,有助于识别、分析和预测个体用户可能面临的风险,及时采取干预措施,降低用户和系统的潜在风险。

(2)重视实时动态性,实时感知用户需求。因小数据规模较小,平台可以实时或近实时地处理数据,数据挖掘与分析效率较高。用户的阅读兴趣具有突发、动态变化和受外界环境变化影响等特点,[12]只有确保用户兴趣、偏好等挖掘得准确、实时,才能精准地描摹用户画像轮廓乃至全貌。这需要图书馆等知识服务机构动态反馈信息并控制、优化和完善个性化服务。小数据的获取和收集需做到实时更新和动态存储,实现具体人物具体分析、具体事件具体更新,实时感知对象变化着的信息需求。[13]通过对动态小数据进行挖掘分析,可以揭示用户的阅读需求、行为特征和活动规律之间的因果关系,真正实现知识服务个性化定制和实时推送。[10]在知识服务智慧化转型过程中,小数据有助于更好更快地了解用户的需求、行为模式和偏好,快速响应用户需求,构建动态用户画像,动态更新知识库,及时调整决策方案,适应性推送知识服务资源,更高效地满足用户个性化需求,优化用户的知识服务体验,提高用户满意度和忠诚度。

(3)具有适度可控性,避免资源成本浪费。与大数据相比,小数据的数据量更为可控,数据质量更高,对软硬件的要求相对较低,数据的采集、存储、管理、分析、处理更加便捷和高效。小数据分析所需要的数据量有限,采集、计算和决策的成本较小。在数据2.0时代,小数据可以通过移动阅读终端、传感器技术、可穿戴设备、物联网技术、读者登记等简单方式被用户获取和使用。[14]在知识服务智慧化转型过程中,相对于需要Hadoop、Hadapt、HPCC等高尖端设备平台支撑的大数据,小数据不需要投入巨大的硬件和软件资源,可简化算法,节约算力和人力成本,大大降低了系统处理与资源消耗的成本,具有较强的灵活性、可控性和可操作性,在人力、物力、财力、算力有限的情况下,更加实用、经济。

3. 用户小数据的结构

数据的产生、收集、存储、分析、挖掘、发布与销毁都是智慧图书馆等知识服务机构必不可少的运作环节。[15]小数据关注单个独立的用户,以个体为中心进行数据采集研究,对数据的精确描述要求较高。[16]用户小数据包括结构化数据、半结构化数据和非结构化数据,也可以分为静态数据、动态数据和第三方共享数据(见表1)。静态数据指存储于用户信息管理系统的基本读者数据,包括用户的ID、性别、年龄、职业、教育程度等,这些静态数据可以形成用户画像的基本轮廓,方便对读者进行初步识别和判断。[17]动态数据指用户在搜索、下载、浏览、互动等阅读活动过程中产生的数据,可以在服务监控设备、信息管理系统或阅读终端上获取。此外,借助第三方社交软件也可以进行数据采集,如一些知识服务平台可以将授权账户与微信平台绑定,通过微信平台采集相关小数据痕迹。

二、小数据视角下知识服务的体系建构

在知识经济环境下,传统图书馆等知识服务机构的服务内容和手段已经很难满足用户的需要,[18]存在用户需求多元化和服务模式单一化的矛盾。静态化的知识资源缺乏社交互动功能和情景化功能,面临被动态的互联网知识资源取代的挑战。知识服务须直面这些挑战,紧紧围绕用户的知识需求,着重体现人本主义精神,重视人的价值。[19]本文在分析中融入小数据思维,将用户小数据特点和知识服务过程相结合,融合知识图谱,以用户画像为核心,提出小数据视角下的知识服务体系,主要包括数据处理、资源管理、服务应用三大模块(见下页图1)。通过采集信息管理系统、服务监控设备、智能传感设备、第三方平台中用户的属性小数据、行为小数据、互动小数据和情景小数据,精准构建不同类型的动态用户画像,并对画像进行评估;通过知识的抽取、融合、加工、更新等生成知识图谱,构建各类知识服务领域的知识库,提供个性化、动态化、社交化、情景化和智慧化的知识服务应用;各类应用融入知识服务循环过程,接受用户的有效反馈,完善小数据管理全生命周期的各环节,形成知识服务的良性循环。这在一定程度上能够摆脱以往固定和简单的信息服务模式,提供智慧化、精准化的认知知识服务。

1. 融合多模态数据,提高用户画像的精准性

基于小数据的知识服务需要融合多模态数据,构建精准的动态用户画像,并根据不同类型的画像为用户提供个性化知识服务。小数据视角下知识服务体系中的数据处理模块分为采集层、处理层、数据层、画像层,通过软硬件设施分别采集用户的静态数据、动态数据和第三方数据;所有数据经过清洗和处理,全部转换为结构化数据后,通过构建相关标签体系,结合信任机制形成用户小数据库。在数据层,用户属性小数据可以用于判别用户的基本特征,行为小数据可以用于挖掘阅读行为、知识需求、知识偏好等信息,互动小数据可以用于发现用户之间的关联互动,情景小数据可以用于分析如何给用户提供合适的知识服务情景。同时,小数据库结合相关动态模型,可以做到实时更新,动态记录用户知识需求、知识偏好的变化。如陈臣等设计的读者阅读兴趣发现模型,可以识别读者阅读的长期兴趣和短期兴趣,从而提供个性化定制服务;[8]通过算法设计、数据建模、搭建标签体系等途径构建精准化动态性的用户画像。

用户画像是小数据视角下知识服务体系的关键技术和重要基础,而数据的采集和处理技术是构建用户画像的关键技术支撑。知识服务用户的数据是多模态的数据,包括文本、图片、视频、音频等。首先,可利用移动设备、物联网传感器、摄像头、无人机等感知用户物理空间数据,通过数据挖掘技术采集用户人机交互过程中产生的、存储在云计算设备或者边缘计算设备中的互联网应用数据。其次,可应用向量机模型、卷积神经网络模型、注意力机制等机器学习技术对用户多模态数据进行特征提取、建模融合,利用知识图谱等自然语言处理技术实现跨媒体语义表达和信息融合,增强用户画像的泛化能力、可解释性和鲁棒性。最后,可运用最新的大语言模型从用户文本数据中挖掘和分析用户偏好等行为信息,提取有用信息。大语言模型对用户隐性信息、可疑信息和未知信息等具有强大的理解作用,可以增强用户画像建模能力,提高用户画像的精准性。

2. 以知识图谱为引擎,促进知识管理的认知性

基于小数据的知识服务需要融合知识图谱,开发知识服务平台的认知智能,促进知识管理的认知性。小数据视角下知识服务体系中的资源管理模块包括用户画像评估和知识管理层。很多用户在使用知识服务平台时留下的行为数据并不完整,一些关键性行为数据的缺失会影响画像的清晰度,所以构建用户画像后需要先进行质量评估,画像合格后再进入用户画像应用和知识管理循环。画像质量的评估指标主要包括准确率、时效性、覆盖率等。准确率是用户画像最核心的指标,指被打上正确标签的用户数量占被打上标签用户总数的比例;时效性要求不同类型的标签需建立合理的更新机制,以保证标签的有效性;覆盖率指被打上标签的用户数量占用户总数的比例。此外,用户画像的可解释性和可扩展性也是画像评估需要考虑的重要指标。如果画像评估指标达到了知识服务的要求,则可以将画像结果传输到知识管理环节;如果评估结果未达到应用要求,则应分析画像结果偏差的具体原因,通过返回控制操作,选择性优化和完善小数据处理过程,保证用户画像真实、动态、可用和经济。[2]

知识管理过程由知识生产加工、知识传播、知识再利用的大循环组成。[20]知识服务以信息知识的搜寻、组织、分析、重组为基础。平台要想提供高质量的知识服务,需要在海量的信息资源中做好知识发现工作,并基于知识图谱对知识进行组织、融合、推理和学习等。[21]知识服务平台中海量的信息资源需要进行知识发现、知识清洗、知识抽取、知识融合、知识加工等步骤才能构建优质的知识图谱,生成可用、易用、可视化的知识内容,从而不断丰富知识服务平台的知识库,为用户提供高质量的知识产品。知识传播是整个知识服务过程的核心,知识服务平台以用户画像和知识图谱为基石,分析不同类型用户需求以及各个知识、用户间的关系,为用户提供知识检索、知识导航、知识问答、知识应用、知识推送、知识共享等智能化知识服务与传播手段。知识服务平台中的各类数据会随着时间的推移而不断变化更新,知识库也需要通过知识循环加工不断进行知识更新,消除无用或质量低劣的知识,使知识库保持动态更新和管理,从而更好地实现知识再利用。

3. 坚持应用为王,增加知识服务的多样性

基于小数据的知识服务需要坚持应用为王,开发集成化、智能化、多元化和国际化的优质知识服务应用,构建线上线下相结合的知识服务模式,不断丰富和优化知识库,增加知识服务的多样性。小数据视角下知识服务体系中的服务应用模块包括知识产品层和服务层。开展知识服务形成的“知识产品”既不是一个简单的结论或数据,也不是一堆现成文件资料和数据的堆积,[22]而是经过知识挖掘、整合重组、深度加工等多环节形成的高质量成果。知识服务领域包括学科知识服务场景、参考咨询服务场景、情报服务场景、教育培训服务场景等。[20]知识服务商需要根据用户需求开发各类场景的平台、小程序、APP、人工智能助手等知识服务应用,在知识产品层面分别形成学科知识库、咨询知识库、情报知识库和教育知识库,并根据用户画像分析知识产品,迭代优化知识服务应用,动态更新知识库,优化用户体验,构建线上线下融合的知识服务模式,最终促进知识服务个性化、动态化、社交化、情景化和智慧化转型。同时,知识服务平台要实时跟进知识服务整体过程,动态收集用户反馈,构建用户和知识产品等的评价指标体系,对知识服务各环节进行评价,从而不断改进各模块各层次的结构和内容。

知识服务机构可以根据潜在期、成长期、成熟期、衰退期不同类型的用户画像提供个性化多元化的知识服务。首先,知识服务平台需要利用多样化的用户渠道,加强宣传引导,消除潜在期用户的信息顾虑,增强其对平台的信任感,鼓励和激发潜在用户参与到知识服务活动中。其次,对于成长期用户,要优化用户体验,通过多种途径推广多样化知识服务,立足用户的实际知识需求,增强用户的阅读兴趣及激活率。再次,在激活用户后需注重用户留存率,向成熟期用户提供全面、优质、丰富的知识服务,以高质量知识传播提高用户的满意度。最后,对于衰退期用户,一方面可以建立用户激励机制,扩展互动渠道,及时优化用户体验;另一方面可以探索新型服务模式,加强口碑营销,推动用户自传播,在提高用户留存率的基础上吸引更多新用户。[23]

4. 重构用户与知识的交互关系

(1)重构用户至上的服务理念。早在2017年,学者初景利就指出,图书馆需要重新打造知识服务的能力,重新认知“以用户为中心”的服务理念,重新构建“用户在哪里,服务就在哪里”的服务精神。[24]知识服务的核心目标是针对性满足用户的知识需求。虽然现有研究构建了各类用户画像和服务模式,但大数据的多样性、异质性及庞大的数据规模等都给具体实践带来极大挑战,[25]用户画像、知识生产和知识服务的有效性并没有得到充分验证,存在的问题也无法及时反馈。从大数据中延伸出来的小数据微观思维,有助于知识服务机构更好地应对大数据时代的挑战,契合“用户至上”的服务理念。

(2)提升个性化知识服务的精准性。小数据具有独特性、动态性、可控性优势,通过采集用户静态、动态小数据,结合相关模型实时更新用户数据库与知识库,可以提升个体画像的细粒度。同时,在小数据的支持下用户的知识需求被放大,知识服务机构能更清晰地了解用户实际需求,针对性地开展服务工作。知识服务平台可以根据用户属性小数据、行为小数据、互动小数据、情景小数据细分用户的知识兴趣与需求,从而定义潜在期、成长期、成熟期、衰退期用户的特征。只有掌握用户深层次需求,为不同类型、不同层次、不同需求的用户提供个性化服务,才能推动知识服务不断向精准化发展。

(3)提高知识服务创新的主动性。传统的知识服务模式强调服务方的主动性,用户作为接收方多是被动地接受服务内容。如今,知识服务用户处于泛在化的知识环境中,一方面他们的知识需求层次与复杂化程度在不断提高,另一方面知识再创新的需求愈加强烈,用户不再单单满足于获取知识,而是希望通过知识创新知识。[26]从PGC到UGC,用户已经主动参与到知识创新体系中,知识服务模式需要提供交互创新的渠道。在小数据视角下的知识服务模式中,用户可以主动参与整个知识服务体系的优化进程,通过服务层进行有效反馈,帮助平台针对性完善知识生产加工、传播、再利用等环节,更新知识库,形成服务创新的良性循环。

(4)促进知识服务数据互联互通。在这场“小数据革命”中,用户小数据将为知识服务带来多方面的变革,产生顺应新趋势、促进图书馆等知识服务机构智慧化的新亮点。[27]学者程焕文将智慧服务视作智慧图书馆的终极目标,主张智慧服务的发展程度依赖于智慧服务体系的设计和运转。[28]因此,知识服务平台应做好小数据的价值挖掘工作,促进数据库不断完善和更新,利用用户小数据实现面向个体的精准知识服务,[5]消除大数据时代知识服务体系的弊端。小数据视角下的知识服务更注重个体用户的特征和反馈,有利于动态调整知识服务功能,规范服务模式。用户小数据和大数据相互融合之际,整体数据的价值密度将得到提高,各类知识服务平台将被打通,形成万物互联的数据中心,真正实现互联互通互应用。

三、小数据视角下知识服务的伦理反思

从过去简单地为用户提供信息检索服务,到如今个性化、智能化、多元化的知识服务,数智时代下人们信息获取渠道和方式的改变,给图书馆等知识服务机构带来诸多伦理挑战。知识服务机构提供的知识服务是否符合伦理规范,对其自身、社会和公众有着深远影响。因此,有必要审视小数据视角下知识服务带来的伦理问题。

1. 价值观:工具理性和价值理性

智慧图书馆的理想状态应该是工具理性和价值理性的合理呈现,[29]知识服务亦是。马克斯·韦伯笔下的工具理性是一种以技术崇拜与利益优先为取向的信息价值观,价值理性则关注行动本身的价值,追求更合理而有意义的实践路径。在小数据变革知识服务的过程中,也会出现工具理性凌驾于价值理性的现象,因此建立数据价值观尤为必要。知识服务除了满足有用性的要求外,还要顾及用户在本能层、行为层、反思层三个层次的体验,包括用户感官体验、用户操作体验和用户情感体验。[30]在小数据视角中追求知识服务与用户需求精准匹配的同时,让用户在享受服务的过程中有更好的体验,形成更具社会公共性、人文关怀的服务模式,是当下数据运用泛滥之下价值理性回归的诉求。

树立小数据视角下知识服务的正确价值观需要处理好四组关系。一是用户中心主义与利润最大化的关系。用户中心主义强调以用户为中心,高度重视用户的实际需求,充分运用新技术、新理念、新模式,为用户提供优质的知识服务。利润最大化提倡以追求经济利益最大化为目标,可能会忽视用户的真实需求,损害用户的合理权益。知识服务机构应秉持用户至上和可持续发展的理念,平衡好经济效益与用户体验之间的关系。二是规模化与个性化的关系。规模化主张为不同用户提供趋向同质化的产品和服务,主要目标是扩大用户范围、追求用户规模。个性化主张尊重用户的不同个性、文化、风格和喜好,根据用户需求特征为用户提供个性化服务。知识服务机构应坚持规模化和个性化相统一,在扩大知识服务规模的同时,充分考虑用户的个性化需求。三是服务效率与服务多元化的关系。服务效率主要需考虑利用技术手段提高用户获取知识的便捷性和快速性,但容易忽视用户获取知识的主观能动性和服务需求的多样性。服务多元化以充分调动用户的主观能动性为目的,便于用户主动寻求多样性的服务。知识服务机构应在提供算法推荐等服务提高用户获取知识效率的同时,引导用户主动获取多样性信息。四是个人发展与社会进步的关系。知识服务机构设计知识服务平台和模式时应以马克思主义为指导,在促进个人全面发展的同时,引导其承担社会责任,追求长远社会利益,促进个人发展与社会进步相统一。

2. 正义观:权利保障和服务平等

亚里士多德将正义划分为总体的正义和具体的正义,具体的正义又包含分配正义、回报正义和矫正正义。[31]随着人工智能的发展,由于算法设计的偏差、决策的黑箱性和社会文化因素等的影响,基于小数据的知识服务出现了算法歧视和数据杀熟等不良现象,导致数据主体在享受知识服务的过程中遭受了不公平的待遇,还面临个人隐私泄露、版权侵害等问题,违背了总体的正义。从用户视角看,应加大对小数据服务的宣传和解释力度,让用户能够理性客观地评估小数据的利弊。从知识服务平台视角看,在小数据采集处理环节应和用户、第三方平台达成合作协议,避免对用户隐私的泄露和滥用。此外,保证知识资源和服务平等惠及每一个用户,让他们都能享受小数据带来的福利,是遵循分配正义和回报正义的基本要求。对于非自愿授权数据的用户,知识服务机构要采取一定的补偿服务措施,履行矫正正义的原则。

正确树立小数据视角下知识服务的正义观需要加强三个层面的建设。一是监管层面的建设。政府和机构要制定相应的法律规定,对智能技术的应用进行规范与管理,从法律政策上约束算法等技术的使用行为和场景,公平分配信息资源与服务,设立相关的监测机构,制定保护措施和应急方案,实时动态监测和预警各类知识服务平台的信息安全风险。二是研发层面的建设。知识服务机构要高度重视信息安全、数字版权保护等工作,加强相关人才培养和引进,加大资金投入,推进区块链等技术在隐私保护、数字版权保护等领域的研发和应用,提高知识服务平台算法透明度和信息安全等级。三是宣传层面的建设。相关机构和部门要加强个人隐私保护、数字版权保护等方面的宣传力度,充分运用数字化技术,多举措多渠道提升用户数字素养,缩小用户数字鸿沟,建立健全数字素养评价体系,提升全民数字素养与技能。

3. 自由观:阅读限制和知识自由

知识自由作为知识服务平台的核心理念,是一种人与知识关系的合理呈现。随着知识服务机构的服务意识普遍提高,用户选择知识渠道的自由度也在逐渐提升。然而,维护社会稳定和发展、促进个体全面健康发展、保护文献和知识权利离不开必要的阅读限制。[32]一方面,知识自由和阅读限制相辅相成,为体现服务的最大公共性和保障公众安全,在运用小数据引导用户使用知识资源的过程中需保持适当的阅读限制。另一方面,用户信息素养不均衡也会产生阅读限制,新技术导致的数字鸿沟不仅影响小数据采集的范围和精确度,也影响用户获得个性化知识服务的能力和效度。[33]

树立正确的小数据视角下知识服务的自由观需要遵循两个原则。一是算法推荐与自由选择相统一。个性化推荐、用户画像、知识图谱等技术的应用一定程度上缓解了学习迷航、信息孤岛等问题,提升了知识服务的效率,但也造成了信息茧房效应,限制了用户获取信息的广度和自由度。知识服务机构在研发知识服务平台和提供知识服务时,要充分保障用户自由获取多元化和泛在化知识的能力,从平台、技术、模式、路径等方面为用户提供多样化的服务选择,确保用户能自主使用和共享其个人信息,完善其在知识服务平台自由进出的通道。二是用户广度与阅读深度相统一。阅读推广是知识服务的重要举措,图书馆、学校、社区、出版社等机构要积极开展图书角、阅读节、读书分享会、阅读竞赛等活动,利用互联网和新媒体平台打造线上线下相结合的阅读推广模式,增加用户群体的广泛性,保障知识服务的多样性。同时,知识服务机构要把提高阅读质量放在首位,以用户体验为核心,以用户隐私保护、知识产权保护、信息安全等为底线,秉持绿色发展、可持续发展的理念,保障用户阅读的深度,促进知识服务业高质量发展。

结语

在大数据时代,从小数据视角思考知识服务是落实国家文化数字化战略的创新举措,对推进国家文化数字化建设和知识服务生态体系构建具有重要意义。如今,知识服务的数据量和服务能力已不再是影响用户获取知识的效率和阅读满意度的关键因素,准确、实时、动态地实现智慧化知识服务,才是保证平台和用户之间黏性的有效措施,才能加快知识服务的智慧变革与服务创新,助力新质人才培养。小数据的特征、结构和价值,势必对我国知识服务体系构建带来不容小觑的变革力量,但受技术、制度、主观精神等因素的影响,在小数据采集、处理、挖掘、分析过程中,也存在着一些伦理问题,需要知识服务机构高度重视、时刻警醒,在遵循价值观、正义观和自由观准则的基础上最大化发挥数据价值,促进知识服务的个性化、动态化、社交化、情景化和智慧化发展。面向未来,随着第三代人工智能的成熟,AI从感知智能迈向认知智能,在数据与知识的双轮驱动下,在日渐盛行的大语言模型的支持下,知识服务将更具安全性、稳定性、精准性、主动性、可扩展性和可解释性。

参考文献:

[1] 张钹,朱军,苏航. 迈向第三代人工智能[J]. 中国科学:信息科学,2020,50(9):1281-1302.

[2] Estrin D. Small data, where n= me[J]. Communications of the ACM, 2014, 57(4): 32-34.

[3] 陈臣,马晓亭. 基于小数据的图书馆用户精准画像研究[J]. 情报资料工作,2018(5):57-61.

[4] 曹霞. 国内图书馆界小数据研究进展[J]. 图书情报工作,2020,64(14):145-151.

[5] 张阳. 基于读者小数据的“智慧图书馆+”精准服务分析[J]. 江苏科技信息,2022,39(20):20-22.

[6] 阮光册,夏磊,周萌葳. 跨媒体智能视角下的知识服务探析[J]. 情报理论与实践,2021,44(7):79-85.

[7] 牛勇. 基于小数据的图书馆知识社区构建研究[J]. 图书与情报,2016(2):58-61.

[8] 何静,周彤. 长尾理论与公共图书馆潜在用户需求的对接研究[J]. 图书馆,2011(6): 26-28.

[9] O4MojvdkatPoeFCv6PGeCF8WPxny9u7xIzo9GNzzm+8=冯龄萱,魏群义. 高校移动图书馆流失用户画像模型构建[J]. 国家图书馆学刊,2021,30(1):14-24.

[10] 马晓亭,陈臣. 基于可信小数据的图书馆butwkS3FVPqmbHAp6akuY5fFiIvuRXpZIXWjKhGHEoI=个性化服务研究[J]. 图书情报工作,2015,59(4):70-75.

[11] 张凤斌. 高校图书馆学科服务小数据系统的构建与优化[J]. 图书馆,2021(11):64-68.

[12] 陈臣,李强. 基于小数据决策的读者兴趣发现与预测[J]. 情报科学,2017,35(5):75-80.

[13] 宫长瑞,轩宣. 从大数据到小数据:思想政治教育精准发展的新思考[J]. 思想教育研究,2021(1):26-31.

[14] 王欣,张冬梅. 大数据环境下基于高校读者小数据的图书馆个性化智能服务研究[J]. 情报理论与实践,2018,41(2):132-137.

[15] 陆康. 数据圈背景下的智慧图书馆数据汇聚研究[J]. 现代情报,2019,39(10):102-109.

[16] 周欣. 大数据环境下基于“小数据”挖掘的学科知识服务研究[J]. 高校图书馆工作,2020,40(6):66-69,84.

[17] 晁明娣. 面向图书馆精准服务的用户画像构建研究[J]. 图书馆学刊,2019,41(4):106-111,130.

[18] 陈臣. 基于大数据挖掘与知识发现的智慧图书馆构建[J]. 现代情报,2017,37(8):85-91,97.

[19] 吴智勤,柳益君,李仁璞,等. 基于社交网络的高校图书馆用户画像构建研究[J]. 图书馆学研究,2018(16):25,26-30.

[20] 徐国娟. 浅析人工智能背景下图书馆的知识服务模式[J]. 文山学院学报,2019,32(6):105-108.

[21] 柳益君,李仁璞,罗烨,等. 人工智能+图书馆知识服务的实现路径和创新模式[J]. 图书馆学研究,2018(10):42,61-65.

[22] 庞素琴,王焕竹. 浅谈图书馆知识服务的特点及模式[J]. 内蒙古科技与经济,2009(1):145-146.

[23] 朱雅彬. 高校移动图书馆App用户流失实证研究[J]. 图书馆学研究,2020(10):39-45.

[24] 初景利. 数字化网络化与图书馆服务的战略转型[J]. 图书与情报,2017(1):98-104.

[25] 高广尚. 用户画像构建方法研究综述[J]. 数据分析与知识发现,2019,3(3):25-35.

[26] 刘双,钱澄澄,周聪. 图书馆转型背景下的社区知识服务模式研究[J]. 图书馆理论与实践,2022(3):123-128.

[27] 梁艳妃,于兴尚,梁荣贤. 小数据在智慧图书馆中的价值评估和应用研究[J]. 图书馆理论与实践,2023(2):71-76.

[28] 程焕文,钟远薪. 智慧图书馆的三维解析[J]. 图书馆论坛,2021,41(6):43-55.

[29] 柏忠贤,夏如意,赵磊,等. 元宇宙视域下智慧图书馆学习空间构建:原则、模型、特征与挑战[J]. 图书馆理论与实践,2023(3):86-93.

[30] 诺曼. 情感化设计[M]. 付秋芳,程进三,译. 北京:电子工业出版社,2005:5.

[31] 宋希仁. 西方伦理思想史[M]. 北京:中国人民大学出版社,2004:74-76.

[32] 沈光亮. 知识自由与阅读限制[J]. 图书馆建设,2010(7):26-29.

[33] 陶海柱. 基于小数据的图书馆个性化服务伦理问题研究[J]. 图书馆建设,2020(6):57-62.

System Construction and Ethical Reflection of Knowledge Services from Perspective of Small Data

BAI Zhong-xian1,2, JI Cheng-jun3(1.Jing Hengyi School of Education, Hangzhou Normal University, Hangzhou 311121, China; 2.Information Technology Center, Communication University of Zhejiang, Hangzhou 310018, China; 3.China Educational Modernization Institute, Hangzhou Normal University, Hangzhou 311121, China)

Abstract: Knowledge service intelligence is an important part of the national strategy for the digitalization of education and culture. In the midst of the big data technology boom, there is an urgent need to think dispassionately about the value of small data. Firstly, the article analyzes the four user types of small data in the potential, growth, maturity and decline periods, explains its individual uniqueness, real-time dynamics and moderately controllable characteristics, and summarizes the three types of small data sources and their structure, including static data, dynamic data and third-party data. Secondly, under the guidance of the third-generation artificial intelligence driven by both data and knowledge, it constructs the knowledge service system from the perspective of small data. It takes knowledge graph as the cornerstone and user profile as the core, proposing that the new knowledge services need to integrate multimodal data to optimize the accuracy of user profile, promote the cognitive nature of knowledge management using knowledge graph as the engine, and insist on the principle of viewing application as the king to enhance the diversity of knowledge services. Finally, it analyzes the interaction reconstructed by small data between users and knowledge, and reflects on the ethical challenges from the viewpoints of values, justice and freedom.

Key words: small data; knowledge graph; user profile; knowledge service; system construction; ethical reflection