隐私与价值:数智时代我国图书馆数据秩序平衡之道*

2022-02-09 05:23陆兴华
新世纪图书馆 2022年12期
关键词:数智价值图书馆

陆兴华

0 引言

互联网发展至今,数据已成为支撑人工智能、区块链、云计算等技术的“养料”,在所应用的场景中变得越来越重要了。随着社会的发展,催生了政府数据的开放制度,各国政府纷纷在线公开其掌握的公共数据资源供公众利用[1]。政府数据开放是数字政府、数据经济以及数字社会建设的关键环节,其中所包含的与人及其行为相关的信息对于社会发展和个人都有重要意义,而含有大量敏感信息的数据开放利用也成为威胁组织或个人隐私等合法权益的问题。2021年09月01日实施的《个人信息保护法》成为规范公共数据开放利用、保护个人合法权益的重要依据。

数智时代,图书馆的精准营销、个性化业务等服务是建立在对用户需求感知基础上,是对用户数据进行挖掘、分析而来,其过程是实现个人数据开放共享与驱动创新生态的路径。可以说数据应用逐渐成为图书馆关注、研究的对象之一,但需要注意数据存在的二元属性,尤其是社会生产活动对数据资源的需求与日俱增[2]的环境下,图书馆在为用户服务过程中需要妥善解决用户数据安全与保护兼顾的问题。在图书馆对个人数据使用日趋频繁的环境中,对数据的价值与隐私二元属性平衡的探讨具有一定的现实意义。

1 在信息技术应用加持下的图书馆数据价值

《国际图联趋势报告》 (IFLA Trend Report) 将人工智能列为四大技术趋势之一[3]。人工智能与图书馆密切相关,今天图书馆界和情报界要做的,不是跟在这一热潮的后面,而是要利用自己的专业优势,参与并在人工智能的发展中有所作为[4]。一些智能分析应用日趋成熟,这需要数据支持,如卷积神经网络 (Convolutional Neural Network, CNN) 和协同过滤 (Collaborative Filtering)等为图书馆的智慧服务提供了实现的方法[5],提高了服务效率。美国图书馆协会 (American Library Association, ALA)将区块链技术列为未来图书馆重大变革性技术列表[6],也给图书馆数字版权管理带来新的思维[7]。区块链的去中心化、不可篡改、开放与透明以及安全可信等特征已成为数智时代图书馆信息共享、版权保护、身份认证、资源存储以及网络众筹等业务实施新的变革支撑点[8]。

云计算并不是一种全新的网络技术,而是一种全新的网络应用概念。云计算的核心概念就是以互联网为中心,在网站上提供快速且安全的云计算服务与数据存储[9],最终实现计算与数据资源的集中汇聚。国外图书馆租用云计算服务已经成为常态,包括IaaS(Infrastructure-as-a-Service,基础设施即服务 )、PaaS(Platform-as-a-Service,平台即服务)、SaaS(Software-as-a-Service,软件即服务)[10]。租用云服务本质上就是将图书馆的服务通过外包给云计算服务商,提供图书馆文献资源数据相关服务。我国图书馆近些年来也在积极探索云计算相关业务,包括云计算、业务流程重组、私有云建设以及下一代图书馆系统的云部署等,形成“数据—系统—应用”三位一体的服务模式。云计算改变了传统图书馆的服务模式,不仅重建图书馆业务生态体系,而且提升了图书馆服务效率,降低了图书馆运营成本。但是,云计算的数据安全、数据隐私以及数据权利等现实问题也困扰着图书馆[11]。

在大数据、云计算、人工智能以及区块链等新兴数字技术的推动下,互联网空间发生了翻天覆地的变化,这种变化从原来以信息技术基础相互关联网络转变为嵌入式的信息空间,使得人们可以通过设备、系统平台便捷自由地利用数据流的挖掘、分析以及应用[12]寻找出已知或者未知、公共或者私人的信息,从而在开放多元的渠道中获取大数据中蕴含着的巨大商业价值和支持科学决策的价值信息[13]。可以说数据不仅能够勾勒出用户个人世界,也能够预测系统、行业甚至学术领域的演变趋势,对社会生产、学术研究起到促进作用,使其成为当前学术交流中极具魅力的话题。从这一价值角度来说,数据对于图书馆无论是用于开展用户服务(用户行为数据价值),还是用于开展知识服务(文献资源数据价值),都是智慧服务关键所在。

数据资源一般是特定项目中已有可重用的数据,这是图书馆数字资源的基础。图书馆文献资源数据以及支撑智慧服务的用户行为数据属于具有隐私特征性质的资源。长期以来,图书馆一直以此类数据应用创新来促进服务发展,并且取得了一些成就。从数据应用角度来说,图书馆数据价值的体现主要集中于文献资源建设、用户智慧服务以及空间智慧管理等方面,其中个人数据的虚拟替代、多元共享、跨界融合、智能即时成为智慧服务与智慧管理数据价值获取是涉及隐私问题的关键所在。数据在图书馆的文献资源建设中的价值性源自于数字图书馆,资源的数字化其核心就是以数据作为载体。随着数据智能以及物联网技术的不断发展,图书馆和用户之间的服务模式也不断改变,数据作为资源被用作文献服务,同时也被用作获取用户各类需求的因素,其中包括资源需求、空间需求等。数据的价值性随着图书馆服务的拓展而不断衍生,逐渐形成“服务—感知”双重特性。

数据对图书馆业务发展所起到促进作用,其核心在于其具有价值性内容,包括虚拟替代性(信息、读者等)、多元共享性(多系统、多渠道关联)、跨界融合(涉及多方应用)、智能即时等。然而,数据作为资源与引用的重要中介,也需要进一步厘清价值与隐私关系,做到利用与保护的平衡。

2 图书馆数据应用的隐私保护

大数据技术的发展给人类社会带来极大便利的同时,科技创新、服务创新所带来的传统模式转型也带来了安全、用户权益方面的问题,而个人信息安全与数据隐私是用户所关切的问题之一[14],显得尤为重要。近些年,Facebook、携程、网易、天涯等企业都出现过隐私泄露事件,加剧了社会各界对个人信息安全问题的担忧。早在2016年业界就对数据应用的复杂性作了研讨,并在中国高校图书馆发展论坛以“机遇与挑战并存:大学图书馆可持续发展策略及实践”为主题,在探索我国图书馆远景规划与协同发展、深层次服务与拓展服务、空间再造与服务推广、服务能力建设与用户信息素养培养等方面,深刻认识到当前图书馆发展的复杂性,认为数据作为促进图书馆发展重要的资源,虽然在可持续发展方面有着举足轻重的作用,但隐私也是需要关注问题之一[15]。对于数据应用及其隐私保护问题,笔者认为目前图书馆界的主要隐私保护在以下三个方面需要关注。

首先,图书馆开展智慧服务时要注重数据的隐私保护。数据是图书馆开展智慧服务的基础,不仅是生产要素,也是与其他生产要素相互融合,发挥倍增效益的来源,其中个人数据就是感知用户需求的主要来源。数据要素的特征包括虚拟替代、多元共享、跨界融合与智能即时,这也是隐私保护所要关注的内容。

其次,在虚拟替代用户的应用场景中,要展开隐私保护。图书馆智慧服务对数据有着强烈的需求,其中虚拟替代用户个人身份,成为隐私保护新的对象,而多元共享、跨界融合以及智能即时等都是围绕虚拟替代用户个人身份来展开隐私保护,匿名化、模糊化等技术方法隐藏用户的身份核心信息成为主要的技术方法,也是当前图书馆用户数据保护的主要途径。

最后,在数据逐渐向资产化转变的过程中,要注重平衡数据价值与隐私关系。传统的用户数据保护模式已经不能适应大数据环境下的智慧图书馆对数据的应用需求,尤其是数据价值倍增与隐私风险突出的矛盾成为数据应用需要平衡的问题。笔者认为,数据的生产力属性及其技术支撑等在将数据逐渐向资产化转变,运用资产管理模式来平衡价值与隐私关系将成为图书馆个人数据治理促进服务创新的重要路径。

3 数智环境下数据价值应用与隐私保护制度基础

图书馆在数智时代要赢得机遇,应对挑战,除了目前在用户隐私保护方面采取的一些技术措施和制度外,还需面对数智技术发展所带来的新问题,例如虚拟替代逐步增强后,个人数据就具备了隐私属性,如通信、邮件、照片以及活动轨迹等信息。利用学习分析、用户画像等模型等进行用户数据分析,“勾勒”出用户生活的方方面面,如不加约束,就容易造成对隐私的侵犯。

数智环境下,数据应用要做到合法、合规,让用户拥有知情权与选择权,这种面上的制度保障并不困难,但是云计算、人工智能、区块链等去中心化,数据的二次、多次使用行为,想要做到制度全面贯穿,面面俱到,并非易事。另外,互联网广泛应用的、面向用户的隐私权利方案仍然存在着不合理性,这是由于建立在传统保护基础上的通过匿名化、模糊化对隐私数据加以保护技术,已不能够满足当前数智环境下社会对数据的共享需求。

欧盟的《通用数据保护条例》(General Data Protection Regulation,简称GDPR)仍然坚持完善个人信息条款来保护用户数据隐私,同时《网络安全法》及其衍生的个人信息保护方面的标准——《信息安全技术 个人信息安全规范》等都遵从着制度保障理念,但是冗长的隐私政策和乏力的“知情—同意”机制在数智时代不断招致“隐私已死”的悲观论调。用户个人信息保护意识随着数据的广泛使用而逐渐增强成为当下数据应用矛盾的两个方面。《公共图书馆法》第43条中“公共图书馆应当妥善保护读者的个人信息、借阅信息以及其他可能涉及读者隐私的信息,不得出售或者以其他方式非法向他人提供”的表述中虽然得到一定体现,但数智时代用户个人信息以数据的形式存在,并且伴随着图书馆数据应用直接影响着图书馆业务实施的效果。从现实情况来看,数据二元属性使得数据对于数据隐私保护与价值利用普遍存在着两者对立的误解,认为隐私保护降低了数据共享效率,对创新发展有阻碍作用。法律经济学者Richard Posner认为,隐私并不是人们所感知的那样,具有多数人所相信的社会价值。所以笔者认为,数据隐私并非数据共享等数据使用行为的对立面,而是对数据使用行为的控制。

4 图书馆数据价值应用与隐私保护原则

数据对图书馆业务产生的影响包括用户服务、馆员能力、业务管理、资源结构等方面,而对图书馆学研究的影响已在研究工具、研究热点、研究方法、研究内容、研究对象、研究趋势等方面改变着学科研究内容[16],这些影响都将改变传统图书馆以文献资源为中心的服务体系,促使图书馆利用数据,借助数智技术实现智慧服务创新的方向转变。

“数智”本质是大数据、人工智能、云计算、物联网等新一代技术思维与技术应用,而大数据支撑的智慧图书馆发展以及新型信息基础设施建设赋予了图书馆新机遇[10],其中,大数据与人工智能应用涉及到的数据成为图书馆发展的重要资源之一,也成为图书馆关注的焦点,某种程度上占据主导地位[17]。与此同时,用户对个人数据安全的关注也越来越高,不能合理使用数据,有可能触犯法律。因此,数据应用在往广度与深度发展的同时,隐私与价值两者之间的关系需要做到有效平衡,才能避免引发安全问题。

4.1 以用户权益不受侵犯为前提来发掘数据价值

数智时代,以数据生成资料属性开展的一系列创新,促进了社会发展的同时也侵犯了传统意义上的用户隐私权益。长期以来,对于数据隐私与数据价值存在着对立的误解,认为隐私保护降低了数据价值的发掘,对社会创新发展有阻碍作用。然而,数据隐私保护虽然在一定程度上影响了数据价值的获取,但是该机制能够在生产资料属性方面促进数据安全、有效、稳定、长久地为社会发展作贡献。

数据价值需要真实、可靠的数据资源供各类工具来挖掘,而真实、可靠的数据需要完善的数据隐私保护机制来保障。我国多部法律并行推动数据保护规则的完善,例如《网络安全法》(2016)、《电子商务法》 (2018)、《民法典》第四篇《人格权》 (2020)、《数据安全法》 (2021) 《个人信息保护法》(2021)等,这些不同性质法律规范虽然制定的初衷不同,但却可以推动图书馆从“数据隐私保护”向“数据治理保护和应用”转变,尤其是近期颁布实施的《数据安全法》 《个人信息保护法》,对数据隐私、数据价值有着明确的法律规定,强调了用户权益。在数据应用过程中,分类治理、多元并进、多源创新等数据开放共享政策,有助于实现数据价值与隐私平衡。其中分类治理将数据分为个人数据与非个人数据,强化个人数据的授权开放共享,并将个人数据重点区分为个人敏感数据与非敏感数据,突出个人敏感数据的人格权,重点隐私权保护,利用《个人信息保护法》等增强隐私数据的控制力,充分保障用户的“知情——同意”权利。因此,数智时代图书馆需要进一步完善数据治理体系,围绕图书馆的用户需求、用户价值、社会价值以及馆员价值等体系内容,进一步在用户、图书馆、馆员等共同作用下实现数据治理模式优化,进一步厘清个人数据与非个人数据,个人敏感数据与非敏感数据等,并进行分级管理,将个人非敏感数据作为用户活动的副产品,汇聚用户行为数据具有较高的业务价值,促进图书馆业务的健康发展。

4.2 以业务发展为核心内容来挖掘数据价值

大数据技术在给社会带来多方面积极变化的同时,其野蛮生长与广泛运用也给人们的隐私带来了一系列的伦理困境,包括数据挖掘与隐私信息的整合、数据预测与隐私信息的呈现、数据监控与隐私信息的透明、数据分享与隐私信息的扩散等方面[18]。隐私权传统规范基础以用户个体为本位,以私人和公共为二分法,围绕空间、事物与主体维度,并且从用户个体本位转向社会本位,从控制范式转向信任范式,从独占维度转向沟通维度,从二元对峙转向一体多元,从权利视角转向权力视角,从概念独断转向语用商谈[19]。

隐私泄露也随着数据使用频繁而风险加大,直接影响了数智时代图书馆有序发展,进而会在很大程度上阻碍技术创新、服务创新。智慧图书馆存在和产生依赖于用户需求,用户需要是图书馆发展的不竭动力[20],由此数据驱动创新需要充分发挥,需要破除数据价值与隐私保护的悖论问题。智慧图书馆领域需要构建便利的数据开放共享与激励数据驱动创新生态,以实现数据要素价值的最大化释放。数据之所以有生产资料属性,就是因为其拥有第三方所需的用户信息,其中包括资源使用数据,也包括空间使用数据,用户借阅行为数据、数字资源访问行为数据、入馆数据以及选座数据等,“学习分析”“用户画像”等数据价值发掘就是通过自动化方式处理用户数据的活动,而该活动用于评估、分析、预测用户的特定方面,涵盖了个人数据信息的各种活动。根据欧盟GDPR、我国《个人信息安全规范》对个人数据使用的明确规定,其中对个人敏感数据的数据价值发掘活动是明令禁止的,除非数据主体出于自身目的给予明确同意或者数据价值发掘活动出于重大公共利益所必需,例如新冠肺炎患者或者接触者的轨迹追踪等。所以,图书馆对业务数据价值的发掘,需要图书馆根据《个人信息安全规范》等法律标准的要求,在加强个人数据使用规范的前提下来保障业务的实施。

5 图书馆数据价值应用与隐私保护之间的平衡之道

5.1 法治平衡

数智生态中,数据处理的形式多样,无论是数字资源的组织,还是根据用户数据来实施“学习分析”“用户画像”开展“智慧”服务,可以说图书馆涉及的数据使用面较为广泛。数智时代的到来,技术发展日新月异,我国图书馆创新也是基于此背景下广泛使用数据,例如CADAL以虚拟现实技术重构图书馆信息资源建设等[21]。然而,我国图书馆现有正式制度《公共文化服务保障法》《公共图书馆法》《数字图书馆资源管理指南》《数字图书馆安全管理指南》等都无法全面涵盖数据隐私、数据价值等数据二元平衡方面的问题。因此,需要借助于《民法典 人格权编》 《公共图书馆法》 《网络安全法》 《数据安全法》 《个人信息保护法》《个人信息安全规范》《大数据安全管理指南》等法律、标准以及技术方案共同构建图书馆智慧服务体系,让数据价值更好地为图书馆的“智慧”发展服务。

5.2 共治平衡

从建立制度的滞后性来说,图书馆创新的“无制可约”现象符合社会发展的规律。当今现行的个人数据保护原则都是基于1980年OECD(Organization for Economic Co-operation and Development, 经济合作与发展组织)制定的《隐私保护及个人数据跨国流通指南》,其中目的明确、知情同意以及最小化原则等成为各国数据制度的标配。然而,在数智时代,这些原则已经显得“力不从心”。图书馆创新与数据制度在目标方面虽然存在着一致性,但是由于制度的滞后性,使得图书馆创新在某些方面存在着被质疑的现象。商业互联网普遍根据《个人信息安全规范》等国内标准制定隐私条款等数据制度,而我国图书馆仍然缺乏该方面的数据制度建设,存在着安全风险与伦理危机[22]。图书馆服务制度是将服务创新传递给用户的基础手段,其创新意味着对制度价值的创新选择和实现[23]。数智时代,我国图书馆亟需在数据制度方面的建设,以适应外部环境的变化[24],构建以政府主管部门、图书馆行业协会、图书馆等组成的联盟,完善个人数据治理的行业制度,形成我国图书馆领域的共治机制,保障业务发展,在一定程度上对图书馆技术创新起到一定的促进作用。

5.3 自治平衡

数智时代,图书馆智慧服务的“用户画像”“学习分析”会极大地依赖于用户数据,因此图书馆在数据应用上一方面需要加强对数据的分层管理、授权访问等,另一方面要加强技术创新,提升数据挖掘的精准性,降低用户数据的采集量,做到数据利用最小化、效率最大化。图书馆智慧服务不仅需要数据的价值的顺利实现,同时更要通过技术制度解决数据隐私、安全等问题,完善使用标准来保障数据价值。数据二元属性的存在,图书馆必须面对数据的隐私与价值问题,做到从数据内涵角度,运用技术、制度创新,逐步完善数据隐私与数据价值之间的平衡关系,将制度创新与技术创新、服务创新协同发展,形成自治机制。数据秩序平衡将成为我国图书馆发展过程中一项重要工作,并且是由技术、制度趋向统一,共同作用,最终实现为图书馆创新发展提供基础保障。

6 结论与展望

我国图书馆对技术创新由来已久,并且积累了一系列的成果。大数据、人工智能、区块链以及云计算等技术被广泛运用到图书馆业务中,促进了个性化服务、精准服务以及智慧服务的健康发展。随着《数据安全法》 《个人信息保护法》的实施以及外部环境的变化,对图书馆数据安全、个人信息保护也提出了新的要求,即图书馆在发掘用户数据价值的同时,也应时刻关注用户的数据安全与隐私等问题。图书馆应该遵循法治规范、共治协同、自治机制对个人信息中的数据隐私、个人权益进行妥善保护,正确认识隐私与价值的关系,运用现有法律、标准来完善治理机制,逐渐消除数据隐私与数据价值对立思维,促进数据价值有效利用,实现图书馆数据隐私、数据价值的有效治理,形成图书馆高质量发展的新模式。

猜你喜欢
数智价值图书馆
大数据+智能时代的教师数智胜任力模型研究*
数智时代教练员的数字素养:概念内涵、价值意蕴与发展路径
网安天下担使命数智引领向未来"双引擎"驱动现代警务创新人才培养(计信系摄影报道)
乡乡镇镇通5G”建设助力山西“数智”转型
图书馆
一粒米的价值
“给”的价值
去图书馆
小黑羊的价值
放大你的价值