基于数据多粒度的隐私差序保护

2024-05-15 00:00:00林爱珺章梦天

摘 要:大数据时代,隐私的数据化与数据的隐私化相互交织,个人隐私边界日渐模糊。传统对于隐私、数据的“粗粒度”保护策略已难以匹配当前高度解析化的“微粒社会”,隐私保护与利用隐私换取便捷生活的悖论进一步凸显,人们的隐私焦虑愈发严重。研究基于数据多粒度探讨隐私差序保护,将个人数据以“人格价值”“敏感程度”与“社会属性”进行分层、分级,明确隐私保护与数据合理使用的价值序位差异及边界,并根据不同层次粒度之间的序关系,赋予用户真正的管理权与使用权,让隐私保护更具针对性,数据管理更具效益。

关键词:隐私价值;隐私焦虑;隐私悖论;多粒度数据;隐私差序保护

作者简介:林爱珺,暨南大学新闻与传播学院教授、博士生导师,主要从事传媒法与新闻伦理、风险沟通与应急管理研究;章梦天,暨南大学新闻与传播学院博士研究生,主要从事媒介治理研究。

基金项目:国家社会科学基金重大项目“人工智能时代的新闻伦理与法规”(项目编号:18ZDA308)的阶段性成果。

中图分类号:G206 ""文献标识码:A ""文章编号:1001-4403(2024)02-0182-11

DOI:10.19563/j.cnki.sdzs.2024.02.017

一、问题的提出

大数据时代,大众对于隐私的理解不再囿于可感知的空间层面,更包涵了抽象的信息和数据层面,对于隐私的保护也不再仅限于公私边界的划定和控制,而愈发拥有更多元化的需求与期待。①" ①李鹏翔、武阳:《模糊的边界:算法传播中隐私边界的内涵、衍变及其规制》,《新闻与写作》2022年第1期,第22-29页。在各种个性化推荐、人脸识别、穿戴性设备、智能家居等智能技术的广泛应用下,一个无所不包、没有边界和限制、相互关联的“信息融合机制”逐渐形成,建构出“流动的空间”和“流动的隐私”,在不断挖掘更大数据价值的同时,也导致现代公民的隐私陷入了无处安放的窘境。②" ②林爱珺、蔡牧:《大数据中的隐私流动与个人信息保护》,《现代传播(中国传媒大学学报)》2020年第4期,第79-83页。数字化社会,如何降低隐私风险,缓解人们的隐私焦虑?如何厘清隐私的合理范围,处理隐私与个人信息、数据之间的关系?如何实现数据合理利用与个人隐私保护的平衡?以上问题迫切需要解决。

就政策实践的进展来看,随着近年来《中华人民共和国民法典》《中华人民共和国电子商务法》(以下简称《民法典》《电子商务法》)等法规的落地实施,我国数据隐私规制的法律框架基本确立。③" ③彭岳:《数据隐私规制模式及其贸易法表达》,《法商研究》2022年第5期,第102-117页。但其中有关个人隐私保护的规定不够详细,有限的司法资源难以有效治理隐私扩散的困局。①" ①陈堂发:《论新媒体环境下隐私收缩性保护与价值差序》,《湖南师范大学社会科学学报》2019年第3期,第1-8页。如《民法典》虽然在第110条、第111条和第127条区分了隐私、个人信息和数据,初步确立了分别保护的体制,却始终未能就如何协调个人隐私、信息与数据的关系作出系统性安排,也缺少相应的管理保护流程及策略方法。《中华人民共和国个人信息保护法》(以下简称《个人信息保护法》)虽然对个人信息的优先级进行了分类,区分了个人信息与敏感个人信息,体现了分级保护的理念②" ②徐梦瑶:《大数据中的隐私流动与个人信息保护研究》,《东南大学学报(哲学社会科学版)》2022年第S1期,第46-49页。,但也缺少对于“敏感性”划分标准的规定。这使得现实实践中敏感信息的内涵在一定程度上依旧存在与隐私、数据概念的重合,隐私保护的范围看似扩大,实则难以落地,个人信息的“合理利用”问题进一步凸显。

面对个人隐私信息不断成为公共数据的一部分,“保护什么”与“如何保护”的问题关涉着隐私客体的界定和实践,决定着隐私保护的未来发展。③" ③姚瑶、顾理平:《对隐私主体分级理论缺陷的修正——兼与王敏商榷》,《新闻与传播研究》2019年第10期,第55-66页。在“如何保护”方面,不少学者从个人、制度与技术等方面探讨了大数据与隐私的保护策略,如试图通过隐私保护技术的提升,如利用数据脱敏技术、差分隐私技术实现个人信息的“去身份化”“去识别化”④" ④廖龙龙、叶强、路红:《面向移动感知服务的数据隐私保护技术研究》,《计算机工程与设计》2013年第6期,第1951-1955页。,或利用联邦学习模型、区块链等技术实现隐私数据的“加密”与“分布式管理”⑤" ⑤杨强、刘洋、程勇等:《联邦学习》,电子工业出版社2020年版,第5页。,希望以技术普惠的方式控制数字技术发展过程中对隐私的侵犯,保证数据的可用性⑥" ⑥张媛媛、邹静:《“技术-隐私”视域下数字社会隐私保护的路径创新》,《社会科学研究》2022年第6期,第25-34页。;亦有学者试图通过立法赋权的路径,将“被遗忘权”“删除权”视为保护个人隐私的新范式⑦" ⑦令倩、王晓培:《尊严、言论与隐私:网络时代“被遗忘权”的多重维度》,《新闻界》2019年第7期,第74-82页。,要求互联网企业赋权于用户,让用户参与数据从采集到使用的一系列过程,完善用户的知情权和参与权,提高用户的自决权。⑧" ⑧吴卫华:《个人隐私保护的伦理反思与体系建构》,《中州学刊》2019年第4期,第166-172页。

然而,在“保护什么”方面,已有研究对于隐私保护的范围认知与界定尚不够清晰明确,存在对于隐私数据保护“一刀切”“一把抓”问题⑨" ⑨王敏:《大数据时代如何有效保护个人隐私?——一种基于传播伦理的分级路径》,《新闻与传播研究》2018年第11期,第69-92页。,以及个人隐私保护与数据利用偏重一方的趋势。⑩" ⑩窦悦:《数据开放共享与个人隐私保护对策研究——层次数据与算法问责》,《现代情报》2021年第7期,第146-153页。一些学者主张隐私宽泛保护理念,对于隐私信息缺乏分级、分类保护的区分,对于如何更好地平衡隐私、数据的两者关系、怎样完善制度体系等问题仍存在较大不足;利用隐私保护技术对于隐私信息“可用不可见”的追求也常常将隐私保护内化于个人信息保护或数据安全之中,混淆了个人隐私、信息与数据保护的内在价值区别,造成隐私保护目标的异化和保护思路偏差。B11" B11李凌:《隐私保护技术变革的价值逻辑、困境及方向》,《新闻与写作》2022年第1期,第30-37页。

面对上述困局,数字化社会的隐私保护策略更应该立足于隐私内涵、范围以及人们对于隐私理解、意识和期望的转变,重新探索隐私主体、数据收集和使用的边界,即什么范围的个人隐私可以被收集,以及这些被收集的信息又应当在何种条件下被使用。对此,本文旨在通过分析大数据时代的隐私流动情况,对隐私、数据保护的边界融合、权利价值转变等矛盾冲突进行探究,并基于数据的多粒度性提出隐私差序保护,探讨隐私数据分层、分级保护的可行路径,以期为当前隐私保护策略提升适应性与有效性。

二、隐私数据化与数据隐私化

数字化生存下,个人的身份、信息与行为不断数据化。随着“千人千面”的算法媒体平台成为人们信息获取、日常生活以及情感交流的主要渠道,轻松地搜索、“最优”的选择皆依赖于无时无刻不在生成、存储、被计算和分析的个人数据。隐私泄露与个人数据滥用问题的持续显现使得隐私焦虑成为时刻笼罩在人们头顶的一片乌云难以散去,隐私保护与利用隐私换取便捷生活的悖论也成为突出的社会问题。

(一)数字化生存的隐私焦虑

在传统的隐私观念中,无论是被视为“阴私”的身体隐私,还是强调个人尊严、个人自决的空间隐私与信息隐私,皆呈现出与公共利益、群体利益较为分明的区隔,人们只需要将隐私归置于私人空间之中或隐藏起来,就可以避免侵扰,并获得相关法律的保护。然而,现实空间和数字空间的叠加拓展了个体的活动边界,丰富了彼此的交互方式,也使得隐私的内涵进一步扩大,传统个人隐私的公私边界日益模糊。算法技术迥然不同的连接与交互方式下,人们的身体特征、情感经历、社会关系或财产信息等海量信息均被数据化,作为一种财富资源成为各主体间竞相争夺的“富矿”。越来越多的个人信息与隐私成为一种“有私无隐”的“明私”①" ①陈昌凤:《“明私”时代,我们如何谈隐私?》,《新闻与写作》2022年第1期,第1页。,在难以察觉的情况下被留存与使用。

由于算法对于用户隐私的获取及使用过程具有很强的遮蔽性,被数据化的隐私边界变得难以可见与可控,用户很难及时发现,也缺乏自主改善能力。在佩特罗尼奥看来,隐私边界的管理包括控制连接(Boundary Linkages)、掌握渗透(Boundary Permeability)和明晰所有权(Boundary Ownership)三条规则。②" ②Petronio S.Boundaries of Privacy:Dialectics of Disclosure.SUNY Press,2002,p.124.如人们常常利用物理空间的遮蔽,关上房门(断开链接)来获得独处的权利;或是通过将写有秘密的日记本上锁、隐藏来控制隐私的传播(掌握渗透)。但当前社会的隐私数据化转变使得上述保护方法捉襟见肘。一方面,在智能应用设备“永久在线、永久连接”的数据收集与分析下,哪怕是最私密的身体隐私,例如身高、体重、心跳和睡眠状态、身体状况等也可以轻易地转换为数据,在不同的电子设备和网络平台之间流动与转换,不知不觉中导入公共领域的数据池之中。另一方面,基于人际关系的边界所有权管理也陷入混乱。社会网络中与“你”哪怕只有一丝一缕联系的“任何人”都有可能成为隐私边界管理中的共有者,任何一次他人有意无意地截屏、转发都随时可能轻易突破界限,个人再也无法决定那些数据内容会在何种语境中被解读,也难以控制其储存与使用的情况。隐私主体对于个人信息的掌控能力被架空,用户的隐私保护行为趋于失效,人们对于隐私安全的焦虑日益加剧。

(二)数据流动中的整合型隐私

近年来,随着算法算力在广度、深度和准确度方面的不断提升,信息的数字化挖掘与获取变得更加具体与个性化,甚至可以从用户自发自为的非敏感性信息中关联出更加丰富而隐秘的含义,形成“整合型隐私”。整合型隐私,是指通过数据挖掘技术将人们在网络上留存的数字化痕迹进行有规律整合而成的隐私。③" ③顾理平:《整合型隐私:大数据时代隐私的新类型》,《南京社会科学》2020年第4期,第106-111页。从获取信息到社交娱乐,用户的每一次使用背后都汇聚着无数次算法对于数据的整合、过滤、筛选,以及重新加工,这些包裹在黑箱之中无法理解的挖掘、追踪与分析过程使得一些数据同样具备了可以指涉个人的私密性。一旦进入了算法的数据池,便可能在不同场景间,不同情境下被反复、多次的使用整合,个体难以知情,更难以自决。

整合型隐私在何时何地被何人以何种方式整合产生,或者会不会产生,都具有极大的偶然性,也造成了其隐形性特征与被侵害时的“无感”特征。但是,没有感觉并不意味着伤害没有发生,而是这种伤害更加难以被用户及时感知,进而导致了伤害的滞后性。隐私主体将很难对其进行纠正或完全擦除,损害结果也可能不定期、无限次地发生,造成难以挽回的后果。这种无处不在、无计可施的数据隐私化威胁极大地影响了用户对于自身隐私保护能力的感知。隐私保护策略的频繁失效、控制感的不断消失可能导致用户的焦虑情绪超过阈值,引发“隐私疲劳(privacy fatigue)”的产生。①" ①Choi H,Park J,Jung Y.The role of privacy fatigue in online privacy behavior.Computers in Human Behavior,2018,81,pp.42-51.尤其是当用户将该策略的失效归因于外部社会因素时,用户对个人隐私保护能力的信念与毅力更会进一步被削弱,陷入以倦怠、疲惫情绪为中心的消极保护之中,产生对隐私保护不抱希望的淡漠心理,或采取刻意忽略隐私协议和日常隐私设置的消极行为,认为自己采取任何措施都无法回避威胁,继而默许了隐私的消亡,甚至产生对于国家政府的无效感,引发更多的社会问题。②" ②田馨滦、韩钰馨、张晓娟:《移动社交媒体用户隐私疲劳的影响因素研究——基于扎根理论和解释结构模型的分析》,《信息资源管理学报》2021年第5期,第103-113页。

(三)数据开发与利用中的隐私悖论

隐私的数据化与数据的隐私化改变了传统隐私的内涵、价值及可行性。流动的隐私背后不仅是个人信息在私有领域和公共领域间的流转,还包括隐私权利的流动以及人们对于隐私是“保护什么”的价值观念转变。面对自身行为痕迹、偏好选择以及基础信息被无时无刻、无处不在的记录、收集的现状,隐私主体却失去了话语权,不再是自己隐私的主人和守护者。③" ③利求同:《“零隐私世界”:信息时代隐私保护的困局》,《文化纵横》2018年第3期,第114-123页。隐私也似乎不再被视为人们“尊严生活”的必需品,而是与个人数据一起成为了一种“待估价的商品”④" ④Sevignani S.The commodification of privacy on the Internet.Science and Public Policy,2013,40(6),pp.733-739.,能否以分享的“美德”获取即时的满足与合理的补偿成为一种看似更合理的隐私期待,用户只能无可奈何地陷入自我披露和隐私保护的矛盾悖论。

目前关于隐私悖论的讨论包含着两组不同的矛盾体现,即用户隐私态度与披露行为不一致的矛盾,以及用户隐私保护与共享利用之间价值对立的矛盾。一方面,数据所具有的虚拟性、隐蔽性和广泛性等特质使得数据(包含隐私)的“真实”价值往往取决于他者对数据的识别、处理与使用能力。⑤" ⑤OECD.Data-Driven Innovation:Big Data for Growth and Well-Being.OECD,2015.这意味着个人作为隐私所有者、数据生产者与数据持有者、数据加工者的权利并不平衡。伴随着算法对于用户大量数据的收集与分析,个人对于自身隐私信息的支配权也不断流失,转向了拥有数据、信息、知识和关键技术的大数据企业。虽然各大平台均以政策合约的方式与用户进行了签订,但平台单方面给出的隐私政策往往依托于具有复杂性与黑箱性的算法机制完成,大量不具备专业知识技能的用户实际难以明晰或切实控制信息披露的种类、程度与用途方式;“同意或是退出”的二元选项也并未给予用户更多的选择,甚至可能成为平台推卸责任的幌子。⑥" ⑥徐敬宏、赵珈艺、程雪梅等:《七家网站隐私声明的文本分析与比较研究》,《国际新闻界》2017年第7期,第129-148页。为了获得基本的使用服务,用户只能在被限制或参与社会交往、信息沟通的条件选择中顺从处于垄断地位的网络运营商和网络服务提供者们创造的信息交互规则,在“被迫的自愿”中将个人隐私的主体性权力屈居于企业的数据生产与利润追逐的目标之后,以商品交换的形式换取利益,哪怕明知自身隐私权益受到减损也无法与之抗衡。

另一方面,数字经济的快速发展下,隐私与数据人格价值意义上的区别被遮掩,隐私数据化后的工具价值被凸显。即使是个人不经意间的网络行为痕迹也可以一定程度上反映出个人的特征偏好可用于匹配数字画像和对应需求信息。个人对于隐私数据的控制与决策成为其保护财产利益的方式与目的。隐私保护的思路及策略逐渐向“为利用而保护”转变。⑦" ⑦李凌:《隐私保护技术变革的价值逻辑、困境及方向》,《新闻与写作》2022年第1期,第30-37页。如此一来,隐私保护的需求便时常与数据共享的商业利益乃至社会管理的公共价值产生冲突。人们沉浸在“自由”“民主”的“算法神话”之中,逐渐察觉不到自身对于隐私保护的需求已渐渐被接受科技、使用科技、依赖科技的行为与思想惯性所降低,在获得服务的同时对于隐私的保护也变得不那么理直气壮,甚至理所应当地开始接受一种“以隐私换取便利”的生活方式。

三、基于多粒度的隐私分级与数据分类

“小数据时代”,个人信息较为单一和独立,传播技术并不足以充分挖掘与利用蕴藏在数据里的经济价值,隐私保护的边界较为清晰。相较而言,大数据时代以不同粒度属性进行的数据收集与分析则更具多样性与复杂性。智能技术对于个人隐私信息自动化、隐蔽化、黑箱化的获取与连接模糊了公共空间和私人空间的界限①" ①范海潮、顾理平:《探寻平衡之道:隐私保护中知情同意原则的实践困境与修正》,《新闻与传播研究》2021年第2期,第70-85页。,个人隐私越来越多地包裹在数据之中,不断以液态的形式在网络中流动,面临着多粒度地整合与解析,成为维系社会顺利生存发展的血液,也创造出巨大的商业价值。传统公私二元划分的隐私边界管理以及对于隐私、数据人格价值与利益价值的一元化保护制度作为一种简单的“粗粒化”保护策略逐渐难以应对隐私主体多元化的利益主张与日益微粒化的社会需求,也难以切实保障个人隐私的安全。需要对信息收集与使用过程中的个人隐私数据进行更多层级的粒度划分。正如克里斯多夫·库克里克在《微粒社会》中所论述的一般,“隐私有着极其细微的划分,它会随周围关系的改变而改变……重要的不是去保护一个共同的隐私,而是管理好各种形式的隐私”②" ②⑤克里斯托夫·库克里克:《微粒社会》,黄昆、夏柯译,中信出版社2017年版,第157页。。

(一)隐私数据的多粒度解析

多粒度分析是人类进行问题求解时采用的重要策略之一。在数据分析的语境中,粒度(granularity)即一种“被解析”的程度,基于多粒度思想对数据的多角度、深层次的分析与处理可以使数据在多个粒度空间中呈现,从而开展不同层次的数据研究与发现。③" ③李金海、王飞、吴伟志等:《基于粒计算的多粒度数据分析方法综述》,《数据采集与处理》2021年第3期,第418-435页。1982年,Hobbs首次提出“粒度理论”,讨论了利用粒的分解与合并将复杂现象理论简化的框架模型,引发了学界的关注;此后,不少学者亦加入了关于粒度化的研究中,旨在建立“概念之间的“IF-THEN”规则与粒度集合之间的包含关系,提出利用由所有划分构成的格求解一致分类问题,为知识挖掘提供新的方法和视角”。④" ④苗夺谦、卫志华、王睿智等:《粒计算中的不确定性分析》,科学出版社2019年版,第4页。粒计算的基本模型包括粒结构、粒层以及粒子三部分,粒结构由多个粒层构成,每个粒层又由多个粒子构成(图1)。一般来说,条件、属性的增加或删除会改变粒的度量大小,数据精确度越高,粒度就越低;数据的粒度越微小, 图1 粒计算的基本模型27可以分析的维度(粒层)就越多,这也进一步影响着粒结构的解释有效性。

大数据时代,人工智能与算法技术的计算使得“个体被计量的单位亦有所偏离……一切都将以比之前更加精细、精确、透彻的方式被获取、分析和评价”。⑤数据的体量大幅增长,数据的粒度不断细化。多粒度的数据应用广泛存在于人们的生产生活中,以往“粗粒化”的隐私保护策略也在这种“微粒化”的结构中失去了原有的效用。从现实层面来看,隐私与信息的流动、数据的交换一起共同构成了当前社会治理的底层资源,人们对于个人隐私保护的需求性与数据共享交换的必要性之间的矛盾是上述隐私保护困境的根本。但从多粒度的角度去理解,这样的矛盾也许并不存在。数据共享不是隐私共享,信息公开也不是隐私公开,关键是明确隐私保护与数据合理使用的边界以使粗粒度的隐私数据保护政策可以进一步适应不断被微粒化的“社会”。实际上,人类具有的智能宏观分析能力本就可以从极不相同的粒度上观察和分析同一个问题,包括在不同粒度的世界上进行问题的求解,快速地从一个粒度世界跳转到另一个。①" ①②③张燕平、姚一豫、苗夺谦:《粒计算、商空间及三支决策的回顾与发展》,科学出版社2017年版,第8页这种多粒度的思维方式及分析能力能够让人们根据自己的实际情况决定在哪个层面进行数据分析与处理比较合适,从而以较为擅长的方式解决问题。因此,可以利用隐私与数据不同的粒度属性,在不同层级的粗糙集中对个人隐私、数据进行分区、分级保护,提升隐私保护策略的适应性与有效性。

(二)以粗糙集三支决策划分隐私数据

20世纪80年代,波兰数学家Pawlak提出粗糙集理论,用于分析不可定义的概念及其近似,即一个概念的可定义性可用正域、负域和边界域三个两两互不相交的区域近似描述。对于正域中的实体,可以通过它们的描述断定它们属于某个概念;对于负域中的实体,可以通过它们的描述断定它们不属于某个概念; 图2 基于粗糙集的三支决策模型而对于边界域中的实体,则无法通过它们的描述断定它一定属于或不属于某个概念。②2009年,学者Yao在传统粗糙集基础上进行了扩展,提出“基于粗糙集的三支决策”,以“三分而治”的思维方式将粗糙集中的三个域分别用来构造接受规则、拒绝规则以及延缓/不承诺规则的三个“进阶”域,从而实现复杂问题的转化及相应治理,其基本方法与目标是根据整体不同问题的特点将其划分为三个互不相交的部分,有针对性地设计策略和动作。每当难以做出接受或拒绝的决策时,便可延缓决策进行再次粒化。③(图2)

目前,关于三支决策研究的主流在于构建理论与数学模型,其多粒度的思想与策略方法亦可用于相关的科学研究,对于当前模糊不清的隐私、数据分级与分类极具启发性。由于隐私内涵的模糊性与时代精神和文化差异所造成的阶段性,我们没有办法为隐私权划出固定不变的界限,也没有办法对隐私保护的范围进行精准定位。但基于粗糙集三支决策的多粒度分析,我们可以将个人或组织对隐私主体的隐私数据收集和使用以“人格价值”“敏感程度”与“社会属性”进行分层、分级,并根据不同层次粒度之间的位序关系,制定相应的处理策略。

1.以是否紧密关涉人格尊严的价值粒度划分隐私数据

从价值属性来看,隐私与数据原本是极不协调的两极,其保护的价值内涵也并不一致:隐私保护最重要的价值体现是“人格尊严”,而数据作为算法时代的新兴技术产品,具有明显的“财产价值”。个人数据相较于个人隐私、个人信息而言更具有碎片化、开放性(非排他性)、不可控性的特征,其保护的价值位序也更强调对于数据利用的效果与收益保护。

就我国的隐私保护而言,从2009年《中华人民共和国侵权责任法》(以下简称《侵权责任法》)的发布确立了我国对于隐私的直接保护模式后,“隐私”陆续替代了单纯身体意义上的“阴私”成为一项具体的人格权利被予以法律保护。隐私被视为一种精神性人格权,与个体生存的自我、尊严与安宁密不可分。因此,“隐私保护的社会意义在于人格利益的维护,即个体的自然生存和社会生存所必须的社会尊严”①" ①陈堂发:《新媒体环境下隐私保护法律问题研究》,复旦大学出版社2018年版,第114页。。相比之下,“数据”作为信息的一种记录表现形式在利益保护方面则更加复杂。《中华人民共和国数据安全法》(以下简称《数据安全》法)中并未创设统一的数据权利,也没有明确数据权属,数据主体不仅会涉及个人,还包括了数据处理企业及组织等。而在2022年12月国务院发布的《关于构建数据基础制度更好发挥数据要素作用的意见》(简称“数据二十条”)中,“促进数据合规高效流通使用、赋能实体经济”“数据可用不可见”的指导思想被再次明确,这也使得数据保护的财产价值进一步凸显。

因此,对于隐私数据分级的第一层粒化可以以“是否紧密关涉人格尊严”为条件属性,将难以区分的隐私数据集按照与隐私主体的人格尊严相关性分为“人格紧密型隐私”“人格疏远型数据”以及“间接关涉人格型隐私数据”,明确隐私保护不可让渡的独特价值的第一位序。需要说明的是,这里的人格尊严更多指代一种“消极内涵的人格尊严”,即具体的个人身份或名誉意义上的人格尊严,具有某种条件性或获得性,与个人的身份、名誉、品行等方面相关,关联于人的精神性生命,与羞耻感相联系。②" ②刘程:《隐私辩护的伦理正当性及其可能进路》,《江海学刊》2023年第2期,第76-83页。可以在一定程度上借鉴陈景辉教授对于“人之尊严获得”的判断方式,将信息中与每个具体且独特个体高度有关的“我是我(具体个人)”信息判断为“人格紧密型隐私”③" ③陈景辉:《隐私的价值独特性:个人信息为何应受保护?》,《环球法律评论》2022年第1期,第36-52页。,如个人的生物信息、基因信息等。信息存在与具体个人是否参与有直接关联,信息内容与不同的参与者有所差异,与具体个人的尊严保障密切相关。

2.以是否可识别个人的敏感粒度划分隐私数据

很明显,上述划分必然存在一定的模糊域,还需要对“隐私数据集”进行二级粒化。2020年出台的《民法典》中,隐私被正式界定为:“自然人的私人生活安宁和不愿为他人知晓的私密空间、私密活动、私密信息。”这进一步明确了当前立法对隐私保护客观存在的“私”之信息或事项与公民主观存在的“隐”之意愿的强调。同时,《民法典》(第1034条第3款)中关于“个人信息中的私密信息适用有关隐私权规定,没有规定的,适用于有关个人信息保护的规定”的相关要求,为我们确定了隐私权的优先适用规则,亦为粒化隐私数据的粗糙集提供了判断依据:具有高度私密性的个人敏感信息,涉及个人隐私核心领域。④" ④张新宝:《从隐私到个人信息:利益再衡量的理论与制度安排》,《中国法学》2015年第3期,第38-59页。

具体而言,个体出于羞耻感或基于社会道德期待而不愿被他人所知悉的“秘密”,即具有较为强烈的“隐”之意愿的个人敏感信息是维系人类本性道德所必需的行为方式,与隐私保护的范畴存在部分重合,可分为“本质敏感型隐私”(指能够直接识别信息主体的敏感信息,包括身份信息、肖像信息等)和“推断敏感型隐私数据”(指需要结合其他个人信息才能识别信息主体的敏感信息,如个人消费记录、网络浏览记录、地理位置等)。其中,根据《中华人民共和国个人信息保护法》(以下简称《个人信息保护法》)中对“敏感个人信息”的核心要素判定标准,即“造成侵害或危害结果上的容易性”,“本质敏感型隐私”的损害应当触及社会大多数人的敏感,可以以已有的规范性文件或社会调查进行佐证;如果没有,则需借助一般经验与常识合理进行判断,并归纳为“推断敏感型隐私数据”。而另一些经过匿名化处理或不可识别到个人的信息则多以大数据的形式呈现与利用,往往并不以与信息主体直接关联的方式面世,或会被要求与信息主体脱敏,其敏感度也相对较低,因可被视为“不可识别个人的一般数据”。

3.以个体性与社会性的强弱关系粒度划分隐私数据

随着社会文化的发展、个人感受的差异,人们对于信息敏感度的判断也会发生变化,缺少明确的固定范畴,还需要对推断敏感型隐私数据进一步粒化,以避免过于依赖个人判断及场景要求,实现隐私数据的区分保护。通常来说,隐私的事项总是与具体的人密不可分,而任何个体都具有两面性,即作为单纯自我的个体与作为社会人的个体。①" ①陈堂发:《新媒体环境下隐私保护法律问题研究》,复旦大学出版社2018年版,第127页。当人们越来越多地自愿在网络平台上共享个人的信息数据以促进社会的交往,隐私的社会性也日渐凸显。隐私问题不再仅关涉个人,还涉及同类群体甚至社会的公共利益,以隐私数据强个体性或强社会性的关系粒度属性进行划分,可以使隐私保护的利益位序更加明确,确保隐私保护的社会共享价值及其时代意义真正实现。

不同的个人信息总是具有不同强弱程度的社会属性。从某种意义上来说,隐私的保护只有在两个或两个以上的个体进行社会交往时才能体现,不被他人知晓的纯粹的个人独处不存在有社会价值的隐私,而至少存在一方以上当事人的共同隐私才是当下社会中更常态化的存在。因此,可以将一般社会交往活动中主要反映在个人私人活动领域中,损害结果不过多涉及他人利益的敏感隐私数据视为“弱社会性个人隐私”(如婚姻状况、健康状态等);而将关涉更多主体利益的敏感隐私数据(如作为社会交往主体符号的身份信息、与他人相关的动态行为信息、已在社会活动中公开展示的个人直观表征信息等)视为“强社会性个人数据”,对其合理利用的条件应当更加宽松。尤其是面对涉及公认的重大或重要国家政权利益、社会公共安全秩序问题以及公民生命与人身安全利益的个人信息,虽具有一定敏感性,但也应当在衡量公共利益秩序的情况下,有条件地放弃其隐私属性的绝对性保护,适用数据保护规则以保障更高价值位序的维系。

四、建立多粒度的隐私差序保护与数据管理机制

面对大数据时代的隐私数据流动,公民的隐私保护需要更具时代性的解决方案。在我们尚未形成共识之前,只有采用多种维度的方法进行规范和保护,才能及时适应和有效应对不断变化的隐私内涵与范围。可以根据隐私数据的不同级别,建立多粒度分级管理机制,加强隐私保护技术的研发,基于数据生命周期增强用户的隐私风险辨析能力与数据管理能力,建立动态的隐私保护方式,以隐私、数据的差序保护缓解当下的隐私保护困境。

(一)建立隐私数据分级保护模型

基于隐私数据粗糙集的三支决策模型划分方式,个人信息收集与处理过程中的隐私数据可以用“人格紧密型个人隐私”与“人格疏远型个人数据”作为保护与利用的利益两极建立分级保护模型,并以“直接识别(关联)性”“敏感性”“强个体性”为充分条件进行多粒度管理,将隐私数据划分为直接关涉人格尊严型隐私(Pⅰ)、本质敏感型隐私(Pⅱ)、弱社会性个人隐私(Pⅲ);以及人格尊严无关型数据(Dⅰ)、不可识别个人型数据(Dⅱ)、强社会性数据(Dⅲ)。对隐私保护以人格利益序位为主,对数据保护以财产利益序位为主(图3)。若某一信息事项符合上述三个条件中任何一个特征,即信息存在与具体个人参与有直接关联、能够直接识别信息主体或仅发生在个人私密领域,都应归属于个人隐私类型,并可以根据其满足的粒度层级进行分级保护,对满足约束条件越多、越精确地指向隐私主体具象个人的隐私信息,进行越严苛的保护。

具体而言,以个人的人脸识别信息为例(Pⅰ),其不仅精确地指向隐私主体的具象个人,且具有独一无二的强关联性,因而需要受到特别保护,应采取原则上禁止处理、例外允许处理的模式,尽量限制商用,只允许在法定情形下让渡于公共利益。而对于满足部分约束条件的信息,如“我”的身高体重、行踪轨迹、个人经历等间接与“我”之人格相关的信息(Pⅱ-Pⅲ),可以由用户自行选择与企业平台达成隐私披露协议,允许开展某些涉及数据的创新性业务,但需要提前通过干扰、匿名技术去除可识别信息,将其抽象至粗粒度数据以避免隐私信息与隐私主体之间的对应,并禁止对经过粒度化表示和规范化处理后的隐私信息进行整合画像的逆向推导;可以结合《个人信息保护法》第28条第2款中的限制处理条件,规定在“具有特定目的和充分必要”以及“采取严格保护措施”的前提下进行处理,应充分告知隐私主体处理信息的必要性与影响,并取得个人的单独同意。在数据方面,对于不可直接识别到个人的人格疏远型数据信息(Dⅱ-Dⅰ),用户可以“去指向性”判定为基础,与企业平台签订数据受托服务,对需要流通进入市场及应用的数据进行模糊化处理,根据数据披露程度、披露时长以及披露目的等条件设定分级同意协商及收益分配机制;而对具有特殊价值、特殊目的的敏感数据使用(Dⅲ),数据处理者应制定数据清单及目录,设立公开透明、定时更新的数据管理报告与风险评估监测机制,并限制敏感数据的存储期限,不再仅仅让用户面临“同意或不同意”“披露或不披露”的二元选择,而是赋予用户真正的管理权与使用权,实现“我是人”信息与“我是我”隐私的良好分割。

(二)多粒度隐私保护的技术路径

大数据时代的隐私危机不能单纯依靠制度规范的限制去解决,还应该寻求技术解决的方案。目前,针对用户隐私的侵害风险,隐私保护技术主要可以分为两种,一是积极“赋权”个人自主决定以及个人信息控制的“访问控制技术”,如苹果在ios14.5系统中加入了“App跟踪透明度”和“App跟踪设置”的选项①" ①iOS14.5:将强制App加入请求追踪用户权限!|ios|app|标识符_网易订阅,https://www.163.com/dy/article/G1H345QL05118P6D.html.,谷歌浏览器则开启了隐私沙盒的设置,阻止广告主通过第三方Cookie在用户不知情的情况下追踪利用用户的个人数据①" ①北鸮:《注定影响你我的新标准:Google的「隐私沙盒」究竟在为什么抗争?》,少数派-高品质数字消费指南,https://sspai.com/post/71499.;二是通过对隐私进行加密或脱敏化处理,不断增强隐私“离身化”的保护技术,如TOR浏览器可以通过节点匿名、边匿名、属性匿名等技术进行社交图谱的隐私保护。②" ②关于Tor浏览器|TorProject|Tor浏览器用户手册,https://tb-manual.torproject.org/zh-CN/about/.但目前这些技术的关注重点尚局限于数据中的收集过程与计算结果上的隐私安全利用问题,企业常常出于经济价值的考量,优先发展能够提高自身经济效益和利润的个人信息挖掘和处理技术③" ③李凌:《隐私保护技术变革的价值逻辑、困境及方向》,《新闻与写作》2022年第1期,第30-37页。,而对于隐私与数据的分级保护、分类使用、分区管理关注较少。同时,大量隐私保护技术的使用方式与原理过于复杂,甚至隐藏于平台后台机制之中,其使用主动权也掌握在平台等数据管理者的手中,这导致用户的应用成本与使用热情大大降低。

实际上,隐私保护技术不应只是某些单一技术的集合,更应成为一种技术保护体系与系统,包含众多技术领域的交叉融合。应继续从多粒度角度出发加强技术的多面向研发,对隐私保护技术的适应周期与流程进行分类,如利用区块链技术制定分布式存储机制实现隐私的去中心化存储和数据交换方式,利用非对称加密、哈希函数等方式区分对隐私与数据的不同处理利用与安全保护,并在国家层面为技术创新赋能,不断完善技术创新的制度环境,适当提供“定制化服务”,④" ④张媛媛:《论数字社会的个人隐私数据保护——基于技术向善的价值导向》,《中国特色社会主义研究》2022年第1期,第52-59页。根据不同用户不同的隐私期望与个性化需求提供异质性保护策略,降低使用门槛,进一步拓展隐私(数据)保护技术的应用场景和应用程度。

(三)基于数据生命周期的个人数据管理

无论是隐私保护还是数据管理,其核心问题均主要涉及三个维度,即谁保护、保护什么以及如何保护。运用多粒度差序保护策略虽然可以最大限度地将隐私与数据进行区分保护,但这依旧依赖于用户的个人意识及管理。与传统的隐私遭受侵害的方式不同,数据一旦生成便可能在其数据生命周期的各个阶段产生泄露的风险,这更需要提升用户对于自身隐私的价值认知及保护意识,以及对于个人数据的安全与管理自觉,增强用户在理解、认知、评估、决策方面的隐私风险辨析能力与数据管理能力。

生命周期这一概念最初源于生物学领域,指生物生老病死的客观生命演化规律。而随着大数据的发展,数据生命周期作为一种揭示数据自身发展规律的理论逐渐成为研究数据管理的重要手段,主要包括数据创建、采集、传输、储存、处理、使用、维护、销毁八大关键阶段。⑤" ⑤郭海玲、刘仲山:《GDPR对我国跨境数字贸易企业个人数据保护研究——基于数据生命周期理论》,《情报杂志》2023年第10期,第1-8页。作为数据生命周期伊始的提供者角色,用户可以从数据创建、采集的起始环节开始对数据泛采滥采的必要性进行限制,有效行使知情权、拒绝权,减少贸然通过“交换隐私”的方式换取经济利益;也可以在数据传输、存储、使用过程中利用数据加密、设置数据权限等方式降低数据外溢或泄露的风险,并通过对数据的定期维护、删除与销毁避免数据被过度使用。因此,不断提升用户的隐私素养与数据素养,唤醒人们的隐私意识和主体意识是未来解决隐私问题的关键,应针对不同的数据主体定期、广泛地开展有关隐私保护意识及技术使用的相关培训教育,促进其自觉将隐私保护视为人格尊严的内在需要,建立正确的道德价值定位和价值取向,提升数据安全意识,主动管理自我数据的生命周期;同时谨防由于技术资源限制及技术应用能力差异所导致的接入鸿沟(接入沟)与使用素养鸿沟(使用沟),有意识地关注“数字底层阶级(digital underclass)”的隐私保护能力,实现隐私素养的全面提升。

五、结语

隐私是使人意识到自己是自由独立个体,以及作为个体所能拥有自由意识的必要存在,具有不可让渡的独特价值。Bloustein认为,一旦人类失去隐私,随之而来的便是他的自主性和作为独立个体的自我意识的消失。①" ①Edward J.Bloustein.Privacy as an aspect of human dignity:An answer to Dean Prosser.NYUL rev.,1964,39,p.962.现代社会,人们对于隐私的理解不仅源于个人自我意识的觉醒,还来自他者角度的审视与启示,并不断受到社会文化、政治经济和技术发展的影响。本研究的实践意义在于,建立多粒度分级管理机制可以进一步区分隐私保护与数据利用的价值差序及保护重点,平衡不同群体的利益诉求,不仅让用户能够根据不同粒度级别对自身隐私、信息、数据进行区分保护,拥有真正的管理权与使用权,摆脱以牺牲隐私换取便利的焦虑,还可以让政府治理与平台规范真正发挥作用,进一步实现数据共享与社会利益的最大化。

[责任编辑:其 时]