摘要:在数据要素价值化背景下,档案数据进入要素市场实现流通交易已是现实与趋势,如何兼顾档案数据隐私保护亟待解决。文章认为档案数据隐私既来源于记载个人私密信息的各类传统档案,也来源于有关数据的档案化。在数据要素的资源化、资产化和资本化的不同阶段,档案数据隐私风险主要表现为数据采集风险、数据共享风险和数据跨境流动风险等,其表现多样且具有多种特征。对上述多样性且特征各异的档案数据隐私风险应依据档案数据隐私治理模型,从法律手段、技术手段和行政手段三个角度开展治理。
关键词:档案数据隐私;档案数据要素;数据价值化;隐私治理
分类号:G273.5
Research on Privacy Risks and Governance of Archival Data from the Perspective of Data Element Valorization
Zhou Yi, Chen Meijun
( School of Social Science, Soochow University, Suzhou, Jiangsu 215123 )
Abstract: Under the background of data factor valuing or transaction, it is a reality and a trend for archival data to enter the factor market and be circulated and traded, and it is urgent to solve the problem of how to take archival data privacy protection into account. In this paper, we analyze and identify the types of archival data and the sources and types of privacy risks in archival data valuing by using literature analysis and data value chain theory, and develop an archival data privacy governance model under the perspective of data factor valuing. The article argues that archival data privacy originates both from various types of traditional archives that record individuals’ private information and the archiving of data. At different stages of converting data factors into resources, assets and capital, archival data privacy risks are mainly manifested as data collection risks, data sharing risks and data cross-border flow risks. As these risks are diverse and have various characteristics, they should be managed from three perspectives, namely legal, technical and administrative means, in accordance with the archival data privacy governance model.
Keywords: Archival Data Privacy; Archival Data Factors; Data Valuing; Privacy Governance
数据是重要的生产要素已经成为重要的社会共识。《关于构建更加完善的要素市场化配置体制机制的意见》《关于构建数据基础制度更好发挥数据要素作用的意见》(简称“数据二十条”)《“数据要素×”三年行动计划(2024—2026年)》等政策为数据要素流通和价值释放提供了基本指引。
档案数据是数据家族中的重要成员,其类型可初步分为公共档案数据、企业档案数据和个人档案数据等,上述类型档案数据在来源上相互交织。例如,公共档案数据、企业档案数据就包含大量个人数据,各类网络服务平台(如互联网医院或网络问诊平台)在业务活动中会将用户个人数据进行档案化管理,从而形成企业档案数据。从信息公开到数据开放再到数据要素流通交易的过程中,往往伴随着个人档案数据使用权的让渡,如何保护档案数据隐私已成为不可回避的问题。
1 研究进展与问题提出
1.1 研究进展
近年来,档案数据要素价值问题逐渐引起学界关注,现有研究在概念界定和理论研究上已积累一定研究成果。有学者从历史源流[1]、价值和使用价值[2]、治理价值[3]和开放共享价值[4]等角度对档案数据是否能够成为生产要素进行探析。部分学者在肯定档案数据要素价值基础上,结合数据生命周期理论和价值链理论构建档案数据价值化模型,提出数字中国战略下档案数据要素价值实现路径。[5-6]
在信息资源管理相关学科中,部分学者从政策、技术、实践等不同视角对数据安全、数据隐私保护等相关问题进行研究,内容主要围绕数据隐私风险类型、数据隐私风险识别与量化和数据隐私治理等方面展开。
目前,学界对如何划分隐私风险类型尚未形成统一观点。基于生命周期理论视角,蒋明敏等将隐私风险划分为数据采集阶段的数据知情权风险、数据组织和存储阶段的数据操作权和控制权风险、数据流动和传播阶段的数据真实性和隐私泄露风险、数据利用和服务阶段的数据关联性风险、数据迁移和销毁阶段的数据访问风险[7];吴宁博等通过文本内容分析《中华人民共和国个人信息保护法》和相关文献并结合实证调研,提出了16个隐私风险要素[8]。也有部分学者更倾向于从风险来源角度分析隐私风险类型,如刘新萍等认为隐私风险主要来源于法规政策、管理和数据三个层面[9];卫玮则将其划分为政府部门泄露、社会公众泄露、平台技术泄露以及数据保密审查泄露四个方面[10]。
有关数据隐私风险评估的相关研究大多集中于构建隐私风险评估模型,并据此进行隐私风险量化研究。罗康等提出一种面向数据发布场景的隐私泄露风险量化评估方法,通过构建敏感数据矩阵并进行隐私等级标记,计算得到字段属性隐私权重,利用矩阵范数计算得出隐私风险值[11];臧国全等分别基于个人通信数据[12]、个人金融数据[13]、个人教育数据隐私文本[14],识别敏感数据并计量隐私值。部分学者参考国外数据隐私风险评估实践经验为我国提供借鉴,如陈美通过总结和归纳英国经验,结合我国在政府开放数据中存在的隐私风险隐患,提出应制定完善的开放数据政策、构建完善的隐私风险评估体系、加强隐私管理等[15]。
目前数据隐私治理的相关研究多聚焦于公共数据开放过程。盛小平等从治理主体、治理客体及治理活动3个要素构建数据隐私治理结构,形成数据隐私风险治理路径[16];朱贝等在厘清科学数据共享隐私问题的基础上,提出4项隐私治理原则,构建隐私治理模型,探索了科学数据共享中的隐私治理对策[17]。
从学界研究进展与业界实践看,现有数据隐私保护一般基于个人主义保护范式来实现,而在数据要素流通背景下该范式已经日渐式微,很难改变具有身份识别性的档案数据所指向的自然人(即档案领域的数据主体,下文简称“档案数据主体”)在隐私保护中所处的不对等地位。[18]
1.2 问题提出
档案学界目前对数据要素价值化中的档案数据流通交易和由此引发的数据隐私保护治理等问题的研究仍处在起步阶段。据学者判断,目前我国个人数据交易并非发轫于数据用户与企业之间,更多的是在企业之间进行交易。由于个人数据交易的立法缺失,大量的个人数据交易无法在白市进行,而是在灰市和黑市交易。[19]与此相类似,与个人隐私有关的档案数据交易已经普遍化,并已形成一定的产业规模,但其交易也有多在灰市或黑市进行的倾向,其中所暴露出的数据隐私安全问题十分突出。如何顺应数据要素价值化要求,将档案数据交易从地下或场外交易转变为合法合规的场内交易,并规范和加强流通交易过程中的数据隐私保护成为一个紧迫问题。基于此,本文拟通过识别档案数据要素价值化不同阶段的隐私风险类型、来源或特征等,构建档案数据要素的隐私治理框架,为档案数据要素规范流通和主动融入数据要素市场提供借鉴和参考。
2 数据要素价值化过程中的档案数据隐私风险识别
2.1 档案数据隐私概念阐释
进入价值化过程和流通的档案数据有两类:一是数据形态的档案[20],二是具备档案属性的数据[21]。数据形态的档案是存量档案数字化成果和增量电子档案的统称。具备档案属性的数据的主要形态是以数字信号进行记录和保存的、以数据为颗粒度的信息记录,如关系型数据库文件、GIS数据、三维数据、数字交付模型等[22],具体而言,其包含各类专题或特色基础数据库、公共数据库,网络信息或网页数据,自媒体信息或数据,政务微博、政务微信、公务邮箱等平台形成的数据或电子文件等。上述档案数据均包含大量数据隐私。数据隐私是一种以个人数据形式记录或以数字方式描绘的自然人的私人生活安宁和不愿为他人知晓的私密空间、私密活动和私密信息等。[23]
从档案数据隐私主体的行为出发,可以将档案数据隐私细分为“主动数据”隐私和“伴生数据”隐私。“主动数据”隐私是有关主体根据工作需要、有关管理规定等954G1PDUMLR3p0mGt2+vbA==,主动生成或提供的各类人事档案数据,或其它上传或授权服务平台读取的数据,如姓名、身份证号码等身份标识符数据,银行账号等财务数据,住址和定位等行程数据,健康数据等个人属性较为突出的数据。无论是人事档案数据,还是在有关平台上手动上传与授权读取的数据,数据使用者均可根据这些“主动数据”追踪到个人数据主体。针对人事档案数据,我国已形成了较为严格的管理与使用规定。针对上传或授权平台读取的数据,大量网络服务平台在提供相关服务时,均通过隐私政策要求用户同意默许平台获得上述有关数据以及数据的档案化;目前我国对其虽也形成了一定的约束性规定,但这些个人数据是否为用户获得服务时平台所必须采集的数据,以及平台是否遵守了最小使用原则等仍存在很多疑问。从理论上看,此类档案数据隐私的流通应该受到严格规制。“伴生数据”隐私是有关主体通过主观操作、网络运用和加工整理而获得的数据资源,如针对档案数据行为主体的浏览历史记录、购物偏好、操作日志等,平台对此类伴生数据进行整理、统计、分析等数据“挖掘”工作产生的财产价值,个人数据主体无权主张[24],它们也会成为平台档案的组成部分。对该部分档案数据隐私是否能够进行流通交易则应视情形而定。
档案数据隐私的具体来源主要包括两个方面:一是档案信息内容本身就是隐私信息或隐私数据,如人事档案、生物数据与健康档案、税务档案、教育档案、医保档案、婚姻档案、财产档案等;二是随着人工智能技术不断发展和数据档案化推进,通过个人数据语料分析聚合而形成的精准的个人画像隐私,或是在数据档案化过程中,如对社交媒体数据、在线行为数据和移动设备数据等的档案化并分析后生成的伴生档案数据隐私。在技术加持和数据档案化汇聚后,原本经过去标识化处理的数据集在整合后成为新的档案数据隐私来源。从上述来源看,传统的以私密信息为核心的隐私已转化为以隐私数据为表征的内涵更为丰富、形式更为多元的数字化新样态——整合型隐私。[25]这种整合型档案数据隐私融合了传统档案中的数据和数据的档案化中所包含或隐藏的隐私内容,数据隐私风险来源更为多元,表现形式更加多样,在相关数据聚合中可挖掘更多、更深的档案数据隐私线索。
2.2 数据要素价值化中的档案数据隐私风险表现
在人工智能技术加持下,当前个人隐私风险已从传统的私密信息泄露风险转为抽象的隐私数据挖掘侵权风险。在档案数据要素价值化过程中,运用人工智能技术辅助档案数据开放审核、档案数据编研开发等正在加紧推进,由此所带来的整合型档案数据隐私风险将会逐步加大。数据要素价值化可以划分为数据资源化、数据资产化和数据资本化三个阶段[26],在数据要素价值化的每个阶段都有其特定的数据隐私风险表现。结合档案数据运动特征[27]及其要素价值化的具体阶段,可以将档案数据隐私风险归纳为10种风险类型,如表1所示。
对多源异构的档案数据而言,档案数据资源化是将混乱无序的原始档案数据整合为可利用的档案数据资源的过程。档案数据资源化是档案数据进入数据要素市场的前提,也是档案数据价值化的基础,其本质是通过采集、清洗、加工、整理、存储等环节深入挖掘档案数据资源使用价值。国家档案局统计数据显示,截至2022年底,全国各级国家综合档案馆馆藏电子档案2372.9tB,相较于2019年的119.3万GB增长了两万多倍,数字化成果也同样增长两万多倍。[36]由此可见,自数据被列为生产要素以来,可利用的档案数据集已形成一定规模。档案数据资源化阶段主要的隐私风险表现为数据采集风险、数据存储风险和数据聚合风险。数据采集风险即采集档案数据时可能无意中捕获敏感数据,如个人身份信息、健康数据或财务数据等。数据存储风险指存储环节操作不当或者受到恶意攻击可能导致档案数据泄露,在缺乏适当加密和访问控制的情况下此类风险更易发生。数据聚合风险为当多个档案数据集被整合时,原本经过匿名化处理的档案数据可能因关联分析而暴露出个人隐私。
档案数据资产化是指档案数据通过流通交易给使用者或所有者带来经济利益的过程,是实现档案数据价值的核心,其本质是形成数据交换价值,初步实现档案数据价值的过程。[37]从有关数据资产化的经验看,以应用场景为导向构建档案数据产品与服务是一种可行的策略选择。浙江公共数据平台将与个人相关的婚姻档案、学籍档案等9大类档案数据进行聚合,开发了“惠民办事”“出生智治”“基层治理”“居民健康”“共同富裕”等场景,这就是一种场景驱动档案数据要素流通的有益探索。[38]这种探索基于不同行业领域的独特性和差异化需求,以应用场景为导向进行档案数据资源的选择性开发,并进行优先级排序与可行性评估,确保档案数据资源高效配置。档案数据资产化阶段主要的隐私风险表现为档案数据共享风险、用户画像构建风险和档案数据重用风险。档案数据共享风险即为生产档案数据产品,提供以应用场景为依托的相关服务,档案数据可能跨越多个组织进行共享或交换,这在一定程度上增加数据隐私泄露的可能。用户画像构建风险则是指利用档案数据创建用户画像时,即使使用去标识化数据,也可能通过数据挖掘和关联分析追溯个人身份。档案数据重用风险指在未经档案数据主体同意情况下,对匿名化或进入销毁阶段的档案数据进行重新识别,造成隐私泄露。
数据资本化是将数据要素资源以产权化和证券化等形式转化为流通资本的过程,也是不断寻求资本价值的过程。[39]档案数据资本化是指通过流通交易方式来实现对档案数据要素的社会化配置,从而使其具有生产价值的动态过程。现有研究证实,数据分析技术的大量使用会直接对已有数据带来价值增值。因此,在档案数据资本化阶段应当重视新技术的引入,积极发展数据分析技术,提升数据价值,从而积累数据资本。[40]档案数据资本化阶段的隐私风险表现为档案数据所有权风险、档案数据跨境流动风险和档案数据市场化风险。档案数据所有权风险是在档案数据资本化过程中,因档案数据所有权归属模糊,边界不明,档案数据主体可能失去对档案数据的控制。针对具备档案属性的数据进行档案化处理时,就较多面临这种风险。档案数据资本化往往伴随数据跨境流动,数据跨境过程不仅可能影响国家数据主权,而且会导致数据隐私流失,滴滴公司用户行程数据的出境就是一个典型例证。档案数据市场化风险指档案数据交易具有不透明性和非排他性,这可能使得数据主体无法知晓其数据如何被使用,以及是否在有条件开放的范围内被使用,从而导致数据隐私泄露。
档案数据要素价值化各阶段的数据隐私风险具有不同特征。在数据资源化阶段,档案数据隐私风险溯源难度低,影响范围相对有限,相较于其他数据,档案数据在归档时须进行价值鉴定和真实性鉴定,因此其权威性更高,隐私风险影响程度更大,其影响范围往往具有相对性特征,风险性质主要为技术性风险,隐私治理主体为档案数据处理者;在数据资产化阶段,档案数据隐私风险复杂性与隐蔽性增强,溯源难度较高,影响范围较大,其风险性质主要为业务合规性风险,隐私治理主体为数据产品开发者和数据控制者;而在数据资本化阶段,受数据市场环境影响,档案数据隐私风险源头极难追溯,隐私风险影响范围广泛,其风险性质为法律和经济风险,隐私治理主体转变为金融市场参与者,包括投资者、数据监管者等。
数据要素价值化不同阶段的隐私风险具有一定内在联系。一方面,数据隐私风险具有连续性与累积性,即隐私风险在数据价值化链条中是连续的,早期阶段的风险处理不当会在后续阶段累积,最终可能在资本化阶段暴发。另一方面,在数据隐私风险反馈机制上,后一阶段的隐私风险可以反馈至前一阶段,促使数据档案化、资源化等阶段相关工作的改进,最终形成一个闭环的数据隐私治理链条。
3 数据要素价值化中的档案数据隐私风险治理路径
在数据要素价值化中,档案数据隐私治理不仅要确保档案数据的完整性、可用性、机密性和可追溯性,防止档案数据隐私被非法获取和篡改,而且还应确保档案数据可以在合法合规的范围内得到流通利用。
从宏观来看,数据要素价值化中的档案数据隐私治理应从法律手段、技术手段和行政手段等方面入手。法律手段提供数据处理的法律框架和市场规制,技术手段通过数据加密、去标识化、区块链等技术实现数据隐私保护的实际操作,行政手段则实现对整个隐私治理过程的协调与监管,三者协同作用,形成一个兼顾数据要素价值最大化和档案数据隐私保护的治理框架。基于此,本文构建了一个数据要素价值化视角下的档案数据隐私治理模型,详见图1。
3.1 法律手段
在我国,个人信息保护相关制度在《网络安全法》有专章规定,《民法典》和《数据安全法》等也对个人信息具体保护制度进行了规定。2021年11月,《个人信息保护法》的出台为个人信息权益保护提供了体系化的法律依据。上述立法进步表明,我国个人隐私保护法律框架已初具雏形。从适应数据要素流通交易和档案数据开放趋势看,对数据要素价值化中的档案数据隐私保护须重点进行以下规制。
在数据资源化阶段,应构建完善的档案数据隐私保护制度体系。对档案数据从采集到开发应用全流程中的隐私保护进行规定,分别明确规定档案所有者、档案形成者和保管者等对档案数据隐私享有受控或限制利用的权利,确保档案数据隐私在合法、安全的前提下流通和使用。同时,针对网络平台的数据档案化过程,特别是针对伴生数据的档案化过程,应制定合规的档案数据隐私采集、处理与使用协议标准。网络平台数据采集、处理与使用协议标准是确保数据处理活动合法、透明并尊重数据主体权利的关键文件,应当覆盖数据的收集、存储、处理和共享等全过程,它也是保证数据档案化过程合理、合规的基本条件。档案部门应站在数据档案化立场上,协同有关网络主管部门、大数据管理部门等制订有关数据的档案化管理与流通利用制度。
在数据资产化阶段,应当建立档案数据资产目录,记录档案数据来源、使用状态和流转历史,明确档案数据要素价值化过程中的权属权责关系,确保档案数据资产的透明度和可追溯性。在具体操作上,一方面应当参照现存个人信息和个人隐私保护相关规定进行档案数据隐私权属权责界定,明确档案数据处理者和存储者应承担的义务,确保其在档案数据资产化过程中严格遵守隐私保护原则,充分尊重档案数据主体的数据获取权、数据修改权、限制处理权和数据被遗忘权等基本权利。另一方面,应当建立档案数据确权机制,以法律形式明确数据权利的类别、权利的归属问题。[41]虽然《数据二十条》提出了数据资源持有权、数据加工使用权、数据产品经营权“三权分立”的产权运行机制构想,但对其如何具体实践仍待探索。将上述构想在档案数据要素资产化中进行探索实践,对挖掘档案数据要素价值具有重要意义。
在数据资本化阶段,应当建立档案数据交易规则与标准,规范档案数据交易活动,确保合理分配档案数据价值,同时保护档案数据主体的隐私和权益。当档案数据作为资产进行交易时,须确保买卖双方均遵守数据隐私保护法规,并在交易协议中明确数据的使用范围、期限以及隐私保护条款;档案数据交易有时涉及跨境传输,可能受到不同国家法律约束,导致隐私保护难度大大增加,此时还应遵守跨境数据流动法规并进行合规性审查。在进行档案数据跨境传输时不仅应遵守国际数据传输协议,还应尊重其他国家或地区对境内产生的数据的管辖权和控制权,遵守数据主权国家的数据保护法,确保跨境数据传输过程和数据处理活动合法合规。
3.2 技术手段
技术手段在档案数据要素价值化过程中发挥至关重要的作用,它有助于保障档案数据的安全性和完整性,实现细粒度的隐私内容与利用权限管理。在档案数据要素价值化过程中,档案管理机构正在逐渐引入并应用多种隐私治理技术,这在一定程度上提升了档案数据隐私保护水平。然而,目前技术应用深度和广度仍显不足,隐私治理技术的应用范围也有待进一步扩大,可拓展覆盖到更多档案类型和档案数据治理环节。
数据资源化阶段的关键技术包括去标识化与匿名化、数据加密技术和边缘计算。具体而言,去标识化是指通过对档案数据的技术处理,使其在不借助额外信息的情况下,无法识别或者关联档案数据主体的过程。[42]如通过哈希函数处理个人标识符,其程度可根据数据的敏感性和用途进行调整。匿名化则采用K-匿名性、L-多样性和t-接近性等技术,确保数据集中任W01Dv/mVKly58dhvVMY3jQ==何个体无法被唯一识别,具体通过分组和添加噪声来实现,经过匿名化处理后的信息不能被复原。[43]数据加密技术主要分为对称密钥加密和非对称密钥加密。基于对称密钥的AeS算法是一种迭代式数据包加密算法,使用一致性密钥处理数据,每次加密时需要进行轮密钥加、字节替换、行位移、列混淆等运算。[44]边缘计算通过在数据生成地部署以减少数据向中心服务器的传输,不仅降低网络延迟和带宽消耗,还能够在将数据上传到云端之前执行数据所有者的隐私策略。[45]综上所述,在档案数据资源化阶段首先通过去标识化与匿名化技术降低档案数据聚合时的可识别性,同时采用数据加密技术确保档案数据存储和传输过程中的安全性,并利用边缘计算减少敏感数据的远程传输需求。
数据资产化阶段的关键技术包括访问控制和数据质量控制。访问控制旨在限制已认证用户对系统资源的访问权限,这是确保档案数据隐私安全的重要手段之一。档案管理机构应建立完善的访问控制机制,对访问档案数据的用户进行身份验证和权限管理,通过设定合理的访问权限规则,确保只有经过身份验证和授权的用户或应用程序才能访问敏感档案数据。具体可以通过基于角色的访问控制、细粒度访问控制和多因素身份验证等手段来实现。档案数据质量控制主要体现在两个方面:一方面是要实现档案数据隐私采集与使用的最小化,不仅应当仅采集实现特定目的所需要的最少量数据,还应当定义档案数据保留期限和删除策略,确保过期或失效档案数据被安全销毁,减少数据存储量,以降低档案数据隐私风险。2023年无锡市集中永久销毁10亿条涉疫个人数据的做法就是一个很好例证[46],它不仅确保涉疫个人数据隐私无法恢复,保障个人数据隐私安全,而且这也表明,数据档案化过程也是一个选择与鉴定的过程。另一方面应通过实施数据清洗和验证流程,确保数据的准确性和完整性,避免因数据错误引起隐私泄露。
数据资本化阶段的关键技术包括隐私计算、区块链与智能合约、数字沙盒。隐私计算技术集成密码学、计算机安全、数据科学等多种方法和技术,旨在确保数据隐私的前提下,实现对数据的安全分析和处理,即实现数据的“可用不可见”,关键技术包括多方安全计算、联邦学习、可信执行环境、同态加密、可信密态计算等。[47]在档案数据资本化阶段中,隐私计算技术能够通过数种加密和隐私保护机制实现档案数据价值挖掘与隐私保护之间的平衡。例如,同态加密技术允许在未解密状态下对加密数据直接进行计算;安全多方计算使得多个参与方在不泄露各自输入数据的情况下共同完成一个计算任务;差分隐私则通过向数据添加噪声的方式,确保任何个体的信息都无法从查询结果中被推断出来;可信执行环境则为数据处理提供一个隔离且可信的计算环境。区块链作为一种分布式账本技术,通过去中心化和加密算法确保数据的不可篡改性和透明性。智能合约则是部署在区块链上的自动执行协议,能够根据预设条件自动执行合约条款,无需第三方中介。[48]在档案要素资本化进程中,应用区块链与智能合约技术有助于确保每条数据交易都被记录且无法更改,提高数据交易效率和可信度。数据沙盒是一种为数据处理和分析提供隔离环境的方法,它允许用户在一个受控的安全环境中访问和操作数据,而无须直接接触原始数据,确保数据的隐私性,同时通过提供一系列工具和服务,如统计分析、机器学习模型训练等,在保护隐私的同时发挥数据的价值,是解决隐私保护和数据挖掘之间矛盾的有效方案。[49]在档案数据隐私治理中,数据沙盒技术能够用于构建一个安全的数据处理平台,数据处理者访问经过隐私保护处理的数据副本进行分析,无须担心泄露原始档案中的数据隐私。
3.3 行政手段
行政手段是指在数据要素价值化中的程序性手段,即在档案数据要素价值化过程中,通过制定并执行一系列操作性的程序、制度和流程,对档案数据的收集、处理、利用等环节进行规范和管理,旨在确保档案数据有效利用与价值实现的同时,充分保护个人数据隐私。在行政层面进行档案数据隐私治理需要综合运用多种策略,以构建一个全方位、多层次的隐私治理体系。
在数据资源化阶段,确保档案数据采集的合法性和合规性至关重要。这一过程涉及合规化采集流程和建立数据保护影响评估(Data Protection Impact Assessment, DPIA)程序。合规化采集流程指采集档案数据时应遵循适用的数据保护法规要求,确保数据主体知情同意,并明确告知其数据将被如何使用,同时遵循最小化收集原则,确保数据准确性、时效性和安全性。数据保护影响评估是欧盟在隐私影响评估(Privacy Impact Assessment, PIA)基础上创设的一种系统性的风险评估方法,能帮助管理数据控制者或处理者处理个人数据对自然人权利和自由造成的风险。[50]DPIA通常在数据处理活动开始之前进行,用于识别和评估数据处理活动中的潜在隐私风险,并帮助数据控制者或处理者将风险最小化,以确保数据处理活动符合相关规定。由于档案数据处理过程涉及的档案数据主体较为复杂,如何应用DPIA还需要咨询领域专家。
数据资产化阶段的关YA/qv3tOX5CCsH5XFqAtpE+w87Au4lZe/NN4s35G31c=键手段包括应用场景控制程序和分类分级管理制度。应用场景控制程序基于不同业务需求和档案数据使用场景,精细化控制档案数据访问和使用权限,确保数据使用既满足业务需求又符合隐私保护原则,减少隐私泄露风险。在数据要素价值化过程中,档案开放审核、数字化成果处理等都应明确界定数据使用范围与目的,确保数据在授权范围内被合理使用。例如,在档案开放审核中,可利用深度学习、自然语言处理技术建立审核模型,同时,针对声像档案等特殊类型,可采用人脸识别、语音识别等AI技术进行处理,但须严格控制处理结果的传播与利用,避免隐私泄露风险。分类分级管理制度是一种系统性方法,它根据档案数据价值和敏感性对其进行分类分级,帮助档案管理机构更好理解和管理档案数据资产,确保档案数据的安全性和合规性。通过数据分类对不同档案数据资产进行编目和标准化,为责任划分提供依据;通过数据分级将档案数据根据其敏感程度和遭到泄露或非法利用后的影响范围,按照一定原则进行排序,为评估档案数据资产隐私风险提供依据。建立档案数据分类分级制度要以档案业务需求为基础,利用知识图谱技术等进行自动化扫描,通过预设参数对档案数据进行分类分级,以简化业务流程。
数据资本化阶段的关键手段包括数据信托制度和档案数据泄露应急响应程序。在信任不足、权利边界难明确的情况下,诸如“信息受托人”、数据交易所等对于个人数据流通机制的探索仍不能解决个人数据处理中不平等的结构矛盾[51],数据信托制度作为一种创新的隐私治理模式,旨在通过第三方机构或组织来管理和保护数据,确保数据的所有权、使用权和价值分配的公平性。同时通过区块链技术确保数据交易的透明度和不可篡改性,增强数据交易的信任基础,并确保数据处理活动遵守相关规定,保护数据主体隐私权利。档案数据泄露应急响应程序通过预先设计流程和策略快速检测、响应和减轻数据泄露事件影响,包括定期进行风险评估、实施持续数据监测机制、启动快速响应计划以及事后分析与改进,确保发生数据泄露事件时能够迅速采取行动。
此外,档案管理机构还应完善全流程组织架构并建立数据安全审计制度。[52]具体而言,应当设立专职档案数据安全管理职能部门,制定档案数据安全管理制度[53],不断优化档案数据安全处理流程。同时,定期实施档案数据处理活动安全审计程序,对档案数据的共享、开放和使用情况进行分析,发现并及时纠正潜在安全隐患和违规行为。
4 结 语
本文在梳理档案数据隐私来源及其风险表现基础上,构建了一个数据要素价值化视角下的档案数据隐私治理模型,并在此基础上从法律手段、技术手段和行政手段三个角度提出档案数据要素隐私治理路径。数据要素价值化中的档案数据隐私治理是一个理论与实践交织的复杂议题,由于档案部门目前尚游离在数据治理体系的整体框架之外,档案数据是生产要素的理念也未形成共识,档案数据的开放力度与范围仍须进一步加大,因此,数据要素价值化中的档案数据隐私治理需要结合档案开放审核、档案开发利用场景、档案数据交易流通等实践工作开展实证研究,以进一步发现档案数据隐私治理的特征与可能途径。
作者贡献说明
周毅:确定论文选题及框架,论文撰写、修改与定稿;陈美君:论文撰写与修改。
注释与参考文献
[1]许晓彤,张嘉玮,李照川.档案数据要素化的历史源流、关键问题与价值空间[J].档案与建设,2024(5):12-21.
[2]赵跃,李琪,王月.关于档案数据要素若干基本问题的思考[J].档案与建设,2024(5):3-11.
[3]周毅.档案数据治理的认识维度及其价值[J].档案与建设,2023(2):8-12.
[4]周林兴,黄星.大数据时代档案数据开放共享机制探析[J].档案与建设,2023(3):8-12.
[5]杨智勇,岳幸晖.档案数据价值链模型构建及实现路径探析[J].档案与建设,2024(4):18-25.
[6]杨鹏.档案数据要素价值论[J].档案与建设,2024(4):26-35.
[7][30]蒋明敏,赵春雷.大数据环境下我国政府信息公开的安全风险及其应对[J].世界经济与政治论坛,2020(2):93-107.
[8]吴宁博,李金燕,杨帆,等.我国政府数据开放的隐私风险判定及其治理路径研究[J].情报杂志,2023(11):192-198.
[9]刘新萍,孙文平,郑磊.政府数据开放的潜在风险与对策研究——以上海市为例[J].电子政务,2017(9):22-29.
[10]卫玮.政府数据开放中的个人隐私泄露及保护研究[D].哈尔滨:黑龙江大学,2020.
[11]罗康,彭长根,谭伟杰,等.基于属性权重的隐私泄露风险评估方法[J].计算机技术与发展,2022(10):82-87.
[12]臧国全,张盼盼,柴文科,等.个人通信数据的敏感性识别与隐私计量研究[J].图书情报知识,2024(2):110-120.
[13]肖洋,臧国全.个人金融数据的敏感性识别与隐私计量研究[J].情报理论与实践,2023(9):105-114,86.
[14]臧国全,柴文科,张盼盼,等.个人教育数据的敏感性识别与隐私计量研究[J].情报理论与实践,2024(8):84-94.
[15]陈美.政府开放数据的隐私风险评估与防控:英国的经验[J].中国行政管理,2020(5):153-159.
[16]盛小平,唐筠杰.开放科学环境下的数据隐私治理研究[J].图书情报知识,2024(4):57-66.
[17]朱贝,王传清.我国科学数据共享中的隐私治理探析[J].图书情报工作,2020(22):37-47.
[18]白银.档案数字化转型中隐私保护的理论优化与制度完善[J].档案学通讯,2024(3):19-28.
[19]阳雪雅. 数据要素市场下个人数据交易的证成与实现[J].上海政法学院学报,2023(5):91-105.
[20]钱毅.技术变迁环境下档案对象管理空间演化初探[J].档案学通讯,2018(2):10-14.
[21][27]金波,添志鹏.档案数据内涵与特征探析[J].档案学通讯,2020(3):4-11.
[22]钱毅.在“三态两化”视角下重构档案资源观[J].中国档案,2020(8):77-79.
[23]盛小平,焦凤枝.国内法律法规视角下的数据隐私治理[J].图书馆论坛,2021(6):85-99.
[24]王忠,王萌晔.平衡数据流通与隐私保护:第三方数据信托运行机制研究[J].经济纵横,2024(1):101-109.
[25]王德正.人工智能背景下隐私数据侵权责任的认定困境[J].法治论坛,2023(4):35-53.
[26][37]中国信息通信研究院政策与经济研究所.数据价值化与数据要素市场发展报告(2021年)[R].北京市:中国信息通信研究院,2021.
[28][29]梅傲,陈子文.政府数据开放中的数据安全隐忧及其纾解[J].情报杂志,2023(5):76-85.
[31]张平.政务大数据环境下数据共享安全保密问题研究[J].保密科学技术,2019(6):42-46.
[32]徐伟,徐静.数智时代用户画像数据安全风险及应对[J/OL].南京邮电大学学报(社会科学版),1-14[2024-07-29].https://doi.org/10.14132/j.cnki. nysk.20240719.002.
[33]郭维嘉,郭少友.开放政府数据中的个人隐私风险类型及消解机制研究[J].河南科技,2018(4):21-24.
[34]尹海员.数字经济中的消费者数据隐私保护——基于数据伦理和数据所有权视角的探究[J].经济学家,2023(4):79-87.
[35]覃浩华,李志.基于智能合约的数据跨境流动风险识别机制[J].中国人民警察大学学报,2022(6):31-37.
[36]2022年度全国档案主管部门和档案馆基本情况摘要(二)[EB/OL].[2024-07-20].https:// www.saac.gov.cn/daj/zhdt/202308/0396ea569aa648f1befd 5c49bac87e6f.shtml.
[38]汪伟民,丁云.县域公共数据档案化治理的理论与实践探索——以嵊州市“个人全生命周期档案”综合智治应用建设为例[J].浙江档案,2023(4):11-13.
[39]刘震.数智化革命—价值驱动的产业数字化转型[M].北京:机械工业出版社, 2022.
[40]刘涛雄,戎珂,张亚迪.数据资本估算及对中国经济增长的贡献——基于数据价值链的视角[J].中国社会科学,2023(10):44-64,205.
[41]赵蔡晶.国内数据要素价值化研究综述及展望[J].信息资源管理学报,2024(2):41-53.
[42]袁纪辉.有关个人信息处理技术概念的厘清——匿名化、去标识化、假名化、去识别化之辨析[J].保密工作,2021(5):59-60.
[43]周娜,刘刚.个人数据共享中的匿名化技术现状与建议[J].中国新通信,2023(17):43-45,75.
[44]范海峰.数据加密技术在计算机网络安全中的应用[J].信息记录材料,2023(6):58-60.
[45]高聪,陈煜喆,张擎,等.边缘计算:发展与挑战[J].西安邮电大学学报,2021(4):7-19.
[46]一地宣布:销毁10亿条涉疫个人数据![EB/OL].[2024-07-20].https://baijiahao.baidu. com/s id=1759303802451016147&wfr=spider&for=pc
[47]何安珣,李宏宇,韦韬.保障隐私安全促进数据流通——隐私计算应用技术发展趋势综述[J].人工智能,2023(6):35-42.
[48]王文悦.基于区块链的物联网访问控制机制研究与实现[D].济南:齐鲁工业大学,2023.
[49]潘鹤中,韩培义,向夏雨,等.深度学习数据窃取攻击在数据沙箱模式下的威胁分析与防御方法研究[J].通信学报,2021(11):133-144.
[50]肖君拥,张雪亭.欧盟数据保护影响评估制度及其镜鉴[J].电子科技大学学报(社科版),2022(5):18-29,52.
[51]周辉,张心宇.新型数据信托机制的创新价值与构建路径[J].南京社会科学,2024(4):98-108,120.
[52]卞咸杰.大数据时代智慧档案信息服务平台数据安全风险及其对策[J].档案管理,2022(6):38-41.
[53]张艳丽.数据隐私与安全:档案管理的挑战与解决方案[J].兰台世界,2024(5):57-59.
(责任编辑:张 帆 冯婧恺)