严 宇,孟天广
清华大学 社会科学学院,北京 100084
随着数字化浪潮席卷全球,数字技术正深刻影响着人们生活的方方面面。数字化已然成为各国经济社会转型的必然方向。为此,处于数字化发展核心地位的数据要素受到了国际社会的普遍关注。2017 年,习近平总书记指出“要构建以数据为关键要素的数字经济。建设现代化经济体系离不开大数据发展和应用”①习近平主持中共中央政治局第二次集体学习并讲话[EB/OL].(2017-12-09)[2022-01-20].http://www.gov.cn/xinwen/2017-12/09/content_5245520.htm.。同年,《经济学人》封面文章也提出“当今世界最有价值的资源不再是石油,而是数据”②The world’s most valuable resource is no longer oil,but data[EB/OL].(2017-05-06)[2021-06-23].https ://www.economist.com/leaders/2017/05/06/the-worlds-most-valuable-resource-is-no-longer-oil-but-data.。美国2019 年发布的《联邦数据战略与2020年行动计划》更是将数据视为“战略资源”(strategic asset)③2020 Action Plan[EB/OL].(2020-05-14)[2021-06-23].https://strategy.data.gov/action-plan/.。2020 年,中共中央、国务院发布的《关于构建更加完善的要素市场化配置体制机制的意见》更是将数据视为一种新型生产要素,与土地、劳动力、资本、技术等传统生产要素处于并列地位④中共中央 国务院关于构建更加完善的要素市场化配置体制机制的意见[EB/OL].(2020-04-09)[2021-06-23].http://www.gov.cn/zhengce/2020-04/09/content_5500622.htm.。
数据要素的价值已经得到广泛认可,但如何厘清数据要素的产权归属、明确数据权利保护和构建数据治理体系是世界各国面临的共同难题,直接制约着数据要素价值的最大化开发与释放。目前,有关数据要素的产权归属存在多种竞争性观点,如个人所有、企业所有、企业与个人共有、国家所有、公众共有等。对于数据要素的产权保护,学者们已经从人格权、财产权、知识产权角度展开讨论,但上述问题尚未形成共识。为此,本文拟聚焦数据要素的权属界定与治理规则,从数据要素的概念、特征、类型和价值等方面展开论述,辨析不同类型数据要素的产权归属与保护路径,为充分挖掘数据要素价值、构建数据要素市场提供理论基础。
本文的框架安排如下:首先,讨论数据要素的定义与特征,辨析数据与信息、原始数据与衍生数据的区别。其次,阐述数据要素在经济、社会与政府治理三方面的价值,拟说明数据要素的价值形成不仅依赖数据采集与汇聚,更依赖数据流通与利用。再次,针对现有数据要素的分类方法,提出新的类型学分类,从“数据谁持有”与“数据谁生成”两个维度切入,区分政府和企业作为数据持有者所管理的四类数据。随后,基于数据要素的类型学分析,界定数据要素的产权归属,并结合人格权和财产权视角讨论四类数据要素的治理逻辑。最后,就数据要素治理提出相关思考与建议。
对数据要素的定义需从数据和要素两部分切入。首先,何为数据?我国与世界其他国家通常将数据定义为信息的数字化表现形式,后者是前者的主要内容。2021年发布的《中华人民共和国数据安全法》将数据定义为“任何以电子或者其他方式对信息的记录”①《中华人民共和国数据安全法》[EB/OL].(2021-06-11)[2021-06-28].http://www.xinhuanet.com/2021-06/11/c_1127552204.htm.。“淘宝诉美景案”中,一审法院也明确承认信息与数据是内容与形式的关系②(2017)浙8601民初4034号民事判决书。。国际标准化组织(ISO)将数据视为信息的形式化体现,便于后者的交流、理解和处理③ISO 10782-1:1998(en),Definitions and attributes of data elements for control and monitoring of textile processes—Part 1:Spinning,spinning preparatory and related processes[EB/OL].[2021-06-28].https://www.iso.org/obp/ui/#iso:std:iso:10782:-1:ed-1:v1:en.。欧盟2018 年颁布的《通用数据保护条例》(General Data Protection Regulation,GDPR)将个人数据(personal data)定义为能够直接或间接识别自然人的任何信息,可见该条例对个人数据的定义也是聚焦于其内容——信息④欧盟《通用数据保护条例》[EB/OL].(2016-04-05)[2021-06-28].https://eur-lex.europa.eu/eli/reg/2016/679/oj.。由此可见,信息是数据的内容,数据是信息的表现形式,信息以数据的方式生成、传输、储存、分析和处置[1]。因此,数据是信息的载体,掌握数据并不仅仅只是掌握了信息,还影响着信息的权属、流通、使用、收益和处置的整个生命周期。
其次,何为要素?“要素”一词来自经济学,指的是生产经营活动所需要的各类资料,譬如被视为三大生产要素的资本、劳动、技术。当前,以移动互联网、大数据和人工智能为代表的数字技术正深刻改变着社会生活和生产方式,由此诞生了数字经济、数字政府、数字社会等全新现象和领域。在此过程中,数据不再是冰冷的数字,而是推动经济社会发展的关键要素,其中数据的经济价值尤被重视。数据社会经济价值的存在使得数据“有利可图”,从而引发现阶段对数据产权的诸多争论。因此,将数据视为要素能更好凸显其经济价值和社会意义。也正是以此为基础,本文展开对数据要素产权归属和治理逻辑的探究。
数据所承载的信息,就其内容而言,可以是关于政府或企业的,也可以是关于个人的。在此,本文着重讨论关于个人信息内容的数据,即个人数据。个人数据可以分为两类:个人信息与个人数字痕迹。两类数据的差别在于它们能否直接体现自然人身份,即可识别性。首先,个人信息,主要指能够直接识别个人身份的信息,如姓名、身份证号、家庭住址、手机号码、银行账号、生物信息等。这些信息能够单独或与其他信息相结合,用来识别个人身份。其次,数字痕迹,也被称之为非个人信息数据[2],指的是个人使用数字化服务与设备设施时留下的使用痕迹,如浏览、搜索、购买、对话、运动等在数字设备上留下的记录。单独使用数字痕迹时,尤其是脱敏加密的状态下,其所承载的信息是难以识别个人身份的。胡文涛[3]将个人信息与数字痕迹视为敏感和非敏感数据。但这一分类受到质疑,原因在于大数据技术日益发达的今天,任何数字痕迹都可能具有将非敏感数据转化为敏感数据以识别个人身份的能力[4]。黄锫[5]甚至认为并不存在绝对不可识别个人身份的个人数据。在这种情况下,对数字痕迹的利用也必须考虑对其承载的个人身份信息进行隐私保护。
数据也可分为原始数据与衍生数据,其中原始数据又被称为“原生数据”或“基础数据”,而衍生数据由于其一般具有更高的社会经济价值,也被称为“增值数据”[6-7]。原始数据指的是未经加工、编辑的数据,例如政府收集的政务数据、公众在互联网上留下的个人信息与使用痕迹(如浏览记录、购买记录)。原始数据通常具有体量大、结构复杂、来源众多等特点,在未经整理和分析的情况下,其价值通常难以体现与释放。衍生数据则指基于特定目标、通过数据分析和计算对原始数据进行加工处理所提取的结果,例如企业通过计算消费者线上购物行为所得出的消费者画像、消费模式等,前者可以为企业个性化服务提供依据,后者则反映了消费者行为的普遍规律,从而为企业改善经营提供依据。在“淘宝诉美景案”中,淘宝开发的“生意参谋”数据产品就属于衍生数据,能够为淘宝、天猫店铺商家提供商品销售行情,为其改善经营提供参考。
数据作为一种无形要素,与资本、劳动、技术等三大传统生产要素相比,具有虚拟性、非竞争性、排他性和非均质性等显著特征。对这些特征的理解不仅体现了数据要素的独特性,还有助于厘清这些特征如何影响数据要素的产权归属问题。
一是虚拟性。数据要素的虚拟性使其无法独立于数字技术与设备而存在,而这直接影响数据要素所有权的判定。数据的生成、采集、存储、分析与处理都必须依托数字技术与设备,因此虚拟性被视为数据要素的核心特征之一[8]。例如,平台企业的消费者数据(包括消费者个人信息与消费记录等)不仅需要消费者的行为付出(如使用平台、提供信息),还需要平台企业使用其技术与设备采集、整理和存储这些信息。数字技术与设备是数据得以生成、存续与价值发挥不可或缺的基础,因而成为数据要素产权界定需要考虑的因素之一。
二是非竞争性。非竞争性指的是物品被生产后可以被多人消费、使用,某一使用者对该物品的使用不会减少对其他使用者的供应。这意味着增加该物品消费者的边际成本为0。典型的例子如国防,人口的增加并不会使得国家对每个人的安全保障有所降低。数据要素也同样具有非竞争性,且这一特征在数据要素的使用权上表现得尤为明显。数据要素一旦生成,就可以同时被多个主体使用,新增使用主体并不会影响到原有主体对数据要素的使用效用,即数据要素的使用边际成本为0[9]。因此,数据要素的使用效率高、潜在价值大。
三是排他性。排他性指的是当某一物品被某一主体拥有后,其他主体就无法再使用该物品。数据要素的排他性指的是数据的生成、收集和利用通常会由某些主体控制,其他主体则被排除在使用该数据要素的范畴之外。可见,排他性主要与数据要素的所有权相关联。例如,科技企业所拥有的用户个人信息与数字痕迹通常只服务于其自身的经营活动,其他企业则会被排斥在外。数据要素的体量越大、信息量越丰富、结构越复杂,数据要素的经济价值越会持续增长,其排他性则越明显。因此,数据要素日益被科技企业视为核心资产,其排他性也日益凸显。
四是非均质性。并不是所有的数据都有较高的社会经济价值。例如,个体拥有的关于自身信息的数据,虽然受到法律严格保护,但因为体量有限,其社会经济价值并不高。再如,平台企业持有体量庞大、结构复杂、维度多元的用户数据,但运用专业知识对数据进行深度挖掘与分析之前,这些数据的价值或是较低,或是难以体现[10]。此外,不同主体会从不同角度对数据要素进行挖掘和分析,其所产生的社会经济价值也不尽相同。数据价值的非均质性既取决于数据体量、结构、维度等方面的丰富程度,也取决于对数据进行分析利用的程度与方式。受这一特征影响,数据要素的产权界定不仅要考虑数据自身的质量,还需要考虑分析利用数据可能带来的衍生价值。
2020 年,中共中央、国务院发布的《关于构建更加完善的要素市场化配置体制机制的意见》将数据作为新型生产要素,这充分肯定了数据要素的经济价值。与此同时,数据要素还具有巨大的社会与治理价值。这些价值无疑体现了数据要素对促进经济社会发展、强化国家治理的重要作用。数据要素价值的实现依赖数据要素的采集、汇聚、分析和利用,因此理解数据要素的价值对于界定数据权属和提出数据要素的治理逻辑至关重要。
数据要素的经济价值体现在以下三方面:第一,数据要素分析能够为企业刻画消费者的个人偏好[11],为满足消费者需求提供个性化服务,例如有针对性的信息推送与产品推荐。第二,数据要素能为企业提供消费者群体的信息。通过对数据分析,企业能更好地掌握消费需求和市场动向,发挥数据辅助经济决策的功能,改善其经营策略,优化企业资源配置,提升产品与服务质量,帮助企业扩大市场份额。在这方面,淘宝的“生意参谋”数据产品最为典型。第三,通过为企业经营决策提供数据依据,数据要素能够在市场层面加快资源流通速度、优化资源配置效率,进而推动经济增长[12]。
数据要素的社会价值体现在三个方面:第一,数据,尤其是在政府、社交媒体等非经济平台采集的数据,是数字时代社情民意的传声筒。数字技术的发展让普通个体在社会议题上拥有了选择、制作和传播信息的能力[13]。当反映个体意见的数据汇聚起来时,就形成了社会舆论,而这些数据也成为感知社情民意的重要指标。第二,数据能够助力社会风险的识别和预测[14]。当前,我国正处于全面深化改革的关键时期,各种社会矛盾相对比较突出,社会风险呈现出新的特点。通过对政府网站、微博、微信、论坛、新闻网站等的数据进行解析、关联关系挖掘、风险指数计算和可视化展示,构建地区社会风险指数,不仅可以为政府管理和决策提供参考依据,还可以反映政策的实施效果,帮助政府及时评估政策的正确性和有效性[15]。第三,数据要素的创新应用能赋权社会组织[16]。数字时代,社会组织必须依靠互联网思维,实现网络化、全球化、平台化的转变[17],数据要素是实现上述转变的必备基础。数据的海量积累与分析运用是社会组织重塑组织结构、提升自治能力的重要依托。
数据要素对政府治理具有三方面价值:第一,数据培育政府数字治理能力。在“一切皆可数”的数字化浪潮中,数据成为政府融合数字空间与现实社会的重要桥梁。以数据要素为基础,运用大数据、人工智能等方式分析数据,政府能够更加全面地掌握经济社会运行规律,预测、研判潜在社会风险,增强政府的社会监督管理能力[18]。第二,数据要素优化政府内部工作流程。借助数字技术,对数据要素的分析与利用可以改善政府的决策流程,优化政府的决策目标,提升政府治理效率和精准度,判断政府治理效果,便利政府施政评估[17]。第三,数据要素提升政府科学决策水平。数据要素精准、动态地反映社会生活的运行状态,提高了政府对社情民意和社会风险的敏感度和反应度,为科学决策提供数据依据[17]。
通过梳理数据要素的经济、社会与治理价值,不难发现数据要素的价值实现需要两个必要条件:海量数据的收集汇聚和依托专业知识的数据分析。第一,只有数据要素总量达到较大规模的时候,数据要素才具备反映经济规律和社情民意的能力。即便是利用消费者消费行为所计算出的用户画像,也需要依靠海量数据来提高计算结果的准确度。第二,数据要素必须依赖专业的数据分析才能从信息转化为相应领域的知识,助力经济、社会和治理活动。淘宝的“生意参谋”之所以有较高的经济价值,被商家所青睐,就是因为其投入大量智力劳动,通过深度开发将大量用户消费行为转化为能够反映市场行情的知识。北京市“接诉即办”改革之所以能取得显著成效,是因为北京市政府对海量政务热线数据进行深度挖掘分析以理解城市运行。由此生成的数据分析结果一方面系统、精准、动态地展现出社情民意的热点和社会风险的潜在分布,另一方面也有效推动了北京市对其治理结构、制度和机制进行重构,进而提升其风险感知能力、民意回应能力和科学决策能力。
现有研究通常将数据要素分为政府数据、企业数据与个人数据。这一分类方式最主要的不足在于混淆了“数据谁持有”与“数据谁生成”这两个基本问题。例如,已有文献提到的个人数据通常指的是包含个人信息与数字痕迹的个人数据,且是涉及众多个体、带有群体性质的个人数据集合。如此体量庞大的个人数据在现实中主要是被政府和企业所持有。
针对现有分类的不足,本文提出新的数据要素类型学,从数据要素持有者与数据要素生成方式两个维度划分数据要素的类型。数据要素持有者或管理者,指的是数据要素被谁持有,或者数据要素的使用被谁管理。这里的持有与管理并不能等同于所有,尤其不等同于法律意义上的所有权。即便在现实世界中,数据要素被某些主体(如企业)持有或管理,即这些主体掌握了数据要素的“实际”所有权,但这也并不意味着法律上也是如此,或者就应该由这些主体所有。现阶段数据要素持有者主要有两类:政府与企业。数据要素持有者一般具有两个特征:一是持有者通过其数字技术与设备采集和汇聚数据,数据体量虽或大或小,但数据内容的丰富程度要远超个人所拥有的数据。二是持有者能够通过运用专业数据分析方法或购买服务的方式,挖掘数据的经济、社会与治理价值,即持有者通过投入各类资源来挖掘数据价值。
本文并未将个人视为数据要素的持有者,因为虽然个人拥有自身信息,但其并非是唯一的拥有者,同时也不拥有其在政府网站、企业平台、移动客户端等设备设施上的数字痕迹。例如,姓名、身份证号、手机号这些信息并非只存储于个人手中,政府、企业都或多或少持有这些信息。而个人的数字痕迹,如购物、浏览、搜索等记录,个人甚至并不全部持有,这些数据被完整地存储于生成这些数据的网站、平台和客户端等设施,被拥有这些设施的政府或企业主体所控制着。因此,实际上,这些数据虽与个人有关,但并不被个人持有。
数据要素生成方式指的是数据通过何种方式实现从无到有的创造和价值实现,具体包括四种:自有数据、用户授权、用户使用和加工创造。本文以数据要素持有者和数据要素生成方式为维度,提出了新的数据要素类型学划分,具体分类见表1。
表1 数据要素的类型学划分
第一类“自有数据”指的是数据持有者自身存在与运行过程中所生成的数据。对于政府,自有数据指的是有关政府履行职责过程中生成的数据,或称之为政务数据①国务院印发的《政务信息资源共享管理暂行办法》第二条规定,政务信息资源,是指政务部门(即政府部门及法律法规授权具有行政职能的事业单位和社会组织)在履行职责过程中制作或获取的,以一定形式记录、保存的文件、资料、图表和数据等各类信息资源,包括政务部门直接或者通过第三方依法采集的、依法授权管理的和因履行职责需要依托政务信息系统形成的信息资源等。,如财政收支、规划文件、执法记录等政府运作过程中生成的数据。对于企业,自有数据指的是企业生产或经营数据,如生产管理数据、运营数据、财务数据等企业经营过程中生成的数据。
第二类“用户授权”数据要素是指通过用户授权,数据持有者在授权范围内记录所生成的个人信息,例如个人在数据持有者网站和移动客户端上注册成为其用户时所提供的姓名、手机号和身份证号等信息。个人信息与其他数据要素不同的是,其存在并不依赖数据持有者所拥有的数字设备设施。这些身份信息在个人使用网站、移动客户端等数字设备设施之前就已经存在。这意味者个人信息与数字设备设施是可以独立存在的。而将二者连接在一起的关键在于用户授权,即用户个人通过签署服务协议同意提供其身份信息。政府和企业作为数据持有者则在用户授权范围内管理、使用和保护这类数据。
第三类“用户使用”数据要素指的是基于用户使用行为生成的数字痕迹,包括用户浏览、搜索、消费等使用数字产品与设备时产生的记录。数字痕迹有两大特点:一是数字痕迹的生成虽然源于用户的主动行为,但其行为目标主要是为获取服务,而非创造价值。以用户搜索行为为例,用户对于信息的搜索旨在获取相关信息,而非创造信息。二是不同于个人信息,数字痕迹的存在必然需要数据持有者所提供的数字产品、服务与设备,后者无法独立存在。结合上述两大特点可以发现,在一定意义上,数据持有者的贡献更为重要,因为用户的主动行为是使用数据持有者的服务,并从中获益。个人信息与数字痕迹这两类数据是目前社会各界争议的焦点,然而现有文献大多并不加以区分,而是将二者混为一谈来讨论产权界定与归属的问题。基于上述讨论,本文对个人信息与数字痕迹这两类数据分开讨论,区分二者的差异,并提出不同的产权归属与治理原则。
第四类“衍生数据”指的是数据持有者运用相关专业知识、数据分析技术对其持有的各类数据进行加工与分析所创造出的数据分析结果。这类数据要素之所以能够存在的关键在于加工创造,对数据加工创造出具有经济、社会与治理价值的知识,推动社会经济发展。例如,政府对公民通过政务热线所反映的诉求数据进行分析,数据分析结果反映了社情民意,为政府科学决策提供数据依据。企业通过对用户的消费行为进行数据分析,探究经济规律,了解市场行情,从而为企业优化经营提供数据支持。
当前,有关如何优化配置数据要素的讨论中,最关键的问题是如何界定数据的产权。产权制度被视为市场经济的基石,是优化资源配置、推动经济增长的重要条件[19]。有关数据产权的界定同样影响着数据要素的价值发挥、数据保护制度的建立以及数据要素市场的培育与发展。
有关产权的定义,经济学界与法学界历来存在差异。一方面,经济学者通常将产权定义为对“物”的占有和使用过程中形成的权利。例如,常修泽[20]认为广义的产权包含三大要义:广领域(覆盖领域广泛)、多权能(以所有权为基础的权利体系)、四联动(产权界定、产权配置、产权交易和产权保护),包括所有、占有、支配、收益和处置等权能。另一方面,法学家则多采用狭义理解,将产权视为物权。产权在法学领域是指财产所有权和与之相关的权利,具体包括经营权、使用权、采矿权和承包经营权[23]。本文所说的数据产权借鉴了经济学对产权的广义定义,将数据产权界定为数据占有、使用过程中形成的权利,具体包括所有、使用、收益、处置等产权权能[21]。
数据产权的界定与保护有两大路径:一个是人格权路径,另一个是财产权路径。人格权路径一般聚焦个人数据,尤其强调个人数据中涉及可识别个人身份的信息数据。人格权路径强调个人的隐私权,重视个人信息与人格尊严的关系[22]。与之相对的,财产权路径则提出数据产权归属应该采取财产权方式。这样做不仅仅是出于提高数据挖掘分析水平、充分释放数据价值的目的,而且还被认为能够更好地保护个人利益[23]。财产权界定的基础是以洛克为代表的劳动权理论。洛克[24]认为当劳动使得某一物品脱离了自然状态,那么这一物品就属于劳动的付出方。劳动权理论对劳动与财产权归属关系的论断,为判定数据产权归属提供了借鉴。在对数据采取财产权路径进行产权归属界定时,其根本在于界定数据是由谁的劳动生成的。
上文提到数据的主要持有者——政府与企业,它们都持有四类数据:自有数据、用户个人信息、用户数字痕迹和衍生数据。本文运用人格权和财产权两种产权界定路径,对这四类数据进行分类讨论,其数据类型与产权归属如表2所示。
表2 数据类型与产权归属
政府与企业自身的数据——政务数据与企业运营数据,其产权归属较为明确,理论界也基本达成共识。首先,应当明确将政务数据界定为政府所有,对社会公开[1]。政务数据由政府所有的依据来自于政务数据收集和生成的主体是国家行政机关,它们在履行法定职责所收集和生成的数据由它们所有具有正当性。政务数据政府所有的界定,不仅要实现政府部门之间的数据共享,还要将其视为公共资源,对社会公众开放①数据对社会公开也存在例外情况,如按照《政府信息公开条例》等法律法规的规定,依法确定为国家秘密的政府信息,法律、行政法规禁止公开的政府信息,以及公开后可能危及国家安全、公共安全、经济安全、社会稳定的政府信息。。将政务数据视为政府所有的做法目前已经在福建省、重庆市等地进行实践。其次,对于企业自身经营数据,理论界与法律界普遍认为该类数据归企业所有。企业对其自身开展经营活动所需要、所生成的信息,如企业名称、经营成本与收入,享有数据产权。
对于个体在政府和企业的网站、移动客户端等数字设备设施上留下的个人信息,理论界普遍认为应该归个人所有。虽然已有研究多关注企业持有的用户个人信息,但政府持有的用户个人信息与之相同,不仅都会直接涉及个人隐私,还都是用户授权政府与企业持有,因此个人信息都应被视为个人所有。用户个人信息划归个人所有后,其保护主要依靠人格权路径,重在保护个人隐私信息。人格权保护路径的典型案例如欧盟颁布的GDPR,对个人数据(在我国语境下即个人信息)设定了八项权利:知情权、访问权、更正权、被遗忘权、限制处理权、反对权和不受制于自动化决策。我国2021年正式颁布实施的《中华人民共和国个人信息保护法》,与《中华人民共和国网络安全法》《中华人民共和国数据安全法》共同构成我国网络法律体系的核心,为个人信息保护提供制度保障。
对个人信息采取人格权保护在我国已有一定实践经验。例如,2018 年江苏省消费者权益保护委员会(以下简称“江苏消保委”)诉百度公司民事公益诉讼案中,江苏消保委指出百度公司旗下“手机百度”“百度浏览器”两款手机软件在用户安装前,均未告知用户其信息获取的权限和目的,且在未经用户同意的情况下,获取诸如“监听电话、定位、读取短彩信、读取联系人、修改系统设置”等涉及用户个人信息安全的权限。这些权限被江苏消保委认为已经超出合理范围,侵犯了消费者个人隐私。江苏消保委在两次约谈百度公司无果后,认为百度公司无法有效保障消费者知情权和选择权,因此向南京市中级人民法院提起公益民事诉讼②涉嫌“监听”侵犯用户信息江苏消保委起诉百度[EB/OL].(2018-01-06)[2021-08-13].https://www.chinacourt.org/article/detail/2018/01/id/3148467.shtml.。
除对个人信息进行人格权保护之外,也有学者提出要考虑财产权保护的方式。随着数字经济的发展,个人信息开始出现商品化现象,例如信息盗卖。在个人信息的经济价值日益显现的今天,仅仅使用人格权对其进行保护,已经无法完全应对个人信息遭受侵害的问题。为此,对个人信息的保护应加入财产权保护路径,构建“个人信息资料权”③吴韬.法学界四大主流“数据权利与权属”观点[EB/OL].(2016-10-24)[2021-07-10].https://www.sohu.com/a/117048454_481893.,将人格权和财产权两种保护路径相结合。人格权保护重在保护个人信息的精神利益,维护人的尊严与自由;财产权保护聚焦个人信息的财产利益,当受到侵害时,损失应按照市场价格计算。
对于用户在政府、企业的网站、移动客户端等产品设备设施上留下的数字痕迹,其产权界定则不像个人信息那么清晰明确。目前,理论界对政府持有的用户数字痕迹讨论相对较少,对企业持有的用户数字痕迹已多有讨论,本文认为虽然政府与企业性质不同,但对后者的讨论能够为判定不同情景下用户数字痕迹的权利归属提供借鉴。
目前,对于企业持有的个人数字痕迹的产权归属问题,至少存在四种观点:个人所有、企业所有、企业与个人共有、社会共有[25]。数据归个人所有的观点聚焦个人作为用户、消费者所生成的数据,认为这些数据是个人合法且不可让渡的权利;数据归企业所有的观点认为个人在企业网站、移动客户端等渠道留下的数据属于企业,企业通过个人在使用其服务时签署的服务协议获得个人数据的使用、收益与处置权;个人和企业共有的观点认为个人数据属于企业与个人共同所有,这一观点在我国法院判决中较为常见;个人数据社会共有的观点认为在互联网企业平台上的个人数据具有公共属性,不能简单归为个人或企业所有。
本文认为用户数字痕迹的产权界定应当采取政府与个人共有、企业与个人共有的方式,其保护路径应以人格权和财产权相结合的方式。这种方式主要来源于用户数字痕迹的生成机制与信息特性。一方面,用户数字痕迹的生成来自用户在数据持有者网站、移动客户端等设备设施上的使用,而这些都需要数据持有者的资源投入,因此数字痕迹的生成需要用户和数据持有者的共同贡献。将用户数字痕迹划归为个人与数据持有者共有产权符合该类数据要素的生成方式。另一方面,在大数据时代,用户数字痕迹同样可能具有识别个人身份的能力。此前,多数人认为用户数字痕迹并不能直接用于识别用户个人身份,但学者发现数字痕迹在与其他数据结合、在巧妙算法的计算下,也可能具有识别个人身份的功能[4]。某些类型的数字痕迹,如医疗健康、宗教信仰等,更容易被挖掘出具有识别个人身份的能力。因此,对数字痕迹的使用应当遵循人格权和财产权保护相结合的方式,坚持底线原则,在个人隐私最大化保护的基础上开发利用数字痕迹,释放其价值。
对数字痕迹采取人格权和财产权保护相结合的方式在我国司法界已有判例基础。例如,2018年法院在“淘宝诉美景案”中,就专门针对淘宝收集和使用其用户信息的正当性进行了界定。涉案的数据产品名为“生意参谋”,是淘宝通过收集、整理、计算和提炼用户浏览、搜索、收藏、加购和交易等数字痕迹所生成的衍生数据产品,能够帮助商家实时掌握相关商品的市场行情变化,改善其经营水平。法院认为虽然用户的数字痕迹不具备单独或者与其他信息结合识别个人身份的可能性,但数字痕迹仍然会涉及个人或商家的敏感信息,有可能暴露个人隐私或经营秘密。经过法院审查,淘宝在开发其数据产品时所使用的信息均符合隐私政策所宣示的原则、范围。法院最终认定淘宝在研发其数据产品时满足了保护用户信息安全的要求,其行为具有正当性①淘宝(中国)软件有限公司诉安徽美景信息科技有限公司不正当竞争纠纷案[EB/OL].(2019-04-02)[2021-08-13].http://www.zjsfgkw.cn/art/2019/4/2/art_80_16841.html.。
衍生数据一般来源于政府与企业对自身数据、用户个人信息、用户数字痕迹的单独或结合分析,可见其生成离不开数据持有者的“加工”。在对数据加工的过程中,数据持有者不仅需要投入设备、资金等有形资源,还非常依赖数据分析人才及其专业知识。甚至后者更加重要,因为人才依靠专业知识制定出的算法才是释放数据价值、生成高价值衍生数据产品的关键因素[10]。
在这个意义上,衍生数据应被视为数据持有者(在本文即政府和企业)所有。政府持有的衍生数据不仅是反映政府运行、社情民意的重要指标,也是政府优化治理体系、提升治理能力、完善服务能力的重要依据。这类数据划归国家所有才能真正发挥上述功能。相似的,企业持有的衍生数据,针对商品制造、销售、购买形成的市场行情报告,对于优化市场资源配置、提升资源配置效率具有重要参考价值,划归企业所有才能释放其经济价值。
上述观点在法院对“淘宝诉美景案”的判决中得以体现。淘宝在诉状中称美景公司招揽、组织、帮助他人获取淘宝“生意参谋”数据产品中的数据内容,从中牟利。淘宝认为其对“生意参谋”数据产品中的原始数据和衍生数据享有财产权,而美景公司恶意破坏淘宝的商业模式,其行为构成了不正当竞争。法院认为淘宝在开发涉案数据产品时,投入大量人力、设备等资源,通过深度开发与系统整合,最终生成了与原始数据无直接对应关系的衍生数据产品——“生意参谋”。因此,淘宝对该数据产品享有独立的财产性权益,可以为其所实际拥有。此外,美景公司在未经授权也未付出劳动的情况下,直接将涉案数据产品占为己有,作为自身获利的工具,有悖于商业道德,对激发开发者创造性、提高消费者福祉、推动数据产业发展都有负面影响。最终法院判定美景公司构成了不正当竞争行为②淘宝(中国)软件有限公司诉安徽美景信息科技有限公司不正当竞争纠纷案[EB/OL].(2019-04-02)[2021-08-13].http://www.zjsfgkw.cn/art/2019/4/2/art_80_16841.html.。
在社会生活数字化不断加深的今天,作为数字化基石的数据要素一直备受关注。数据要素的经济价值已多有讨论,但本文提出数据要素的价值远不限于经济领域,其社会、治理价值同样重要。同理,数据要素市场的构建,不仅能为数字经济新产业、新业态、新模式的发展“添砖加瓦”,还能起到赋权社会、赋能政府等多种作用。为充分释放数据要素的经济、社会与治理价值,如何确定数据要素产权归属成为关键性问题。本文聚焦数据要素的类型学划分,提出了与已有研究有所不同的分类方式。以数据要素持有者和数据要素生成方式为维度,提出政府和企业作为数据持有者,二者都持有四类数据:自有数据、用户个人信息、用户数字痕迹和衍生数据。根据这四类数据的生成方式与信息特性,结合人格权和财产权方式对其进行产权界定,以期实现保护个人隐私与利益,促进数据要素共享流动,释放数据的经济、社会与治理价值,推动数据要素市场培育等多重目标。
当前,数字化转型已然成为全球浪潮,深刻影响着世界各国的社会经济发展与国家实力,甚至将改变世界权力格局。作为其核心“燃料”的数据要素无疑在其中扮演着重要角色。多年来,我国通过数字技术的研发与推广,在经济、政治与社会等领域已经持续积累了海量数据,如何充分释放这些数据要素的价值成为进一步推动社会经济发展、提高民众福祉、提升国家实力的重要议题。因此,我国应结合各地在数据要素确权、共享、开放、交易与应用方面的经验教训,构建数据要素市场,旨在保护个人隐私的同时,增强社会各主体对挖掘数据要素价值的积极性,持续推进数字化、现代化的转型与发展。推动数据要素市场良性发展,我国应依据以下原则加快相关制度建设:
第一,遵循数据要素的分类原则,搭建精细化的产权界定体系。数据要素的产权界定与保护是数据要素市场得以良性发展的必要基础,根据本文的研究发现,数据要素存在多种类型,因此其产权归属需遵循分类原则。通过分类可以明确不同类型数据要素的生成主体与方式,从而判定数据要素产权归属与保护机制,进而发挥数据要素的价值,推动数据要素市场的快速发展。
第二,坚持隐私保护的底线原则,在释放数据价值时保护个人信息。数据要素市场的主要目标是发挥数据要素的经济、社会与治理价值,但价值的释放并非唯一目标。由于数据要素的生成通常会涉及个人信息与数字痕迹,前者能够被直接用来识别个人身份,后者在一定条件下也具有相似功能,因此个人隐私保护是挖掘与释放数据要素价值过程中不可忽视的议题。为此,应遵循个人隐私保护的底线原则,在充分发挥数据要素价值的同时,强化对个人隐私信息的保护。
第三,落实经济社会数据(数字痕迹)的强监管原则,强化政社协同监督作用。数据要素中有关经济社会的数据价值重大,尤其受到企业等市场主体青睐,但在价值巨大的另一面则是潜在的数据安全隐患。为此,应坚持经济社会数据的强监管原则。政府与社会作为监管主体,发挥政社协同的作用;在监督内容上,既要保证数据在使用过程中个人隐私保护的原则,又要确保数据的使用符合相关伦理标准,如透明、公开、人类尊严等。
第四,倡导数据融合与协同开发原则,鼓励多元数据互通汇聚,释放聚合作用。得益于数字技术的快速发展与广泛应用,我国在政府、经济、社会等各领域已经积累了海量数据。然而,这些海量数据目前仍被不同主体所持有,并各自为战,不同类型数据之间的互联互通仍未实现。这是数据要素市场快速发展必然需要解决的问题之一。为此,应坚持多元数据融合、多主体协同开发的原则,创新性地将政务数据、经济数据与社会数据相结合,建立政府、市场、社会等多主体协同开发的工作机制,充分利用各主体的专业知识与技能,最大化释放数据要素的经济、社会和治理价值。