袁 曾,刘志鸿
(上海大学 法学院,上海 200444)
数据作为全新的生产要素,在驱动数字经济高质量发展和打造具有国际竞争力的数字产业集群中发挥着重要作用。确权是数据价值建构的基础,在政策层面,国家高度重视数据基础制度的顶层设计,积极构筑数据基础制度的“四梁八柱”。2022年6月22日,习近平总书记主持召开了中央全面深化改革委员会第二十六次会议,强调要“促进数据高效流通使用、赋能实体经济,统筹推进数据产权、流通交易、收益分配、安全治理,加快构建数据基础制度体系”。2022年12月19日,中共中央、国务院印发了《关于构建数据基础制度更好发挥数据要素作用的意见》(简称“数据二十条”),强调“建立保障权益、合规使用的数据产权制度……根据数据来源和数据生产特征,分别界定数据生产、流通、使用过程中各参与方享有的合法权利,建立数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制”。在数据基础制度深化演进的过程中,对于数据应否确权、如何确权等关键性问题的体系性建构,关系着数据要素市场的整体发展状况。在既有的讨论中,理论界与实务界的观点存在多种分化。有学者认为应否定数据确权,由于当前技术手段无法实现,因此,确权既无必要也无可能。[1]同时,当前数据通常以“副产品”的形式出现,大数据时代下的数据生产,并非一种主动的、有意识的社会生产活动,因此其生产并不需要额外地设置法律机制去激励市场主体行为。[2]而数据缺乏特定性、独立性、专属性以及垄断性,不宜成为民事权利的客体,实现数据流通的关键在于合理设计数据获取、访问规则,而非在于构建确权规则,仅当存在数据滥用或损害竞争秩序的情形时,才有必要进行适度调控与干预。[3]特别是当前对数据交易市场的探索并未达到设想规模,虽然上海数据交易所、北京数据交易所等数十家交易机构相继成立,但数据交易鲜有较大体量的典型案例,其原因亦可归结为数据估值、定价与交易等较为困难。面对现实困境,需要重新从实际出发,反思“数据确权”这一核心命题——数据是否应当确权、确权的技术路线应遵循何种范式、立法究竟怎样为数据确权做相应调整。
应该先予讨论的是,既有法律框架能否为数据权益提供完备的保护方案?在现行法律中,《个人信息保护法》《数据安全法》《网络安全法》等法律和配套法规的出台,初步形成了保护个人信息、规范数据处理活动以及捍卫国家网络安全等互为依托的规制框架,我国在数据前端处理环节已构筑起较为完善的规则体系,但涉及数据权益保护、数据确权的私法保护仍然缺位。《民法典》第127条规定“法律对数据、网络虚拟财产的保护有规定的,依照其规定”。这一规定虽体现出立法者对数据保护的决心和态度,但仅为原则性规定,未能也无法在当时的技术条件下详细规定数据的权利属性与具体保护规则。转而希望通过引致条款的立法技术,为未来数据保护利用范式的完善预留空间。其深层次原因是对数据的概念范畴、法律属性、是否适合确权等核心内容存在较大分歧,立法者基于法的稳定性与权威性的考量,需要在理论与实践层面达成共识后再予以妥善回应。
理论界就数据保护提出了不同路径。一是物权保护路径。即将数据视为民法体系下类似光、电、磁的“无体物”,扩张解释民法中“物”的范畴。[4]为权利主体设定绝对性排他权利,以克服制度桎梏从而更容易被社会公众接受。二是知识产权保护路径。在《民法总则》起草过程中,全国人大常委会《民法总则(草案一审稿)》第108条曾将“信息数据”纳入知识产权客体的范围。有学者主张通过著作权或商业秘密等知识产权路径对数据进行保护。[5]三是合同法保护路径。即突破“物必有体”的局限,通过在交易主体之间创设相对权的方式,确定合同双方的权利义务,体现双方意思自治,合同制度是连接数据利用与价值实现的桥梁。[6]四是反不正当竞争法保护路径。即承认数据持有者对数据享有竞争性财产权益。(1)在“淘宝诉美景”案中,法院强调在“注意力经济”时代,拥有体量规模庞大的用户本身就是一种竞争优势,其需要诚实经营者耗费大量时间、人力、物力等经营成本,因此数据属于可保护的竞争性财产利益。参见广东省深圳市中级人民法院〔2017〕粤03民初822号民事判决书。将市场其他竞争者未经授权的数据爬取、利用等行为视为不正当竞争行为,通过反不正当竞争法一般条款进行规制。但无论以上何种单一路径均存在难以克服的弊端,即无法建立起符合数据资源属性以及适应数据市场发展的宏观规则秩序。
是否有必要对数据进行确权,学界展开了较为全面的讨论,大致可分为支持确权论与否定确权论两类。否定确权论的拥趸多从数据不确定性、不必要性以及不经济性三个维度进行论证。
1.数据特征决定其无法实现精准确权
该说基于数据的物理形态不确定、数据权利主体不确定、数据价值不确定等特征,主张不宜采取数据确权路径以实现数据价值。[7]原因如下:一是数据范围变动不定,缺乏权利客体的特定性。数据的生产规律决定了其范围不特定,数据遵循现代通信技术的传播规律,在其生命周期中,不断会有新数据加入并与原有数据发生融合,进而产生新一轮的数据,“数据池”效应导致其范围始终处于不断变化之中。数据动态变化的范围边界,决定了对数据确权的不可能性与无意义性,对某一时刻的数据集合进行赋权,下一秒该数据集合便发生巨大的变化,与上一秒的数据集合完全不同。因此,对数据集合进行赋权并无可能且毫无意义。二是数据缺乏权利客体所要求的独立性。现实世界中,民事客体依附于民事权利,其必须是实际可控的、独立于他人的权利载体。数据虽具有无形性,但又可与载体完全分离,导致民事主体无法直接控制数据,即便能够控制计算器终端、存储设备等数据载体,也无法阻止数据的流通、复制、共享等行为。三是数据的多元主体导致数据确权难以分配。数据承载了多元主体的利益诉求,导致数据权利分配难以协调,将权利“一刀切”地分配给任何主体都存在顾此失彼的情形。数据用户、网络服务提供商、软件设计者、数据收集者、数据处理者、数据传输者等多元主体均参与数据的生产过程,相关主体基于经济规律均天然觊觎享有数据权利,无论是对不同主体单独配置权利还是由多元主体共同享有权利,抑或是直接归入公有领域,均存在难以调和的矛盾。
2.行为规制范式足以保护数据权益
数据确权否定论的支持者认为应搁置数据确权争议,暂无必要通过构建全新的权利类型涵盖数据这一新兴法益,亦无必要赋予数据持有者相应的数据权利,行为规制范式足以保护数据之上的合法利益。行为规制是指从反向控制相关行为人的行为来构筑利益主体的利益空间,常见的行为规制方案,包括通过反不正当竞争法、合同法等行为规制法以实现对数据权益的反向保护。例如,反不正当竞争法采用“一般条款+类型化条款”的立法例,既能调整类型化的不正当竞争行为,又能调整尚未类型化的不正当竞争行为。考虑到数据竞争作为一种全新的竞争行为,无法被纳入反不正当竞争法列举的十一种类型化行为,因此,法院可以援引反不正当竞争法一般条款(第2条)进行规制。行为规制范式与数据确权范式具有截然相反的保护逻辑。行为规制范式不追求清晰的数据权益边界,也不要求数据权益必须有固定且明确的归属主体,搁置了数据权利证成、权利行使、权属分配等困境,而是将考察重心放在行为本身,重点关注数据获取、使用等行为是否正当,从规范其他主体的数据行为切入,为数据控制者开辟利益保护的通道,从而确定数据控制者专有的利益空间。[8]在此意义上,行为规制范式与数据确权范式均具有分配数据权益的基本功能,只是两者在数据权益分配的逻辑起点上根本不同。数据确权范式的逻辑起点指向“数据是谁的”,其通过赋予数据控制者对数据权益的排他性地位,进而确定数据权利的归属状态,使得每一项数据权利均对应特定、唯一的权利主体。而行为规制的逻辑起点指向“数据行为是否合法”,并不过分关注“数据是谁的”。行为人在不违反法律规定以及公序良俗的前提下,数据控制者与行为人均可使用同一数据,从而获得不同层面上的财产利益。[9]
3.数据确权成本过高
当数据确权成本远高于数据流通、交易成本时,数据确权便是不经济的,这是支持数据确权否定论的主要论据之一。这一问题在法经济学上早有过讨论,根据美国学者卡拉布雷希和梅拉米德在20世纪70年代创立的卡梅框架(C&M Framework),按照法学逻辑归类的划分方法,突破单一部门法对权益的保护框架,将分散在公法领域、私法领域内不同部门的法律规则置于同一框架内进行讨论。具体而言是将法律规则划分为财产规则、责任规则以及禁易规则。[10]按照第一层法律是否允许对相关法益进行自由转移的区分标准,法律规则剥离出禁易规则。按照法律在允许法益进行交易与转移的基础上,抽象出是否允许法益自愿交易与转移,进而区分出财产规则与责任规则。财产规则旨在国家确认相关法益的初始归属,而将法益交易价格交由双方当事人自愿协商,取得法益的乙方必须征得法益所有者的同意。对于数据权利这一新兴法益,法律体系应结合现实需求从以上法律规则中适配最为恰当的方案,即需要在禁易规则、财产规则与责任规则中选择较优方案。反对数据确权者认为,责任规则与数据权益保护问题更为契合。司法实践中,相关典型案例均选择责任规则,通过援引反不正当竞争法一般条款,按照司法机关的定价确定损害赔偿的方式,以保护数据权益。此种裁判路径一方面兼顾受损害的企业得到相应的法律救济;另一方面通过司法机关以法定价格确定损害赔偿金的方式使得法益转移的效率提升,即数据法益的转移不以交易双方当事人的意志自治,而是通过司法机关第三方定价进行强制转移。
究其原因,其一,数据确权后的交易成本远高于确权成本。囿于数据价值在供求双方中的价格预期不同,加之数据要素市场内互联网巨头与中小微企业之间的议价地位不平等,导致即便数据确权,其后的交易成本、沟通成本也远远高于确权成本,使得市场内数据交易流转的效率降低。[11]而“先使用后支付法定价格”的责任规则可强制迫使数据资源重新分配,将数据资源从数据持有方转移至数据需求方。其二,数据确权后的负外部性较强。基于数据要素市场由互联网巨头以及先发企业主导,先发企业通过技术设施优势和相关格式化用户协议在既定事实与法律安排上控制着数据,客观上对数据权益形成反噬,使得数据在平台企业的裹挟下沿着平台企业既定的轨迹运行,触发锁定效应。数据确权可能会进一步巩固互联网巨头的先发优势,诱发其拒绝中小企业访问与使用数据、阻碍后发企业创新利用、加固数据垄断等严重问题。
鉴于数据确权否定论无法满足数据利用的应然要求及其天然弊端,有必要基于发挥数据价值要素的功能,重新考虑数据确权肯定论的价值意义。但在讨论数据确权时,应厘清其是否可以确权以及确权的技术路线。首先,应考察数据与信息的两分,厘定数据确权的范围。其次,需要探明数据的可排他性特征与数据确权的逻辑耦合。最后,无论是行为规制范式还是权利范式,两者的逻辑内核存在同一性,均指向数据确权。
数据与信息的区分是数据确权中首先要厘清的对象问题,这是确定确权问题是属于“数据问题”还是“信息问题”的关键。数据与信息作为当代数字法治中一对密切相关的基础性概念,尚未被有效界定与区分。常见混用类型包括“数据与信息等同说”“数据包含信息说”及“信息包含数据说”,三种类型的模糊使用同时存在又相互冲突,造成相关研究限定在各自学术领域内自圆其说,难以形成学术共同体的“知识前见”。在不断消解法律语言规范性的同时,徒增理论与实践的困惑。事实上,两者并非措辞或者表达习惯的差异,而是构成数据确权的根本性问题,涉及法律调整对象与法律调整方法等诸多方面的重大影响。
在信息爆炸的时代,几乎任何个体均在自觉或不自觉地获取与使用信息,通常理解下,信息是被赋予一定意义的内容。信息可以被编码以及转移,同时信息本身又独立于编码以及转移的过程。[12]但究竟什么是信息,法学界暂未确定一个准确、周延的概念。国际标准化组织《信息技术词汇》(ISO/IEC 2382)将信息界定为关于对象——如事实、事件、事物、过程或思想、理念,在特定语境下具有特定含义的知识。由此可见,数据与信息之间是有重大区别的。在信息的生成链条中,数据是按照一定规则排列组合记录客观事物的符号,信息是赋予数据现实意义后的映射。简言之,“信息=数据+意义”。信息论创始人克劳德·艾尔伍德·香农曾提出,信息赋予数据意义并提高数据的准确性与可靠性,进而减少不确定性。[13]在计算机网络语境下,数据的含义已从“对客观事物的记录”延伸到信息技术领域,常被引申为电子数据,被定义为能够输入计算机中,并被计算机识别和处理的电子符号。以微信为例,存储数据的网络服务器以及手机内存处于物理层,操作系统中以0和1比特形式传输的数据处于代码层,最终用户看到的由文字和语音所呈现的微信消息处于内容层。尽管数据与信息均具备可复制性、可传播性以及价值性,但是两者在技术上具有区分的可能性,信息处于内容层面,而数据处于符号层面,两者之间不存在范围上的交叉或隶属关系,形成了数据与信息两分的差序格局。相较于信息而言,数据具有原始性、电子性等特征,生成、处理、分析、存储以及传输等行为均需要借助于电子手段,依赖于计算机、服务器、存储介质以及用户终端等互联网基础设施。
值得注意的是,数据确权与个人信息是保护分属不同平行维度的法律问题,其内涵、调整对象以及权益性质均存在差异。[14]个人信息被收集后,经过加工处理转换为二进制代码形式的电子符号,该数据即成为个人信息的载体,但信息主体对该数据所蕴含的个人信息内容,仍享有人格或者隐私方面的权益,受到隐私权或者个人信息保护法的保护。数据控制者受保护的利益范围仅限于符号层的数据,并不涉及数据所承载的个人信息。例如,微博、点评等服务类网络平台中,企业在事实层面控制着类型多样的数据,部分数据对应的可能是可识别到的用户的个人信息,部分数据对应的可能是受著作权保护的作品,还有部分数据可能对应的是平台企业的商业秘密。这些数据对应的信息权利归属按照既有法律规范均可找到相应适合的位置与位阶。按照霍菲尔德权利束的解释,作为数据控制者的平台企业基于对数据的存储、加工等劳动,享有对抗外部第三人不正当竞争的防御性权利。(2)根据霍菲尔德权利分析理论,其基本规范形式(元形式)有四种:(狭义)权利(claim)—义务(duty)关系、自由(privilege)—无权利(no-claim)关系、权力(power)—责任(liability)关系、豁免(immunity)—无权力(disability)关系。其中每一种元形式的法律概念都是法律关系中的“最小公分母”,因此需要严格遵循其概念含义。参见王涌:《私权的分析与建构:民法的分析法基础》,北京大学出版社,2020年版,第50页。具体而言,平台企业对数据的使用仅具有自然意义上的可能性,当触及他人信息权益时,他人信息权益对平台使用数据构成阻碍,导致平台企业无法行使数据权益。在大多数情况下,数据承载着个人信息的附着关系,使得两者具有利益一致性。当外部第三人实施侵害数据的行为时,数据持有者可以就其合法权益受到他人侵害为由提起诉讼,并不影响承载个人信息的信息主体就同一行为造成的损害向法院寻求救济。综上,数据保护与个人信息保护分属不同层面的保护问题,两者并行不悖。数据确权需要严格区分数据与信息的关系,数据权利的权利内容仅包含数据权利,不应涵盖信息权利。
不同于其他生产要素,数据本源特征具有非竞争性、可排他性与可复制性。数据之所以成为推动数字经济发展的引擎,得益于数据能够为人工智能、大数据、云计算、元宇宙等新行业、新业态的提供养料供给。基于电子符号特征,数据易与数据载体分离,具有可复制性,且在使用过程中不发生损耗,在数据消费过程中一些主体对数据的消费不会影响其他主体对数据的消费,因此具有非竞争性。数据的非竞争性与可复制性在理论与实践中已达成共识,但数据的可排他性尚存在争论。数据具有有限排他性,应反对绝对化的排他性权利,对受保护数据的范围进行限缩:一是该数据必须是数据收集者付出实质性投入产生的数据;二是该数据必须满足数据规模大、体量大的要求。[15]这样既能保护企业实质投入产生的数据,又能维护公共领域其他人获取、利用数据的行动自由。[16]也有学者主张,数据绝非天然存在的,其生产过程依赖于用户行为、互联网架构等要素,数据持有者可以通过设置技术措施限制他人对数据的访问与使用,划分出数据持有者与社会公众之间的行为空间,形成数据持有者的“专属”利益空间,进而在事实上达到排他性的控制效果。[9]
笔者认为,“可排他性”是数据作为生产要素必须具备的本源特征。一是事实上的排他性。尽管数据可复制性、非竞争性决定数据可被复制并由多主体同时占有,但是并不妨碍数据持有者通过数据伪装限制、登录限制等技术措施排除他人使用。二是法律拟制的排他性,即人为通过设置排他性法律规则制造排他性。具体而言,法律通过确认某一权利主体对某一权利客体享有权利,权利主体可借助法律之力排除他人未经许可使用,并辅之以侵权责任强化破坏排他性的法律后果,知识产权即为例证。数据的可排他性可以通过事实上的排他性和法律拟制的排他性实现,此种排他性确定了数据确权的逻辑基础,使得数据确权在理论上具有可行性。
行为规制范式未能解决数据权益初始分配问题,但其背后的逻辑依然蕴含着确权意识。行为规制范式旨在评价数据持有者之外的主体获取与使用数据行为的正当性,通过划定数据持有者与社会公众之间的界限,以实现数据权益保护,本质上是界定各方主体之间关于数据权益的边界。在此意义上,行为规制范式与确权范式具有共同的结果导向。然而,行为规制范式保护的数据权益类似于一种高度非标准化的数据财产权益,常常表现为依赖事后判断、个案判断,这将使数据持有者缺乏对数据权益的可预期性。作为典型的行为规制法,反不正当竞争法通常援引一般条款进行裁判,一般条款提供的是一种事后的、消极的保护。其并未规定不正当竞争行为的构成要件、客体保护范围以及损害责任等,而是依靠宽泛的诚实信用原则、商业道德进行个案判断,缺乏法律实施的统一性,削弱法的正当性与稳定性。[17]而反不正当竞争法一般条款的保护路径,严重限制了数据的财产权益,无法为数据财产提供交易、转让、设定担保等积极权利,限制了数据流通以及数据产业的发展。在保护目的上,反不正当竞争法旨在维护健康的市场竞争秩序,无法解释数据控制者对数据控制、使用以及收益的问题,通过反不正当竞争法一般条款保护数据,无疑将数据权益降格为一种受法律保护的纯粹经济利益,显然,纯粹经济利益与数据权益并不完全重合。[18]同理,合同法保护路径同样未能正面解决数据交易中数据权益的初始分配问题。
相反,若数据权益边界清晰,则可以给潜在数据利用者提供较为明确的非合意获取与使用数据的预期,有助于促成潜在数据利用者从试探性获取转向事前协商的合意取得。倘若仍然将此种较为明确的数据权益边界纳入以反不正当竞争法为代表的行为规制范式,将会造成数据财产权规则碎片化的窘境。实践中,法院通常援引反不正当竞争法来化解数据权益纠纷,这可能是行为规制论者误认为既有反不正当竞争法分析框架足以应对实践需要。但深层次的忧虑是法院在既有法律框架内无法寻求实体法依据,而不得不援引反不正当竞争法的一般条款。这实则是原因与结果的错配,其逻辑是先确定数据持有者享有何种权利,进而科学划分出与社会公众合理使用之间的边界,最后将超过合理使用边界的行为判定为侵权。但按照侵权标准评价该行为的法律后果,却又无法解决实践面临的问题。
关于数据确权的具体规则,学界提出了诸如数据经营权、数据用益权、公开传播权、数据生产者权、数据产权、数据使用权、权利块、权利束等多种抽象的确权方案。(3)参见申卫星:《论数据用益权》,载《中国社会科学》2020年第11期,第110页;马斌:《数据生产者权之证成——以数据资源排他权为视角》,载《中国流通经济》2021年第4期,第103—115页;付新华:《企业数据财产权保护论批判——从数据财产权到数据使用权》,载《东方法学》2022年第2期,第132—143页;文禹衡:《数据确权的范式嬗变、概念选择与归属主体》,载《东北师大学报(哲学社会科学版)》2019年第5期,第69—78页;龙卫球:《数据新型财产权构建及其体系研究》,载《政法论坛》2017年第4期,第63—77页。“数据二十条”在充分借鉴吸收上述观点后,创新提出数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制,因此,有必要将政策话语体系充分地转化为法律话语体系。基于数据生产周期中不同主体参与生产的贡献度,可以将数据主体划分为“数据来源者”和“数据处理者”,并采取原始数据权利以及数据产品权利二分的差异化确权路径,妥善平衡数据之上的利益分配,稳健推进我国数据确权规则的落地。
客观层面,数据生产过程是一个多主体多重参与的链条,在该链条上数据收集者、存储者、传输者、加工者、分析者以及使用者等多元主体共同参与,使得数据实现从数据资源到数据集合再到数据产品的转化。在数据生产过程的不同阶段,多元参与者在不同阶段承担的角色任务决定了其在数据生产上的贡献程度不同,而将上述参与者以及不同数据形态压缩至一个问题来解决,势必无法准确设计确权规则,更遑论数据收益公平分配。[19]数据之上负载着多重利益,其权利形态亦具有层级性,不同层级之间承载着不同主体的利益关系[20],因此讨论数据确权的前置性条件,是将数据资源与数据产品置于不同的数据生产周期进行确权,不宜孤立地对数据进行单线性思维赋权。所以,有必要区分数据与数据要素。现代意义上的数据在计算机出现后才产生,是指所有能够被计算机输入、计算、输出的符号介质的总称,通常由具有一定意义的数字、字母、符号以及模拟量等要素构成。而数据要素与数据的收集、存储、传输、加工、分析、利用等一系列劳动相结合,只有在数据生产过程中投入劳动的那部分数据才能被称为数据要素。换言之,并非所有的数据均值得法律保护,仅投入实质性劳动的那部分数据要素值得法律保护,否则将会导致法律的过度保护。
另外,所谓数据权益差异化配置,是指同一数据上区分数据来源者与数据处理者而确认不同的权利。数据确权的难点在于数据之上承载着多元主体,如何厘清和平衡多元主体之间的利益冲突是化解数据确权的关键。通常数据上交织着用户、企业以及社会三元利益主体,可能存在数据利益叠加与冲突的情形。其一,数据并非如石油一般天然存在,其生产过程依赖用户行为、互联网架构等要素。在内容层面,数据可机读转变为信息,而信息关联至用户时,易引发个人信息权益与数据财产权益之间的利益重叠。其二,作为核心经营资源,数据意味着流量、竞争优势与机遇。在商业竞争过程中,势必造成爬取者与被爬取者之间的零和博弈。其三,数据的获取与利用关乎社会公共事业的发展,在客观上形成企业利益与社会利益之间的紧张关系,有必要从用户、企业以及社会三个层面对数据权利进行分层式差异化权利配置。综上,数据确权的内核在于厘清数据上的各种权益属性以及优先顺位,进而妥善处理数据上的多元权益叠加与冲突,形成能够良性循环的数据要素市场秩序。
数据确权应针对数据的不同形态采取差异化的数据权利配置,如何科学合理地分层次划分数据上的权利构成数据确权的关键。就数据生产过程而言,数据可以划分为原始数据阶段和数据产品阶段。在原始数据阶段,数据来源者对原始数据享有合法权益。既有学理观点以及司法裁判实践习惯性地依循“谁收集,谁所有”的确权逻辑,甚至有观点将企业合法收集到的原始数据视为企业的商业秘密,其论证依据主要有两点:其一,数据并非用户有意识、主动的社会生产活动,而是用户在互联网空间内活动产生的“副产品”,而非劳动产品。按照洛克“劳动赋权”的观点,数据是企业投入大量劳动的产物。[21]在数据收集方面,企业需要投入大量劳动对互联网中的海量数据进行筛选,保证数据的完整性与真实性;在数据存储方面,企业需要运用云计算、分布化以及冗余配置等技术手段对数据进行过滤、分门别类地存储;在数据处理方面,企业需要耗费大量算力对数据进行计算、分析;在数据呈现方面,企业通过算法对数据进行语义分析并导出、呈现给用户使用,增加用户与数据之间的交互体验。[22]其二,单条数据并无财产性价值。仅当企业对单条数据进行规模化利用后,其才发挥要素性价值,因此为避免数据权利过于碎片化,应当将原始数据的财产性权利分配至企业。
但是,以上论据无法支撑将原始数据的权利归属于数据处理者。一方面,洛克的劳动赋权理论,无法解释谁是劳动者。以平台数据为例,平台数据在用户、数据收集者、数据处理者、数据分析者等多元主体共同作用下产生,很难判断是何者的劳动起主要作用。平台企业主张其在数据生产过程中起到决定性作用,而用户主张平台数据的产生离不开用户的使用行为,没有用户的使用行为,根本不会产生数据,因而有学者主张,用户才是真正的数据生产者。[23]另一方面,数据来源者享有原始数据权利具有正当性。数据来源者既是触发数据生产的启动者,又是与企业互动的弱势群体,在数据利用过程中,企业通过利用数据来源者产生的数据实现经营获利,但是却将获取、使用行为产生的外部成本(如侵害隐私、个人信息的风险)转嫁给数据来源者,基于公平原则应当将原始数据的权利赋予数据来源者。以劳伦斯·莱斯格为代表的西方学派认为,应当将原始数据权利分配至数据来源者,如此一来,提高了数据来源者的议价能力。[24]当企业想要获取、利用数据时,需要主动与数据来源者协商,有助于改变企业的强势地位。同时,促进企业向数据来源者支付对价,迫使企业将使用数据的外部成本内部化。[25]在数据产品阶段,数据处理者对数据产品享有财产性权益。数据产品是数据处理者基于对原始数据进行清洗、加工、挖掘后形成的以数据为展现形式的产品。目前对于数据产品的法律属性尚无明确的法律规定,而数据处理者对数据的采集、加工需要投入大量的时间与精力,并通过数据产品直接获得收益,因此,有必要赋予数据处理者对数据产品享有数据财产性权利,鼓励数据处理者投资、投入、创新,持续推动数字经济的发展。
为促进数据的自由流动,最大限度地缓解数据权利主体基于法律安排所形成的锁定效应,避免形成数据垄断,有必要科学设置法律机制对数据权利进行限制,平衡数据保护与数据流动之间的良性互动关系。[26]具体而言,一方面应当对处于公开状态的数据设置合理使用规则。自由、开放、共享是互联网成立之初的精神。有学者就互联网的运行机理作过经典论述,将企业平台视为类似商店的公共领域,店主通常对潜在客户持开放欢迎态度,即便当店主不在时,只要商店不锁门或者门上没有“仅限员工进入”的限制,客户均有权利进入商店查看、挑选商品,因为进入商店是完成双方交易的前置性条件。[27]企业平台只要接入互联网,就可以查看互联网内其他主体的数据,同时允许其他主体对自己的数据进行访问。公开数据是互联网运行的逻辑产物,彰显着互联网的开放性与公共性。在此背景下,从私人领域流向公共领域的公开数据,需要承担容忍他人合法获取、使用的义务。但与商店禁止同行进入的原理一致,容忍他人获取、使用行为也是有边界的。[28]因此,基于公开数据的公共性,理论与实务界均认为应当对公开数据的使用给予一定程度和范围的宽容,同时对公开数据的合理使用需要满足以下要件:一是使用的数据必须是其他经营者主动公开的数据,使用者不得使用通过避开、破解等非法方式获取的非公开数据。二是使用数据时不得超过必要的限度,即使用者在使用时不得对数据控制者造成不必要的负担。 另一方面,允许因教育、科研、医疗等公共事业对数据进行的合理使用行为。数据是知识进步的基石,更是开展教育、科研、医疗等社会公共事业的原材料。对数据的合理使用是推动教育、科研、医疗等公共数据发展的关键。因此,早在20世纪末欧盟提出赋予数据库制作者以排他性的数据库特殊权时,这一提议便遭到科研界代表的强烈反对。学界普遍认为,排他性数据财产权的配置将会严重限制教育、科研、医疗等工作者获取数据的能力,可能导致获取数据的成本不合理增加,即将原来处于公共领域的数据转化为私人财产,获取者只有征得私人同意并付费后方可使用数据,这使得数据的价格由成本价格上升为市场价格,从事公共事业的工作人员将难以负担高昂的数据使用成本。基于对专有权制度可能对科研、艺术等公共事业发展产生阻碍作用的担忧,我国《著作权法》第24条规定了13种合理使用情形,《网络信息传播权保护条例》第6条在此基础上增加了8种在互联网环境下的合理使用情形,旨在平衡私主体利益与社会公共利益。在数据使用过程中,为了防止数据控制者对数据的排他性控制阻碍公共事业发展,有必要对数据控制者的事实控制作出限制,允许公共事业的从事者基于科研、教学等目的对数据进行必要范围的合理使用。
《民法典》第127条规定,法律对数据、网络虚拟财产的保护有规定的,依照其规定。该条确立了将数据作为民事权益客体进行保护的基本原则,但具体应以何种制度进行保护,法律并未给出明确方案。截至当前,围绕着数据保护与利用,国家以及地方层面相继出台多个指导性文件,上述文件无一例外地彰显数据在推动经济与社会发展中所发挥的关键作用,也呈现出数据的认识以及发展规律的精准导向。因此,有必要将政策内涵转化为法律制度话语体系,即以法律语言、法律逻辑充分地进行规则表达。在数据确权制度缺位的情况下,个人数据与企业数据等生产要素均未能得到应有的保护,无益于数据交易与数据开发利用。通过探索数据确权的意义、逻辑与理路,应阐明以下基本观点。首先,数据确权始终是数据要素市场建设以及数据法学研究中无法回避的议题,否定确权论的拥趸从不确定性、不必要性以及不经济性三个维度均无法证成否定确权论的正当性与合理性,反而数据确权是开启数据市场繁荣的前置性条件。其次,数据确权具有较强的逻辑主线,数据与信息的分离奠定了数据确权的基础,数据的“可排他性”本源特征与数据确权的逻辑耦合,使得数据治理范式已从行为规制范式转向确权范式。最后,就数据如何确权而言,应当采取差异化的数据权利配置思路,而非简单地解决数据归属于个人抑或是企业所有的问题。针对原始数据与数据产品进行两阶确权,形成数据来源享有原始数据权益与数据处理者享有数据产品权益的双层权利架构,建立起符合数据资源特征以及符合数据要素市场建设需求的确权规则。此外应科学设置法律机制对数据权利进行限制。通过对数据确权制度的完善,以制度优势引领数据要素市场实现高质量发展,充分发挥数据要素的功能,促进我国数字经济的长期繁荣。