□叶宣含
(浙江大学 光华法学院,浙江 杭州 310058)
自数据的经济和社会价值逐渐凸显开始,设立“数据财产权”、“数据信息财产权”、“数据生产者权利”、“数据用益权”、“数据新型财产权”等数据财产权利的呼声就不绝于耳。不同于以往的数据库作品保护,设立数据财产权的目的是保护数据本身,无论其编排方式如何。并且,这种呼声随着《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》(下文简称“《意见》”)等文件将数据作为一种新的生产要素而愈发高涨。特别是《意见》中“研究根据数据性质完善产权性质”的表述似乎为数据财产权利理论提供了重要的依据。然而“产权”并非法定的权益,也不具有明确的规范含义。数据财产权这一解读方式或许与中共中央和国务院的意旨相距甚远。与其将此视为一种定论,不如将此视为有待研究的未决问题,否则《意见》中直接提及数据财产权即可,并且“数据“一词也不具有清晰的内涵和外延。当然,因为笔者对数据法律性质以及保护规则的研究是在财产权体系中展开的,不涉及人格权益,所以将数据限定于具有经济价值的非个人数据,而且这些数据本身不构成现有法定财产权的客体。
无论数据“产权”如何界定,数据保护的最终目的是实现数据自由流通与共享。这一目的在《意见》的总体要求部分就开宗明义地确定下来。中共中央和国务院希望“破除阻碍要素自由流动的体制机制障碍”以及“充分发挥市场配置资源的决定性作用,畅通要素流动渠道,保障不同市场主体平等获取生产要素”。《中共中央国务院关于加快建设全国统一大市场的意见》又再次强调“加快培育统一数据要素市场”“建立健全数据交易流通、开放共享制度”,更明确地提出“破除平台企业数据垄断等问题,防止利用数据、算法、技术手段等方式排除、限制竞争”。因此任何阻碍数据自由流动,阻止市场主体平等获取数据的障碍都应当被破除。数据配置制度设计也应当围绕此目标展开,否则容易被各种群体的不同利益所裹挟,甚至成为某一群体的独家保护伞。
不仅如此,新型数据财产权对财产权法定原则的挑战应当以坚实的理论基础为武器。但是数据所具有的经济利益或价值只是新型财产权设立的必要条件,而非充分条件。若要证成数据作为新型财产权的客体,还需要其他正当理由。毕竟具有经济价值但不作为财产权客体保护的例子比比皆是,例如数学公式、单纯的事实性新闻、科学发现等。对数据产权的界定应当回归理论基础。抛开理论基础的数据法律性质研究皆为空中楼阁。当前主张设立数据财产权的理论基础主要有两种:一为洛克的劳动财产论;二为数据收集激励原则。然而劳动财产论本质上是一种自然法思想,产生于农业社会阶段,主要限于物资丰饶的自然时期。洛克观念形成的背景与当下的数字经济时代截然不同,其能否适用于数据这一无形客体值得怀疑。至于数据财产权的潜在激励作用则是不明确的:它有可能加强或抑制数据经济中的创新活动。应该仔细审查创造额外的激励措施促进数据收集和流通的正当性和合理性。
再者,对数据保护的探讨不应脱离算法保护。在数字时代,大多数据集是通过算法而非自然人直接收集的,这不同于以往劳动密集型的数据汇编。尽管人也参与数据收集,但人的智力劳动通常体现为对收集数据的机器设备和算法的开发设计。并且,被收集的数据本为无序、混乱的原始数据,只有通过大数据挖掘算法的分类、聚类、关联规则发现等处理,才能成为有序、有使用价值的数据资源。这个算法挖掘数据过程被称为“数据资源化”。在这个意义上,算法提升了数据的经济价值,数据是算法的副产品。同时,算法的优化又需要大量有效数据的支撑。算法所得结果的质量取决于其和数据的拟合程度。如果没有足够的数据支撑、检验,设计算法无异于闭门造车。因此,算法和数据之间存在极为密切的互动关系。为了实现数据资源化和流通,应当设计正当合理的算法保护规则。但“算法解释权”“算法公开透明”等观点与数据保护之间的激烈矛盾却少为人所注意:若算法保护薄弱,数据挖掘和价值提升也将受阻。或许从算法和数据的关系出发,一个研究数据配置规则的新视角将被打开。
基于防止“不劳而获”“食人而肥”等传统社会道德理念,洛克的劳动财产论非常容易被接受并作为设立数据财产权的正当性基础。针对财产起源的条件,洛克认为:“所以只要他使任何东西脱离自然所提供的和那个东西所处的状态,他就已经在那个东西中掺进他的劳动,加进了他自己的某种东西,因而使它成为他的财产”,“财产权是对勤奋劳作的一个合理的报酬”。在此种思想影响下,许多学者将数据分为原始数据和衍生数据,或称之为基础数据和增值数据并且认为自然人或企业对自己参与社会活动所产生的可识别原始数据享有权利,数据处理者则对原始数据收集、加工、融合形成的衍生数据享有财产权,因为他们投入了大量人力物力。
实践中,一些法院也通过适用劳动财产论,将他人收集整理的数据视为财产权客体。例如在“青岛市气象科技服务中心等诉青岛东岳时通电讯公司天气预报侵权纠纷案”中,法院即认为天气图、雷达资料、卫星云图、实况资料等各种气象数据,经各自专业人员会商、分析整理而加工制作得出,属于通过智力劳动得到的技术产品,具有无形财产的属性。对该技术产品,两原告共同享有民事权利,应当享有占有、使用、收益、处分的权利。在“深圳市谷米科技有限公司与武汉元光科技有限公司不正当竞争纠纷案”中,法院认为公交实时类信息数据经过人工收集、分析、编辑、整合并配合GPS 精确定位,具有实用性并能够为权利人带来现实或潜在、当下或将来的经济利益,其已经具备无形财产的属性。原告对这些信息数据的占有、使用、收益及处分享有合法权益。不仅将劳动作为财产的基础,这些裁判还具有财产物化思维,将物权作为设立数据财产权的模板。
然而,以劳动为理论基础的数据财产权突破了财产权法定原则。财产权法定原则是指财产权的种类和内容由法律明确规定和限定。该原则的主要针对对象是绝对权。一般认为,法律对绝对关系必须采取权利法定原则,并且,一切绝对权利必须公示;对于相对关系来说,因其仅限于当事人之间,法定原则与公示性则无必要。该原则排除了当事人通过约定、法官通过判例创设绝对权之内容与类型的可能性。物权法定、知识产权法定是财产权法定原则中的一部分,任何绝对权性质的财产权均须遵守该原则,数据财产权也不例外。也有法院基于物权法定原则,否认数据产品财产所有权,认为财产所有权系绝对权利。如果赋予网络运营者享有大数据产品财产所有权,则不特定多数人将因此承担相应的义务。限于我国法律目前对大数据产品的权利保护尚未规定,法院对原告大数据产品财产所有权的主张不予支持。该法院虽然遵守了物权法定原则,但违背了财产权法定原则,认为大数据产品自身已成为市场交易的对象,已实质性具备了商品的交换价值,是原告的劳动成果,其所带来的权益应由原告享有。这实质上是将数据作为一种可以在市场中自由流转的无形财产,数据处理者对此享有保护期限不明的排他权。
冠以“民事权益”“无形财产”之名,具有绝对权性质的数据财产权益也突破了财产权法定原则。纵观上述案件,虽然法院并不直接确认数据处理者的合法权利,却以权益之名赋予数据处理者绝对权。因为这些数据财产权益可以对第三人产生普遍的排他效力,并且没有权利范围、保护期限制,几乎具有和知识产权、物权等相同的效力。但我国《民法典》并未设定相应的数据权,仅在第一百二十七条规定:“法律对数据、网络虚拟财产的保护有规定的,依照其规定。”该条文间接确认了数据保护应当遵从财产权法定原则,依照已有的法律规定,若没有规定的,则不得任意创设新型权利。在没有依照相应法律规定的情况下,一些法院仅因数据可以产生经济利益将其作为无形财产,赋予当事人新型财产权。这严重损害了法的安定性,破坏了财产权制度的体系结构。
除了维护法的安定性,财产权法定原则还包含了其他价值考量。若要证成数据财产权的正当性基础,至少其创设不应妨碍财产权法定原则所保护的各种实质性价值。财产权法定原则保障的实质性价值包括:一般人的行为自由、市场经济秩序以及立法者重视的其他利益等。因为财产权会对不特定的第三人发生效力,关系到第三人的利益和行为自由。如果不对财产权的种类、权利内容、保护期间加以限制,第三人将无法合理预测自己的行为。但数据类型多种多样,具有经济价值的时间也长短不一,其保护期间极难通过法律加以确定。这就会影响第三人合理利用数据的行为自由。不仅如此,健康的市场经济秩序也鼓励经营者自由竞争。一味强调数据保护,创设具有强大效力的数据财产权会损害市场公平竞争机制。
如果说数据财产权在实然层面突破了财产权法定原则,那么其可否依据劳动财产论在应然层面获得正当性基础呢?虽然劳动财产论体现了一种“劳有所得”的朴素社会道德观念,但法律的逻辑并非如此简单。财产权制度中充斥着各种价值,“劳有所得”只是其中之一。仅依据劳动创设数据财产权的正当性是需要被质疑的,因为这可能与财产权制度中的其他价值相冲突。下文就以两种主要的绝对性财产权——物权和知识产权为例,考察劳动财产论在我国财产权制度中的应用情况以及探讨财产权制度所保障的首要价值。
劳动财产论并非知识产权的理论基础。劳动财产论以保护个人财产作为目的本身,但是我国知识产权法以“促进社会主义文化和科学事业的发展与繁荣”“促进科学技术进步和经济社会发展”等公共利益为目的。保护个人财产、利益只是一种实现这些公共利益目的的手段。在知识产权领域,当公共利益和私人利益发生难以弥合的冲突时,前者往往优先于后者。即便他人付出了劳动,也会因为有碍公民基本经济、文化权利和自由而无法获得保护。例如对于某一种商品通用名称,即使经营者付出劳动,投入大量人力物力提高其知名度,也不得基于商品化推广中的贡献主张商标专用权。否则将导致其他市场主体无法准确注明其商品名称以及展开正常推广活动,进而不合理地限制市场竞争。甚至智力劳动也不一定受知识产权保护,现有知识产权专门法仅对部分智力劳动成果予以保护。权利人对智力劳动成果所享有的权利不是与生俱来的,而是将可以保护和应当保护的智力劳动成果作为知识产权专门的权利客体,依法确定。权利客体的种类和数量虽然始终处于不断发展变化当中,但具体的种类和数量仍须以现行法为依据,司法裁判标准也须遵守现行法。而且知识产权法对某些智力劳动成果的保护只是激励文化、科学和经济发展的手段。
劳动财产论在数据保护中的复兴令人联想到曾被放弃的“额头淌汗”理论。“额头淌汗”这一理论源于抽象的公平观念,由适用《安妮法令》的英国法院首先提出,强调在后作者不能利用他人的劳动而获得利益。这一理论也随之被美国版权法吸收,一度成为保护劳动的理论基础。但是在Feist 案中,美国最高法院否认了原告付出劳动所收集的电话号码簿(本质上是一个数据集合)构成作品,认为作品需要体现作者创作性的选择和安排。而且即使数据汇编构成作品,他人仍然可以自由地使用该作品中的数据,只要不复制其中的独创性部分。至此,Feist 案结束了一些法院基于劳动而提供版权保护的传统。通过放弃“额头淌汗”理论,美国最高法院强调其价值位阶立场:不受限制地获取事实和信息的公众利益高于他人因劳动而获得的个人利益。无论是英美版权法还是我国的著作权法,都允许在后的作者站在前人的肩膀上创作作品,利用那些处于公共领域的材料来节约时间和精力,从而避免不必要的重复性劳动。而今以劳动为基础的数据财产权学说却重拾“额头淌汗”理论,忽视了数据流通的公共利益,允许数据处理者对数据本身的合法垄断。
劳动财产论也并非物权的理论基础。现代社会中的财产权均“由法律直接创设”,与“劳有所得”自然法思想无关。即便是诞生于农业社会的物权,也逐渐剥离其自然法属性。“洛克和卢梭都认为物权是基于谁创造谁所有这一‘正当’的自然法则的,后来的物权法不过是对这种正当的、符合道德和公义的自然法则的确认。”这一理念或许可以适用于农业经济社会,但却无法适用于纷繁复杂的现代经济社会。物权的正当性基础已经从劳动取得财产权的自然法思想逐渐转变为保证财物流通交易安全、维护市场经济秩序和国家的基本经济制度等公共利益。物权法是落实宪法规定的“公有制为主体、多种所有制经济共同发展”基本经济制度的民事法律。基于我国社会主义国家性质,专属于国家所有的不动产和动产,特别是土地,禁止任何组织或者个人侵占,无论他人是否对此付出过劳动。这从根本上排除了他人通过劳动将国有财产转化为私人财产。此外,物权法除了保障公民的财产自由之外还兼顾分配正义的价值追求。分配正义体现了与劳动财产论相反的价值取向——保护弱势群体。若按照劳动财产论的逻辑赋权,结果必然是强者更强,弱者更弱。但为了实现共同富裕这一社会主义的本质要求,物权法的诸多制度设计向弱势群体倾斜,例如建设工程价款的优先受偿权等。这些权利的理论基础显然与劳动无关,而是为了保障有序的人类共同社会生活。
由是,物权和知识产权都以保障公共利益作为最高的价值位阶和理论基础。“劳有所得”虽然符合传统社会道德观念,却需要让位于公共利益,而且劳动的报酬也不必以设立财产权的方式收回。所以当某一劳动成果不属于法定权利客体时,对于未经许可使用他人劳动成果的行为,不能当然地认定构成侵权或者不正当竞争,这是因为“模仿自由”。使用或利用不受法定权利保护的信息是基本的公共政策,也是一切技术和商业模式创新的基础,否则将在事实上设定一个“劳动成果权”。所以,以劳动为基础的数据财产权不仅在实然层面突破了财产权法定原则,在应然层面也违背了我国财产权制度所确保的核心价值。
除了正当性基础不牢固,以劳动财产论为基础的数据财产权还将面临难以克服的制度设计难题。任何一个完整的权利制度应当包含以下几个方面内容:权利的主体、权利的内容、权利的客体以及权利的限制。但以劳动为基础的数据财产权将在权利主体、客体、内容与权利限制方面产生太多的不确定性。
首先,享有数据财产权的权利主体难以通过抽象的劳动行为加以确定。不同于作品创作行为、专利发明行为以及商标注册申请行为,“劳动”的含义是抽象和模糊的。立法者无法对产生数据财产权的劳动设定一个法律标准。劳动语义的泛化将导致任何实施与数据收集、处理有关行为的人成为数据财产权的主体。并且,正如亚当·斯密在《国富论》中所述,劳动分工增进了劳动生产力。在生产力发达的现代社会,劳动分工的细化已经超出常人想象。任何个人的劳动必然要依赖于他人的劳动,而数据的收集处理也是许多不同主体共同的劳动贡献。如果按照劳动财产论的逻辑,将得出这样的结论:一些数据集合的财产权因共同劳动而被集体拥有。这与一些学者主张的由特定数据控制主体享有数据财产权的观点背道而驰。为了解决这一问题,欧盟创设了数据库特别权利(sui generis database right),尝试通过按照实质性的劳动投入确定权利主体。《关于数据库的法律保护的指令》第7条第1款将受保护的劳动限定为“在数据库内容的获取、检验核实或选用方面,经定性/定量证明做出实质性投入”。但是这个尝试也是失败的,因为无法确定“实质性投入”所需达到的数量或质量。加之,如今大多数据集是由人工智能、算法直接采集生成的,人对数据的直接劳动投入更难以达到实质性的数量或质量。
其次,劳动财产论无法准确地界定数据财产权的客体范围。劳动与数据财产权客体之间建立的联系并不是直截了当的。在著作权领域,作者的创作行为和作品之间存在一一对应的关系。但是数据处理者的劳动和数据财产权客体却无法建立一一对应的关系。并非所有劳动都可以产生数据财产权客体。何种数据才能受财产权保护?对此,存在衍生数据、数据集合、数据信息、“价值增值”的数据等客体观点。这些观点的核心是具有经济价值的数据集合才能成为数据权客体。然而,数据所具有的价值由市场中其他人的需求所决定。如果这个价值不是由劳动所决定,而是由他人的需求所决定,劳动如何能够把自然权利建立在市场价值的基础上?更重要的是,这些学说也无法精确划定数据财产权客体范围,将导致数据财产权客体不合理地扩大。
再者,劳动财产论也不能界定数据财产权应具有何种权利内容与多大程度的权利范围。权利内容和范围的设计往往需要综合性衡量各种价值因素和各方利益,寻求一个巧妙的平衡点。这些价值和利益衡量已经超出了劳动财产论的范畴,进入了更广阔的公共利益的层面。至于数据财产权主体能否禁止他人对数据的复制、传播以及其他利用方式,劳动财产论也无法提供指引。
最后,遵循劳动财产论的逻辑所设立的数据财产权将没有保护期间的限制,产生永久有效的财产权。劳动财产论所确认的个人财产在社会形成之前就已经存在。因为是个人劳动而不是法律将共有物转化为私人财产,国家的主要任务是确保个人财产权,而不是干涉它。这种理论应用于数据保护,将会导致一个荒诞的结论:数据财产权应被特定主体永久拥有。这显然会造成一个社会无法接受的制度成本。即使适用一种“修正”的劳动财产论,确定数据财产权的保护期限,保护劳动仍会导致权利扩大以及保护期限延长。因为数据处理者可以通过更新、添加和修改已有数据集合的劳动,对数据财产权进行新的拓展以及延长保护期。
洛克劳动财产论形成的时代背景与现在截然不同,但是仍然有许多学者热衷于引用该理论作为数据财产权等新型财产权的理论基础。这主要出于两方面原因:一是为了获得“思想体系上的正统性”;二是受一种传统社会道德观念的普遍影响。但将劳动财产论作为数据财产权的理论基础是站不住脚的。在财产权所保障的价值体系中,劳动财产论所强调的“劳有所得”这种以个人利益为目的的价值往往处于底层,劣后于公平竞争秩序、信息自由以及科学文化事业发展等公共利益。即使设立数据财产权,劳动财产论也无法划定正当和不正当使用数据的边界,达到公平和效率的平衡。
除了劳动财产论之外,一种功利主义下的激励原则也是数据财产权支持者所依据的理论基础。这种理论建立在“数据市场失灵”的担忧上。他们担心如果不直接保护公开数据,社会只接受丛林规则,数据收集者为了维持自己的商业模式,就必须不断收买随时会出现的真实的或伪装的复制者以消除他们的“搭便车”行为。最终,数据收集者的动机会因此受损,市场失败很可能出现。因此需要创造数据财产权这一额外的激励措施促进数据收集和处理。上述论断其实包含三重条件:其一是存在一个真实的数据市场;其二是数据处理者已无法通过各种手段收回自己的投资;其三是数据财产权的设立会对数据收集和处理产生良好的激励作用。只有这三重条件均成就,“数据市场失灵”这一命题才可能成立。否则,该命题不能成立或无法判断真伪,进而影响激励原则的正当性。以下即从这三重条件出发,检视数据财产权设立所依赖的“数据市场失灵”这一命题能否成立。
“数据市场失灵”命题成立的前提必然是存在一个真实的“数据市场”,但“数据市场”的界定并不明晰。数据市场及市场主体交易形式的界定对后续的规范讨论尤为重要,这决定了数据是以何种性质流通的:是作为无形财产还是作为服务合同的内容。受传统商品交易市场的影响,“数据市场”往往被认为是一个商品化数据的交易市场,数据作为一种商品在市场中进行交易流通。可商品化数据是市场主体可以自由将其用于商业活动的数据类型,财产属性是可商品化数据的最大特征。然而此种“数据市场”观点已经默认数据是作为一种无形财产在市场上流通,若再以此为基础论证数据财产权的正当性未免陷入了循环论证的泥潭。
实质上,根据当前主要的市场交易形式,数据在规范意义上更适合被认定为服务合同所提供的内容而非直接交易的无形财产。我国“数据市场”中数据交易的主要形式是由数据控制主体对他人提供一种以数据为内容的服务,并且二者之间形成服务合同。首先,以提供数据为内容的服务与以数据为对象的无形财产交易存在重要的区别。前者形成的是继续性合同,后者则多是一时性合同。继续性的数据服务合同须经持续的给付才能实现合同目的,时间因素在合同履行上居于重要地位。例如在“安徽美景信息科技有限公司、淘宝(中国)软件有限公司不正当竞争纠纷上诉案”中,淘宝公司与商户之间签订了《生意参谋零售电商大数据软件服务协议》。基于此,淘宝公司为合同相对方提供为期一年的继续性数据提供服务,商户可以在合同期限使用生意参谋零售电商大数据软件获得的各项数据内容。数据服务之所以成为数据交易的主要方式,是因为数据具有很强的时效性。许多数据的经济价值会随着时间推移而显著降低。这就要求数据控制主体不断地对数据集合进行更新,提供继续性的数据服务。因此,在当前甚至是今后,数据多是作为服务合同的内容进行流通。将数据视为一种无形财产,甚至是一种物的观点,忽视了数据市场的主要交易形式并非一次性的数据转让或使用许可。所以,“数据市场”应当是一个以数据服务为核心的数据流通市场。在该市场界定下,数据流通不以数据作为无形财产为前提。
面对未经许可的数据获取和使用行为,数据处理者并非毫无还手之力,实际上他们可以通过各种手段收回自己的投资成本。否则,为什么在同样不提供数据财产权保护的美国,数据处理和提供商如此成功,行业如此有利可图?如今,即使没有数据财产权保护,数据处理者也已经以提供有偿数据服务的方式逐渐填补数据收集和处理的成本。同时,数据处理者通过技术手段、持续更新数据以及限制性合同保护其认为具有商业价值的数据。这些手段使数据处理者对数据享有“事实上的排他性(factual exclusivity)”,排除他人未经许可擅自获取和使用其数据。以下将论述数据处理者如何在没有数据财产权的情况下利用这三种措施控制数据流通。
第一,数据处理者可以利用加密、识别访问行为特征与复杂的验证码等技术手段排除擅自访问和获取数据的行为。如果数据库处理者是通过软件、数据库等提供数据服务,其可以设置一套复杂的加密系统,只允许掌握密钥的用户登录该系统并获取数据。此外,许多网络数据库一次只提供少量数据,因此用户难以复制整个数据库。而且数据处理者可以通过技术识别访问行为特征,以辨别访问主体是否为正常用户。对于那些频率高且有规律的机器自动访问行为,网络服务器会自动切断数据提供服务。复杂的验证码技术也有助于限制网络爬虫以较低的成本和较高的效率获取数据。由此,数据处理者可以保留对数据的控制,并在合同基础上提供数据服务。甚至,在数据只有唯一来源时,数据处理者的技术手段不仅能够克服市场失灵的威胁,甚至还能使其拥有异常的市场支配地位,导致过度的数据保护状态。
第二,数据处理者可以通过持续更新数据集合具有区别于其他经营者的竞争优势,从而赢得更多的商业机会。数据的时效性导致数据处理者更新数据集并提供继续性的数据服务。这种数据持续更新行为既增加了数据处理者的竞争优势也增加了他人获取数据的成本。即便他人可以复制数据并以更低价格提供数据,若用户认为数据已经丧失时效性,他们就不愿意购买此种数据服务。由于获利降低,擅自获取并使用数据的行为也会随之减少。
第三,数据处理者还可以与交易相对人签订限制性的数据服务合同,约定具体的数据获取和使用方式。一旦合同相对人违反该约定,将承担违约责任,数据处理者只需依据合同关系就可以获得充分保护。以“淘宝诉美景案”为例,淘宝公司与美景公司间形成的协议明确约定账号购买者禁止将账户提供给第三方使用,并且禁止将通过生意参谋软件获得的各项数据向第三方提供。因美景公司违反该约定,淘宝公司有权请求其赔偿损失。既然违约损害赔偿请求权可以填平损害,数据处理者就无须借助额外的数据财产权实现数据保护。
如此,以数据服务为核心的数据流通市场就可以在没有法定数据财产权的情况下蓬勃发展起来。认为数据处理者在没有财产权依据的情况下往往不敢开展数据共享和交易的观点忽视了他们凭借各种手段对数据享有“事实上的排他性”。在实践中,“事实上的排他性”足以保障他们在服务合同基础上有偿提供数据,并收回投资成本。然而,通过设定额外的数据财产权利来干预并未失灵的数据服务市场的运作,并不能保证市场秩序改善。相反,它可能会带来扰乱当前数据服务市场秩序的风险。
基于激励数据大规模收集和处理以增加社会福祉的美好设想,一些学者主张设立数据财产权。此种功利主义下的激励原则或许可以成为设定数据财产权的理论基础,但问题是:数据财产权的激励作用是否如此有效?它的设定真的可以增加整体社会福祉吗?如果比较国家“完善数据要素市场化配置”的目标和数据财产权设定的后果,这个回答很可能是否定的。
一方面,数据财产权的设定并不能有效地实现“数据资源化”的目标。“数据资源化”是国家“完善数据要素市场化配置”的重要目标之一。不管是在《意见》,还是在《“十四五”规划》等政策性文件中,国家都特别强调“数据资源化”,要求“提升社会数据资源价值”以及“激活数据潜能”等。该目标的本质是提升数据质量,激发数据使用价值。数据处理者所收集的数据一开始可能是无序、混乱的,需要通过大数据处理算法进行分类、聚类、关联关系挖掘等整理,转化为高价值的数据资源。然而,数据财产权的激励作用未免过于单一,只能增加数据产出的数量,却无法提升数据产出的质量。因为按照现有的数据财产权理论,无论数据的质量以及价值高低,只要企业为收集和整理、分析数据付出了实质性的劳动投资,即可获得排他性的保护。高保护程度的数据财产权不一定能促进数据资源化,反而容易导致“劣币驱逐良币”。如此,数据财产权的激励功能则十分有限,并不符合现有政策性文件所强调的“数据资源化”目标。
另一方面,数据财产权的设立也可能与促进“数据资源流通和共享”的目标背道而驰。功利主义所追求增加社会福祉的目标在数据经济领域可以被解释为“数据资源的流通和共享”。具体而言,即数据资源可以流通至有迫切需求且有能力处理数据的需求者处。对于数据财产权和数据流通之间的关系,一些学说意图通过引用科斯的产权理论,证明前者对后者的正向促进作用。因为界定清晰的数据财产权可以降低交易成本,促进数据流通。但是数据财产权的制度构建本就面临主体、客体以及保护期限不明等重重困难,难以达到所谓的产权清晰。更为关键的是,交易成本是双方的,一方交易成本的降低很可能是以另一方交易成本的增加为代价的。数据财产权的设定或许降低了数据处理者的交易成本,但增加了数据需求方的交易成本。由于议价能力和信息的不对称,数据服务合同通常有利于数据处理者而非数据需求者。数据财产权的设定则将加剧二者在议价能力方面的不平衡。特别是一些拥有大量用户的平台可以收集海量数据,并从中获得非同一般的竞争优势。数据竞争优势所带来的市场支配力可以让大型平台经营者制定规则,单方面对数据的访问和使用施加条件。但目前的反垄断制度还没有考虑到这样一个事实,那就是拥有集中数据控制权的公司可以系统性地使市场倾向于他们的利益,从而戏剧性地重塑这个行业。是以,一向注重保护企业数据的欧盟也察觉到此,在《欧洲数据战略》中强调通过《数字服务法案》解决或预防该问题,以确保市场保持开放和公平。因此,数据财产权等额外制度的激励作用极为有限,反而可能会干扰数据服务市场运作,阻碍数据资源流通和共享。
要而论之,“数据市场失灵”是一个伪命题。在不提供数据财产权保护的情况下,数据处理者仍然有各种方法实现对数据“事实上的排他性”并收回投资成本。而且实际上,企业在不断地收集和处理数据,数据不足的预测更像是一个臆想。仅谷歌公司每天就处理20PB(20000TB,1TB=1024GB)的数据,而且全球的数据收集正以指数级的速度增长。此外,数据财产权的激励作用也非常有限,既不符合“数据资源化”目标,也不一定能促进“数据资源流通和共享”。
即使不考虑财产权法定原则,数据的时效性和复杂性也决定了其不适合成为财产权客体。数据的时效性将导致数据财产权保护期间的不确定。不同于一般财产权客体,数据的经济价值会随着时间流逝而逐渐削弱直至完全丧失。甚至,许多数据的经济价值就在于较强的即时性,例如每日天气预报数据、实时新闻数据和即时金融数据。正是因为数据处理者在第一时间提供了相关的数据服务,他们才具有区别于其他经营者的竞争优势。当此类信息公布后一段时间,就不再具有经济价值,不应再受法律保护,大众可为科学研究目的或其他目的任意使用。如果数据需求方非常在意数据的时效性(例如只关注当天的金融数据),获取并直接使用上个月甚至上周数据的行为并不会损害数据处理者的利益,也不会破坏市场秩序。数据的时效性特点还引发了对欧洲数据库特别权利15年保护期的批判乃至完全废除的质疑,认为在如此快速创新循环的动态环境中,15年的保护期过长。此外,不同数据经济价值的存续期间又千差万别,由是,立法者无法确定一个统一且合理的数据财产权保护期限。
数据的复杂性还导致数据财产权客体的不特定。因为数据类型复杂多样,难以对数据抽提规范意义上的公因式。面对这种立法技术上的障碍,当前数据财产权支持者放弃对数据本身的分类,设想出一个客体标准——数据规模化。规模化的“数据集合”“大数据”就成为数据财产权的客体。但即使是数据财产权的支持者也无法回答“数据集合”需要达到多大规模才构成财产权的客体。更何况并非所有规模化的数据集都可以成为财产权客体,例如不具真实性和准确性的虚构数据集合就不值得保护。其实,强调数据财产权客体“规模化”标准的原因是只有大量数据积聚才普遍产生经济价值,单个数据一般不具有经济价值。所以数据财产权的客体标准本质上就是“经济价值”标准。然而,正如霍尔姆斯所言:“财产,是法律的创造,不是由价值产生的,可以交换仅是一种事实。”经济价值不直接产生财产,也无法准确划定一个清晰的数据财产权客体标准。当数据财产权客体难以特定时,第三人对自己获取和使用数据行为的预测和信息成本仍然无法降低。由此,面对任何数据集合,第三人都可能以为无法使用,从而引发“寒蝉效应”。
虽然数据的特性决定其不适合作为财产权的客体,但具有经济价值的数据的确可以赋予数据处理者竞争优势,故而可以构成《反不正当竞争法》中的竞争利益。竞争利益是经营者相对于其他经营者的合法权益,包括交易机会和市场竞争优势。存在值得保护的竞争利益是不正当竞争的前提,它类似于侵权法中的权利,没有权利存在,就不可能存在侵权行为。但是与绝对性的财产权利相比,数据竞争利益具有相对性,只存在于具有竞争关系的经营者之间。所以,数据竞争利益所产生的排他性是有限的,无法波及消费者以及不具有竞争关系的其他经营者。不仅如此,数据处理者竞争利益受到损害的结果也不必然导致《反不正当竞争法》的适用,除非他人获取和使用数据的行为同时扰乱市场竞争秩序。原则上,《反不正当竞争法》不推定擅自获取或使用数据的行为构成不正当竞争。因为,在自由竞争的市场中,经营者无权要求对其竞争利益保护像绝对权一样,绝对排除竞争者损害,而是必须将部分损害作为自由竞争的结果加以容忍。根据科斯的损害相互性原理,当数据处理者A 的竞争利益因经营者B的行为受损时,《反不正当竞争法》的处理逻辑不是制止B保护A,因为制止B保护A也会导致B的利益受损。《反不正当竞争法》真正需要解决的问题是:在具体市场场景中,A 和B 谁的利益更值得保护。这涉及“模仿自由”“公平竞争”“数据自由流通和共享”等多种价值的取舍和平衡。
在综合考虑多种价值的基础上,鼓励其他经营者以增加数据价值的方式使用数据,与数据处理者展开“效能竞争”是一个较为合理的解题思路。“效能竞争”理论,即经营者是否以自己的商品或服务的优质优价或自己经营活动的业绩展开竞争。如果其他经营者以与在先数据处理者相同或相似的方式使用数据,提供同质化的数据服务,则无益于数据要素市场的培育,除非在先数据处理者构成“数据垄断”。尽管市场经济鼓励经营者在数据的收集、处理和使用等方面进行自由竞争,但是竞争行为应当以增加原有数据集的价值为前提。只有如此,其他经营者的行为才会惠及社会公众,并促进数字经济发展。同时,其他经营者的竞争行为也不会实质性替代在先数据处理者提供的数据服务。
在坚持“效能竞争”的前提下,《反不正当竞争法》可以提供程度适当的保护:保障数据处理者收回投资成本,填平其损害,但又不给予过多的救济。这既能使数据处理者在合同法缺位的场景下不遭遇市场失败,也能防止其议价能力过高而阻碍数据流通。具体到数据获取和使用行为正当性的判断上,应当综合考虑多种因素:(1)数据的性质以及商业价值;(2)竞争者获取和使用的数据量;(3)数据处理者最初需要多少付出成本才能获得这些数据;(4)竞争者从其他渠道获取这些数据的难易程度;(5)竞争者使用这些数据的目的;(6)竞争者在后续数据使用中付出的投资以及是否增加数据价值;(7)竞争者提供的数据服务与在先数据处理者的相似程度以及二者所在市场的重叠交叉程度;(8)竞争者向市场其他主体提供数据服务的时间。另外,单纯的数据获取行为并不干扰市场秩序,除非行为人非法侵入、破坏计算机信息系统,一般不予制止。上述的不正当竞争考量因素表明,法院可以适当地制止竞争者以相同、近似方式使用他人收集处理的数据,直至数据商业价值消失。数据处理者因此获得了所需的救济:足够的市场领先时间,使其能够收回投资。数据竞争利益保护期间取决于不同数据的时效性,与传统财产权的固定保护期间相区别。由此,市场中的竞争者可以相对自由地采取对数据处理者损害更小,并能实现积极社会效果的方式使用数据。数据自由流通的目标因而能够得到保障。
不过《反不正当竞争法》对数据的保护因救济的被动性和缺乏清晰的界限而受到质疑。尽管如此,它仍然是比数据财产权等更理想的法律调整方式。首先,即使是数据财产权对数据的保护也主要是被动的、事后的,因为数据财产权最重要的权利内容是对他人某些数据使用行为的禁止权或排他权。这种排他权同样是在特定数据获取、使用行为发生后才真正产生效力。其次,《反不正当竞争法》对数据的保护虽存在抽象性,但也体现了一定可预期性。至少,擅自以相同方式使用他人收集、处理并产生竞争优势的数据,又未增加数据价值的低效能竞争一般具有不正当性。而且在快速变动的数字经济时代,《反不正当竞争法》的抽象、模糊属于一种恰到好处的“留白”而非“空白”。因为它以更加灵活的方式调整数据处理者和其他市场主体之间的关系。最后,《反不正当竞争法》以减少直接市场干预的方式保护作为竞争利益的数据。目前数据服务市场正在蓬勃发展,没有证据表明市场已经或者即将失灵。过度的数据财产权保护反而会干扰市场自身的调节能力,对数据流通造成不合理的障碍。
数据所产生的竞争优势不是固有的,而是依赖于收集、分析它的算法。因为几乎所有数据都是算法的副产品:经营者能够利用算法从各种信息来源收集和汇总数据并处理和分析数据。为了获得长期的竞争优势,数据处理者需要开发和培训算法以促进数据资源化。同样,算法也是其他经营者增加数据价值,与在先数据处理者展开效能竞争的关键。以搜索引擎为例,搜索引擎算法越成熟,搜索结果越精准,使用该引擎的用户越多,经营者获取的数据也就越充分。算法因而成为经营者在数据服务市场上展开竞争的核心工具。
基于算法对数据价值的决定性作用,数据的保护可以溯源至算法的保护。积极的算法保护规则可以促进企业开发出更成熟的数据收集和挖掘算法,进而间接激励其收集和处理数据。也有学者注意到算法和数据之间的关系,但仍然强调通过规制算法或设置算法的责任清单来界定数据财产权的边界,而非给予算法积极的保护。该观点似乎只将算法作为规制的对象,而非保护的对象。一般认为,算法无法构成知识产权的客体。因为算法在此被理解为一套逐步解决问题的规则、方法,区别于算法的具体表达,例如对收集或分析数据的步骤和应用标准的描述。所以算法不属于著作权法保护的作品,否则会将保护范围拓展至思想的范畴。算法本身也不能受到专利法的保护,因为通过算法处理数据被认为是非技术性的。算法目前主要是被作为商业秘密进行保护的,但不能排除合法的获取、使用或披露行为,例如允许以公共利益为由而进行披露。这意味着在涉及公共利益的情况下,算法很容易被强制性披露而丧失保护资格。然而,如果作为算法副产品的合法数据可以获得财产权保护,为何产生数据的合法算法不享有财产权保护呢?因论文文本范围的有限性,合法算法的法律性质暂且不在本文讨论范围内。但可以确定的是:如果收集和挖掘数据的算法无法得到充分的保护,企业就无法持续地从数据中获得竞争优势。
为了实现数据的资源化和流通,应当对算法提供正当合理的保护。然而当前盛行的“算法解释权”“算法公开透明”等算法规制学说与算法和数据保护之间存在激烈矛盾,危及算法的创新和优化。“算法解释权”最早由Goodman和Flaxman提出,二人认为欧盟《通用数据保护条例》创设了“算法解释权”。由此用户可以要求数据控制主体解释与他们相关的算法决策,以此确保算法不仅高效,并且透明、公正。我国一些学者也主张对个人赋予算法解释权,并认为算法的逻辑、意义、设定的目的和一般功能都将成为被解释的对象。但欧盟《通用数据保护条例》并未明确规定“算法解释权”,只在序言第71 条提及个人可以获得算法决策的解释。序言无法设立权利和义务。与算法难以构成知识产权法客体的观点相比,“算法解释权”“算法公开透明”等学说目前已成为阻碍算法获得合理保护的最大障碍,甚至采取保密措施,作为商业秘密保护的算法都无法应对“算法公开透明”的侵蚀。因为公共利益对商业秘密的限制铺平了算法透明的道路,在实践中,有法院在对算法决策进行司法审查的路上走得更远,认为平台行使算法权力应当公开透明,事先披露治理机制、管理规则以及相关技术原理。用户有权对自动化决策提出质疑和申诉,进一步知晓算法逻辑构造。平台依据算法对用户个人的自动决策未触及公共利益,但法院却要求平台披露算法,有侵犯平台商业秘密之嫌。尽管平台应当对涉及用户重大利益的决策结果予以说明,但不必以披露算法的形式。仍然有其他方式解释算法,保障结果公平公正。若“算法公开透明”落实为法律制度,可以想象届时竞争对手将借公共利益之由破坏数据处理者的算法。而作为算法副产品的数据也将遭受毁灭性的打击,皮之不存毛将焉附?由此,“算法透明”与国家所规划的数字经济发展政策是冲突的,应当破除“算法透明”的迷障。至少在找到合适的保护方式之前,大数据收集、挖掘的算法不应当真正透明。
在“算法开发—数据收集处理—算法开发”的环路中,数据对于算法也有重要意义。数据保护规则的设计不得不考虑算法优化对数据自由流通的强烈需求。数据是算法的“原料”:算法的开发和优化需要大量有效数据,算法所得结果的质量随输入数据多样性而变化。特别是监督学习算法需要在标记的数据上进行训练,以形成算法模型,即人工智能系统。为了促进算法更好地发展,应避免设立绝对性的数据财产权利,使数据获取原则上是开放的。正如谷歌首席科学家彼得·诺维奇(Peter Norvig)所说:“我们没有比别人更好的算法,我们只是有更多的数据。”此言虽夸大了数据的竞争优势,但基于大数据的算法的确陷入“强者愈强”的循环。数据处理者控制的数据越多,就越能开发出高效的算法,随之吸引更多的用户贡献数据。如此循环往复,控制大数据的经营者将进化为“人工智能寡头”。数据财产权的设立不会激励他们与(潜在的)竞争对手分享数据。相比于获得有偿数据服务的对价,他们更愿意囤积数据、优化算法,获得更长久的竞争优势。将数据定性为竞争利益的保护方式,则可以综合纳入多种价值考量因素,既保障数据处理者收回投资,又促进数据流通。所以各市场经营者均能以相对较低的成本获得训练算法模型的数据集,从而在发展算法方面具有公平竞争的机会。
当然,算法在社会生活中的广泛应用也产生了许多问题,应该对算法滥用所产生的风险和危害加以预防和消除,但是披露、解释等算法规制方式不是唯一正解。算法治理需要同时包含算法规制和算法保护的双重维度。结合数据自由流通的构想,算法在获得保护的同时,也可以受到合理的规制。这一种规制来自当前以数据为驱动力的算法技术原理对算法自身的约束,也来自充分市场竞争对算法开发者“技术权力”的约束。随着深度学习、自主学习等技术的演进,一些算法脱离了人类全过程的开发和设计,可以在输入经过处理的数据后,通过大量数据集的训练加以自主演化。人类干预较少的无监督算法,甚至可以在没有持续性数据输入的情况下自主演化。此种技术原理导致特定数据集合的选择对算法的开发具有关键影响。大量的案件表明,训练数据集的选择、数据挖掘以及关联等数据处理行为的偏向性是算法决策结果不公正的重要原因。就此,数据的自由流通可以促进算法另一种意义上的“透明”,起到监督算法的根本性作用。获得开发算法的数据,并进行数据审查已成为监督算法的关键性措施。例如,美国众议院提出的《2022年算法责任法案(草案)》,要求将训练、测试、开发算法的数据和相关信息记录为文件,并加以更新和维护。这一要求的目的就在于评估数据对算法开发的影响,从而评估算法是否存在歧视、侵犯个人信息或隐私等危害。再者,对于此种数据驱动、具有一定自主性的算法,算法解释权、算法公开的可行性也受到质疑。由于算法中存在的随机性及其学习过程中自主积累的算法逻辑,算法开发者难以对算法的运行过程和结果进行解释。所以,数据自由流通及随之可行的数据审查为评估和监督算法另辟蹊径。数据的自由流通还能促成多方主体利用相同数据开发相互竞争的机器学习算法,能更有效地识别被采用算法的缺陷,并实现算法工具的不断优化。在充分竞争的市场中,其他经营者会比公权力机构更有激励性去监督那些凭借算法获得优势竞争地位的大型互联网企业。即使大型互联网企业因在先收集大量数据而开发出效率更高的算法,他们也会因为担忧自己的优势地位不再稳固而努力改进算法和防范算法决策风险。因此,数据自由所带来的市场竞争得以防止任一经营者通过算法实现“技术统治”,肆意地侵犯个人权益和无视社会伦理规范。总之,尽管数据自由和算法保护结合的构想并不完善,但是可以被发掘为算法治理的一个新方向,增加全社会福祉。
当“劳有所得”在财产权制度所保障的价值体系中劣后于公共利益,当数据市场失灵成为一个“伪命题”时,增设数据财产权的正当性基础摇摇欲坠。实际上,经营者,尤其是平台经营者,一方面能凭借其平台基础设施便捷地收集数据,另一方面能凭借其技术手段及现有的法律制度阻止他人不正当获取并使用数据的行为。另外,数据所产生的竞争优势不是固有的,而是依赖于收集、分析它的算法。如果收集和分析数据的算法获得积极的保护,经营者也能间接被激励收集和处理数据。如此,数据收集者和处理者可以在一段市场领先时间内获得充足保护。若额外设立数据财产权,反而可能损害竞争自由和数据流通的公共利益,甚至产生“平台企业数据垄断问题”。数据垄断又将进一步导致其他经营者因数据不足而丧失公平竞争机会。所以,“数据自由”更加符合我国促进“数据流通和资源化”的目的。当然,数据自由是相对于绝对权性质的数据财产权的自由,并非绝对的自由。这意味着数据处理者不应长期、绝对排除任何获取和使用数据的行为。