李安
(中南财经政法大学知识产权研究中心,武汉 430073)
一是在事实层面对数据财产利益的争夺与防卫。作为数据的收集者、存储者和管理者,互联网企业是数据的事实管理者,也是数据财产利益的事实占有者。如基于用户数据挖掘的各种“私人订制”成为各个网络平台提高服务质量的一种常见方式。不过,这种事实利益的享有并不稳定,它无时无刻不遭受着其他数据使用者的争夺,因而数据冲突频频发生。在事实层面上,企业对自己平台上数据财产利益的支配和排他,几乎完全依靠以Robots 协议、API 数据接口认证、防火墙等技术措施为核心的自我保护力量。
企业围绕数据财产利益的争夺和防卫从事实层面转向规范层面,这在法理学上具有重大意义。借用康德(Kant)的权利哲学来讲,企业对于平台数据财产利益的占有,正寻求从“感性占有”走向“理性占有”,正谋求从“经验占有”发展为“法律占有”。或者说,企业正在努力推动将自己持有的数据财产利益从一种个人意志主张的“事实性利益”。转变为一种体现社会意志的“规范性权利”。这一转变可称为数据财产利益的权利化。
本文所讨论的“数据财产利益权利化”是法理学意义上的“利益/权利”概念。目前,互联网平台数据财产利益面临的是正当化问题,而不是法定化问题。事实利益的法定化,是事实利益正当化之后的事情。以法理学上的“利益—权利”区分理论为基础,可以认为:在过程意义上,正当性评价是数据财产利益权利化的桥梁;在结果意义上,正当利益是数据财产权的内核。也就是说,数据财产利益权利化的关键在于正当性问题。只有基于一定的正当性(价值)基础,社会各界才能对数据财产利益的保护形成共识,进而运用社会公共意志制定法律规范。
迄今为止,私人财产权的正当性论证吸引了许多优秀的学者。其中,洛克(Locke)是最耀眼的一位,他的思想对近代私人财产权的确立起了奠基性作用,“任何关于财产的严肃讨论,都要从他的作品开始才算明智”。本文将以洛克的财产权学说为理论资源,首先揭示洛克财产权正当性理论的对物和对人双层结构,然后分别在对物层面分析企业支配数据的正当性及对人层面论证企业数据排他的正当性,以期推动企业数据财产利益的权利化,为当前的数据治理规范体系建设提供理论支持。
洛克关于财产权的论述主要集中于《政府论(下篇)》第5 章“论财产”。洛克的财产权思想包含多个方面,如劳动与私有财产权的关系、货币与财产不平等的关系、财产权利与政府权力的关系等。因为篇幅有限,本文将不对洛克的财产权思想作全景式的回顾,而是以数据财产权化的正当性问题为导向,主要关注洛克对财产权证立的论述。
在引入洛克财产权正当性理论之前,需要直面并解答一个可能的疑问,即洛克于17 世纪围绕实体财产构建的财产权学说,能否穿越时间并跨越空间,被用来解说21 世纪非物质形态的数据财产问题。笔者的回答是肯定的。实际上,已经有许多学者,如中国吴汉东教授、美国莫杰思(Merges)教授、澳洲德霍斯(Drahos)教授,借用洛克财产权学说来论证非物质财产之典范——知识产权的正当性,产生了积极的学术影响。此外,已有学者借用洛克思想来说明企业对数据享有独占权益的合理性。
首先,对物关系的财产权正当性,关注个人与对象物之间的关系,对应的是洛克财产权的正面论证和积极要件。洛克财产权的正面论证包含三个核心概念,即共有、需求、劳动。“共有”是私人财产权产生的背景,“需求”是私人财产权产生的理由,“劳动”是私人财产权产生的方式。三者联合解释了私有财产从共有公社中产生的逻辑:第一步,上帝将世界给予人类共有,亦给予人类理性通过利用土地及其中的一切来保存和发展自我;第二步,遵循上帝的理性指令,人类为了生存和发展的需求利用土地等共有物时,就需要将共有物拨归私用;第三步,人类的劳动是将共有物划归私用的方式,即当某人将自己的劳动掺进某物使其脱离自然状态,则该物成为他/她的私有财产。洛克财产权的正面论证或积极要件关注的是人与物之间的关系。如积极要件中的人类需求要素,反映的是人需要遵循上帝的理性命令将物划拨私用以使自己生存下去。再如积极要件中的劳动占有要素,强调的是人须花费时间和精力(劳动)将物从自然(共有)状态中剥离出来。
其次,对人关系的财产权正当性,强调个人与其他人(或人的集合体即社会)的关系,对照的是洛克财产权的反面限制和消极要件。洛克设置了财产权成立的若干附加条件:一是禁止浪费(糟蹋或败坏)条件;二是同样好且足够多的留存条件。另外,加州大学伯克利分校莫杰思教授提出了洛克的第三个附加条件,即“仁爱条件”。该条件从《政府论(上篇)》第42段内容中引出,洛克指出“一个人不能够基于对土地的所有权或财产权而取得对别人生命的正当权力”,而且“一个人如果乘人之危”利用财产权“强迫他成为自己的臣属”是不义的。申而言之,洛克的“仁爱要件”强调生命和人格的价值位阶要高于私人财产。洛克设置财产权的附加条件,目的是回应利益相关人可能的异议,关注的是人与人之间的关系。如设立浪费禁止这一附加条件,一方面是为了限制财产权人的贪婪从而给其他人留下更多的可用资源,另一方面旨在促使物的充分利用从而增加社会整体福利。再如设置同样好的且足够多的留存附加条件,是为了保证某人获得财产权的同时,不会严重地恶化他人的生存条件,不会不合理地限制他人的发展机会。另如仁爱附加条件,明确私人财产权不能凌驾于他人的生命权,明显的是为人与人之间的利益冲突而设置的。
综上,洛克财产权的正当性理论由两个方面组成:一面是对物关系,即个体与外在物之间的关系;另一面是对人关系,即个体与他人围绕外在物而形成的关系。两者的侧重点不同,对物层面的财产权正当性考虑的是个体因素,对人层面的财产权正当性关注的是社会因素。需要说明的是,本文所讲的对物关系,其中的“物”是与主体相对的客体,是主体行为的对象,是外在于主体的事物而不是外在于主体的实物。虽是非物质形态但以数字组合(0 和1)形式客观存在的数据,是本文对物关系讨论中的“物”。
在对物层面,财产权的正当性问题,追问的是个人与外在物存在什么关系?或者说,个人和外在物是如何联系在一起的?在洛克看来,劳动在对物层面的财产权论证逻辑(共有—需求—劳动)中最为重要,正因如此,洛克的财产权学说也被称为“劳动财产权学说”。想要在对物层面理解好、运用好洛克财产权学说,关键在于正确而全面地剖析劳动在洛克学说的中含义和作用。通览《政府论(下篇)》,可以发现洛克在两种意义上使用“劳动”一词,即一种是在动词意义上使用,一种是在名词意义上使用。洛克的这两种不同的使用意义,使得私有财产的劳动所得“既有逻辑性又有道德性”,具体来说,由动词性劳动所展开的话语是洛克财产权证立的感性路线,而以名词性劳动为起点的论证是洛克财产权证立的理性逻辑。对洛克来说,联结个人和外在物的事物是“劳动”;对企业来说,勾连企业和数据资产的媒介是企业的数据处理行为,如数据收集、数据存储、数据保管、数据加工等。以洛克劳动的两种用法和两套理论为指导,下文将分别探讨企业数据利益正当的情理和事理。
在《政府论(下篇)》第5 章中,洛克多次在动词意义上使用“劳动”一词。在动词意义上,洛克的劳动是对树下橡实的“捡取”和对树上苹果的“采集”,是对野兔的“追赶”,也是对土地的“耕耘、播种、改良、栽培”。在劳作或工作的意义上,洛克财产权的正当性来源于劳动所具有的道德力量,这种强大的道德力量源于劳动过程中的辛苦和艰难“在人类将心比心的体验上容易唤起人们对于劳动价值的情感认同。”对照洛克动词性劳动的道德意义,下面我们来分析企业的数据利益何以正当。
在讨论数据财产权益的时候,我们要注意区分信息和数据这两个不同的事物。信息是数据的内容,数据是信息的一种记录形式。借用康德的概念来讲,信息在没有被记录之前是一种不可知的“自在之物”,而被捕捉并以一种有形记录而存在的信息是一种可知的“现象之物”。而作为现象之物存在的信息具有多种记录形式,如结绳记事、烽火传信、文字记实,以及近几十年出现的电子数据。2021年6月通过的《中华人民共和国数据安全法》(以下简称《数据安全法》)第3条就对数据和信息作出了区别,规定:“本法所称数据,是指任何以电子或者其他方式对信息的记录。”诚然,该条将数据扩大解释,既强调包括电子形式的信息记录(狭义数据),也声明包含其他形式的信息记录,不过在表达上前者比后者更为突出。这是因为数据经济价值的本源是信息,但是并不是所有的信息形式都是算法可以分析的对象,只有信息以二进制数字组合即数据形式存在才能被用于机器学习。在作出以上区分之后,可以发现,信息的数据化是信息在智能产业意义上成为可用之物的关键。以洛克财产权学说为参照,未被记录的信息和以非数据形式存在的信息记录可视为处于自然状态中的消极共有物,而企业的数据收集、储存、保管和加工等行为可归类为洛克的劳动行为。通过一系列数据处理行为,企业将以消极共有形态存在的信息划拨私有,在字面意义上受到洛克财产权学说的支持。进一步来讲,在动词性劳动层面,我们可从以下两个方面理解企业数据利益正当的情理。
一方面,形而下即通俗地讲,劳动的道德正当性根源于是广大人民“种豆得豆、种瓜得瓜”这一朴素的生活经验,发源于“投入—回报”这一质朴的但在人们心中具有普遍性的心理预期。企业的数据处理行为将信息数据化为可被算法或机器利用的资源,其背后是企业长期的辛勤劳作和巨大的成本投入。企业对数据的收集、存储、保管和加工等行为,尽管不一定会有“额头流汗”式的体力劳动,但也包含了数据企业的心力与脑力、努力与勤勉、操劳与艰辛,这同样合乎广大人民关于“天道酬勤”的情感认同,符合广大群众关于“所得源于付出”的心理期待。在这个意义上,企业通过自己的数据收集、存储、加工等获得数据财产权益,会赢得社会公众的尊重和赞许。
另一方面,形而上即学术地讲,洛克劳动之所以具有道德正当性,是因为遵循了康德道德律令的第一原则,即“要只按照你同时能够愿意它成为一个普遍法则的那个准则去行动”。也就是说,劳动所得是一项潜在的人们都彼此认同的普遍法则。从反思的角度看,企业尊重其他企业通过自己的努力和付出去收集和积累数据,不是出于他利而是出于自利,即他希望其他企业以同样的方式尊重自己的数据资产。因此,企业依据数据收集、管理等行为获得数据资产的财产所得方式,根据康德道德律令第一公式,也可以普遍化为一项各方都能够彼此认同的行为准则。在这个层面上,企业主张对自己数据平台上的数据享有财产权益,会取得社会各界的认同和支持。
总之,企业对数据的收集、存储、保管和清洗加工等一系列辛苦行为,一如洛克动词意义上劳动,具有道德正当性。企业通过自己的数据处理行为获得数据财产权益,在广大人民普遍的生活经验和朴素的心理预期中是正当的,在康德道德律令第一原则的层面上也是正当的。
在《政府论(下篇)》第5 章中,洛克也在名词意义上使用“劳动”一词。前文已述,生命权和自由权的自然正当性较财产权更为牢固,因此洛克意图从生命权和自由权的自然正当出发,来论证私人财产权的正当性。洛克首先指出“每个人对他自己的人身享有一种所有权”,然后认为个人的自由行为即劳动是“劳动者无可争议的所有物”,最后个人的劳动“掺进”外在物从而获得对该物的所有权。对此,诺奇克(Nozick)以番茄汁代替劳动,质问洛克,“如果我有一罐番茄汁,我把它倒入大海以使分子均匀地溶于整个大海,我就因此而拥有这个大海吗?”可见,劳动在这里作为一个名词出现,它是劳动者的当然财产。那么问题是,为什么个人可以通过自身及其劳动意义上的“我的”来获取外在事物意义上的“我的”?洛克的逻辑是财产的“混合”和“添附”,前者解决财产的确定问题,后者回答财产的归属问题。个人财产与外在财产的稳定混合,外在财产对个人财产的价值添附,是动词性劳动这一感性话语在洛克财产学说中发挥作用的理性基础。对照以洛克名词性劳动为起点的财产权逻辑,我们可从以下两个步骤来分析企业数据利益正当的事理:
首先,企业资本通过一系列数据处理行为与信息资源相结合为数据资产,从而确定了可归私有的财产对象。在洛克财产权正当性的对物层面,“行动者与对象之间发生的是一种‘混合’和一种‘联结’”,即个人劳动“掺进”外在物。自我财产与外在物财产的混合,是洛克财产权的精髓,后世黑格尔(Hegel)的财产权理论也很大程度上受惠于此,“两位哲学家都运用了相同的形而上学观念:一个行动者体现在一个外在对象中”,只不过黑格尔主张“人把他的意志体现于物内”。就本文讨论对象企业数据而言,在数据的生成、存储、保管和加工等方面,企业投入了巨大的成本,可以说,企业将资本掺进了数据资产。互联网企业是整个数据生态链中的最大投资人。从早期的“+互联网”到现在的“互联网+”,互联的数字化信息累积成为一种可供机器学习的“数据资源”,在这一过程中互联网企业付出了巨大成本。从另一个方面来看,改变了人们的生活和生产方式的互联网企业,以免费的互联网产品和服务将各种人、事、物信息纳入互联网,数字化为可供计算和统计的数据,并为之提供存储空间和安全保护。在这个意义上,包含某种信息的数据是一种“互联网新货币”,是用户用以支付企业互联网产品和服务的对价。总体来说,数据的生成、存储和保管,均有赖于企业的技术投资、人力投入和其他财产的付出。没有数据企业资本的深度参与,就没有现在蓬勃发展的数据经济。正是互联网企业推动着中国从“人口大国”走向“数据大国”,变“人口红利”为“数据红利”。可以说,企业平台上的数据资产是企业资本与信息资源稳定结合的一类新型财产物。
其次,只有数据化的信息和经过“清洗”的数据才是智能产业的生产资料,数据企业的资本投入是数据资产价值形成的主要原因,企业可基于财产添附规则获得数据资产的财产权益。在洛克看来,劳动使外在事物的价值得以提升,“将绝大部分的价值加在土地上的是劳动,没有劳动就几乎分文不值。我们是靠劳动才得到土地的一切有用产品的最大部分的”,“自然和土地只提供本身几乎没有价值的资料”。只有数字化的信息和经过“清洗”的数据才是智能产业的生产资料,企业的资本投入和经济行为使得信息和数据具有了经济价值。上文已述,信息和数据是两种不同的事物。作为自在之物的信息和非数据记录形式的信息,没有被算法或机器加以利用的价值。企业的资本投入和经济行为,以数字组合的形式捕捉、收集、固定了信息,使其可知,并且数据形态的信息可以被算法和机器加以统计和计算,产生经济价值。一言以蔽之,只有数字化的信息,才是可供统计分析的信息能源,才是人工智能产业的生产资料。此外,也应该注意到,原生数据与衍生数据之间的区别。原生数据是信息被记录储存的初始形态,杂乱无章。这些杂乱的原生数据,只有在经过“清洗”和加工、聚合和整合、计算和统计之后,从无序中理出了有序(如购物偏好、出行喜好、信用评估),才能具有经济价值。在这个意义上,能够成为专有权对象的是有序的衍生数据,而不是无序的原生数据。依据以上两个方面的分析,企业的数据资本投入是数据资产价值形成的主要原因,这也是企业支配数据资产的正当性所在。
综上,以名词性劳动为起点的财产权逻辑解说了企业数据财产权益之所以正当的事理:首先,企业资本通过数据处理行为使信息数字化为数据,可以说,数据资产是企业资本与信息资源的结合物;其次,企业资本在数据经济价值的形成和发掘中起主要作用,因此,企业依据添附规则享有数据财产权益。
浪费禁止要件的设立目的,一方面是限制财产权人的贪婪,为其他人留下更多的可以使用财产;另一方面是禁止物的闲置和浪费,强调物尽其用,促进整个社会福利的增加。浪费禁止要件下的第一个目的同样是充足留存要件的内容,因此浪费禁止要件的主要意义在于第二方面,即强调财产应有价值的充分利用。就数据而言,数据企业不仅能够使数据实现物尽其用,而且可以达到物超其用。因为,拥有数据资产的企业一般都具有利用开发数据的经济动机、资本实力、科技基础和人才储备,具有开拓智能产业经济的先天优势。
大型的数据平台企业,同时也是国家大力支持的人工智能产业创新平台。2017 年11 月17 日,国家15个部委在新一代人工智能发展规划暨重大科技项目启动会上,宣布依托百度、阿里巴巴、腾讯、科大讯飞四家企业建立首批国家新一代人工智能开放创新平台,具体如表1 所示。很明显,百度、阿里巴巴、腾讯是老牌的互联网平台企业,科大讯飞也属于资深的语音服务型的平台企业,他们共同的特点是在各自领域内拥有海量的数据并成为国家发展战略的选择对象,足见数据平台企业对数据开发利用的实力和能力。
表1 首批国家新一代人工智能开放创新平台
可以认为,将数据财产权配置给企业,数据资产没有闲置的可能和荒废的风险。进一步来说,企业拥有数据财产权益,可以为企业在数据方面的投资提供稳定预期,激励企业在数据经济和智能产业领域的进行投资,调动企业在数据产业的模式创新和数据利用的技术革新中发挥更大的积极性和主动性。可以相信,在蓬勃发展的数字经济和智能产业中,企业能够充分地释放“数据红利”惠及更大范围的社会公众。这正是洛克财产权浪费禁止要件所欲达到的结果。
首先,同一信息可以被多次数据化,也即一个信息可对应多个数据。信息是数据的价值本源,而信息具有公共产品特征,即信息的使用具有非排他性,信息的受益具有非竞争性,简单来说,信息的经济利用具有“同时性”和“无损性”。一个企业将某一用户的信息,如姓名、性别、职业、爱好、教育程度等,收集为数据,并不排除其他企业对用户的上述信息进行数据化记录。与专利权、商标权等强专有性权利不同,数据财产权不会排斥其他企业对同一信息进行再次数据化以及其后续利用。一言以蔽之,信息的数据化机会向所有企业开放,企业对同一信息的数据化不存在排他和竞争关系。
最后,网络的“去中心化”力量会进一步促进用户的“多栖性”和数据的“多归属性”。在互联网和人工智能的发展过程中存在两种并存的力量,即“趋中心化”和“去中心化”。在数据垄断议题上,网络的“趋中心化”能量容易被人熟识,但是网络的“去中心化”力量却容易被人忽视。在网络无处不在的今天,用户接触、下载和安装同类软件产品的成本非常低,即网络接入成本非常低。此外,目前软件产品友好的用户界面设计,使得软件更加容易上手,即用户学习成本特别低。同类产品网络接入成本和学习成本的降低,无疑会进一步促进用户的“多栖性”和数据的“多归属性”。在网络“去中心化”格局中,用户在多个同类软件平台上切换成为一种普遍现象,数据化的用户信息不会也不可能被某一企业平台所独占。
综上,数据的价值渊源是信息,而同一信息可被多次数据化,且数据化的信息在使用方面具有“同时性”和“无损性”;此外,用户在网络中具有“多栖性”,用户数据在网络中具有“多归属性”,而网络的“去中心化”进一步扩大了这一特征。以上因素表明,企业数据的财产权化不会不合理地减损其他企业获取和利用数据的机会。可以说,企业对自己平台数据私有化的同时,留有充足的数据资源供其他企业收集和使用。
仁爱附加要件,强调财产权不能够凌驾于包括生命权和人格权在内的人身权利。企业数据财产权利的正当性评价需要经过该要件的检测。在所有的企业数据类型中,用户数据因具有鲜活性、及时性和多样性而最具价值。用户数据是用户个人信息的数字化形式,兼具财产利益和人格利益。分别由《民法典》第111条和第127条规定的个人信息和数据是不同的权利对象,用户数据中的财产利益可归企业享有,而用户数据中的人格利益表征为个人信息权,属于用户的人格权范畴。根据洛克的仁爱附加条件,企业对用户数据财产利益的享有不能以用户主体的人格权利为代价。即企业对用户数据的收集和使用要符合康德道德律令的第二原则,把自己和他人“在任何时候都同时当作目的,绝不仅仅当作手段来使用”。就本文议题而言,企业要把用户当作“人”而不仅仅是数据信息宿主的对象“物”。综合考察平台企业数据利用的实践情况,可以说,数据企业可以在事前和事后两个阶段做到对用户个人信息的尊重和保护。
企业在事后阶段对用户个人信息的保护,表现数据管理的安全性保障和数据使用的匿名化处理。“数据是石油”这一命题频频见诸报端,但只强调了其类比逻辑的积极面——数据如同石油一样具有重大经济价值,而忽视了其类别逻辑的消极面:石油在推动工业经济发展的同时,伴随着石油泄露和有害气体排放;同样地,数据在推动智能经济发展的同时,也面临着数据泄露和数据不当使用等问题。用户数据的安全性保障问题是企业保护用户个人信息的首要工作。数据的资源价值是数据量变为大数据之后的质变,为了数据资产的成长,企业有动力也有能力采取有效技术措施防止用户数据的外泄。2021 年6 月出台的《数据安全法》为企业的数据处理行为提出了新的安全性合规要求。此外,用户数据的匿名化处理,是企业数据使用避免与用户个人信息保护发生冲突的重要措施。个人信息的核心特征是针对特定个人的“可识别性”,数据的使用可以采取匿名化技术措施有效地去除用户的敏感信息,如此将极大地缓和企业数据利用与用户个人信息保护之间的紧张关系。而实践中,原生数据一般都需要经过清洗加工转化为衍生数据才具有较高的使用价值,而这一转变进程即是数据匿名化处理的过程。因此,衍生数据所携带的个人可识别信息远少于原生数据。
总之,企业的数据财产权与用户的个人信息权之间的紧张关系并不是一个无解的方程。一方面,明确用户个人信息的价值位阶高于企业财产权益;另一方面企业可以通过各种规范性措施和技术性手段来缓和两者之间的紧张关系。既不能任由企业数据市场力量压榨用户个人信息权益,又不能因用户个人信息的保护而否定企业数据利益的正当性。只有变对立冲突为和谐共生,才符合数字经济生态化发展的愿景。
人工智能时代,数据是具有战略性意义的生产要素,目前企业特别是互联网企业是数据财产利益的事实占有者。企业仅用技术措施来保护数据这一事实利益,在数据竞争日趋激烈的今天,显得力不从心,并非长久之计,因此企业对数据财产利益的保护正逐渐从事实层面走向规范层面,即诉求数据财产利益的权利化。而正当性评价是“事实性利益”转化为“规范性权利”的必由之路;毕竟法是“理”和“力”的结合,缺乏内在正当性的法律规范仅凭暴力强制终将“独木难支”。
本文借助洛克财产权学说解剖企业数据财产权正当性的内在机理,更多是描述性地、解释性地阐明企业数据财产权的正当性,但更倾向于批判性、规范性地为企业厚植其数据财产利益正当性指明努力方向。具体而言,数据企业应注意以下两点:(1)企业数据财产利益的正当性处于流变之中。正当性从来都不是一成不变的,它可以从无到有,也可以从有到无。因此,企业数据财产权正当性的证立不是一劳永逸的,数据企业应时常检视自己的数据处理行为,不断稳固其数据财产利益的正当性根基。(2)企业数据财产利益的正当性在对人层面仍较为薄弱。当前,企业在对物层面具有支配数据的正当性,在对人层面拥有数据排他的正当性,但比较而言,后者的正当性基础要弱于前者,更容易受到诘难。本质上,对人层面的正当性要比对物层面重要,因为权利归根结底是人与人的关系。对此,企业应以洛克对人层面的浪费禁止要件、留存充足要件、仁爱要件为准则克制其数据处理行为,尤其要尊重其他企业的市场竞争利益,维护网络用户的个人信息权利,努力厚植其数据财产利益的正当性基础。阐明、稳固和厚植企业数据财产利益正当性的价值在于促使社会共识的形成以及共识面的扩大,并以此为基础运用公共意志制定数据财产权保护的具体法律规范,填补《民法典》第127 条关于数据财产权保护的“法律留白”。