李齐 郭成玉
摘要 推进数据资源规范高效地采集、整理和分析应用,有效保护个人隐私、企业权益和公共安全,对于推动经济社会发展和国家治理现代化具有重要意义。当前推进数据资源的生产和利用面临的首要问题是数据资源确权,需要构建数据资源确权的理论基础,形成统一的实践应用框架。文章分析了相关理论纷争和实践困境,认为基于传统资源的现有法律规范及精神,在理论探讨和实践中不能有效适用于数据资源确权。明确基于数据资源特性及运用产权理论建构数据资源确权的理论基础,进而构建确权实践应用框架。在充分考虑数据资源特性的基础上,分析表明数据资源确权有两个基本维度:排他性维度和伴生性维度。排他性维度分析基于技术水平、社会效率和分配公平三个因素,平衡考虑数据生产者利益、社会整体效率和社会风险,明确了排他、有限排他和非排他的三种制度选择及其产生的效果。伴生性维度分析了数据资源的伴生主体分类,以及由伴生主体利益诉求和参与数据生产程度确定的伴生程度强弱,确定了数据资源类型和产权类型。依据排他性和伴生性维度分析数据资源实践应用框架,以个人、企业、社会组织、政府、国家为伴生主体,各种数据资源产权可以分为人格权、私有产权、俱乐部产权、公共产权和有条件限定公共产权5种类型;并依据各主体的特性,分析了产权归属及产权交易和共享的可能性与方式,以平衡社会公平与效率,既保障各主体的利益诉求,又促进数据资源的持续产出和流通。
关键词 数据资源;数据产权;数据确权;排他性;伴生性
中图分类号 C939文献标识码 A文章编号 1002-2104(2020)11-0206-11DOI:10.12062/cpre.20200616
在信息革命第三次浪潮的推动下,数据资源成为经济社会发展的基础性战略资源[1],其价值日益凸显,已经成为决定国家和企业竞争能力的重要因素。本文所分析的数据资源主要是指“大数据”,即超大规模数据、快速流转和低价值密度的数据,以及采集和分析方式不同于传统调查数据的“小数据”,包含结构化、半结构化和非结构化的多类型数据。推进大数据产业发展成为国家战略,对于实现经济社会高质量发展和国家治理现代化具有重要意义。如何基于数据资源确权,规范高效地采集、整理和分析应用数据,以及如何保护个人隐私、企业权益和公共安全,成为当前亟须解决的问题[2]。为此,相关研究和法律实践不断推进,但是相关主体权利和利益始终难以平衡,导致数据确权在理论上各执一词,相关实践存在多重困境,不利于合理有效配置数据资源。究其原因,在于数据资源确权难以适用已有的法律规范,而新的理论基础没有得到统一建构,实践框架也没有统一认识,这正是本文试图解决的问题。
目前关于数据资源确权的研究,主要集中于数据权体系、数据保护路径和标准三个层次,其考量基准是现有法律规范,以及相关权利的确定可能对各主体利益带来的损益。在数据资源特性的约束下,依据不同的路径分析,理论纷争自然形成。相关实践和判例由于没有能够容贯一致的法律规定和解释,只能根据现有法律精神,适用不同法律规范,形成相互冲突和矛盾的现象。
如何继续推进相关研究和实践?如何能够实现在统一的基础上对话?这需要在数据资源确权的理论基础上达成共识,从数据确权的理论源头探索。产权的发生史说明,每个时期的技术水平和资源特性,以及对效率和公平的追求,让人们采用了不同的产权模式。因此,数据资源确权的分析,需要基于当前的技术水平,考察数据资源的特性和产权理论的适用,进而根据效率和公平的考量,确定数据资源确权的维度(排他性与伴生性),分析各种数据资源在不同场景下,各主体应当遵守的行为规范,即产权配置,最终形成数据资源确权的实践应用框架。
1 数据资源确权的理论纷争与实践困境
深化理论基础研究,分析应用框架,有必要对数据资源确权的理论纷争和实践困境做全景式考察,把握当前研究和实践的基本脉络,明确需要解决的基础性问题。
1.1 数据资源确权的理论纷争
当前数据资源确权的理论研究的基本思路比较明晰,首先讨论数据权体系,即数据权包括哪些基本权利;然后,讨论不同的权利应依据哪些法律途径予以保护;最后,分析法律适用的具体标准。这三个层次的分析都没有统一的认识,学者的观点往往针锋相对。
對于数据权体系,研究者从不同的角度有着不同的表述。大部分学者关注数据资源所有权归属问题,即明确数据资源为个人所有,或为企业所有,或为社会组织所有,或为社会共有,由此形成数据权体系。基于所有权,可以将数据权界定为由归属权、占有权、支配权和使用权等权利构成的财产权[3]。有的学者从国家和公民的角度分析,认为数据权体系包含数据主权体系和数据权利体系两个部分[4]。对此,有的学者并不赞成,认为以网络安全和主权威胁的名义限制数据流动和信息交换的立法可能产生意想不到的后果,不提倡将数据主权纳入数据资源确权之中[5],并指出没有必要将数据主权涵盖在数据确权范围之内,因为它更多涉及数据安全问题,而数据确权却更多的是数据权的约束问题[6]。也有学者提出,应当将数据权体系分为公法层面的数据主权、社会权力意义上的数据权和私法意义的数据所有权、隐私权等[7]。对于以上分析方式,有的学者认为,这都是对数据确权的单边分析,根据双边保护框架,应将数据分为数据人身权、财产权和经营权[8]。
根据对数据权体系的不同理解,数据权的保护路径在不同研究者那里各有侧重。基于人格附属的财产权保护路径,注重个人信息保护的重要性。国内学者洪海林及美国学者劳伦斯·莱斯格认为,数据附属于人,需要在充分保护人格权的基础上,保护个人数据的财产权。基于物权所有权保护路径,将数据资源看作是中立的工具,注重数据资源的利用价值。周林彬等[9]从制度效率高低、克服制度禀赋阻力大小、交易成本大小三个方面,论证物权所有权保护路径促进数据交易和数据产业发展的适用性。有学者认为,数据作为无形物不适用于财产权保护路径,提出大数据开发是数据开发者技术、知识、劳动的结果,要注重保护数据开发者的劳动,主张知识产权的保护路径[10]。有的学者认为,数据也不适用于知识产权保护路径,而主张新型财产权保护路径,建立一个保护“无形物”的独立的财产权体系,重新平衡用户和数据从业者的利益关系,让用户拥有基于个人信息的人格权和财产权,数据经营者拥有基于数据资产的经营权和财产权[11]。但主张新型财产权的学者也认识到,个人信息的人格权、财产权与数据经营者的经营权、财产权间的界限比较模糊,实现个人信息保护与数据价值开发利用双赢局面较为困难。
数据保护路径不同,自然导致数据确权的判定标准不同。若数据产生主体和采集与使用主体为同一主体,或者自然数据被单一主体采集和使用,一般不存在判定标准的争议。但是,现实中常见的一种情况是,个人为数据产生者或同时作为使用者,而企业为数据的采集者和使用者。这样就存在数据权归属于个人,或归属某个企业的问题。至少有以下几种判定标准:第一种标准认为数据所有权归属于个人,因为个人是这部分数据的原始产生主体。任何企业对数据的采集和使用,必须获得个人同意,并保障个人对数据拥有修改或遗忘等权利。第二种标准认为数据所有权若归属于个人用户,侵害了企业的劳动成果,也不利于数据资源的开发利用与流转效率,所以数据所有权应归属于企业。相关学者认为这些数据是经过去身份化脱敏处理得到,已经切断了与用户的联系[12],同时企业在数据采集、存储等方面投入巨大成本,所以是企业的劳动成果。第三种标准认为个人拥有个人数据所有权,若个人数据变成匿名化的数据,成为数据资产,则企业享有限制性的所有权[13]。如果一个主体面对多个企业采集和使用数据,数据保护标准就更加难以确定。然而,现实中这种情形大量存在。比如一个主体的某一行为数据会被多服务应用、支付平台、手机数据平台同时采集和使用。那么到底数据归属于谁,可能还要考虑反不正当竞争或侵权标准等,让确权标准变得更加复杂。
1.2 数据资源确权的实践困境
理论纷争是对数据资源确权实践困难的反映。在缺乏统一理论认识的情况下,实践按照固有的路径探索前进,面临着重重困境,主要表现在这几个方面:类似的案例可以对应不同的法律部门,有着不同的法律实践;数据价值利益获取与人格权保护间的冲突,依据现有法律规范难以调整;数据规范的各国差异较大,数据主权保护存在冲突。
第一,对于类似的案例,在实践中适用不同法律部门。关于数据权的各种判例,主要集中于企业与企业间、个人与企业间,以及个人与两个或多个企业间的数据权争夺。比如,朱烨诉百度隐私权纠纷案的两次判决所运用的法律逻辑截然相反,一审重视保护个人信息,而二审偏重于保护数据资源利用。淘宝诉美景公司案与新浪微博诉脉脉案情况相似,但前者判决被告美景公司构成了不正当竞争,而后者判决则保护被告获取原告用户信息的合法权益。数据纠纷案例如果根据主体间协议,可以适用合同法,但主张数据是中立的工具,忽视了数据的价值受制于数据内容和数据依附于主体存在的现实。如果根据数据的无形和劳动成果特征,适用知识产权法,就没有注意到数据资源不具备独创性、期限性、法定性的知识产权必要特征。根据数据占有或所有事实,适用物权法,则容易忽视数据的个人权利保护,或在某个范围内数据应有的共有性。根据产生主体适用个人信息保护法,就会忽视数据产生过程中企业的价值和数据流通的价值。根据数据流通适用价值的冲突,适用不正当竞争法,却会忽视数据在平台上的共有性与网络的开放性。不同的判例实践,往往只能根据当时的情景,根据某种法律依据进行裁定,不自觉地忽视了其他依据可能给予的保护。
第二,数据价值利益获取与人格权保护间的冲突难以调整。个人对数据的权利主张及对个人数据权的保护,与企业对数据的利用,在不同的情境中存在冲突。一种是对人格权可能的侵害。现实中存在企业在未经许可的情况下收集、占有、使用其数据,分析用户需求,获得市场优势,侵犯了数据生成者的合法权益的情况。正常情况下,个人和企业之间会签署协议,但这种协议是不完全契约。数据生成者在使用大数据运营主体推出的软件或应用时,只能签订同意或不同意条款,不能协商更改,处于被动地位[14]。另外,随着数据分析技术的改进,数据价值获取逐渐超出契约规定范围,对于契约外的或然事件的决策和处理,大数据运营主体拥有“剩余控制权”,可能在契约未明确的情况下侵害数据产生者的权利[15]。另外,还存在对企业数据价值利益获取的侵害。如新浪微博与头条关于数据的争夺。按照判例,数据归个人所有,个人拥有处理数据的自决权。然而,在微博上形成的数据,已经让微博付出大量成本,經个人转移到头条,必然在相互竞争中,让微博利益受损。
第三,各国数据确权实践不一致,数据主权保护相互冲突。面对数据确权难题,世界各国由于法律体系等差异造成确权实践存在冲突。欧盟秉持体系化理念,确立了“个人数据”和“非个人数据”的二元架构,创设“数据主体”身份,并赋予其一系列权利,试图提升自然人对其个人数据的控制。针对“非个人数据”,企业享有“数据生产者权”,不过,其权利并非是绝对的[8]。美国选择了一条充分利用既有法律身份和监管机制的实用主义路径,在宽泛保护个人权利的同时,促进企业对数据的利用。在联邦层面,信息隐私保护规则分散在各个传统法律部门中,利用“信息隐私权”来化解互联网对私人权利的威胁。但同时,美国主张个人和数据企业在协议的基础上,实现权利的转移,并不对企业使用匿名化数据给予过多限制。日本遵照个人信息保护法,同时经济产业省制订了《数据使用权限合同指引》,通过合同方式来解决数据权属问题,和美国在实践中较为一致,但对个人数据权利保护要更严格。对于数据主权,2018年欧盟和美国分别发布了《数据通用保护条例》(General Data Protection Regulation)、《澄清域外合法使用数据法》(the Clarifying Lawful Overseas Use of Data Act, CLOUD Act),都明确主张对境内产生的数据,以及境内企业在境外产生的数据,拥有其他主体不可侵犯的主权[16]。我国虽然没有明确的法律规定,但在实践中基于网络安全等需要,也实际秉持相同的主张。如此,数据主权的冲突就在所难免。
2 数据资源特性与产权理论分析
数据确权的理论依据缺失和法律实践冲突,必然引发数据资源使用效率与公平间的博弈难以平衡。为此,需要进一步推进理论研究,提供实践应用框架。理论纷争和实践困境的关键影响因素,使数据有着不同于其他资源的特性。数据资源其本身的特性决定了产权理论分析的内容及确权维度有别于其他资源。
2.1数据资源的特性分析
数据资源作为一种特殊的资源,从数据本身而言,具有非競争性、可替代性、伴生性、被承载性和载体性。从流通和生产的价值来看,数据具有边际效益递增和容易陷入复制性陷阱的特性。数据资源特性为数据资源确权分析提供了基础。
2.1.1 数据资源的非竞争性与可替代性
数据资源具有非竞争性,即任何使用者对数据资源的消费都不会影响其他使用者的利益,也不会影响整个社会的利益,具体体现在两个方面:第一,数据资源使用的边际成本接近为零。每增加一个数据资源的消费者,不需要再追加投入。第二,数据资源的边际拥挤成本为零。即每个使用者对数据资源的消费都不会减少其他使用者的消费数量和质量,不会减少其他人对数据资源的满足程度,不存在消费拥挤的现象。因此,数据资源是一种具有非竞争性的特殊资源,它不同于具有竞争性的石油、煤等传统资源。要更高效配置数据资源,就需要促进数据资源流通,让需求者以低交易成本获取,从而不断创造新的价值。
数据资源具有非竞争性的同时,具有明显的可替代性。很多资源具有可替代性[17],但数据资源的替代性特征更为显著。从共时与历时两个维度分析,数据资源的替代性表现在:一方面,不同的数据资源可能经过分析,得出相同或相似结果,使获得相同数据资源成为非必须选择。因此,当某种数据资源难以获取时,往往选择可以获得相同或相似结果的其他数据资源来替代。另一方面,随着时间推移和技术进步以及元数据资源产生主体的行为改变,将会出现更具价值的可替代性数据资源。因此,基于数据资源的可替代性,数据资源需要加强流通,从而尽可能彰显其价值。
2.1.2 数据资源的伴生性与被承载性和载体性
不同于其他资源,数据资源具有伴生性。数据资源的伴生性是指其产生需依赖于自然环境或人类社会环境中的特定主体。当数据资源指向自然环境时,数据资源是对自然物变化的记录,如台风、地震数据等。伴生于自然物的数据资源与被记录数据资源的物体可以完全分离,不受被记录物体的限制,要依据数据内容及其与采集主体关系进行分类确权。而当数据资源指向人类社会主体及其拥有的物品时,数据资源是人类个体或群体的相关行为活动的记录,要受数据资源伴生主体利益诉求限制,不能利用数据资源危害其伴生主体的合法权益[3]。这说明,数据资源要在伴生主体限制下使用。
另外,数据资源还具有被承载性和载体性。数据资源在产生后,不能作为物品单独存在,需要信息系统作为载体,其本身为信息的载体。数据资源是无形的,无论是作为以比特形式存在的物理介质,还是其本身所承载的内容都具有无形性的表征,必须依赖于信息系统作为载体存在[18]。数据资源的价值,不体现于其作为比特形式存在,而是体现于数据承载着信息,据此,人们可以根据数据进行分析和深度挖掘,以获取具有价值的信息。因此,数据资源的生产和持续应用,始终存在既有成本。
2.1.3 数据资源的边际效益递增和复制性陷阱
不同于传统资源在生产中会产生边际效益递减的规律,数据作为生产要素往往会产生边际效益递增的效果[19]。当技术水平和其他生产要素投入固定时,增加某一种生产要素的投入,单位资源投入对产品产出的效用是不断递减的,即边际效益递减。但是,在以数据分析为主导的企业中,当技术水平和其他生产要素投入固定时,增加数据的投入,在正常生产的情况下,往往是随着单位数据的投入,产品的产出会提速,即投入与产出的二阶导数不是负值,而是正值。例如,淘宝平台在现有的技术水平和其他要素投入不变的情况下,不断获取商家、消费者、广告商等主体行为数据,通过对不断增加的数据进行分析,会越来越精准地向商户、消费者、广告商推送消息,处理平台事务,让各主体行为更加有效,让单位数据投入获得更多产出。数据边际效益递增会促使数据企业不断积累并垄断数据,以期获取超额利润。同时,中小企业和新创企业在面对拥有海量数据的企业时,往往因为数据缺乏而丧失竞争力。因此,如果不能促进数据有效流通,就存在不利于社会整体效益和持续创新发展的风险。
但同时,如果对数据流通不加以限制,又容易陷入复制性陷阱。数据可无限复制,且复制不会减损其价值,这是数据有别于有形物的特征[20]。不对数据生产者利益予以保护的数据共享,让所有人都可以免费或者以超低价格获取这部分有价值的数据资源,会导致数据生产者运用数据生产出来的商品在市场中不再具备优势。从社会激励机制来看,这就会出现“搭便车”现象,降低对数据生产者的激励。如果数据资源收集、加工、分析者的劳动权益无法保障,那么这些数据生产者将缺乏动力去创造数据资源价值,将最终不利于社会的创新与发展。
2.2 数据资源的产权理论分析
面对不同类型资源,应当根据其自身本有特性和在流通使用中的特性,进行产权理论的分析。所谓产权,意指使自己或他人受益或受损的权利[21],没有这种权利的初始界定,就不存在权利转让和重新组合的市场交易[22]。产权史的发展告诉我们,根据效率与公平的权衡,有着共有产权、排他性共有产权和排他性私有产权分别主导不同历史阶段的发展过程。当今基于物品分类,产权也可以分为公共产权、俱乐部产权和私有产权。学者对数据资源确权的讨论,除政府数据外,往往探讨如何把数据确立为私有产权,即只将产权归属于某个主体所有。但从历史发展过程和当前实际来看,产权的界定还有其他形式。根据数据资源特性,基于产权理论探讨数据资源产权的可能形式及其制约因素。
基于物品分类确定产权归属主要依据两个维度,即竞争性和排他性。竞争性是物品固有的属性,指在不考虑制度规范的情况下,物品本身所具有的性质[23]。而排他性是制度属性,是通过制度规范确定的物品属性。数据资源拥有的各种属性,已经明确了数据资源的非竞争性,还没有讨论排他性。数据资源的其他特性是为讨论排他性做准备。这里,根据产权理论,对数据资源排他性做分析。并根据数据的伴生性,增加了产权分析的伴生性维度。
根据排他程度可分为数据资源的私有产权、公共产权和俱乐部产权(社团产权)。数据资源私有产权是一种完全排他性权利分配的产权形式,没有经过数据资源产权所有者的许可或没有给予其应有的补偿, 任何人都不能合法地使用产权所有者的这部分数据资源[24]。私有产权主体可以是自然人,也可以是一个有限自然人的集合,如企业和社会组织。对数据产权行使的决策及其承担的后果完全是由私人做出的,任何其他的人都无权干预私有产权主体如何使用、交易数据资源,也无权享用数据资源带来的效益。与之相对应的是公共产权,是一种非排他性的产权形式,意味着公共产权要由广泛的社会公众个体共同使用,具有不独为私人专用的 “联合使用”的特征[25]。介于数据资源私有产权与公共产权之间的是俱乐部产权,俱乐部产权的性质具有公共属性,对俱乐部内部成员无排他性,可共同拥有产权,但要想成为俱乐部成员,获得俱乐部产权,需要支付一定的费用或者具备一定的身份。根据排他程度的区分,俱乐部产权是有限排他性产权。这样,我们将根据排他程度,将数据产权确定为非排他性、有限排他性和排他性三种不同的制度设计。
但同时,我们也要注意到,数据资源具有伴生性。考察数据资源的伴生性具有重要意义。首先,伴生性说明数据资源附属于某些主体产生,必须考虑伴生主體的人格权和与核心利益紧密关联的权利。涉及个人隐私、商业秘密、国家机密和公共安全的数据,在制度规范上都是不可以共享和交易的。为此,数据资源的排他性制度设计根据排他程度,不仅要考量数据的私有产权、俱乐部产权和公共产权,还需要考虑个人和法人的人格权,以及国家和政府必须掌握的权利。其次,伴生性为排他程度的制度设计提供了重要依据,即可以根据伴生主体的特征、与伴生主体的相关程度,确定排他性的强弱。最后,依据数据资源的伴生主体,能够较为明确地确定数据资源类型和产权类型。
因此,数据资源特性与数据产权理论分析为数据确权提供了两个关键分析维度:“排他性”维度与“伴生性”维度。对数据确权的排他性和伴生性维度进行详细阐述,分析逻辑如图1所示。
3 数据资源确权的“排他性”维度分析
根据数据资源的特性分析和产权理论分析,首先基于“排他性”维度分析数据资源确权。排他性不是数据资源的根本属性而是一种制度属性[23]。根据萨缪尔森对公共物品的供给成本分析[26]、科斯的“灯塔理论”[27],以及布坎南对公共物品外部性分析[28],排他性制度设计的主要影响因素是技术对于排他成本和收益的影响、社会效率高低和分配公平问题。这就是说,对于数据资源采取何种排他性制度设计,必须考虑技术的可行性及其付出的成本与收益的比较,同时要考虑对社会整体效率和社会公平的影响,以在保障各方利益的基础上,持续推进数据资源的生产与利用。
3.1 技术因素分析
具有排他或有限排他性的数据资源可交易,但任何可交易的物品都存在“使用和监控成本”,数据资源也不例外。排他性的技术因素就是要考虑对数据资源的使用进行收费和有效监控成本,及其在技术上是否可以实现和实现的适宜性问题。显然,如果技术水平低,很难将数据资源的无贡献者或不交费者排除在外,往往出现“搭便车”现象。即使技术上可以实现排他,如果数据资源的排他成本偏高,即主体的排他成本高于排他效益时,也不适宜采取排他性行为。一般来说,现有的技术水平越高,排他成本越低。如图2所示:当现有技术水平在 0~n0区间内时,技术水平太低,无法实现排他。当技术水平在n0~n1区间内时,技术上可实现排他,但排他成本大于排他效益,故不适宜采取排他性行为。当现有技术水平大于n1点时,技术上可实现排他,排他效益又大于排他成本,因此采取排他性行为较为合适。从目前现有的技术水平来看,是完全可以实现数据资源的排他,如区块链技术,以技术手段实现强技术信任,从而以快速即时的价值转移来实现数据资源的确权和维权。
但是,考虑数据资源具有非竞争性和可替代性,最大可能实现大量数据资源非排他或有限排他,则可以提升数据资源使用的社会总收益。因此,需要考虑排他性维度的社会效率分析。
3.2 社会效率因素分析
是否采取排他性制度选择还需考虑数据资源排他的社会效率因素。根据科斯的观点,只要产权是明确的,并且交易成本为零或者很小,那么,无论在开始时将财产权赋予谁,市场均衡的最终结果都是有效率的[29]。但在现实中,交易成本不为零,在很多情况下,可能会很高。数据资源的社会效率一般由使用数据资源而获得的社会总效益与获取和使用数据资源过程中投入的社会总成本决定,用公式表示为:数据资源社会效率=(数据资源社会效益-数据资源社会成本)/数据资源社会成本。根据数据资源的规模效益递增及复制使用成本几乎为零,可以将数据资源的社会总效益和成本的关系图简化为如图3所示。数据资源社会效益与数据资源社会效率成正相关,数据资源社会成本与数据资源社会效率为负相关,只有当数据资源社会效率指数值大于0时,表现为有效率。图3中n0点的社会效率指数(p)为0,n0右侧表明数据资源的使用是有效率的,左侧则无效率。这说明,除了要考虑排他使用主体的成本和收益,还要考虑数据资源排他使用的外部效益。比如,灯塔的供给,如果基于技术可以降低排他成本,实施了排他性使用,但对逃避缴费船只来说,可能因此造成重大损失。排他的负外部性效益大于灯塔所有者收益。如图4所示,对于一种特殊资源,不论排他成本如何变化,排他总效益始终小于非排他总效益。在这种情况下,不论技术水平如何变化,都不宜实施排他性措施。
数据资源的非竞争性、边际效益递增、可替代性等特性指明,数据资源得到最广泛的流通和使用,能够提升社会效率,采取非排他性和有限排他性的制度选择较为合适。但是,数据资源还有复制性陷阱的特性,如果采取完全非排他的制度设计,会导致“搭便车”行为,对数据生产者不公平,不能为数据生产者带来足够激励,就会导致数据资源的生产减少,反而不能提升社会效率。给予数据生产者适当补偿的非排他设计,或有限排他设计,对于社会效率的提升,显然更为有利。
3.3 分配公平因素分析
数据资源的排他程度制度设计的分配公平因素,主要考虑对于数据生产者和社会其他主体的公平问题。如果为了实现更高的社会效率,不顾及数据生产者的利益,采用完全非排他性制度设计,对于数据生产者而言,结果是不公平的。数据资源要经过收集、加工、处理、分析,甚至还要经过清洗、脱敏、加密等一系列复杂的过程,需要付出相应成本。根据劳动财产权理论,如果行为主体对数据进行了实质性的大量投入,那么理应得到相应的回报[30]。数据资源的复制性陷阱使非排他的权利分配无法保障数据生产者的劳动成果,因此,相比之下,排他性的制度选择对数据生产者较为公平。然而,这并不意味着排他性的制度选择一定比非排他性的制度选择更有助于分配公平。基于边际效益递增的特性,数据生产者和使用者偏向于积累和垄断数据,以获取竞争优势。如此,排他性制度设计对于初创和中小数据企业会形成行业进入门槛和发展限制,在同样的技术条件下,失去竞争优势,导致进入市场和发展的机会不公平。相比排他性和非排他性,有限排他的制度选择可能更为公平。通过有限制地实现数据共享,不仅可以保护数据资源主体的劳动成果,避免出现复制性陷阱,又尽可能促进数据资源分配的机会公平。因此,要综合考虑在不同情境下排他性、有限排他性与非排他性权利分配的公平性程度,最大限度地平衡数据资源利益相关者的利益,做出合理的产权制度安排。
综上,非排他性、有限排他性、排他性的制度选择在综合考量技術因素、社会效率因素、分配公平因素的影响下,其可能的确权考量如表1所示。从表1可以看到,无论是排他性的制度选择还是有限排他性的制度选择抑或是非排他性的制度选择,就目前社会技术水平而言,都可以实现。在技术可实现的条件下,数据资源的非排他性制度选择和有限排他性制度选择都能在一定程度上使数据资源呈现一定程度的效率和公平。因此,对于不涉及个人隐私、商业秘密、公共安全和国家机密的数据资源,采取有限排他性和非排他性(在给予数据生产者适当补偿的基础上)的制度安排较为合理。
4 数据资源确权的“伴生性”维度分析
基于产权分析的排他性维度,可以一般性分析数据资源排他程度的制度设计。基于伴生性维度,分析伴生主体的特殊性和伴生程度,可以分析数据产权类型,保障数据资源伴生主体的合理诉求。
4.1 基于数据资源伴生主体的数据产权类型与谱系分析
人类社会和自然世界都在不断变化,相应生成数据资源。基于“自然物”产生的数据资源,分析较为简单。其中涉及国家秘密、公共安全和国家整体利益的伴生自然物的数据资源,应当归国家或政府所有,准予采集且有价值的应给予采集者以适当补偿,并通过协同运作, 实现多渠道补偿, 提高补偿效率[31];其他的应根据数据内容和采集主体特性,适用排他、有限排他和非排他制度设计。人类社会中产生数据的行动主体,可以称之为“伴生主体”。数据资源伴生于主体的确权,情况较为复杂。
伴生主体分为多种,且各自特性不同。根据数据资源产生所指向的对象,伴生主体包括个人、企业、社会组织、政府、国家等多个主体。对于国家作为伴生主体,可能存
在争议。本文把国家确定为基于共同体存在的实体,作为全体共同体成员的共同利益的代表者和保护者,并是相对于其他国家而存在的行动者。政府和国家不同,政府可以分为中央政府、地方政府,可以与个人、企业等主体相对存在,但国家在一国之内,只能作为一个主体存在,并涵盖其他主体。数据资源也可能伴生于多个主体,需要根据相关程度最强的主体,判断其伴生主体。
数据资源依据“伴生主体”,可划分为多种类型。首先,基于单个伴生主体生成的数据资源的分类。根据伴生主体可以划分为个人数据、企业数据、社会组织数据、政府数据,以及国家数据。个人数据是指由个人活动所产生或与个人相关的数据,涉及个人身份和行为。企业数据是指由企业生产经营产生的数据以及反映企业基本状况的数据[32],如企业人力资源数据等。社会组织数据是指由社会组织活动产生的数据。政府数据主要包括政府机构或政府工作人员自身履职产生的数据等。涉及国家秘密、国家安全和国家整体利益的,不论哪种主体所产生的,归为国家数据。其次,基于多个伴生主体生成的数据资源分类。如公共组织收集的个人-政府型、企业-政府型数据资源,这部分数据资源多为个人、企业、社会组织等其他数据主体的原始数据;又如个人-企业型、个人-社会组织型数据资源,这部分数据资源多为衍生数据资源,是企业、社会组织等主体在个人原生数据被记录、存储后,经过算法加工、计算、聚合而成的系统的、可读取、有使用价值的数据。衍生数据确权的争议主要集中在互联网企业以及其他需要大量采集个人数据的行业中[33]。多伴生主体生成的数据资源,可以根据伴生某个主体的程度和数据内容,归为某个主体的数据,或归为俱乐部产权与公共产权数据。
根据上述分析,数据产权谱系如图5。基于数据资源伴生主体,数据资源的类型可以分为个人数据、企业数据、社会组织数据、政府数据、国家数据和公共数据。对于数据的确权,数据资源产权可以分为人格权、私有产权、俱乐部产权、公共产权、有限定条件的公共产权。对于如何确定数据产权,并非是从伴生主体到资源类型,再到产权类型的一一对照,需要根据“伴生性”强弱程度考量。
4.2 伴生程度与数据确权考量
伴生主体的分类,能够为数据资源类型和产权类型分析提供依据,但依附于某主体的数据资源确定为何种产权类型,还需要考察其伴生程度。数据资源伴生程度受两个因素影响,即伴生主体属性及其利益诉求、数据资源产生与伴生主体的关联程度。首先,分析伴生主体属性及利益诉求的影响。个人作为独立的个体,受自身技术水平的限制,数据资源价值获取能力有限,主要看重的是个人隐私等人格权益的保护[34]。各类型数据虽然都不同程度地涉及自然人或组织法人的隐私,如个人的隐私信息、企业的商业秘密以及政府机密等,但并不是所有的伴生主体都像个人那样看重自身的人格权益保护。企业具有“私人”部门属性,主要目的是获取数据资源的价值,谋取经济利益,看重数据资源的私有产权保护,产权安排趋向于降低交易费用[35]。社会组织是准公共组织(相对于企业和政府的第三方组织),政府是公共组织,两者具有公共性,都致力于追求公共利益,即数据资源的整体社会效益,主要看重的是数据资源的公权保护。由此,对于个人来说,人格权地位高于财产权,涉及人格权的个人数据伴生性强。对于企业而言,在自我认可的情况下,涉及企业秘密的,也可能作为财产进行交易。对于社会组织、政府而言,需要根据涉及公共安全、政府机密、组织机密等来分析伴生性强弱。其次,数据资源产生与伴生主体关联程度的影响。对于只有一个伴生主体的数据资源,其伴生性强。当数据资源产生涉及多个主体,虽然主要伴生于某个主体,但如果其生成与其他主体关联度强,相对来说,伴生性就很弱。比如,用户依赖平台生成的行为数据不同于身份数据,对于用户来说,其伴生性相对弱。
根据伴生程度的两个因素分析,可以确定数据资源伴生性强弱程度,确定产权的类型。伴生性强的个人数据应界定为人格权。伴生性弱的,可以界定为个人私有产权。伴生性很弱的,可以界定为俱乐部或公共产权。伴生性强的企业数据,可界定为商业秘密,是法人人格权数据。伴生性弱的,可以界定为私有产权或俱乐部产权。伴生性很弱的可以根据情况设定为俱乐部产权或公共产权。而社会组织数据,伴生性强的,可以界定为法人人格权。弱或很弱的,可以界定为俱乐部产权或公共产权。政府数据产权安排不同于其他伴生主体,不涉及国家机密、政府机密、个人隐私、企业秘密的数据,及除法律要求保护的数据外,其伴生性都弱或很弱,可界定为公共产权。伴生性强的政府数据为政府机密,可界定为有条件限定的公共产权。凡涉及国家秘密和安全的数据,都与国家主体伴生性强,是有条件限定的公共产权。对于伴生于自然物的,应该看与哪些主体的相关联度强,确定归属某主体,一般可以确定为私有产权、俱乐部产权或公共产权。
5 数据资源确权的实践应用框架
在实践中推进数据资源确权,需要基于伴生性维度的伴生性强弱和排他性维度的排他程度,分析数据资源确权的应用框架。各种数据资源依据主体利益诉求和与主体关联程度两个因素,有着不同的伴生性强弱程度,分为强、弱和很弱三个层次。不同伴生程度的数据资源,基于现有技术条件、社会效率和分配公平三个因素考量,可以将数据资源的排他程度分为排他、有限排他和非排他三种。如此,可以在实践中确定不同数据资源的数据产权类型和产权归属(见表2)。
应用框架首先依据伴生主体确定伴生程度,再根据排他因素考虑排他程度,从而确定数据资源产权类型和产权归属。
5.1 伴生主体为个人的数据资源确权的实践应用
个人的身份数据、隐私数据等人格数据伴生性强,不论由哪个主体实际控制,都具有排他性,为个人人格权数据,其中隐私数据在任何情况下都不可交易,其他人格权数据,在保障人格权的情况下,根据个人意愿可以交易。主要依赖于个人产生的非人格权数据伴生性弱,具有排他性,作为个人私有产权,可以交易。有其他主体参与产生的个人数据,与个人关联度弱,伴生性很弱,具有有限或非排他性,需要设定为俱乐部或公共产权,依据一定条件为团体共享,或为所有公众共享。
5.2 伴生主体为企业的数据资源确权的实践应用
企业内部形成的管理数据、涉及企业内部信息的数据、与其他主体约定不能公开或限时公开的数据,以及在不妨碍整体社会效率和公平情况下,涉及企业利益且企业不愿公开的数据,伴生性强,具有排他性,属于商业秘密,作为企业法人人格权数据,根据企业自身意愿决定是否可以交易。对于商业秘密以外的数据,以企业为主产生,与企业利益关系密切的,伴生性弱,具有排他性,作为企业私有产权数据,企业可以交易;其中与企业利益关系不够密切的,伴生性弱,具有有限排他性,作为俱乐部产权,企业可以依据一定条件提供于团体共享。除以上以外的企业实际控制的数据资源,伴生性很弱,具有有限或非排他性,作为俱乐部产权或公共产权,根据条件提供为团体共享,或在一定补偿条件下提供于公众共享。
5.3 伴生主体为社会组织的数据资源确权的实践应用
涉及社会组织内部、存续和经营核心利益的数据,具有排他性,作为社会组织法人人格权数据,为社会组织的运营秘密,归属于社会组织,根据社会组织自身意愿,可以依据条件提供给其他相关主体共享。涉及社会组织重要利益,但能够提升社会整体效益和公平的数据,伴生性弱,具有有限排他性,作为俱乐部产权,根据条件提供团体共享。除以上数据资源,伴生性很弱,具有非排他性,在获得相应补偿的情况下,需要提供为公众共享。
5.4 伴生主体为政府的数据资源确权的实践应用
涉及政府内部运行,并在法定时间内不能公开和涉及公共安全的数据,伴生性强,虽然作为公共产权,属于公众所有,但是作為政府机密,由政府掌握,根据相关法规和程序才能公开共享。其他政府掌握的数据,伴生性弱,不涉及其他主体人格权的数据,具有非排他性,作为公共产权,归于公共所有,需要开放共享。对于部分批量下载且以营利为目标的使用主体,为确保社会公平,不让数据生产成本为所有公众平均负担,“遵循成本”和“创新补偿”原则[36],收取相应补偿费用,以支持政府生产数据资源。
5.5 伴生主体为国家的数据资源确权的实践应用
不论数据由何种主体生产,只要涉及国家机密、国家安全和整体国家利益的,都属于国家要掌握的公共产权数据,伴生性强,具有非排他性,但只能在保障国家安全和国家利益的情况下,依据相关法律和程序推进公开共享。
5.6 伴生于自然物的数据资源确权的实践应用
伴生于自然物的数据资源,应依据数据采集主体,参考数据资源伴生主体分类,相应归为伴生程度弱或很弱选项,涉及国家主体则伴生性为强,分类确定产权类型和归属。
数据资源依据伴生程度和排他程度分类在实践中应用,目的是平衡各主体的利益,并基于现有技术水平,提升社会效率,维护社会公平,既要保障各主体的基本人格权、财产权,又要促进数据的流通和使用,还要对数据生产者给予激励。因此,在上述数据资源实践应用分析中,在保护应有的人格权和私有产权外,尽可能促进数据为团体或全体公众共享。所谓为团体共享,就是依据俱乐部产权特征,根据身份或缴纳费用的门槛,提供给公众共享。提供给全体公众共享的数据资源,对公众也并非完全免费,需要政府或使用者为数据实际控制者提供相应数据生产和管理的补偿。如此,数据资源的实践应用框架设计,根据伴生性和排他性的理论分析,为保障基本人格权、社会效率和公平的平衡,以及经济社会持续良性发展,提供了保障。
6 结 语
数据资源已经成为战略性基础资源,如何在经济社会发展和国家治理体系与治理能力现代化推进过程中得到有效应用,亟须推进数据确权。但是数据资源确权的理论研究与实践应用存在着纷争和难以解决的困境。如何推进确权?本文根据已有的文献和实践分析,从数据资源特性和产权理论分析着手,得出了确权的两个分析维度:排他性和伴生性。这两个维度的分析,基于当前的技术水平,兼顾了各主体的利益诉求、社会效率与公平,以及数据资源产生和利用的持续性。由此推进了数据资源确权的实践应用框架分析,基于伴生主体的分类,确定伴生性强弱和排他程度,明确不同数据资源产权类型和归属。本文最主要的创新在于三点,一是从数据资源特性和产权理论基础出发确定了确权分析的排他性和伴生性维度,为数据确权研究提供了基础性研究视角;二是根据理论分析系统地明确了数据资源伴生主体的分类、产权类型和产权归属;三是基于两个维度分析,权衡各主体利益和社会效率与公平,提出了多种数据类型可以提供团体和公众共享,为当前以私有财产权分析的研究和实践,提供了新视角和新观点。
当然,论文的研究仍存在不足:一是难以准确判断不同排他性制度选择的公平性程度。数据资源分配的公平性问题主要考量社会风险和社会公平,以及由此形成的可持续社会效率问题。既要分析各种外部效应带来的整体性问题,更要分析当前分配引发的可持续性问题,这需要建构分析模型进一步深入研究。二是数据资源实践应用框架的分析还停留在理论层面,需要通过相关案例进行实证分析和验证。三是数据确权的重要应用是数据共享和数据交易,对于确定共享补偿和交易价格,需要根据数据产权类型进行确定,但定价标准,以及定价主体与补偿主体都需要根据数据确权的更深入分析来确定,这是拓展研究的重要方向。此外,公共数据资源具有类似公共物品的属性但不同于公共物品,对于具有公共产权的公共数据资源的供给模式及监管机制研究,也是将来继续推进研究的重要方向。
参考文献
[1]中共中央办公厅,国务院办公厅.中华人民共和国国民经济和社会发展第十三个五年规划纲要[N]. 人民日报,2016-03-18(1).
[2]齐爱民, 盘佳. 数据权、数据主权的确立与大数据保护的基本原则[J].苏州大学学报(哲学社会科学版),2015,36(1):64-70,191.
[3]魏鲁彬, 黄少安, 孙圣民.数据资源的产权分析框架[J].制度经济学研究,2018(2):1-35.
[4]曹磊.网络空间的数据权研究[J].国际观察,2013(1):53-58.
[5]JING D, JONG C. Data sovereignty, cybersecurity, and challenges for globalization[J]. Georgetown journal of international affairs,2015:112-122.
[6]吴首都.大数据确权法律问题研究[D].南昌:江西财经大学,2018:18.
[7]吕廷君.数据权体系及其法治意义[J].中共中央党校学报,2017,21(5):81-88.
[8]刘新宇.大数据时代数据权属分析及其体系构建[J].上海大学学报(社会科学版),2019,36(6):13-25.
[9]周林彬,马恩斯.大数据确权的法律经济学分析[J].东北师大学报(哲学社会科学版),2018(2):30-37.
[10]黄立芳.大数据时代呼唤数据产权[J].法制博览(中旬刊),2014(12):50-51.
[11]龙卫球.数据新型财产权构建及其体系研究[J].政法论坛,2017,35(4):63-77.
[12]邬贺铨.数字资源的利用与保护[J].中国经贸导刊,2017(16):55.
[13]石丹.大数据时代数据权属及其保护路径研究[J].西安交通大学学报(社会科学版),2018,38(3):78-85.
[14]MUNDIE C. Privacy pragmatism: focus on data use, not data collection[J]. Foreign affairs, 2014, 93(2):28-38.
[15]李齐.数字时代的权力生產与政府责任[J].中国行政管理,2019(11):75-81.
[16]CURTIS T. Privacy harmonization and the developing world: the impact of the EUs general data protection regulation on developing economies[J]. Wash. J. L. Tech. & Arts, 2016(12):96.
[17]CAINO L, LAPIN A, CARRETERO J, et al. Applying big data paradigms to a large scale scientific workflow: lessons learned and future directions[J]. Future generation computer systems-the international journal of science, 2018, 110(9): 440-452.
[18]李爱君.数据权利属性与法律特征[J].东方法学,2018(3):64-74.
[19]李晓红.网络经济环境中的边际效益递增规律探讨[J].平原大学学报,2006(4):9-11.
[20]杨善林,周开乐.大数据中的管理问题:基于大数据的资源观[J].管理科学学报,2015,18(5):1-8.
[21]哈罗德·德姆塞茨,银温泉.关于产权的理论[J].经济社会体制比较,1990(6):49-55.
[22]科斯.企业、市场与法律[M].上海:三联书店,1990.
[23]李政军.萨缪尔森公共物品的性质及其逻辑蕴涵[J].南京师大学报(社会科学版),2009(5):45-51,92.
[24]叶祥松.西方经济学的产权理论[J].当代亚太,2001(7):50-56.
[25]贾小雷.公共产权:基于产权理论和财产所有制度的辨析[J].政治经济学报,2015,4(1):182-204.
[26]DESMARAIS T, MAXIME. Musgrave, Samuelson, and the crystallization of the standard rationale for public goods[J]. History of political economy, 2017, 49(1):59-92.
[27]NAVA F, SCHIRALDI P. Differentiated durable goods monopoly: a robust Coase conjecture[J]. American economic review, 2019, 105(5):1930-1968.
[28]MARCIANO, ALAIN. Why market failures are not a problem: James Buchanan on market imperfections, voluntary cooperation, and externalities[J]. History of political economy, 2013, 45(2):223-254.
[29]姚婷,宋洁.法经济学相关理论问题探析:从科斯《社会成本问题》出发[J].山西省政法管理干部学院学报,2018,31(4):5-8.
[30]刘丽霞,蔡永刚.知识产权保护之法理学检视:基于洛克劳动财产权理论视域的研究[J].人民论坛,2014(19):113-115.
[31]郑云辰,葛颜祥,接玉梅,等.流域多元化生态补偿分析框架:补偿主体视角[J].中国人口·资源与环境,2019,29(7):131-139.
[32]管洪博.大数据时代企业数据权的构建[J].社会科学战线,2019(12):208-215.
[33]朱宝丽.数据产权界定:多维视角与体系建构[J].法学论坛,2019,34(5):78-86.
[34]程啸.论大数据时代的个人数据权利[J].中国社会科学,2018(3):102-122,207-208.
[35]吕有晨,李万军.产权的新经济史观分析[J].吉林大学社会科学学报,2001(5):113-117.
[35]胡玉凤,丁友强.碳排放权交易机制能否兼顾企业效益与绿色效率?[J].中国人口·资源与环境,2020,30(3):56-64.