冉高苒
内容摘要:随着数据成为生产要素,数据分享成为一种有效的经济生产方式。数据分享契合数据要素与数据经济发展的特征与规律,可以解决数据利用中的集体行动问题,可以实现数据资源优化配置和数据利益的合理分配。基于生产组织逻辑的差异,数据分享可以分为基于市场逻辑的数据交易、基于管理逻辑的数据开放和基于社会性逻辑的利他共享。《数据二十条》的出台,标志着我国数据基础制度由“重保护”走向“促分享”。数据分享理论的提出,有助于建立符合社会和市场要求的数据利用规则, 实现不同的数据利用逻辑之间概念与规范的协调,也有助于积极探索构建基于数据有效利用的数据治理体系,进一步完善具有中国特色的数据基础制度。
关键词:数据分享数据开放数据交易数据共享数据治理数据二十条
中图分类号:DF49 文献标识码:A 文章编号:1674-4039-(2023)06-0053-63
随着数据成为一种生产要素,关于数据要素如何高效流通利用的问题就成为数据法律与经济研究的重要课题之一。政府、企业等各类型数据持有者均尝试开展促进数据流通实现的活动,诸如“数据分享”“数据开放”“数据共享”“数据交易”等各种形态的数据流通技术概念被纷纷提出。基于技术差异化的界分标准,上述相关概念对于各类数据持有者积极探索尝试数据流通的多元化途径,扩展数据要素的合法来源具有重要的理论与实践意义。但在未形成共识的前提下,过于技术性且非体系化的概念表述极易造成理解和认识的差异,从而导致制度定位和实践的错位。〔1"〕诸如“数据共享与数据开放是何关系? ”“数据共享与数据交易有何区别? ”等类似的问题被不断提出,这些事关概念体系的问题对于数据法律研究和制度实践探索皆提出了挑战。
本文结合国际数据流通实践与我国现阶段的制度探索,尝试以“数据分享”为核心与基础概念,构建整个数据流通利用的法律概念体系。本文认为“分享”是实现数据流通利用的基本途径,也是数据法律的核心基础概念。在数据经济的视角下,数据分享具有经济生产方式的制度意义,应当是数据开放、数据交易、数据共享等概念的上位概念,与技术上所称“数据流通”的基本意涵保持一致。首先,在数据成为生产要素的语境下,通过数据分享的生产组织方式来实现数据的流通利用,是符合数据要素特征的制度选择,可以达成有效的资源配置和生产性激励;其次,依据“市场—管理—社会”三种差异化的组织逻辑,可以将数据分享分为“基于市场的数据分享”“基于管理的数据分享”和“基于社会性的数据分享”,不同的生产方式组织逻辑将对数据要素的流通产生不同的影响,并以此体系化地连接不同制度规范之间的理论关系与规范构成;最后,作为一种经济生产方式,多样化的数据分享实质上体现了一种基于复杂利益关系而构建出的数据治理模式,其本质是通过对数据上多元利益的协同治理进而实现数据的社会化分享与利用。数据分享理论的提出为我们提供了反思数据法律研究范式和现有数据法律制度规范的契机。
一、数据分享:一种经济生产方式
如果说商品所有权的移转是有形财产实现社会化利用的主要方式, 那么数据要素的无形性、非竞争性与非消耗性等特征就决定了数据分享是适合数据经济时代生产要素特性的基本方式。在我国,事实上的数据分享活动时刻都在发生,但将数据分享作为一个具有制度意涵的规范性概念尚未达成共识。简单来说,数据分享就是让他人使用数据,实现数据重用的过程。在数据成为生产要素的时代背景下,我们有必要将数据分享纳入数据基础制度的范畴进行思考和研究。
(一)分享行为的生产性及其扩张
在本克勒教授提出“分享是一种常见且被低估的生产方式”时,基于社会关系而开展的分享行为被认为可以实现联系较弱的(或者无联系)参与者达成某种合作。〔2"〕事实上,在智能网络环境下,正是这种弱关联性的生产参与者之间的分享和合作具有巨大的经济前景,他由此提出著名的“同侪生产”理论。本文遵循本克勒教授狭义分享的概念内核,并尝试将分享行为和现象进行扩展,形成广义的数据分享概念。对于数据经济来说,只要是为实现数据价值,以数据流通为实践措施的相关行为都可以被理解为广义上的数据分享行为。这种分享行为既不会以任何实体财产转移占有为前提,也不会造成数据要素的消费性损耗,对于协同发挥数据要素多元化价值具有重要的意义。
一方面,分享是数据汇集、價值实现的基本途径。与传统生产要素相比,重要的不是数据本身,而是从海量的数据中收集的趋势、模式和关系。〔3"〕在数据经济中,数据持有者往往并不致力于将其持有的数据直接货币化,而是更专注于从数据的汇集、挖掘与分析中获得更多的洞察力,以科学、精确地指导实践决策。这些洞察力的形成恰恰是多源数据汇集、匹配的结果,广泛的数据分享行为是支撑数据充分汇集的前提。此外,数据的价值不是由供给端而是由需求端决定的。需求端所实现数据的价值往往因具体场景而异,因此,任何能够实现数据从供给端向需求端流动的行为,都是实现数据价值转化的必要流程,没有分享环节就无法实现数据要素的价值实现。
另一方面,分享概念的扩张是数据要素特征以及数据经济发展特征所决定的。关于数据的自身特征影响,下文将详细论述,此处不再赘言。从经济发展特征来看,数据经济从来都不是自发形成的,而是“从属于政治、宗教和社会关系的”。〔4"〕数据的社会化配置有赖于价格发现、社会信任以及法律对于合同和社会义务的强制确认和执行。市场、管理和社会性经济生产的组织方式并非独立运行的系统,而是相互“嵌入”的结构。因此,对数据分享的理解不应狭义地定位在除市场和国家之外的“第三条道路”,而是实现数据要素多元化价值的一般性生产方式。对于利益多元、结构复杂的数据要素和数据经济来说,这样的概念扩张是必要的。
(二)数据成为被分享的对象
一般意义上的分享经济被认为是“把闲置的资源提供给真正需要的人, 并由此创造新的价值”。〔5"〕无论是闲置的单车还是房屋,这些特定类别的有形商品因为“系统性过剩”而成为可被分享的对象。但是,在本科勒教授看来,可被分享的对象往往受到以下因素影响:(1)功能上的离散性;(2)生产商品的技术特征;(3)社会对功能的需求形态;(4)社会财富的数量和分配。这些因素的组合将使一些商品或资源系统地表现出相对于其他所有者需求的满足能力。〔6"〕不难发现,可供分享的对象并不是如我们一开始设想的那样一定满足有形和闲置的要求。一切具有某些功能性的技术特征,又可以通过基础性机制进行社会化配置,以满足特定主体特定需求的客体对象,都可以成为被分享的对象。这也意味着,分享可以成为一种可持续、普适性的生产实践。
数据分享是与数据经济最为契合的生产方式,而这基于数据本身的自然属性与价值特征。首先,数据具有非竞争性。这一特征导致数据可以很容易地被复制并且被多个主体同时“占有”,尤其是当一个消费主体对数据进行使用和消费时,并不会减损其他主体的消费性价值。这样一来,数据甚至具有了接近公共物品的特征。也有学者将数据的这一特点称为数据经济的“乘数效应”,即数据可以在多个用例中以接近零的边际成本实现重用。〔7"〕数据分享所产生的巨大价值与极低的分享成本使得分享成为实现数据价值最为合理高效的生产方式。
其次,数据具有动态性。这一方面反映在数据供给与需求的时效性上,这也导致及时性往往成为判断数据质量的重要标准之一。另一方面,数据的动态性反映出不同数据之间的关联性和与其他资源(如算法、算力等)之间的依赖性。数据要素不完全独立于其他生产要素,数据要素的价值往往取决于与其他生产要素的结合关系,即呈现出“作为同一整体的构成部分之间在整体过程机制中的相互依存、不可分割、彼此影响、共同行动的关系”。〔8"〕正是数据的这种系统性的关系结构,使得数据价值具有创生性与涌现性特征,从而使得其应当通过分享实现价值。
最后,数据的流动性与累积性是人类文明进步的基础。对于社会发展来说,信息、知识和数据的创造者既是生产者又是消费者,正是在知识生产和消费的无限循环之中,人类文明得以被无限创造。数据要素的利用不单单需要考量直接的经济价值,还需要考虑“公共数据空间”的开放程度以及如何协调全社会成员的使用利益。特别是当数据被描述为一种战略性基础资源时,数据的分享可以作为基础设施与生产要素的结合。这就要求对数据的配置并不能简单地依靠市场或者行政管理力量,社会性分享同样至关重要。只有充分拓展多渠道的分享途径,使数据分享成为数据要素流通治理的生产性框架,才能在市场、国家和社会主体的共同驱动下实现更加高效的数据资源配置。
(三)数据分享的价值与作用
数据分享可以使数据的社会价值最大化实现。首先,数据分享可以解决资源利用的集体行动和利益分配问题。由于数据的可再生性和可复制性,数据的利用一般不会因资源稀缺性而产生“公地悲剧”问题,但却会出现数据被非法收集、倒卖、非法使用等现象,造成人们生活安宁被打扰、公私财产遭受损失、人身安全面临风险、国家安全受到威胁的集体行动问题。〔9+〕因此,充分的数据分享有利于通过利益的区分,遵循市场、管理和社会性逻辑,进而实现多元化利益相关者集体行动的有效协同。一个不分享数据的社会将会产生主体之间利益的分配不均。表面上看,这只是商业竞争所形成的相对优势。但是如果从分配正义的角度来看,缺乏分享的数据利益关系可能加剧分配不正义的问题,其原因就是无法确定数据产生多少价值以及价值应当归谁所有,这会对社会范围内广泛的利益相关者产生不利影响。例如广泛存在的数据“爬虫”行为所面临的合法性与正当性问题。〔10#〕
其次,在竞争环境中,数据分享是一种商业战略行为。在复杂多样的商业模式中,分享数据是一種塑造市场的方式。例如,欧盟数据法(草案)就强调了微型、小型或中型企业的公平获取、使用数据的权利,中小微企业可以通过提出数据分享主张来实现竞争优势的塑造,从而得以与既有的大型企业抗衡。而在非竞争环境中,数据分享是全社会普遍利益的实现方式。作为一种多元利益叠加的社会性生产要素,数据上某个主体的权利必然涉及其他人的相关权利,而这反过来也为数据持有者创造了相应的社会性义务(例如基于人格利益的个人数据保护等)。这种社会性义务旨在实现全社会主体的普遍利益,也有学者称其为“人类的共同繁荣”。〔11#〕在不可通约的各种利益之间,数据分享可以构建在不同的利益相关者之间进行协调的财产规则,而如果没有这种规则,普遍利益将受到损害。
最后,数据分享可以实现不同的数据利用逻辑之间的协调。作为在数据持有者与使用者之间形成的一种类似合同的关系,〔12#〕一般意义上的数据分享包括:(1)基于市场的数据分享;(2)基于管理的数据分享;(3)基于社会性的数据分享。这些数据分享的基础性逻辑和实践规则是有差异的。其中,市场逻辑是基于供需关系的价格机制,管理逻辑基于国家的行政权力和公共利益的考量,而社会性逻辑的特征则是随着“促进有效行动的能力和决定贡献的权力的彻底分散化,依靠社会信息流、组织方式和激励结构来激励和指导生产性贡献”〔13#〕的一种利他主义的分享实践。虽然各个部分的功能和行为逻辑并不相同,但一般共识意义上的数据分享可以同时适用于市场、国家和社会的多元参与者,从而实现数据利用的社会化协调。
二、数据交易:基于市场的数据分享
市场是组织经济生产的一种有效方式。正如波兰尼所说,经济是一个由相互连锁的市场组成的体系,这个体系能通过价格机制自动调节供给和需求,即使有时面临“市场失败”,它还是把经济视为有机整合的市场组成的均衡体系。〔14#〕因此,对于数据经济来说,遵循市场逻辑的数据分享被认为可以充分发挥市场的自发、高效的特点。由此,本文从交易对价形式划分,将数据交易区分为数据的货币交易和数据交换。
(一)数据货币交易
数据交易是指数据持有者让与或许可数据使用权于数据使用者,使用者支付对价的行为。由于数据的可复制性,数据持有者和数据使用者可以同时持有数据,因而除非极特殊的情形,数据交易通常以许可使用方式而不是以让与的方式进行。随着数据利用方式的多样化和专业化,出现了通过汇集、处理和分析数据,仅提供数据分析结果的交易方式。由于这种交易不直接交易数据本身,而只提供结论或分析报告,所以被称为数据服务。数据服务的本质不是将数据进行传输,而是以有价值的数据为原料,通过云计算技术提供从数据中发现知识的服务,〔15#〕是自己利用数据行为,而不是让他人利用数据,因此,不属于一般意义上的数据交易。本文所指的数据交易标的是原始数据,即可以不断与其他数据相结合、匹配的可机读、可重用原始数据。〔16#〕数据使用者交易数据的目的是获取数据计算价值、分析价值,而不是直接享用或消费内容或知识。虽然两者都为数字形式,但却有着不同的“使用价值”,因此必须予以严格区分。
数据的价值在于通过特定场景的使用以发现新知,不属于可以脱离应用场景而任意自由流通的“商品”。凡是通过市场的价格发现机制有偿地使他人持有数据的行为都属于数据交易。之所以称其为“交易”,旨在强调其可以进入市场,形成适合数据的价格发现机制,而不是说数据可以像标准化的商品或资产一样自由地买卖交易。“有偿”则应当理解为有对价,而对价既可以是金钱也可以是数据。数据交易通常是基于第三方支撑的数据交易平台而开展的, 交易平台除了实现供需双方交易匹配,还需要提供数据交易合规和安全等服务,使数据交易过程可控制、责任可追溯、合规性可监督。因此,国内坚持以数据交易市场为实现数据交易的基础设施,并由此构建数据交易的类型。《中国数字经济发展白皮书(2020年)》将我国数据交易场所分为四类:一是政府主导建立的大数据交易所和交易中心;二是企业主导型数据服务商;三是产业联盟数据交易平台;四是大型互联网公司数据交易平台。〔17#〕
根据欧盟《企业间数据分享的研究报告》,数据分享的典型模式包括数据货币化、数据市场、工业数据平台、技术移动者和开放数据政策。〔18#〕其中,数据货币化是指从数据的对外提供行为中直接获益;数据交易市场类似于我国的大数据交易所,旨在促进数据交易。这两种数据分享方式均可归类为数据交易。只是欧盟的数据交易不仅依赖于数据交易市场的作用,〔19#〕还包含了数据直接交易的类型。笔者也赞同这一观点,数据交易的形式和场景复杂多样,为拓展多元化的数据交易路径,市场主体可以通过依法设立的数据交易平台进行数据交易,也可以由交易双方依法自行交易。
(二)数据交换(易数交易)
广义上的数据交换与数据分享同义,泛指一切实现数据流通的方式途径,〔20#〕而本文中的数据交换仅指不通过货币,以数据交换数据的数据交易行为。数据交换与有形物存在的易货交易模式十分类似。易货是一种不使用货币或任何其他货币媒介的涉及商品或服务的交换行为。以物易物是最古老也是最简单的商业形式之一,因为它只需要参与方协商并交换一种有价值的产品。易货交易涉及需求的双重巧合和对相同需求的相互评估。易货是直接贸易,缺乏共同的价值衡量标准,无法为商品确定明确的价值,因此,易货关注的是满足人类的基本需求。而货币交易则彻底改变了经济运作方式,它以一般等价物来衡量和确定所有商品的价值,它只关注交换价值,不需要关注双方需求的巧合,大大拓展交易空间,刺激了经济的增长。
数据交换是一种特殊的数据交易,但其本质也是一种基于市场逻辑构建起的数据分享方式。不同于有形物中易货交易的罕见,网络环境下的数据交换似乎更为普遍。整个互联网的经济都是建立在免费模式上逐渐发展起来的,而免费商业模式本质上是非货币交易。推动脸书、谷歌等互联网公司商业发展的部分原因就是一种不需要金钱的数据交换: 消费者数据的收集是为了提供互联网服务,就像布匹可能被交换为肉一样。这种数据分享更多是一种传统交换,一种个人以数据换取公司服务的简单交换。尽管这些公司往往通过第三方广告将这些数据货币化以实现所谓的“交叉补贴”,〔21#〕但并不会从根本上改变原来交换的事实。〔22#〕实际上,这样的易数交易模式仍将长期存在,并继续支撑数字经济的发展。随着数据保护制度在各个国家落地和实施,个人在数据使用方面的自主意识增强,出现了个人数据主体主导进行的数据交换。互联网公司为用户提供了“出售”数据以为互联网工具付费的模式。例如,一些国家尝试开放“My#Data”的计划也可以视为消费者个人与互联网服务提供商的数据交换。〔23#〕
相较于个人数据,企业与企业之间的数据交换更为普遍,这也是本文在市场经济意义上所指的数据交换的主要形式。比如,在企业之间签署所谓的业务合作协议,但其背后是允许另一方获取或使用企业的某些数据或数据产品,甚至企业之间也存在以数据交换市场的各种类型交易。这些数据交易实质上就是数据的交换。实践中,世界经济论坛(WEF)一直在研究由数据市场服务提供商运营的“数据交换”模式。WEF观察到,相对于世界上存在的大量数据,控制它的各方之间交换的数量仍然很少。由于各种复杂的原因,处理和分析数据的市场缺乏深度,但主要是因为公众仍然关注并只关注数据隐私。WEF将数据交换视为解决数据交易的两个障碍的主要路径:通过规则、执行机制、透明度程序等以系统信任取代双边关系中的信任;考虑到数据估值的问题,他们通过最大限度地减少信息不对称和扩大买卖双方的数量来创建“价格发现”机制。〔24#〕
对于市场主体来说,现代意义上的易货交易主要旨在:(1)组织新客户,开拓新市场;(2)买其所需,节省现金支出;(3)为企业提供金融杠杆和融资手段。对于数据交易来说,数据交换更多地承载了降低数据交易成本,扩大数据交易渠道,促进数据分享的作用。在许多数据交付技术的加持下,数据交换是管理隐私安全、分配交易风险和回报的高效路径。同时由于数据交换在用途、环境、主体等分享条件上的灵活性,有利于建立多种目的和维度的数据交易许可机制,最大化地激发数据持有者的参与动力和市场信任,满足多样化的数据要素市场需求。虽然在数据交换模式中没有货币的参与,但并没有排除市场定价机制的参与和底层逻辑,其本质上依然存在“报价———估价———议价”的价格生成路径,〔25#〕只是这种“价格”在出现的瞬间即转化为交易相对方所持有的数据价值。市场是一个隐含交易各方行为规则、知识和信息的集合,价格则是这些元素相互作用的集中体现,〔26#〕当数据交换双方就交换数据的价值达成一致时,数据交易的根本目的已经可以在動态中实现。
三、数据开放:基于管理的数据分享
全面的数据开放是数据经济的制度基础,可以为数据经济活动提供作为“原材料”和“产品”的数据要素,〔27#〕与此同时,数据开放也是实现数据社会价值或公共价值的必然要求。因此,通常法律只对公共机构或政府部门配置了开放数据的义务。而本文认为,从价值创造、发现与分享的维度来看,数据开放是一种极为重要的数据价值发现和分享的途径,是一种基于纵向管理关系而产生的面向社会主体的数据分享行为。因此,数据开放既可以是法律规范强制配置给公主体的义务,同样也可以基于正当理由将其配置给私主体。至于开放的数据类型、开放方式、开放对象、开放期限以及最重要的开放的目的等条件则可以基于多元化的数据流通场景予以具体确定,并不应当成为限缩解释数据开放意涵的考量因素。因此,由于数据开放主体的不同,可以将数据开放区分为公共数据开放和私主体的数据开放。
(一)公共数据开放
公共数据开放是一个具有鲜明中国特色的数据开放制度。在国际社会中,存在开放数据的(Open%Data)理念和运动,但很少使用数据开放(Data%Opening)概念。在我国,事业单位、国有企业事实上承担了特定的公共服务职责或涉及一定公共利益,因此,我国目前更为通用的概念是“公共数据”,即国家机关、事业单位、经依法授权具有管理公共事务职能的组织,以及供水、供电、供气、公共交通等提供公共服务的组织,在履行公共管理和服务职责过程中收集和产生的数据。〔28%〕实践虽如此,但对于公共数据规范意义上的内涵和外延依然存在较大争议,并未形成共识。〔29%〕
虽然尚未就公共数据的规范含义达成共识,但就开放方式而言,国内外的实践均认为公共数据不限于无条件开放,也可以是有条件开放,即根据数据性质、用途、数据上可能存在的权益等因素对数据进行科学分类,建立数据分类分级的体系和清单,对可以进行开放的公共数据处理的条件及其适用作出清晰界定。实践中对于公共数据的分级分类开放已经基本形成共识,但是对于具体的方式和类型还未探索出多样化的实践机制与模式。对此,有研究概括总结了限制访问、限制使用和开放为开放数据三类不同程度的数据开放形式, 对于继续细化和丰富完善我国公共数据的分类开放的实施细则具有很强的借鉴价值。〔30%〕此外,为使数据开放活动稳定有序,实现数据开放的安全可控,应当通过数据许可协议明确数据使用范围、用途、方式、禁止条款、违约责任等内容。在公共数据开放的过程中,通过设计更为合理的制度,确保公共数据开放所创造的价值更具公平性、普惠性与合作性。〔31%〕
公共数据开放是基于纵向管理权力而开展的数据分享活动。公共数据开放坚持“公共部门或其他实体以公共预算为代价生成或收集的数据应造福社会”的公共性目的,〔32%〕而政府作为社会公共产品的主要供给方,在公共产品生产/再生产链条中处于主导性的地位,为社会提供公共数据产品是基于其公共管理与服务职能的法定责任与义务要求。〔33%〕由此,数据供给意义上的公共数据开放已经被视为数据社会化利用的基础设施,成为政府积极推动要素市场发展,平衡数据要素需求与供给的宏观调控举措。实践中,公共数据开放制度也正经历着从单纯的资源供给向综合的基础服务提供的转变。但公共数据开放作为一种经济生产组织方式并不能单一定位在资源的供给功能上,其本质上仍是国家、政府或者是公共管理和服务机构基于纵向的管理逻辑而从事的数据分享活动,是基于行政管理逻辑的经济组织方式。因此,公共数据开放从未摆脱也不应摆脱其数据利益分配和数据风险控制的国家治理价值。
综上所述,公共数据开放是典型的基于国家管理逻辑而构建起的数据经济生产组织形式。法律规范、经济结构以及技术性基础设施都将对公共数据开放的效果实现产生极大影响。在当下各地方政府纷纷积极推进公共数据开放的背景下,多样化的公共数据开放机制逐渐被探索建立起来。这样的公共数据开放已经不再属于传统开放数据意义上的数据开放,而应当被理解为数据分享。随着我国公共数据授权运营概念提出,公共数据有条件开放将逐渐纳入授权运营通道,使公共数据接入数据要素市场, 进而实现基于管理的数据开放和基于市场逻辑的数据交易两种生产机制之间的联通,发挥出数据分享概念之于不同数据使用逻辑之间的协调作用与价值。
(二)私主体的强制数据开放
与公共数据相比,由企业、社会组织甚至个人持有的数据也具有相当的价值,但往往难以访问,更难以实现社会化的高效利用。因为对于私主体性质的数据持有者来说,分享数据一般是企业“成本—效益”分析的结果。〔34#〕由于激励机制的缺失,即使自身所控制的大量数据涉及公共利益,私主体也没有足够的动力自发向社会(或者公共机构等特定主体)开放,由此便造成大量涉及公共利益的数据(“公益数据”)无法通过有效的数据开放制度得以流通利用,出现了“公益数据的私人控制”问题。〔35#〕虽然现有的数据法律制度尚未制定相关私主体的数据开放义务规范,但私主体的数据强制开放依然是基于管理权而纵向实施数据分享的一种必要类型。通过增加对公益数据的强制开放,不但可以满足数据的公益使用需求,还可以促进其他市场主体利用它们进一步创新,也可以避免大型互联网公司在这些市场上的垄断。〔36#〕
实践中,欧盟已经在积极促进公益数据开放分享,在充分激发和转化私主体所控制数据的公共价值方面迈出了极具开拓意义的步伐。法国的数字共和国法引入了“普遍利益”的概念,扩大了社会主体都可以获得的被私主体所控制数据的范围。〔37#〕虽然这一范围仍然相对较小且封闭,但这足以开启强制私主体开放公益数据的制度尝试。与此相似,在2022年4月发布的数据法(草案)中,欧盟正式提出“本条例旨在确保数据持有者在有特殊需要的情况下,向成员国的公共部门机构和欧盟机构、机关或团体提供为履行公共利益而开展的任务所需的数据”,并规定了“数据持有者在某些情况下有提供数据的义务”。这标志着欧盟正式提出了基于公共利益为私主体配置数据开放义务的制度设计,以实现公益数据的流通分享。这样的制度设计对于我国的数据开放制度是重要的补充,值得立法者予以认真考量和借鉴。
由此可見,基于公共利益的考量,国家有权针对私主体采用强制开放的方式以实现数据分享。原则上,私主体在组织运营过程中持有的数据属于可以自由控制的私人数据财产,而当这些数据属于公益数据时,国家具有了通过相关法律规范明确私主体强制开放义务的正当性,即限制数据持有者的自主权,以实现特定公共利益。从财产法理论上来看,私主体的数据开放义务属于私主体基于其所控制的数据财产的社会性义务的体现,是对“财产权绝对主义”观念的根本反思。〔38+〕出于维护社会正义的目的,财产权应当作自我限缩。在个人张扬其财产自由的同时,应使其财产亦有助于社会公共福祉的实现,也就是能够促进合乎人类尊严的人类整体生存的实现。〔39#〕对于数据来说,私主体既然可以通过其所控制的数据获取巨大的经济利益,那么出于人类共同繁荣的公益性目的考量,相应地给其配置合比例的数据开放义务既是合理的也是必要的。
四、利他共享:基于社会性的数据分享
传统上的“市场”和“管理”是组织经济生产活动的两种基本路径,它们分别依赖于价格信号和权力命令的调整和指挥,从而实现在促进生产要素流通和生产组织方面的作用。这两种模式的行动驱动力通常来自外部,即金钱对价的收益刺激或者是法律、管理规范所规定的责任与惩罚。〔40#〕而对于基于社会性的分享行为,其组织基础通常是社会、集体或者组织关系所构建起来的社会性联系,其主要的驱动力往往不是外在的物质反馈,而可能是由“爱、地位和尊重的交往所激发的与他人关系中的个人价值感”〔41#〕和具有普遍价值意义上的创新、高效、文明进步和共同繁荣。因此,本文认为互益性的数据共享和数据捐献可以被认为是基于利他主义的社会性数据分享,它们补充了基于“市场”和“管理”逻辑的数据分享类型,扩展了数据分享的途径。
(一)互益性数据共享
数据共享源于国际上盛行已久的知识共享社区和开源社区理念。在越来越严苛和完善的市场规则和知识产权法律规范面前,对于生产性活动的激励超越了知识信息的分享和传播,而这种异化事实上产生了一系列有待解决的社会问题。人们开始逐渐认识到知识、信息、文化思想都应当是公共物品,不能简单地依靠市场和国家管理来激励知识的生产和创新。由此,将知识和信息作为一种公共资源在社区或者集体内共享, 以产生创新和创造力的知识共享和开源的模式越来越受到认可和推崇。有学者就认为,知识共享源于我们的信念,即知识和信息资源的生产和管理是一种固有的社会现象,发生在广泛的范围内,发生在复杂、重叠的各种正式和非正式体制结构中。〔42#〕
与知识、信息一样,数据的流动性、非竞争性特征,加上数据分享对于数据预处理的成本需要,也催生了像知识共享社区类似的生产组织。数据共享泛指特定范圍内的主体之间相互开放数据,相互获取和使用对方的数据。从形成机制上来看,数据共享更多是一种基于一定组织集体关系的数据分享行为,即两个以上的主体之间相互获取和使用对方的数据。数据共享既可以适用于政府部门之间,也可以适用于私人领域,是在一定范围的主体之间共享特定的数据资源。〔43#〕数据共享必须先创建可以分享使用的数据,然后才能实现共享。因此,数据共享必须管理与数据资源生产和使用相关的协调、组合和竞争问题,包括共享参与者的数据调用、预处理、汇集、回流、使用限制,等等。基于数据共享的组织功能和开放程度,数据共享既可以通过将数据集中在一个数据池、数据湖或数据仓库的方式实现,也可以将数据保留于参与者处并通过分布式计算来实现共享。这些数据共享的基础设施一方面实现了数据要素在技术上的加工处理,另一方面也实现了在生产结构、组织关系等方面的匹配和建立,实现了在非市场、非等级的分布式的组织机构或者社会成员之间的联系,为社会化的数据分享开辟了第三条道路。
从内部关系来说,数据共享是基于某种网络社会、组织关系而建立起来的数据分享结构,正因此本文将其归类于基于某种社会性而构建起的数据价值生产方式。数据共享中的每个成员都是共享网络关系的一部分,网络关系联系着每一个数据共享的参与者。成员之间的多种不同类型的数据分享或“社会行动”丰富了数据共享的功能和价值。这些行动与参与者的数据共享目标密切相关,对内影响着数据共享的组织结构,对外则连接外部的行为激励和社会规范。从外部关系来看,数据共享又是一个具有专业或者目的特定性的功能结构。不同主体之间之所以要共享数据,正是因为这些主体之间具有共同的数据需求,以达到减少重复收集、采集的目的,从而提高组织生产效率和运营效率,发挥各自数据的外部价值。这种经济生产、价值创造意义上的功能作用,也被称为数据共享的“溢出效应”。〔44$〕
在实践中,数据共享已经非常普遍。欧盟也已经尝试用行业规范的形式促进不同企业之间的数据共享。例如,在汽车行业,欧盟要求汽车制造商与维护服务提供商共享维护数据,以促进授权经销商和独立服务提供商之间的竞争。他们认为维修服务竞争带来的消费者福利收益证明了这一决定的合理性。〔45$〕此外,随着数据成为现代科学发现的核心,科研数据共享现在已成为科学进步的关键举措。研究发现,超过85%的受访者承认他们愿意与他人共享数据,并表示如果可以轻松访问他人收集的数据,他们会使用这些数据。绝大多数受访者认为,无法访问其他研究人员或机构生成的数据是整个科学进步的主要障碍。〔46$〕显然,通过构建以科研参与者为成员的数据共享实践机制,可以为实现科研数据的分享与流通提供更大的帮助。
(二)数据捐赠
数据捐赠的理论源头来自开放数据运动。与前文所述的数据开放并不是同一概念,开放数据是对于数据状态、特征、性质及使用条件的事实描述,即数据处于开放获取的状态。因此,开放数据只是数据开放的一种结果。开放数据强调了技术上和法律上可以为任何人在任何时间和地点进行自由地使用、重用和再分享。〔47$〕
对于企业、社会组织这类私主体来说,开放数据运动演化为向公共领域进行的数据捐赠,即私主体的数据捐赠行为。欧盟在《企业间数据分享的研究报告》中,将开放数据作为第五类典型的数据分享工具,〔48$〕其实质上想要描绘的就是这种私主体将自身所持有的数据直接置于公共领域,以供全社会主体无差别、无条件使用的类似“捐赠”的数据分享行为。例如,在世界银行的“开放数据计划”中,所有世界银行研究数据集都可以在搜索性数据目录平台上免费获取,为外部研究人员和其他组织提供额外的分析和可视化工具。世界银行承诺其开放数据必须在公共领域完全可用或能够以“最低限度的限制”进行访问。〔49$〕实践中已经存在大量的私主体主动“捐赠”自身数据的案例,例如谷歌的Open$Images数据集、Natural$Questions数据库,等等。〔50$〕这种向公共领域捐赠数据的行为一方面实现数据分享的目的,一方面又使自身回避了数据质量治理义务或后期管理义务,有效地降低了分享成本。
理论上,数据捐赠是一种完全自愿、平等和开放的数据分享行为,其分享的相对方是全社会主体,而分享者因为不能为其捐赠的数据施加任何条件而往往无法获得任何对价激励。因此,本文将其放置于基于利他主义而开展的数据分享行为,其本质上追求的是“建立更加相互关联的社会,更好地满足公民的需求,以创新、正义、透明度和繁荣发展”。〔51$〕但是,对于企业、社会组织这类私主体来说,“开放知识”的模式很难在数据上实现。因为信息、知识、文化思想的开放是基于人类为价值生产基本工具的传播逻辑。而对于数据来说,作为由0、1组成的代码结构,其价值发现和转化的工具是计算机或者人工智能。这就造成即使存在开放数据也需要巨大的算法、算力的投入来实现知识生产和价值创造。对于作为生产资料的数据的结构化、机读性和互操作性的要求极高,这些治理成本显然是作为“慈善”的数据捐赠的参与者所不愿承受的。为此,为激励私主体的数据捐赠,同时努力弥补数据捐赠者的预处理成本,各国政府纷纷积极探索数据捐赠的有效激励和促进举措。例如,依赖鼓励性政策,包括投入激励机制和建设公共性质的分享平台,积极引导私人领域的数据捐赠,或者探索将数据捐赠作为“企业社会责任”议程的一部分,利用“网络声誉机制”给予捐赠主体以“信誉奖励”,从而提高数据捐赠的积极性。〔527〕
综上所述,作为一种重要的数据社会化分享组织形式,数据捐赠颇具自发性与理想化色彩,似乎无法成为数据分享的主流模式,但其作为数据开放、数据共享等制度的有效补充,依然具备一定的理论与实践意义,可以成为丰富数据分享方式的重要手段。此外,被捐赠的数据属于公共物品,应当允许被全体社会成员无条件、无差别地使用。但由于这类数据可能涉及侵害数据来源者的人格利益,或者涉及商业秘密和国家安全,这类数据在使用时依然需要妥善处理相关者的利益保护问题,不得利用相关数据从事侵害利益相关者的行为。
结语:以数据分享为目的的数据治理
数据分享是一种符合数据要素与数据经济特征的经济生产方式。实现高效有序的数据分享是建构数据要素治理体系的核心考量。在数据治理中,保障基于事实控制的数据持有者的利益是尊重劳动与价值创造的表现,但这样的权利并不意味着数据持有者可以完全排他支配数据要素。包括数据来源者、数据使用者甚至全体社会数据上的利益相关者都有权参与数据分享利用的过程,以确保自身的相关利益得到尊重和保障。从这一角度来看,数据分享不单单是一种知识和经济生产的组织方式,同时也是数据治理的重要途径和现实目的。只有综合法律、公共政策和伦理规范等工具,构建具有适应性、可预期性和公平性的数据分享制度,才能更好地应对数字时代的社会变革。