胡 凌
“数据要素”①和“劳动”概念类似,“数据要素”本身只有放在特定生产方式中理解才有意义,并区别于一般性的日常数据,因此本文在生产方式意义上不加区分地使用“数据”和“数据要素”。参见刘震、张立榕:《马克思主义视角下数据所有权结构探析》,《教学与研究》2022年第12期。一词被作为政策话语提出以来,②《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》(2020年3月)。吸引了不同学科的大量研究投入。回顾历史,数据作为有价值的生产要素,至少从“大数据”一词出现时就开始强调了;考虑到数据的本质就是信息,甚至还可以追溯到20世纪80、90年代电子工业和信息产业的兴起时期。由此看来,单纯重复强调一个概念,并不能帮助我们理解当下面临的问题有何不同。随着技术进步和社会实践的发展,人们逐渐认识到数据要素可以带动其他类型要素的开发利用,但需要提供系统性的政策和制度支撑,也需要中央政府部门在整体上推动。③国家发展和改革委员会:《加快构建中国特色数据基础制度体系 促进全体人民共享数字经济发展红利》,《求是》2023年第1期。这可以部分解释为何在数年前未能有效运转的地方数据交易所近年来相继重启或再次设立,并在各地通过数据条例的方式加以固定。
2022年12月,中共中央、国务院印发《关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称“数据二十条”),系统地明确了若干制度性配套措施,集中在数据产权、数据流通与交易、数据收益分配以及数据要素治理四个主要领域。尽管在每一个领域中都有不少细化研究,但少有研究将这些领域整合在一起进行观察,形成有关联的类型化分析。①一个综述,参见王建冬、于施洋、黄倩倩:《数据要素基础理论与制度体系总体设计探究》,《电子政务》2022年第2期。例如,关于数据权属,流行的主张认为应当由生产数据的主体控制数据的处理,将数据确权问题视为数据基础制度最为核心的构成,认为这是其有效流动的前提;但如果从现实来看,至少平台企业并不想要颗粒度十分精细的确权,即给予在数字平台上从事生产和消费活动的各类主体以绝对控制权,而是希望拥有一种不受干扰的集合性空间财产权益。②更详细的分析,参见胡凌:《数字经济中的两种财产权:从要素到架构》,《中外法学》2021年第6期。又例如,关于数据公共性的看法也存在差异,要么主张公共数据由国家所有,由国有企业运营、国有资产管理部门监督开发,并向全民分发红利;要么走向另一端,主张原则上应全部向社会无偿开放。但这些讨论往往忽视公共数据生产和归集的本地化和反流动倾向,以及公共数据究竟如何利用最为有效的问题。③刘阳阳:《公共数据授权运营:生成逻辑、实践图景与规范路径》,《电子政务》2022年第10期。产生种种认知分歧的原因之一是论者对数字化生产方式的理解还停留在政策文字上,很少有研究能够发现,不同的生产方式事实上塑造了不同的数据要素秩序,无论该种秩序是偏向市场还是行政指令。
具体而言,以往法学、经济学和公共管理学相关研究存在的共同问题是:(1)倾向于从普遍视角理解数据要素的规范构成,忽视背后生产过程的不同推动力;(2)只看到真空中基于个体的权利设计,忽视权利有效运行所处的整体制度结构和行为动力,这可能导致对要素确权的迷信,事实上即使法律政策给予了相关权利,社会主体仍无法得到明确行动指引;(3)抽象地谈论“场景”中的数据规则,不关注数据发挥的特定功能,这看似合理但容易因为对场景的理解不同而自说自话,无法聚焦问题;(4)只关心数据如何通过私人利用产生价值,不太讨论数据的公共利用方式或者公共性,甚至把两者对立起来;(5)不能有逻辑地将数据基础制度放在一起讨论,即使每一类制度都可能设计得很细致(如确权或交易规则),如果缺乏对整体制度目标(如要素流动性或公共利益)的分析,还是会丧失判断具体设计是否有效的标准。
本文将努力克服上述研究视角的局限,采取一个结构性视角展开分析。首先,继续基于生产方式框架进行讨论。④笔者之前作过关于技术引发的生产方式变革如何塑造规则的讨论,参见胡凌:《理解技术规制的一般模式:以脑机接口为例》,《东方法学》2021年第4期。现实中存在两种不同类型的数据秩序:一种在平台经济生产方式下形成,该秩序更强调扁平化与市场化,希望打破要素流动的地域界限,强调通过网络连接形成不同社会关系,进而获取用户在场景中的行为数据加以利用;另一种更贴近地域性和科层制,即由各级政府在辖区内通过推动企业数据交易实现数据价值,并通过加大对公共数据的供给来满足市场需求,属于典型的工业化生产方式。本文将这两类秩序作为理想类型分别讨论,认为数据秩序(具体而言是数据生产和流动结构)的存在先于并影响数据确权、交易和权益分配等具体制度,有必要解释其如何在不同生产方式下需要不同的数据基础制度。其次,继续采取行动者—结构视角分析数据权利/责任。⑤胡凌:《数据要素财产权的形成:从法律结构到市场结构》,《东方法学》2022年第2期。传统视角只是单纯就权利义务本身如何适用展开分析,如果将其置于更广阔的视野中,不难看到某种观念的形成或选择的作出,实际上是顺应了某种在先社会和技术结构需求的结果。不是因为权利/责任必然产生了结构和秩序,而是秩序本身的结构特性允许或需要身处其中的要素或主体可以稳定地获取收益或承担责任。因此根本的问题是,谁需要何种权利/责任,进而揭示出那些未能言明但实际上起作用的隐形社会力量。⑥这在方法论上其实就是要着重思考语词背后的真实问题,参见苏力:《想事,而不是想词——关于“法律语言”的片段思考》,《东方法学》2023年第1期。再次,继续按照数据功能而非数据一般种类进行讨论。⑦胡凌:《功能视角下个人信息的公共性及其实现》,《法制与社会发展》2021年第5期。常规研究往往按照政务数据、企业数据和个人信息进行分类讨论,它们实际上相互交叉,且无法直观判断究竟何种权益更加优先。只有提炼出特定类型数据所具有的社会和市场功能,才能继续讨论在某种场合使用某类数据的正当性,揭示社会主体行为的动力。最后,特别关注针对数据公共性的分析。“数据二十条”中提到“合理降低市场主体获取数据的门槛,增强数据要素共享性、普惠性”,即需要探索数据的公共功能能够以何种方式体现,既可以通过增加公共供给的方式,也可以通过建立公共基础设施进行共享的方式,这有助于打破传统的公私二元划分对立,延续公私合作的讨论。①关于互联网治理领域的公私合作,参见杨学敏、刘特、郑跃平:《数字治理领域公私合作研究述评:实践、议题与展望》,《公共管理与政策评论》2020年第5期。
本文将沿着上述思路展开论述:首先描述数字经济中的两种生产方式及其推动力,尝试提供一个基于数据流动秩序的理论性解释框架,这个框架包含了生产方式、数据功能和结构性动力;其次分别在两种数据要素秩序下讨论各自的生产动力、数据权属、基础设施、收益分配等制度规则,阐明基于不同生产方式的秩序需要不同类型的法律规则,而不是反之由规则主导构建秩序,重要的是看到社会主体使用规则参与数据秩序演进的结构性动力;最后对两种数据要素秩序的冲突与合作前景进行展望,并总结全文发现。
对数据议题展开讨论不可避免要回到一个基础问题:数据的价值究竟从何产生?首先,从分析预测的角度看,数据事实上没有宣称或想象的那样重要(“数据是石油”②现在看来,这种说辞更多是互联网行业吸引投资的夸大性策略,一旦无法成真,可能会带来诸多社会不信任,参见戴昕:《平台责任与社会信任》,《法律科学》2023年第2期。),因为有效数据需要实时更新,一旦披露就会丧失价值,③丁晓东:《数据交易如何破局?——数据要素市场中的阿罗信息悖论与法律应对》,《东方法学》2022年第2期。更不用说总会有新的“替代数据”或者“另类数据”的出现补充预测模型,并得出不同的结论。④关于另类数据,参见王闻、孙佰清:《另类数据:理论与实践》,北京:世界图书出版公司2023年,第12—14页。重点在于是否能够以低成本获取这些数据,并尝试让其发挥作用,而这需要经历一个试错过程,并不必然会带来可见的价值。在复杂的经济和社会当中,关于结构化数据的价值远未达成共识,很难明确说何种数据一定有用,只是说其对特定的对象行为有边际上的推动或调整作用,因此重要的是持续改进数据质量,以及能够将信息实时反馈到需要影响的行为主体,以便系统地改进其选择和预期。
其次,从供给的角度看,除了数据本身能够以低成本复制传播,我们已经看到机器有能力近乎无限地生产数据或对现实进行模拟,这也意味着在整体上数据价值不断淡化,无法处理的超载信息或数据伪造会带来负外部性,给人们的选择和决策带来困难,成为另外一种意义上的“污染”。⑤Omri Ben-Shahar, “Data Pollution”, Journal of Legal Analysis, Vol.11, 2019, pp.104-159.因此,成为市场要素的数据更多是依附性的,需要通过商业模式和真实世界的市场要素不断发生关联而非在真空中产生,才可能有实际意义。例如,以往谈论的数据更多依附于企业组织内部的生产活动,受到专利或商业秘密的保护,而如今依托互联网消费,企业已经可以大量追踪消费者的行为数据,从而使数据市场涵盖了更为广泛的生产者和消费者。从这个角度来看,探讨数据规则需要回到社会主体之间的关系,只有看到主体之间的关联性,才能理解由此产生的数据流动和边界。⑥戴昕:《数据界权的关系进路》,《中外法学》2021年第6期。
由此,在一个相对稳定的数据秩序中,如果数据依附的社会主体能够持续地再生产,该秩序的不同参与者就可以逐步利用信息的价值,服务于一个更广义的价值体系,有效调节生产和消费的关系。无论是数据要素确权机制还是分配机制,都是在秩序稳定后才逐渐出现并不断改进的。这就需要引入生产方式的视角,基于经验总结不同类型的数据流动/控制系统,观察总结如何塑造出一个从生产到分配的环环相扣的逻辑机制。
数据要素秩序形成的逻辑在本质上是进行成本—收益衡量。一方面是数据本身的价值,看能否稳定地生产和输出信息反馈,改善产品或服务;另一方面则是技术成本和制度成本,只有大量产生数据的技术成本降低,从数据分析中可以得到的边际收益超过边际成本时,市场主体才可能开始利用数据要素,推动数据经济,但也仅仅是可能。此外,数据需要能稳定地产生价值,才会被行业广泛接受为一种资产,主张固定化的权属,否则仍然只是被个体在边际上灵活使用。还有一点需要考虑的是,如果广泛要素确权的制度成本(如交易所、数据集团、资产登记、第三方评估、权属证明)高于其可能的价值,就没有必要统一要求和强制执行,而是可以先由市场主体以合约方式自行选择。如果对要素强制定价(如强制企业将数字资产入表)或提高成本(如数据税)且无法从中获得可预期收益,社会主体就可能以各种方式退出该秩序。当然,即便正式制度成本高昂,也不意味着数据秩序无法建立,只要社会有能力通过既有其他要素的制度红利抵消该种成本,也能为新型要素使用建立坚实基础。①这在数字经济中往往被称为“非法兴起”,参见胡凌:《非法兴起:理解中国互联网演进的一个视角》,《文化纵横》2016年第5期。上述约束条件都会影响市场主体的理性决策,但无论如何,人们不会因为某个抽象的权利概念就自动选择技术更新或模式创新。
更进一步看,任何一种完整的数据秩序都需要实现若干目标与需求:(1)确保产生基本价值的数据要素持续生产,可以循环;(2)确保数据要素本身发挥应有功能,表现方式未必是可衡量定价的市场价值,而是某种系统性的公共价值。例如,私人缺乏动力提供的公共信息需要强制共享,也无法被个体控制和占有,只要在一个达成共识的公共空间中运行利用即可;(3)为持续生产提供有效激励,特别是公平的分配方式,确保参与主体即使无法从数据中直接获得收益,也会从其他方面获得。但有效的秩序首先要能在边际上让数据起作用,并维持一个保证生产基本面的大致公平的制度,直到数据作为新型要素稳定产出后,才可以逐渐将其纳入固定的分配范围。因此,并不需要急于将数据作为资产进行确权征税或通过“全民基本收入”方式分红,②具有不同制度功能的“哈伯格税”是个例外,参见Eric Posner, Glen Weyl, Radical Markets: Uprooting Capitalism and Democracy for a Just Society, Princeton: Princeton University Press, 2018, pp.30-42。或者追求公共数据有偿使用,制度的重点仍然需要放在生产过程的公平参与、流量的公平获取以及工作条件质量的提升上面;(4)建立完善约束生产和流动带来的负外部性的机制,如数据安全机制。这些系统性需求正是“数据二十条”中的基础制度需要着力回应的,但目前该文件还只是一个指引性框架,如何与现有秩序相互契合需要深入分析。
以往研究不太注重数据的功能,但却喜欢讨论所谓的“场景”,结果就是将行业或服务类型作为不同场景讨论,但问题是在每个场景中很多数据的作用也是相似的,我们不需要将数据规则变成某种“场景之法”,而要提炼其中共通的问题和原理。③这类似于网络法研究中的“马法”之争,参见戴昕:《超越“马法”?——网络法研究的理论推进》,《地方立法研究》2019年第4期。实际上原初的场景理论核心也是探究主体之间的关系类型,参见Helen Nissenbaum, Privacy in Context: Technology,Policy, and the Integrity of Social Life, California: Stanford University Press, 2009。将数据按照其承担的不同功能,而不是按照和数据有关联的主体进行分类观察,可以更好地理解为何某种数据被以特定方式处理,以及某种数据能够实现何种目的和社会价值,否则大家可能都以数据之名谈论不同的对象。
在一个市场或社会空间中,数据的主要功能可以抽象地分为展示性和辅助性两种。其中展示性功能是指信息向特定或不特定人公开,通过内容处理体现价值;而辅助性功能则是为了使各类要素在系统中的流动与合作更加便利、安全和有序,例如身份认证、行为分析、匹配、声誉评分等。④更详细的讨论,参见胡凌:《功能视角下个人信息的公共性及其实现》,《法制与社会发展》2021年第5期。辅助性数据是为了群体有序互动、重复交易而使用的数据,对维持系统的有效运行更为关键,服务于公共利益。这表明数据功能会直接影响到权属讨论,即辅助性数据不应当由私人占有获益,甚至可以在特定场合为了公共需求而不经告知默认使用,或者免费向公众普惠开放。⑤参见《中华人民共和国个人信息保护法》(以下简称《个人信息保护法》)第十三条(三)(四)(五)。
数据功能也和系统存在的目标联系在一起。如果系统的目标是推动系统中要素流动,扩大规模效应,并提升要素活动水平,就需要通过技术手段实时追踪这些活动加以分析。同时还要考虑要素之间的关系,即塑造何种网络能够更好地便利人们合作与交流,进而设计出不同类型的网络。如果系统的目标只是改进企业内部的产品服务或组织能力,在边际上提升服务或产品质量,搭建或巩固产业链与产业集群,那么数据流动对复杂关系的要求就相对较低,只需要实现信息系统的标准化,推动市场供给即可,市场主体就不需要投入太多资源构建关系网络。
从“数据二十条”的政策目标来看,似乎可以追求一种规范性的统一数据秩序,但如果深入总结数字经济在中国发展的经验,就不难发现至少有两类数据要素生产方式。一种是传统上经由组织内部生成和改进服务而产生数据,这类数据更多是在生产环节关涉产品或服务开发本身,而不涉及实时回馈使用者或消费者,现在讨论较多的公共数据、传统行业协会产生的数据以及传统企业数据都属于这一类。这类数据更多地在某个封闭的组织环境中产生,伴随产品或服务的改进而逐渐改善。这种数据依托的生产方式某种程度上是工业化的,即由市场或社会组织吸纳不同生产要素,在内部按照固定流程创制产品进行销售,其数据更多用来改进组织行为,提高组织效率或创新程度,对于组织的日常行为比较容易通过信息系统实现其结构化,最终可以计入资产负债表,但因其无法回馈消费者,此类数据未必是因人而异的。
这种生产方式有赖于企业和政府行为的推动,往往集中在特定地理区域,其秩序动力不仅来自企业的市场行为,也来源于我们较为熟悉的政府过程。按照流行的政治学理论,这种秩序发生在“行政发包制”过程中,即中央政府将社会治理任务通过科层制逐级分包给不同层级的政府,由下级政府部门在各自辖区内完成并接受考核,中央政府通过人事晋升等激励措施与量化考核,推动地方政府间和区域间竞争。①周黎安:《行政发包制》,《社会》2014年第6期;周黎安:《行政发包制与中国特色的国家能力》,《开放时代》2022年第4期。我们已经看到,从公共数据开放到智慧城市建设,地方政府在国家数字化转型、推动数字市场建设和提供基础设施过程中起到关键作用。毋庸置疑,数据产业也同样依托于这类由地方政府逐级发包来完成的治理秩序,其手段包括出台地方性数据条例、推动建立本地化的数据交易所、将公共数据授权运营、打击数据产业中的不正当竞争等。不难看出,这种科层—属地式的数据秩序是适应既有工业化生产方式的必然结果。
与之相对应的另一种生产方式是网络化的,即由平台企业主导、超出地域界限进行跨领域调配生产要素的生产过程,其中较为核心的是发生在不同网络关系中的行为数据,根据实时行为数据可以进行生产和消费决策,推动经济循环。在这个过程中,平台企业向更多市场要素开放,并引导它们在不断迭代的数字架构空间中流动。②关于架构的系统讨论,参见胡凌:《论赛博空间的架构及其法律意蕴》,《东方法学》2018年第3期;吴伟光:《构建网络经济中的民事新权利:代码空间权》,《政治与法律》2018年第4期。这类数据秩序以建立行动者网络为目标,不断通过市场机制寻求要素之间新的连接,从而创设更多的合作与交易机会。
尽管平台企业主导的数字经济过程看起来是单纯的市场化过程,但如果仔细观察就会发现和行政发包制类似,这一过程事实上也存在着发包逻辑,本文称之为“平台发包制”。我们已经看到互联网平台逐渐成为超越地域性的组织力量,它们凭借自己的能力塑造了数字市场,建造与之相适应的基础设施,形成稳定的数字生产秩序,头部平台企业无疑是提升经济发展水平、实施国家关键治理政策的重要抓手,它们在日常治理过程中响应国家政策,落实互联网治理目标。③例如,2022年中央经济工作会议提出“要大力发展数字经济,提升常态化监管水平,支持平台企业在引领发展、创造就业、国际竞争中大显身手”。另可参见黄冬娅、梁渊栎:《超越审查与监管——互联网产业发展中的国家角色》,《文化纵横》2022年第4期。同时,国家也通过放宽市场准入和弱化经营者集中的政策给予相应激励,促进新型生产方式的成熟落地。这已经超越了单纯的监管合规问题,而是将平台企业定位为社会治理的主体而非对象。平台企业也就不仅在一般的服务市场上竞争,也通过更好地响应国家治理需求来竞争获取潜在政策资源。④于洋、马婷婷:《政企发包:双重约束下的互联网治理模式——基于互联网信息内容治理的研究》,《公共管理学报》2018年第3期;黄冬娅、杜楠楠:《平台企业政府事务部门专门化与政企关系发展——基于国家制度环境的分析》,《社会学研究》2022年第6期。因此,就数据要素开发而言,至少头部平台企业已成为中央政府部门直接发包、塑造数据秩序的可依赖的关键力量。
上述两类秩序更多是作为理想类型提出,在现实中往往混杂在一起。例如,特定平台企业仍然可能是地域性的,主要靠市场要素的本地活动获取数据,或者通过推动产业互联网发展获取更多中小企业数据;而科层下的数据流动也可能具有全国影响力,如持牌的个人征信机构或行业协会主导的业务信息系统。但两者都试图解决数据如何在经济发展中起到更好作用、推动生产要素有效组织的问题,都是调动生产要素、搭建产业链的手段,但各自运行的逻辑不尽相同。本文无法提出一个连通不同秩序的普遍适用的数据利用机制,而是希望人们看到在应对不同市场和社会需求时,不同生产方式会展示出不同的制度样态。接下来分别分析两种秩序各自需要什么类型的数据基础制度,也是尝试对“数据二十条”中规定的四类一般性制度进行细化解释。
互联网的兴起已经提出并实践着一种创造性利用数据/信息的方式,即混合了免费基础服务(包含软件使用和其他增值服务)和广告或会员制的模式。这种互联网消费的特点在于,打破传统生产和消费空间的界限,尽可能消除商品或服务的流通环节,不断创设网络和连接,从而发现消费者的行为模式。①胡凌:《网络法中的“网络”》,《思想战线》2020年第3期。从数据的功能角度看,前者更多是展示性的,无论是平台企业承载第三方生产还是机器自动生产的信息都首先以免费方式提供给用户,吸引流量;而后者获取用户的身份和行为数据,是为了使用算法对用户行为进行评估、预测和匹配,由此构成辅助性功能。无论如何,这两类数据都可以说是依附于生产者/消费者的副产品,只要有持续的流量和流动性,此类数据就可以一直在边际上发挥作用,画像就表现得越精准,即便生产要素的范围从线上内容扩展至线下服务仍是如此。②关于数字生产方式更详细的分析,参见Shoshana Zuboff, The Age of Surveillance Capitalism: The Fight for a Human Future at the New Frontier of Power, New York: Public Affairs, 2019。
实际上,这种生产方式的维持并非单纯依靠数据,还有商业模式本身,只要消费者认为能够从该模式中得到好处(如收益或流量),并相信数据收集可以帮助改进服务或获取因人而异的服务,就会有人通过软件使用持续不断地生产和消费,而不会特别在意其行为数据本身的价值或者权属,自然解决了供给问题。③这种商业模式在前期极大地依赖资本投入来维持优质的免费服务以获取流量,如果后期仍然无法找到有效的付费方式,该模式即宣告失败,这也是为什么头部平台企业都需要数年才能够依靠多边市场进行交叉补贴,且需要更长时间开始真正盈利。尽管用户协议可以规定个人信息收集的形式合法性,但真正影响用户选择的其实是服务方式本身。如果以这个视角看待数据,就不用担心无限生产和数据污染的问题,因为如果数据分析不能在边际上优化特定服务或消费行为,平台就会尝试改变数据类型或使用数据的方式。此外,行为数据基本上不会被转移至平台生产体系外使用(除非是生态系统与第三方深度合作),更不会轻易出售,其目标是持续推动体系内的生产和消费。从这个意义上说,以平台经济为依托的数据要素秩序的核心是生产者/消费者的持续行为和经济循环速度。
研究者普遍认为数字平台具有“市场—企业”两重性,④陈永伟:《平台反垄断问题再思考:“企业-市场二重性”视角的分析》,《竞争政策研究》2018年第5期。构成的市场是多维度和超越地域的,并通过扩展平台企业的技术架构,将更多生产要素纳入空间生产过程实现市场运行。从市场范围界定来看,目前在竞争法领域和反垄断法领域出现了对数字市场不同的认知和判断标准。就竞争法领域而言,法院在诸多不正当竞争案件中更倾向于按照跨平台服务模式来界定相关市场,将竞争关系界定得十分宽泛,从而能够最大限度保护利益相关主体;而就反垄断法领域而言,法院则表现得十分谨慎,将竞争发生的相关市场尽可能限缩至特定种类服务的单一市场,避免处理双边乃至多边市场带来的交叉网络外部性问题。⑤胡凌:《数字平台反垄断的行为逻辑与认知维度》,《思想战线》2022年第1期。这就为平台企业通过基础设施进行扩张提供了较为充分的学理理由。
我们已经看到,网络化秩序由平台企业推动,要素资源跨地域流动,以平台为核心的新型生产组织构建了生产秩序,形成了架构性的财产利益,因此一整套要素权利体系都围绕生产秩序而设计形成。从平台企业角度看,平台上构建的市场本身就已经具备了权属、流通、分配和治理等规则,这些规则和人们一般将数据设想成需要以低成本确权流通的要素不太一样。接下来将从数据权属、基础设施、交易与定价模式、分配机制四个方面展开分析。
1.数据权属。任何纸面上的财产权利都可以根据需要细化,进行言语上的拆分和重组,这就是权利束或模块化的意思,这种思维方式可以容纳不同类型层次的利益诉求,如数据上可以同时承载财产权和人格权。①王利明:《论数据权益:以“权利束”为视角》,《政治与法律》2022年第7期。但业界最为关心的无非是数据财产权利的确定和分割问题,即谁有权对何种数据占有和处分,这可能直接影响最后的收益分配。②劳动理论是当前较为普遍接受的一种确权理论,即根据不同主体付出的劳动和贡献程度进行确权,同时也可以延伸至分配环节。“数据二十条”提出“健全数据要素由市场评价贡献、按贡献决定报酬机制”,“按照‘谁投入、谁贡献、谁受益’原则,着重保护数据要素各参与方的投入产出收益,依法依规维护数据资源资产权益,探索个人、企业、公共数据分享价值收益的方式,建立健全更加合理的市场评价机制,促进劳动者贡献和劳动报酬相匹配”。网络化的数据秩序意味着以推动要素流动为主要目标,源自个体的数据只有形成集合性的资源池才有价值,这种资源池仅需要法律保护平台企业排他的自主经营权,根据需要对市场活动进行调节,数据资源持有权、数据加工使用权、数据产品经营权等权利从而结合在一起,不需要专门分置强调。③从历史上看,数据要素确权因技术成本无法标准化,或者因确权颗粒度精确可能造成反公地悲剧等原因,并未成为这一平台秩序的形成原因,只是生产秩序稳定后的一种可能后果。只要生产者或消费者在适当的劳动定价模式下从要素流动的过程中获得的稳定收益高于对数据固化的确权,就不会产生数据资产固定和转让的问题。此外,当用户根据协议条款同意将行为数据授权平台企业使用后,个人信息权益在这一秩序下就成为从属性的,不能超越平台企业组织生产的整体目标而随意由第三方转移。在这个意义上,所谓的个人数据可携权对个人而言整体价值不大,更多具有的是竞争法的意义。有法院曾提出个人信息的三重授权模式,也是对这一秩序的回应,参见北京知识产权法院(2016)京73民终588号判决书、杭州市中级人民法院(2018)浙01民终7312号判决书。但同样不可否认的是,随着时间推移,在一个更加专门化和成熟的平台上,完全可以为持有某些核心数据的主体赋权参与分配。平台企业塑造的网络化数据秩序不太希望对内确定个体层面的“要素财产权”,否则会增加平台上主体的合作和交易成本,特别是数据要素的价值无法稳定预期的时候;但同时又需要另一种排他不受干扰的“架构财产权”,希望对外明确法律边界,限制其他竞争对手劫持流量、爬取数据、设立外挂等行为,力图使自身的技术架构在法律上更加清晰和不断延伸。④目前《中华人民共和国反不正当竞争法》(以下简称《反不正当竞争法》)已经可以有效回应这一需求。详细的分析参见胡凌:《数字经济中的两种财产权:从要素到架构》,《中外法学》2021年第6期。
2.数据基础设施。⑤“数据基础设施”这一术语在使用时具有相当的模糊性,除了传统的电信运营商外,一般意义上的用法是将其与“新基建”和“关键信息基础设施”联系起来;另一些研究讨论集中在反垄断法维度上,试图将具有基础设施意义的大型数字平台纳入“必需设施”或者“公用事业”监管,或者主张其在特定领域履行“守门人”特殊义务。参见《中华人民共和国网络安全法》第三章第二节;《个人信息保护法》第五十七条;《国务院反垄断委员会关于平台经济领域的反垄断指南》(国反垄发〔2021〕1号)第十四条;高薇:《平台监管的新公用事业理论》,《法学研究》2021年第3期。传统上我们对“基础设施”的认知限于以物理实体为主的设施及其运营服务,随着互联网不断向纵深发展,数据基础设施变得愈加重要。和传统基础设施相比,数据基础设施具有一些新特点:首先,从概念上看,传统基础设施往往表现为能源、交通运输、水利、环境保护、市政工程等领域的公共基础服务,和公用事业形态联系在一起,并通过特许经营或政府和社会资本合作(PPP)方式进行运营和规制;而目前除了“新基建”可能落入这类公用设施外,大型数字平台主要由私人企业所有和运营,按照一般商事主体的法律地位接受监管。其次,传统基础设施往往强调其公共服务面向和公共性,属于自然垄断行业,按照社会公众需求提供稳定和成本较低的普遍服务,并负责对公共资源进行有序开发利用;而大型数字平台表面上也在提供涵盖大量用户的普惠服务,但其能力更多源自信息技术本身带来的边际成本不断降低的效应,其服务本质上是基于合同的信息增值服务,其提供的诸多信息资源也由用户免费贡献。最后,传统基础设施更多是基于道路、管线等提供服务的具有物理实体的一整套设施,可以独立于其他实体存在和建设,而数字市场中的基础设施更接近和内嵌于一个生产性系统,虽然基于平台软件进行操作,但在功能上类似于维持传统市场和社会运转的抽象基础服务(如金融、物流、纠纷解决等),从而在不同市场之间形成了壁垒和桥梁。由此,上述特点涵盖了网络化数据秩序中数据基础设施的若干面向:(1)公共性维度,即其目标主要基于特定范围的公共服务与公共资源,带有一定的普惠性;(2)所有权维度,即其可以由不同性质的主体所有和运营;(3)技术维度,即其广泛采用了数字技术与信息系统;(4)系统维度,即其存在本身是为了辅助市场/社会作为一个循环系统更为有效地运转,功能围绕信息展开。①从功能角度而非反垄断法角度理解数据基础设施,就能理解其是为了更好实现数字市场中要素安全有序流动交易而普遍推行的某种带有信息功能的公共服务,从而使数字市场中的所有参与者共同获益,而不论这一市场是否依托于特定平台企业,也不论该公共服务是否仅由公共机构提供。这类数据基础设施主要体现为身份认证信息服务、要素评分信息服务、需求匹配信息服务、交易网络信息服务等辅助性功能。
3.交易与定价模式。在网络化数据秩序下,数据因其本身的特性可以在加入平台架构的用户之间或者通过会员订阅信息服务的方式共享,这往往是免费的(会员制尝试在边际上动态收费),其前提是用户也要以自身行为数据作为交换,贡献到集合性的数据资源池当中。当下讨论较多的数据互联互通的实现方式实际上也基本是通过小程序或第三方账户登录模式共享流量,而不是单纯连接信息孤岛。这一模式实际上是将社会主体之间的数据交易转化为平台生产秩序内部的信息和流量交换,这就是为什么我们在数字平台上无法简单从外部观察到一种想象中的数据交易和市场定价过程。
4.分配机制。网络化数据秩序下的分配机制是以市场原则为主导,通过增加市场主体合作与交易机会进而增加收入(如广告分成、打赏),衡量的标准往往是一般可以识别的劳动计件或点击数量,在数据收益不明的情况下,没有特别强调数据要素的价值。一旦研究和舆论过于强调数据权益分配的普遍价值,就会将带有不确定价值的数据固化从而抬高相关市场参与者的要价,这可能对网络化生产方式发展不利。但这不是说数据不能成为一种劳动,②Eric Posner, Glen Weyl, Radical Markets: Uprooting Capitalism and Democracy for a Just Society, pp.30-42.而是说研究重点应该回到新就业形态下劳动过程本身,关注更为一般的劳动者权益保护问题。③人社部等八部门《关于维护新就业形态劳动者劳动保障权益的指导意见》(人社部发〔2021〕56号)。
成熟的平台企业已经看到数据本身的价值有限,不会贸然将数据要素财产化,而是继续按照基本的互联网商业模式逐渐推进,将流量变现,在扩张的同时避免脱实向虚。这种看待数据的方式对网络化生产秩序具有较强的意义,但其带来的最大问题仍然是平台的封闭性。“数据二十条”在一个侧面有利于强化平台企业主张的架构财产权,特别是加固头部平台企业的市场权力,进一步减少竞争对手公平获取数据的动力,降低竞争程度。究其根本,仍然在于平台企业的数据基础设施难以保持中立。按照传统互联网分层理念,基础设施(如物理传输层)应当保持中立性,提供普遍服务,确保基本服务质量,但从目前的趋势看,上层资源的网络效应将市场力量不断传导至底层,要求在流量上区别对待,甚至上下游垂直整合,④丁晓东:《网络中立与平台中立——中立性视野下的网络架构与平台责任》,《法制与社会发展》2021年第4期。数字基础设施服务本身也构成了平台上双边市场中的一边,并受到国家牌照管制的影响。拥有相关牌照的现行企业由此具备一定的竞争优势,大型平台也逐渐通过向第三方开发者或中小平台提供自己的基础设施,抬高交易谈判筹码。因此从底层基础设施和上层生产要素活动的关系来看,更容易出现非中立现象,这使平台自我优待行为十分常见。⑤陈兵:《互联网屏蔽行为的反不正当竞争法规制》,《法学》2021年第6期;刘晓春:《数字平台自我优待的法律规制》,《法律科学(西北政法大学学报)》2023年第1期。这就说明在法律制度设计上,网络化数据秩序要求:(1)在确保控制力基础上进行非清晰化数据权属划分;(2)保证平台企业垂直整合的自主经营范围;(3)获得更多基础设施牌照,即使接受强监管。
从中国互联网的发展脉络来看,其实际上遵循着一种不断强化底层基础设施(自然垄断),同时推动上层创新开发竞争的模式。前者有助于以标准化方式降低整个市场的交易成本,促进生产要素的流动,后者有助于在架构内可控的流动中推动更多第三方开发和服务。当下的问题在于,除了底层的电信基础设施实现了互联互通以外,隶属于不同大型平台的基础设施目前仅在封闭的企业架构中发挥作用,而未能做到互联互通。如果说数字经济仍然需要平台企业相互竞争才能不断发展,那么我们看到的是大型平台企业之间的护城河愈加深厚。要解决这一问题,有必要回到早期互联网兴起的流动性秘密,即监管政策不仅需要帮助将更多非数字化的资源数字化,保留一定程度的“非法兴起”灰色地带,同时也需要开始考虑推动数字平台之间的要素流动。为了实现这一目标,不是简单地依靠赋予用户“数据携带权”或强制提高数据互操作性,而是需要首先提高各平台之间的基础设施标准化程度和制定保障安全流动的制度措施,降低中小平台创业者的经营合规成本,才能为下一阶段释放流动性红利做好准备,最终的目标是推动生产要素可以更加便利地在不同平台之间流动,建立互联网上的统一市场。
“数据二十条”中相当多的制度性规则实际上更适用于科层—属地式数据秩序。这一秩序中的数据要素形态较为符合流行认知,即将数据想象成边界清晰、可以转移定价的物品;只要确权到位,加强法律保护,就可以形成稳定可预期的要素市场。如前所述,这种对数据的想象不适用于以消费者行为为核心的网络化秩序,而是适用于企业和政府组织的产品或服务生产过程。在这类数据要素秩序中,有两类可以动员推进的行为主体:其一是地方政府,它们在本辖区内经过多年的公共数据(政务数据)归集实践,要求不同层级的部门生产出可供集中运营和开放的公共数据,已经具备一定基础;①《国务院关于加强数字政府建设的指导意见》(国发〔2022〕14号)。其二则是正在逐步进行数字化转型的传统企业,它们拥有企业数据,也希望逐渐形成数据要素市场。无论是哪类数据要素,基本上都是本地化的,更多为本地公共服务和经济发展服务,其流动范围、循环程度和数据总量都不及网络化的数据秩序。
在科层—属地式数据秩序中,数据交易常常被认为是生产组织之间的活动,而不是发生在像平台组织一样的体系内部,因此需要在本地市场中设立专门的数据交易场所进行交易。在这种对数据的想象中,不同的社会组织可以到交易所对持有的数据或数据产品进行挂牌,根据他人需求进行交易,并通过技术方式实现“原始数据不出域、数据可用不可见”。在一些地区的制度设计中,数据交易场所和其他类型的传统交易所一样,都构成了一类特定市场,但这个市场目前主要还只是发挥挂牌发布信息的功能,缺乏进一步的匹配与撮合能力。
和网络化秩序相比,科层—属地式秩序相对保守,只能就本辖区数据进行管理和交易。数据要素的流动性并非是这一秩序追求的主要目标,因为可供交易的数据主要围绕组织性的生产者展开,其功能主要是改进生产和服务,但无法追踪到消费者个人。而且因为需要耗费较大成本且在边际上没有可见收益,无论是公共数据还是企业数据运营者都没有动力对掌握的个人信息进行匿名化处理,宁愿选择那些不涉及个体的产品或环境数据。这类数据秩序的动力也并非源于数据本身,而是既有的地方政府运作过程,政府通过传统行政力量推动辖区内特定企业组织进行交易,搭建产业链或吸引产业集群,提升本地化的创新程度和技术标准,或者通过将公共数据授权运营,成为吸引社会数据的一类供给来源。在行政发包的激励下,地方政府以推动本地经济、加强区域竞争能力的心态推动交易实现,同时也有意愿通过信息系统整合对下级部门和人员进行更好管控。此外,条块关系在要素资源整合中也比较关键,例如一些中央部委会要求地方政府部门使用垂直统一的业务信息系统,以便汇总收录标准化数据,但地方就很难有直接使用此类数据的权力和动力,横向整合本地数据的成本也较高。
科层—属地式秩序基本上是在传统工业化生产方式下形成的,其经济动力由地方政府和企业共同提供,政府根据产业政策需要帮助特定企业获取数据要素,从而实现其融资需求。该过程中的数据流动基本上局限于政府部门和企业组织,以及企业组织之间,由此一整套数据规则体系都围绕传统经济生产秩序目标而展开。下文同样从数据权属、基础设施、交易定价与分配模式等方面展开分析。
1.数据权属。由于无须追踪用户的个人信息,科层—属地式的数据秩序更多集中在行业、社会或环境数据等另类数据,这些数据的产出速度与规模无法与网络化数据相比,但相对稳定和同质化,主要服务于企业产品改进,以及政府公共数据的开发,因此更加看重数据确权,这使得对数据的认识更接近于传统知识财产或数据产品。①一些地方政府将数字藏品交易作为文化产业数据交易的一种形态,这十分接近于传统知识产权交易和生产方式。还有地方政府为企业开出“公共数据资产凭证”或“数据知识产权登记证书”,都展示出类似的努力。这一数据秩序的预期是,随着工业信息化的推进和企业信息化能力的提升,最终可以将相当的企业数据标准化,并计入资产负债表,②财政部《企业数据资源相关会计处理暂行规定(征求意见稿)》(2022年12月)。特别是随着产业链的搭建和信息化水平的提升,各社会主体逐渐拥有更多种类的数据,逐渐打造较为完备的要素市场,并适当加强部分公共数据供给引导社会数据开发。“数据二十条”规定的数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制符合这一预期,其权属划分主要根据数据上可能承载的不同法益并按照数据价值产生的不同阶段进行,更加适合属地化的不同组织之间的交易与合作。
2.数据基础设施。科层—属地式秩序中的数据很少能起到类似市场基础设施释放信号的功能,更多是帮助改进产品服务或提高企业效率,核心的基础设施主要涵盖地级市或省的地方性数据交易场所。“数据二十条”要求“规范各地区各部门设立的区域性数据交易场所和行业性数据交易平台,构建多层次市场交易体系,推动区域性、行业性数据流通使用”,“促进区域性数据交易场所和行业性数据交易平台与国家级数据交易场所互联互通”,基本上是按照设置传统交易场所的方式进行规划。交易必然使某类数据超出传统组织控制的范围,在不同的市场或控制主体之间流动,由此就会涉及相当程度的数据安全合规问题。如果交易所要求的合规成本太高,企业或政府部门就不太有动力寻求场内交易,转而进行场外甚至黑市交易。因此交易所面临的主要问题就是如何通过增加有效的公共数据供给带动社会数据进入场内,提供合适的安全港规则,③戴昕:《作为法律技术的安全港规则:原理与前景》,《法学家》2023年第2期。并逐步提升撮合匹配的能力,目前这一功能只能依托社会中的数据经纪人等中介主体实现。
3.交易定价与分配模式。在科层—属地式秩序下,企业数据交易主要是以涵盖交易双方、交易所与第三方机构的数据价格形成机制和“报价—估价—议价”相结合的模式进行定价;对于公共数据,则需要“结合数据核算成本,参照行政管理类、资源补偿类收费标准和流程,制定本地区、本系统(行业)数据利用收费标准管理办法,原则上对公益性目的数据利用进行成本补偿收费或免费,对经营目的数据利用进行合理收费或市场调节收费”。④黄倩倩、王建冬、陈东等:《超大规模数据要素市场体系下数据价格生成机制研究》,《电子政务》2022年第2期。在分配上也主要根据实现合作的份额约定进行,和既有知识产权使用参与分配的逻辑没有特别不同。由于在交易过程中主要是实现企业一对一合作,双方往往看重的是通过数据搭建产业链的合作前景,这就对交易所的信息能力提出了更高的要求。
在科层—属地式秩序下,数据的生产流动并不快,如果没有很好的经济循环加以带动,数据生产速度和要素生产与交易的速度无法衔接匹配,那么数据流通本身就无法带来额外价值。目前总体而言,这一秩序不太需要持续的供给行为,为经济循环和社会服务带来的价值提升空间有限。“数据二十条”的制度设计可能会帮助盘活一些传统企业,将其运营数据和产品数据进行系统性升级改造入表,传统的地方交易所或行业协会也可以顺势将过去的交易数据或者行业数据进行某种方式的转化和挖掘,从而推动未来的交易。但复杂性在于,地方政府有时以行政指令的方式使用公共数据(如社会信用体系或授权运营),有时又希望推动市场化运作(如建立交易所),如何有效协调这一系统中的不同措施,更好地进行合作,对未来科层—属地式秩序而言是一个挑战。在法律制度设计上,科层—属地式数据秩序的要求相对简单,更需要“数据二十条”带来的数据确权规则,以及对传统企业的数据加强知识产权类保护。
另一个常见的主张是推动公共数据授权运营带动企业数据和社会数据价值的实现,但目前来看仍然难以找到有意义的突破口,较为显著的举措可能是开发部分能源数据帮助中小企业的金融融资。①“数据二十条”要求“鼓励征信机构提供基于企业运营数据等多种数据要素的多样化征信服务,支持实体经济企业特别是中小微企业数字化转型赋能开展信用融资”。如果数商能够成为产业链上的重要一环,形成社会共治体系,就比较有价值。但如前所述,这个过程实际上和数据本身也没有太大关系,更多涉及的是企业业务模式和产品上的合作或者现有产业集群的固化,数据只是这个过程中的副产品,用来打通上下游产业链,也就是在合作谈成后才需要进一步讨论的问题。如何帮助增强企业数据和公共数据的多元性,推动合作的多样化,形成更广泛的关系网络,将是科层—属地式秩序下需要进一步考虑的问题。
本文在生产方式、数据功能和结构性动力三重条件的框架下,着重分析了作为理想类型的网络化数据秩序和科层—属地式数据秩序,前者由平台企业推动,后者由不同层级的地方政府推动,各自要解决的问题并不相同,因此可能需要针对不同生产方式对规则指引进行解读和适用,避免一刀切的分析和实践。简单说来,在网络化数据秩序中,数据由大量消费者行为抽象而成,在平台架构内跨地域流动,依附于其他要素并在统一的数字市场中辅助交易与合作,通过不同类型的商业模式形成更多价值,基本由平台企业主导建设;而在科层—属地式数字秩序中,数据更多由本地企业活动抽象形成,通过交易所进行交易,实现产业链信息化等地方经济价值,由不同层级的地方政府主导建设。一个完整统一的数据秩序应当是在认清两种理想类型基础上进行多维度的融合。本文一再强调,有价值的数据要素不仅是依附性的,更受到要素流动的社会和技术结构的约束。数据本身无法构成有效的价值生产环境,需要和其他市场要素以及既有价值生产的动力结构结合起来理解,脱离了外部结构的抽象分析无助于理解真实世界中的数据要素,除非我们是在谈论虚无缥缈的“元宇宙”。因此,更有意义的研究应着重于观察两类不同的数据要素秩序如何形成,数据要素在整个价值生产过程中所处的位置,由此对数据权属、分配政策、基础设施等衍生问题进行重新解释,展示现实问题的复杂性。
从互联网发展过程来看,网络化数据秩序正依托新型生产方式而不断扩展,将越来越多的生产要素吸纳至平台上流动,从而和传统经济组织与利益群体发生竞争性利益冲突。例如,一个全国性的平台企业将地方劳动力转化为分享经济中的生产要素,会和科层—属地式数据秩序形成竞争;而本地中小企业或劳动者可能主张更强的监管,如提升劳动保护水平、抬高数据要素价格、认定不正当竞争行为等,这对平台企业的统一政策和商业模式就会产生较大影响。
同时也要看到,网络化秩序事实上也难以全面取代科层—属地式秩序。这不仅是因为公共数据本身具有较强的属地性公共服务特性,需要数据运营者将数据价值回馈本地(例如建立具有国资背景的数据集团或成立数据专区,而不是全国性的平台企业),也是因为即使平台企业能够调动特定类型的本地化资源,也需要本地监管部门帮助组织管理。如果没有科层制的维护运行,平台企业本身无法有效对生产资源进行调动,也就无法有效利用其行为数据。从这个意义上说,两种秩序需要相互依存从而逐渐提升各自的能力,并通过基础设施加强联动与合作,任何一种数据秩序都无法单独有效运行。例如,一些平台企业正逐渐加大对实体工业经济的投入,而地方政府市场监管部门也可以帮助加强数据不正当竞争执法,维护平台企业的数据权益;②之前出现的大量数据不正当竞争行为,都主要依靠法院在边际上进行确认,主要适用《反不正当竞争法》第二条原则性条款,但地方市场监管部门则无法得到明确授权执法。2022年《反不正当竞争法(修订草案)》对包括数据不正当竞争在内的诸多新型违法行为都进行了明确规定,该法一旦通过就可以促进行政机关实现更好执法,增强威慑和保护力度。地方政府同样欢迎能够调动本地灵活劳动力的平台企业入驻,以便使税收回馈本地,带动本地企业形成产业链,但这也可能推动平台企业本地化,设立更多分公司,影响既有的平台扁平化结构和商业模式。
两种数据秩序面临的共同问题是确保市场持续向要素开放。在网络化数据秩序中,因为有平台企业生产目标和竞争过程的约束,这一秩序逐渐变得封闭;而科层—属地式数据秩序本身就存在数据无法跨区域连通、仅在辖区内部共享的问题。在这个语境下理解建立国家统一大市场的目标,其实就是要逐渐破除包括数据在内的要素的流动边界,降低流动成本,增加公共数据资源投入和扩大数据基础设施建设。例如,虽然看起来大型平台之上已经形成了超级巨大规模的市场,但相较于平台之间的相互连通而言仍然有限。平台企业本身因内部交易成本问题无法一直无限扩张,需要通过基础设施的互联互通来解决,否则可能会遭遇数字经济发展的瓶颈,这就需要回到数字基础设施设立的初衷即推动更大范围的流动性入手进行政策设计。
最后,本文的研究也可能在一个侧面回应以往关于国家与市场关系的理论讨论。传统上认为,为了使市场能够有效运行,国家应当确立基本要素的权属和交易规则,从而便利财产流转和交易。本文不否认国家继续通过确定数据权属以便利交易的努力,但试图更进一步看到这一努力的局限,即在数字经济生产方式中,单纯的权属本身无法带来稳定预期和收益,有效市场秩序的建立依托于其他更为基础的要素和信息基础设施的确立,国家数据局的组建为此带来了一种可能性。根据2023年《党和国家机构改革方案》,国家数据局负责协调推进数据基础制度建设,统筹数据资源整合共享和开发利用,统筹推进数字中国、数字经济、数字社会规划和建设等。这种统筹规划对于两种生产方式和数据秩序下的数据资源的有序和高效利用具有重要意义。我们寄希望于国家数据局既通过传统科层制方式推动激活各省市数据要素资源,也通过强化数字平台的新型基础设施推动数据要素跨行业和地域流动,由此,一个不断整合平台与地方政府、进行合作型治理的数字市场环境或许终将形成。