数据法人:超级平台数据垄断的治理路径

2022-03-15 03:41:51王延川
国家检察官学院学报 2022年6期

王延川

数据作为生产要素应该广泛开放和共享,为更多的社会公众带来最大化利益,这已经成为国际共识。2014年5月9日,美国发布《美国数据开放行动计划》;欧盟于2020年围绕数据的开放和共享制定《欧洲数据战略》;2020年4月6日,中共中央、国务院印发的《关于构建更加完善的要素市场化配置体制机制的意见》强调数据的开放与共享。以上政策要表达的宗旨 是一致的,即“数据的经济属性表明,数据可以被视为基础设施或基础设施资源……”。〔1〕See OECD,Data-Driven Innovation:Big Data for Growth and Well-Being,2015,https://www.oecd.org/fr/sti/ieconomie/data-driven-innovation.html.但是,由于数据权属尚无完整、通行的定义,数据在法律上未被赋予资产属性,国际社会也未形成共识和规则。这使得数据使用缺乏清晰边界,造成互联网平台企业对数据拥有事实上所有权的现状,并逐渐产生了平台企业对数据的不断汇集甚至垄断,这种现状背离了数据的基础设施定位。

关于平台对用户数据的占有,最让人瞩目的莫过于互联网超级平台。〔2〕国家市场监督管理总局于2021年10月发布的《互联网平台分类分级指南(征求意见稿)》将“超级平台”定义为年活跃用户5亿以上,核心业务涉及两类平台业务,市值(估值)在1万亿元以上,具有超强限制商户接触消费者(用户)的能力的平台。据统计,2020年年活跃用户数超过5亿的平台包括:微信(12.14亿)、支付宝(9.14亿)、淘宝(8.85亿)、QQ(8.17亿)、拼多多(7.54亿)、高德地图(7.22亿)、抖音(6.98亿)、百度地图(6.05亿)、腾讯视频(6亿)、爱奇艺(5.9亿)、QQ浏览器(5.44亿)、微博(5.24亿)、美团(5.13亿)、百度(5.12亿)、京东(5.06亿)、优酷视频(5.05亿),这表示上述平台均属于超级平台。从重要性上看,数据不仅是这些超级平台在资本市场上的核心资本,也是它们通过投资掌控更多资源的媒介。从总量上看,部分超级平台不仅在资本能量方面能与一座一线城市比肩,其对数据资源的收割及聚集,更是深刻影响并重塑公众的工作与日常生活。国家之所以有意对平台分类,其原因在于各种平台的规模、社会影响力和控制力差异很大,超级平台是其中治理的重点。通过治理超级平台,促使其引领公平竞争的主要责任,进而在平台经济领域构建合理竞争秩序和开放平台生态。

一、超级平台数据垄断与市场垄断

(一)数据垄断的成因

1.经济成因

关于实践中是否存在数据垄断,存在两种不同的说法。持肯定说者认为,数据是平台市场力量的重要来源,平台可以运用大数据排除和限制市场竞争。〔3〕See Daniel L. Rubinfeld & Michal S. Gal,Access Barriers to Big Data,Arizona Law Review,Vol.59,p.339 (2017).持否定说者认为,由于大数据市场的进入壁垒很低,大数据市场并不存在垄断问题。〔4〕See Joe Kennedy,The Myth of Data Monopoly:Why Antitrust Concerns About Data Are Overblown,http://www2.itif.org/2017-data-competition.pdf.持否定说者进一步认为,一方面,数据具有可复制性,而且复制不影响数据的价值,另一方面,数据不具有独占性特点,〔5〕“作为无形物的数据,不可能被某一特定主体独占,具有非独占性或共享性的特点。”程啸:《论大数据时代的个人数据权利》,《中国社会科学》2018年第3期。超级平台虽然可以垄断数据,但别的平台依然可以收集数据,理论上可以和超级平台收集一样多的数据,所以数据竞争是充分的,不存在所谓的数据垄断。〔6〕See Anja Lambrecht & Catherine Tucker,Can Big Data Protect a Firm from Competition,2015,https://ssrn.com/abstract=2705530.Joe Kennedy,The Myth of Data Monopoly:Why Antitrust Concerns about Data are Overblown,2017,http://www2. itif.org/2017-data-competition.pdf.另外,数据市场准入门槛并不高,即使所有数据都被一个人占用,也总会有足够多的数据供其他人使用。

虽然数据存在可复制性,但是,经营者在收集数据方面存在技术上的困境:其一,在市场中可能存在着各式各样的壁垒,使经营者对大量数据的收集、整理存在困难,从而影响其对数据的复制。其二,网络效应的存在也使得某些数据并不能轻易获得。其三,数据会受到知识产权法的保护,此时其他平台不得对具有一定独创性的数据进行复制,这些数据具有不可复制性。〔7〕参见李兆阳:《从数据垄断走向数据开放:数据成为关键设施的竞争法分析》,《重庆大学学报》(社会科学版)2021年第4期。

虽然数据不具有独占性,但是收集数据具有很高的成本。建立数据获取系统的前期成本很高。在 TomTom 收购 Tele Atlas 案中,欧盟委员会认为:“虽然可以通过收集各种公共数据,相对迅速且以有限的费用为许多地区编制基本的数字地图数据库,但编制一个可导航的数字地图数据库的费用高昂且资源密集。”〔8〕See TomTom/ Tele Atlas(Case No Comp/ M.4854),Commission Decision of 14/05/2008,C(2008) 1859.经营者收集数据的成本有两个部分:第一,新进入者为了获得数据需要搭建一个为用户提供免费或低收费服务的平台,以吸引大量的用户,这需要在服务器、人力资源、宣传推广以及维持平台运行等方面进行大量投资。第二,新进入者需要在数据收集、存储、分析、使用以及开发算法、建设数据中心等方面进行高额投入。〔9〕参见殷继国:《大数据市场反垄断规制的理论逻辑与基本路径》,《政治与法律》2019年第10期。与此同时,这种企业重复收集数据的行为会造成资源浪费,不值得提倡。

2.制度成因:事实权利

数据垄断是一个资源配置不均衡问题,对此问题,源头上的解决方法是明晰数据的产权。

目前,学者们普遍认为不应该为数据确权。〔10〕See Elettra Bietti,Locked-in Data Production: User Dignity and Capture in the Platform Economy,2019,https://ssrn.com/abstract=3469819.有学者指出,私法上为数据确权面临理论和操作困难,而现有法律和技术条件下已形成的数据控制足够支持利用和交易秩序,额外确认私权不利于数据分享。参见梅夏英:《数据的法律属性及其民法定位》,《中国社会科学》2016年第9期。原因在于:其一,某一具体用户很难拥有汇集数据的所有权,当然他也不能对自己的个体信息拥有财产权,因为数据只有汇集在一起才有价值,不能私自剥离。其二,数据开发后,其权属在用户和平台之间会产生争议。因为此时不再是个人信息,而是在此基础上产生新的形态,这种不确定状态的确认会耗费高昂的司法成本。其三,关于数据问题实践中尚未出现系统性的法律缺陷,为了解决特定问题而引入数据权属没有必要,引入数据权属反而可能造成许多无法预见的新问题,尤其会增加法律的不确定性。〔11〕See F. Thouvenin,R. H. Weber & Alfred Früh,Data Ownership:Taking Stock and Mapping the Issues,in Matthias Dehmer & Frank Emmert-Streib eds.,Frontiers in Data Science,CRC Press,2017,p.111-146其四,为数据确权不能促进更好的隐私政策或更多的创新或技术进步,却有可能扼杀言论自由、信息自由、科学和技术进步。给数据确权有违数据性质,因为数据可以被多次复制而不损害其价值,数据只有被更多的人使用才可以实现价值最大化。

对数据不予确权意味着平台在事实上获得了其收集数据的所有权。〔12〕譬如,有学者认为,除了公共领域的数据之外,企业拥有的数据可以明确属于公司。参见曲创:《数据垄断的伪命题和真问题》,《科技日报》2019年8月21日。超级平台经营者认为,用户原生数据是在他们提供的技术服务支持下产生的。个人自愿或非自愿提供的大多数在线数据是通过浏览器输入到平台的专有域系统中,由域所有者通过人为或机器干预进行处理,并且输入的数据和处理产生的任何输出都是存储在平台的服务器上,因此,平台拥有自身研发的互联网技术记录下来的数据产权。这也符合一般的法律原理,即先占即所有。平台对于数据而言构成一种排他性控制,表现为私人基于事实上拥有数据以及通过技术措施限制和控制其他人访问的能力。〔13〕“数据并不是纯粹的公共物品,因为个人或公司可以排除数据的使用,对公司特别相关的数据,由收集数据的公司独家控制。”See Nils-Peter Schepp&Achim Wambach,On Big Data and Its Relevance for Market Power Assessment,Journal of European Competition Law & Practice,Vol.7 :1,p.11 (2016).

这种认识的问题在于:第一,不予确权的结果是数据成为“无主”财产,更易遭受侵害,而且侵害的救济无法在法律上操作。第二,数据缺乏权属助长了平台企业违规违法使用个人敏感数据,数据泄露情况也层出不穷,导致侵犯用户个人隐私的巨大风险和社会隐患。第三,数据事实上的所有权掩盖了数据生产环境固有的合作维度,这是一种短视的逻辑,意味着要接受私人对作为公共资源的数据的占有。

(二)数据垄断的竞争优势

有人认为,数据本身并不稀缺,单纯依赖数据,很难形成明显的竞争优势。〔14〕See A. Lambrecht & C. Tucker,The Negative Effect of Tensile Promotions in Digital Marketing Communications,Social Science Electronic Publishing,2016.有人持一种折衷思维,认为经营者持有大量数据并不必然导致对数据驱动型业态竞争的限制,并不等同于排除竞争行为的发生,但这并不意味数据垄断的潜在风险和威胁在实践中不存在。〔15〕参见陈兵:《“数据垄断”:从表象到本相》,《社会科学辑刊》2021年第2期。的确,数据规模庞大与平台企业滥用市场支配力量不能画等号。〔16〕See Joe Kennedy,The Myth of Data Monopoly:Why Antitrust Concerns about Data Are Overblown,Information Technology & Innovation Foundation,2017,http://www2.itif.org/2017-data-competition.pdf.因为数据的拥有是一个客观的静止状态,而法律上的垄断是一种行为状态,二者之间不存在绝对必然的联系。但是,实践中超级平台的数据垄断具有外部性,其与市场垄断交织在一起互相影响。譬如,数据可以帮助平台提高生产和服务质量,以争取更多的客户资源,从而获得更多的广告收益,这些收益又被拿来提高平台的生产和服务质量,并争取更多的客户,这些客户又意味着更多和更好的数据。这就形成了数据和竞争力之间的“良性循环”。

数据的特殊性使数据垄断相较于传统垄断,市场集中度更高、对公共秩序和社会福利的破坏性更强。〔17〕参见孙方江:《数据垄断视角下金融业和互联网平台的共生发展问题研究》,《金融科技》2021年第3期。See Maurice E. Stucke,Here Are All the Reasons It’s a Bad Idea to Let a Few Tech Companies Monopolize Our Data,2018,https:/ /hbr.org/2018/03/here-are-all-the- reasons-its-a-bad-idea-tolet-a-few-tech-companies-monopolize-our-data.数据垄断会让超级平台垄断“如虎添翼”,但一个超级平台即使没有形成垄断,其数据垄断本身也会给市场造成很大的负面影响,有学者称此影响为对市场的结构性破坏。〔18〕这种结构性破坏主要表现为:超级平台数据垄断破坏了公平的市场竞争环境,构成竞争对手进入相关市场的数据壁垒,遏制了市场创新的活力,对数字经济的信任基础造成威胁。 参见付新华:《论超级平台数据垄断的法律规制》,《学习与探索》2022年第2期。

超级平台数据垄断会引发市场的结构性问题,助推市场垄断等破坏市场秩序结果的发生:

第一,通过数据优势设置壁垒并排除和限制竞争,并打压科技创新。数据作为生产要素被垄断,即少数生产者控制相关市场的数据要素,〔19〕2019年统计资料显示,前10%的数据收集者均收集了不少于97%的权限数据,在工具类、社交类和游戏类领域,前1%的数据收集者收集了约95%的权限数据。参见孟小峰:《破解数据垄断的几种治理模式研究》,《人民论坛》2020年8月25日。其他生产者要获得可以转化为生产要素的数据,一方面需要向数据垄断者申请,但这种办法的协商成本很大,另一方面自己从用户处重新获得数据,但这样会造成不必要的社会资源浪费。因此,数据要素进入和退出市场存在一定的壁垒。〔20〕同前注[17],孙方江文。数据不仅可以作为平台的一种竞争优势,还可能形成相关市场的进入壁垒。〔21〕参见孙晋、钟原:《大数据时代下数据构成必要设施的反垄断法分析》,《电子知识产权》2018年第5期。多边平台的特征增加了成功平台在市场上占据主导地位的可能性。由于平台提供商向用户和广告商提供的服务质量在很大程度上取决于所收集数据的性质和数量,因此数据的回报越来越高,这可能会给希望进入市场的企业带来进入壁垒。目前,少数超级平台打造数据收集中心,通过集中策略(合并、控股或签订协议)实现数据的跨行业横向集中,形成数据寡头,设立进入行业市场的极高数据壁垒。数据垄断成为超级平台打压中小型企业的利器。小企业无法取得数据,难以开发更具价值的大数据和算法技术,自主创新能力大大降低,导致市场中颠覆性创新产品越来越难以问世。这种数据共享和管控对数字经济的全面发展和创新迭代产生了一种扼杀效应,阻碍市场良性竞争,侵害消费者权益,亟待改变。

第二,超级平台的“数据共享”是增强其市场竞争力的重要手段。近年来,部分超级平台的覆盖范围逐渐超出金融领域,并在产业链和供应链方面加紧布局,通过数据控制为主线的资本扩张和标准管控等全方位措施实施整体控制,建立新的数字化垄断生态,对行业健康发展带来重大隐患。超级平台通过业务扩张、资本运作和并购等方式完成企业扩张,导致其具有多产品、跨领域的商业特点,并据此吸引或维系海量用户,从而具有极强的数据收集能力,形成数据垄断。〔22〕同前注[19]。现有超级平台的发展中,一方面通过覆盖互联网全产业链的投资布局,将用户数据资源引入其体系内的创业公司,以在市场获得高额回报。超级平台与关联企业间的数据共享,形成了数据垄断,严重影响个人信息保护和产业发展甚至国家安全。另一方面通过并购或者投资新设主体,攫取和聚合平台原有的数据资源,不断扩张平台的数据集。〔23〕德国垄断委员会2015年和2017年发布的竞争报告中指出,以数据集中为目的的收购会给收购方在未来竞争中带来很大的优势,因为他们长时间掌握和分析包括用户偏好、消费习惯在内的大数据,还可以将这个优势扩展至收购方非核心业务的其他数字市场。See Monopolkomission,Competition Policy:the Challenge of Digital Markets,Special Report,Vol.68,p.111 (2015).Facebook收购WhatsApp之所以支付190亿美元,正是因为后者已经拥有了巨大的客户和数据资源以及高新技术。我国携程收购艺龙案和滴滴收购优步中国是数据市场的典型垄断案例,收购让平台逐渐成为数据寡头,遏制了该行业内的竞争秩序。

第三,超级平台利用数据垄断助推其资本无序扩张。2020年12月14日国家市场监管总局以涉嫌违反“经营者集中”为由对阿里、腾讯、顺丰三家平台企业开具反垄断罚单。这是政府首次针对平台企业资本无序扩张所做出的回应。超级平台之所以能够通过大肆收购和投资随意进入其他经济领域,根本原因还是数据垄断。借助于数据垄断,平台资本在新的经济领域产生了新的垄断,损害这些领域中企业的利益。学者研究了互联网平台进入金融业可能产生的风险,认为数据垄断将放大资本无序扩张的风险,并发展成为系统性风险的源头。〔24〕同前注[17],孙方江文。更重要的是,平台企业依靠数据垄断对社区团购等领域小企业主和小商贩产生利益挤压,导致贫富分化现象加剧,长期来看会损害消费者利益,最终阻碍经济发展。

二、超级平台数据垄断的反垄断法治理路径检视

(一)反垄断措施

1.“必要设施”规则的应用

占主导地位的超级平台可能会通过提高进入大量用户数据的门槛来阻止竞争。这必然会给竞争对手和新进入者带来访问问题,因为他们需要访问由主导平台收集的数据,以提供竞争或互补的服务。〔25〕Inge Graef,Assessing Data Access Issues In Online Platforms,2015,https://papers.ssrn.com/sol3/papers.cfm?abstract_id=2647309.这就涉及“必要设施(Essential Facilities)”规则。如果一个处于上游市场的经营者控制了下游市场生产经营无法复制且“必要的”设施时,为了消除限制竞争的效果,其有义务让下游市场的生产经营者以合理的条件使用该“必要设施”。〔26〕See S.W. Waller & W. Tasch,Harmonizing Essential Facilities,Antitrust Law Journal,Vol.76:3,p.741-742 (2010). 有学者认为“必要设施”规则使用的场景并非直接竞争,而是间接竞争。譬如,在People Browsr诉Twitter案中,原告起诉被告,要求获得被告的基础数据,其中Twitter公司属于数据收集市场,而 People Browsr是数据分析市场,前者处于上游市场,而后者位于下游,但位于下游的数据分析以上游的数据收集为前提和基础。

占主导地位的超级平台拒绝提供用户数据的访问权限,可能构成拒绝交易,并导致所谓的“必要设施”下的责任。〔27〕尽管美国最高法院和欧洲法院从未正式承认“必要设施”规则的存在,但两家法院都明确表示,在某些情况下拒绝提供必要设施会导致反垄断责任。See D. Geradin,Limiting the Scope of Article 82 EC:What Can the EU Learn from the U.S. Supreme Court’s Judgment in Trinko in the Wake of Microsoft,IMS,and Deutsche Telekom?,Common Market Law Review,Vol.41:6,p.1525-1526 (2004).美国《谢尔曼法》第2条〔28〕See United States V. Terminal Railroad Association of St. Louis,224 U.S. 383(1912).和《欧洲联盟运作条约》(TFEU)第102条都有相关规定,但二者却沿着不同的路线发展。美国最高法院在Trinko判决中极大限制了该原则的适用范围,〔29〕See Verizon Communications v. Law Offices of Curtis V. Trinko,LLP(Trinko),540 U.S. 398(2004).而欧盟委员会和欧洲法院似乎赞成更广泛的解释。这种分歧导致两个司法管辖区之间在在线平台上访问数据的执法方面存在差异。

但是,关于数据垄断问题的解决,实践中很少应用“必要设施”规则。〔30〕譬如在美国的案例中,LinkedIn拒绝数据交易的决定,轻而易举地就可以起到在下游职业数据分析市场排除HIQ的竞争,因此,法院支持了HIQ的请求,要求LinkedIn不得阻止HIQ抓取数据,但却没有对数据是否构成必要设施展开分析。See Case No. 3:17-cv-03301-HiQ Labs v.LinkedIn( N. D. Cal.) [Z]. 2017.一方面,“当数据驱动型企业为了收集、存储和分析数据付出了巨大的成本,它们可能有强烈的动机限制竞争对手访问和获取这些数据集,阻止其他企业共享数据集。”〔31〕See Allen P. Grunes & Maurice E. Stucke,No Mistake About it:The Important Role of Antitrust in the Era of Big Data,2015,https://papers.ssrn.com/sol3/results.cfm.另一方面,“必要设施”规则的适用需要严格的条件,申请企业很难举证证明这一点,〔32〕构成“必要设施”的四个条件分别为对于竞争不可或缺、设施的不可复制性、拒绝开放没有正当理由和数据开放的可行性。同前注[21]。这四个条件的满足都存在一定的难度。以“对于竞争不可或缺”条件为例。在Bronner案中,欧洲法院针对案件争议的“送报上门”服务是否为“必要设施”指出,只有当没有替代的产品或服务,而且由于技术、法律或经济的障碍使任何企业都难以在下游市场中开展运营活动时。才可认定该产品或服务“对于竞争不可或缺”。由于“送报上门”有其他可替代性方法如“岗亭售报”,而且重新开辟“送报上门”也不存在技术、法律或经济的障碍,因此原告诉讼不能成立。ECJ Bronner C-7/9,judgement of 26.11.1998, Para 44-45.数据通常具有较强的可替代性。当甲企业认为乙企业占有的数据是其营业不可或缺的基础,而向法院主张该数据为“必要设施”时,按照Bronner案的精神,法官可能不会支持其诉请,因为甲企业可以在市场上找到替代性数据。从普遍的角度来看,没有任何资源是必需的,只有当一个设施用于提供某种特定的产品或服务时,才是必不可少的。因此,从欧盟的司法事件来看,“必要设施”申请胜诉案例极少。〔33〕根据欧洲法院的判例,仅在个别案件中有强制权利人与竞争对手分享必需设施的要求,因为一个具有支配地位的企业无义务促进竞争对手的业务发展。

正因上述争议,关于将数据纳入“必要设施”立法,有学者同意,〔34〕同前注[21]。 See Zachary Abrahamson,Essential Data,Yale Law Journal,Vol.124:3,p.867 (2014).有学者反对。〔35〕参见王健、吴宗泽:《论数据作为反垄断法中的必要设施》,《法治研究》2021年第2期。See Giuseppe Colangelo & Mariateresa Maggiolino,Big Data as Misleading Facilities,European Competition Journal,Vol.13:2,p.249 (2017).反对的原因有二:一是国际上具有代表性的法域即欧盟和美国对此做法均抱有谨慎的态度,二是认定数据是否构成必要设施在界定数据相关市场、认定数据市场支配地位以及实现数据开放等方面均存在现实困境。〔36〕数据作为必要设施并成为反垄断规制的对象须满足以下几个条件:第一,企业拥有排他的数据控制权和数据优势;第二,数据拥有者通过拒绝使用设置市场进入壁垒;第三,必要设施规则仅适用于下游的间接竞争。同前注[21]。

2.平台并购审查

超级平台可以通过并购这种合同策略加强数据集中,强化其市场主导地位。针对该情形应该建立平台合并时的数据集中审查制度,加强其中数据垄断风险的评估和监测。目前针对超级平台数据垄断的法律规制,主要集中在并购审查方面。在欧盟,为了防止数据垄断,在平台合并时附加反垄断条件,如允许别的平台无条件使用合并平台的数据,同时对于并购后市场份额达到一定标准的要进行干预。具体而言,欧盟的反垄断机构将并购可能产生的数据垄断情形归纳为两种:一是基于并购的企业数据合并会增强平台的市场力量,或者会强化实际或潜在竞争对手进入市场的障碍。二是合并前两家企业所控制的数据相互竞争,合并会消除这种竞争。〔37〕See European Commission,Case M.8124-Microsoft /LinkedIn,para.179.另外,美国FTC在审査Google收购Doubleclick,欧盟在审査Microsoft收购Linkedln时,均考虑到了消费者的隐私问题。隐私问题也涉及反垄断问题。譬如,在滥用市场支配地位的反垄断审查中,企业降低隐私保护的行为被视为滥用市场支配的行为。实践中,应该制定相关的法律以明确超级平台并购的条件、并购双方的权利义务、并购程序、并购管理和法律责任,同时对产权交易进行规定,明确产权交易的对象、原则、管理机构、运作程序、资产评估程序和标准等。通过这样的立法对超级平台的并购合同行为加强监管。但是,这种办法只具有形式意义,一方面平台可以针对法律法规而制定规避策略,如分开几次合并,或者通过控股关系实现数据共享,另一方面即使被审查依然不能解决平台数据开放和共享的问题。

3.加大对数据垄断违法使用和平台资本无序扩张的执法力度

实践中,针对平台依靠数据垄断而实施的资本无序扩张行为,亟需以前瞻视角加强执法力度,加快相关立法和修订进程,更好发挥行政执法、司法、立法的引领作用,以推动数字经济的健康快速发展。

第一,加大对数据使用范围的监管。监管机构执法重点要逐渐从当前的个人信息收集审查,扩展到超级平台关联企业间数据共享带来的风险和危害评估。限制超级平台及其关联企业间的数据聚合行为,保障消费者权益,扫除信息泄露风险。对当前的数据垄断行为进行安全审查和执法监督,将“数据黑洞”扼杀在萌芽阶段。

第二,在超级平台资本无序扩张方面,市场监督管理部门应该严密关注超级平台在其他领域的收购和投资行为,要求其履行申报程序。下调平台在其他领域的投资比例。我国目前超级平台实际投资比例高于国家要求比例的处罚金额太低,过低的违法成本不足以遏制平台资本无序扩张,建议通过修改法律提高处罚金额。

第三,当前亟需加快形成治理数据霸权的典型案例。对少数超级平台以资本扩张形成市场垄断、以不正当手段获取用户隐私数据、操控舆论等行为启动重点调查,形成典型案例,促进互联网行业的健康持续发展。

但是,这种办法基本上属于事后救济,不能从根本上解决数据垄断问题,尤其不能解决平台数据开放和共享的问题。此外,不解决权属问题,那么事实上控制数据的超级平台总可以利用这些数据为自己的利益服务,损害消费者利益和市场公平竞争,因此,数据权属依然是解决问题的重要前提。

4.由国家推动建立数据流转平台与共享平台

随着近年来联邦计算、区块链等数据安全利用技术的发展,技术上已可以实现在脱敏和保护个人信息且不进行数据聚合的前提下保障技术开发与业务运营。有人建议由国家主导打造这样的数据共享平台,〔38〕为促进数据开放和共享的平台主要分为三种:第一,数据包交易为主的政府类数据交易所,如贵州大数据交易所、上海数据交易中心、长江大数据交易中心等,以及以 API 接口模式为主的民营平台,如聚合数据、京东万象、数据堂等。第二,为企业或个人提供有偿的数据供应及下载途径的数据众包平台,如百度数据众包、有道众包、蚂蚁众包等平台。第三,直接共享和数据间接共享的数据共享平台,直接平台是指推动公共部门之间不对称信息的流通和企业之间数据的合理共享,如因果数据信托试验点。间接平台是指支持对本地数据训练得到的模型参数进行共享,而后由多方参与者共同训练效果较强的机器学习模型,如微众联邦学习项目与华为NAIE 联邦学习平台。同前注[19]。为中小创业者的研发提供数据保障。

第一,推动超级平台建立公共数据流转平台。针对超级平台的数据封闭措施,在电子支付、快递物流、互联网医药等领域搭建一套基于公平、公正的数据处理平台,市场上参与竞争的主体均有权接入,为超级平台上的用户提供支付、物流、服务、互联网医药等服务。

第二,打造公共数据共享平台。数据资源是平台经济发展的生命线。创业科技企业之所以选择依附超级平台,是因为随着数据安全和个人信息立法的趋严,可用于研发的公开数据越来越少。公共数据共享平台有利于激发各类企业的创新创造活力。

但是,数据的非竞争性和非排他性特征使得建立数据共享市场的成本非常高,因为数据的原始控制者在数据售出之后,很难控制其被再次出售。〔39〕参见李勇坚:《互联网平台数据垄断:理论分歧、治理实践及政策建议》,《人民智库》2021年12月24日。另外,这些共享平台上的企业参与度较差,现实的交易量极小,可谓初衷甚好,实际效果却不容乐观。

5.其他措施

在欧盟,消费者具有可携带权,以此推进所谓的数据共享,〔40〕同前注[39]。因为数据携带权有助于消解数据的实然排他性、降低数据市场进入壁垒、削弱用户锁定效应和催生互利共赢理念,因而能够在一定程度上起到抑制数据垄断的作用。但也有学者认为,数据携带权可能会加重新进经营者的经济负担、导致新进经营者的数据流失和加剧个人数据的泄露风险,从而致使数据垄断愈演愈烈。〔41〕参见李伯轩:《数据携带权的反垄断效用:机理、反思与策略》,《社会科学》2021年第12期。同时,经营者要和众多的消费者进行谈判,也会存在所谓的集体行动困境问题。

针对数据垄断带来的危害,还有一些应对策略。〔42〕同前注[19]。譬如,通过隐私权保护弱化平台对数据的控制,但是这种模式只是对数据垄断进行缓解而非根除,并且需要权衡好数据治理与产业输出之间的关系。再譬如,对数据产生、流通和使用的整个生命周期进行监管,弱化数据寡头对数据的掌控权,增强数据生成者(即用户)和数据监管者对数据的控制权,但是这种模式成本较高,且实际应用并不成熟。

(二)对反垄断路径的反思

关于数据垄断的主要危害,多被定义为破坏竞争秩序,因此,治理的方法是依靠反垄断法推进数据开放。〔43〕同前注[7]。学者认为对大数据卡特尔、数据优势公司滥用优势地位行为可以通过反垄断进行有效规制,〔44〕See D. D. Sokol & R. E.Comerford,Antitrust and Regulating Big Data,Social Science Electronic Publishing,Vol.23,p.1129-1162 (2016).或认为现有的反垄断法完全可以解决数据竞争问题。〔45〕See Ben Holles De Peyer,EU Merger Control and Big Data,Journal of Competition Law & Economics,Vol.13:4,p.767-790 (2017).但是,也有学者认为,通过反垄断视角来解决数据问题,可能会威胁到新产品和服务的创新。〔46〕See M. K. Ohlhausen & A. P. Okuliar,Competition,Consumer Protection and the Right Approach to Privacy,2015,https://papers.ssrn.com/sol3/papers.cfm?abstract_id=2561563.

数据竞争的独特性质使得传统基于价格理论的反垄断法架构难以对超级平台数据垄断进行有效因应。〔47〕参见袁昊:《新兴权利视域下互联网平台数据垄断的法律规制》,《西北民族大学学报》(哲学社会科学版)2020年第5期。竞争案例分析需要大量资源,事实复杂所以审核速度很慢,而且具有很大程度上的法律不确定性。此外,科技公司要求访问超级平台的数据库,以便在人工智能领域进行竞争和创新,这个目标就无法通过反垄断法来完成。

数据垄断不仅推动了市场垄断,还造成了其他的社会问题,如隐私保护和数据安全等问题。所以,不能仅仅用反垄断法来解决数据垄断问题。如果仅从反垄断法角度看待数据垄断问题,并没有将数据垄断提高到战略高度,这和数据的生产要素地位是不匹配的。因此,关于数据垄断,应该超越它对市场垄断的影响,从更高站位去理解,并采取相应的治理措施。

笔者认为,针对数据垄断,反垄断法介入的结果是超级平台维持数据垄断的现状,或者在个别利害相关企业之间对数据的共同使用,这是对数据垄断问题的局部解决,并非长远和根本的解决之法。超级平台的数据垄断应该作为一个全新的问题得到重视。关于数据垄断的主要治理方法,无论是“必要设施”还是合并审查制度,要么效果甚微,要么效率不高,究其原因是没有解决数据的权属问题。破解数据垄断最为有效的方法是对数据的权属进行界定,同时引入国家治理,这是一切涉及数据问题破解的逻辑基础。如果数据权属没有界定,所有的办法均为无源之水和无根之木。

三、超级平台数据垄断治理的优化:数据法人制度

(一)数据确权的探索:个人权利路径的弊端

超级平台事实上控制数据存在正当性的质疑。虽然超级平台为了收集和处理数据付出了成本,但不能依此认为其具有对数据的控制权。而且超级平台为了自身利益考量,不愿意与别的企业或者政府共享数据,使得数据价值无法得到最大化利用。为了将数据归属的正当性与数据的开放和共享统一起来,有必要为数据确立权属,并将该权属作为数据开放和共享的依据。对此,许多学者设计出各种方案,但这些方案在一定程度上反而造就了数据的排他性,使得数据开放和共享这一理念无法落实,违背了数据作为基础设施资源的定位。

国内学者在数据确权方面提出了各种主张。有人认为数据权利是多种权利的综合:譬如,数据权利是具有财产权、人格权和国家主权属性的新型民事权利。〔48〕参见李爱君:《数据权利属性与法律特征》,《东方法学》2018年第3期。有人认为,企业数据财产权保护需要兼顾多种功能、多种利益,需要设计一种具有极强外部协同性的复杂财产权。〔49〕参见龙卫球:《再论企业数据保护的财产权化路径》,《东方法学》2018年第3期。有人认为,个人数据财产化的私益结构分为支配性权能和排他性权能,支配性权能有个人数据的占有权、个人数据的使用权、个人数据的收益权以及个人数据的处分权。〔50〕参见汪厚冬:《个人数据财产权化的进路研究》,《行政法学研究》2021年第6期。有人认为数据财产权是一种新型的无体财产权,其权利人对特定数据享有直接支配和相对排他的权利。〔51〕参见钱子瑜:《论数据财产权的构建》,《法学家》2021年第6期。有人根据不同主体对数据形成的贡献来源和程度的不同,设定了数据原发者拥有数据所有权与数据处理者拥有数据用益权的二元权利结构。〔52〕参见申卫星:《论数据用益权》,《中国社会科学》2020年第11期。

上述观点中,无论将数据认定为多重权利或者特殊的单独权利,本质上都在确立数据的个人权利,或者称为准所有权。这些权利都建立在民法的基础之上,是经典民事权利的变种。民事权利的实质是赋予权利人以某种排他性权利,或者产生与平台对抗性的权利。但是,这种处理存在很大的问题:第一,超级平台非但无法得到数据带来的利益,而且还会失去收集和处理数据的动力。第二,当不同的个人数据混在一起时,哪些数据属于何人并不清楚,让一个人拥有所有权可能会削弱其他人的权利,或者至少可能会有不同的人同时对同一数据提出索赔。第三,他人要使用所有物需要取得所有权人的同意,数据“所有权人”并非单独个人,而是群体,因为只有大数据才具有权益,而要取得大多数人的同意存在一定的难度,而且会出现隐私权暴露的问题。因此,自上而下的所有权或其他财产权属模式并不适合作为数据资源的制度性界权方案。〔53〕参见戴昕:《数据界权的关系进路》,《中外法学》2021年第6期。第四,数据权能在不同利害相关人之间分割是未来数据应有的产权结构,但是不能在权能分离设计中产生相互排斥的权能,给数据的整体使用造成制度上的障碍。譬如,有学者认为,以数据的不同属性为依据,构建所有权、使用权、管理权、平台权等多权分离的产权配置模型。〔54〕参见李晓东:《数据的产权配置与实现路径》,《人民论坛》2022年1月24日。依照此理论,数据权能的完整性遭到破坏,使得数据的利益变得支离破碎,难以实现。

(二)数据法人与数据开放和共享机制构建

2022年6月22日中央全面深化改革委员会第二十六次会议召开,会议审议通过了《关于构建数据基础制度更好发挥数据要素作用的意见》。其中指出,要建立数据产权制度,推进公共数据、企业数据、个人数据分类分级确权授权使用,建立数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制,健全数据要素权益保护制度。

首先,将数据认定为新型生产要素。对数据权属进行界定的理由是,只有通过赋予个人对其数据的财产权,才能实现数据经济利益的最公平分配。但是,就法律而言,由于数据不是石油,不属于“物”的范畴,因此根据现行物权法理,个人不能在法律意义上“拥有”数据,〔55〕See Wir brauchen ein Datengesetz in Deutschland,Strategiepapier Digitale Souveraenitaet,Bundesministerium Für Verkehr und Diditale Infrastruktur,http://www.bmvi.de/SharedDocs/DE/Artikel/DG/datengesetz.html.从大陆法系物权法体系的角度出发,数据所有权这一提法并不成立。〔56〕See Guest Commentary Thomas de Der Tagesspiegel http://www.tagesspiegel.de/politik/data-debatesdatenschutz-ist-kein-selbstzweck/ 19391956.html.而无论是平台还是用户对数据享有个人权利,都会给数据的开放和共享带来阻碍。新问题需要新的范式,个人权利思维是近代以来的个人保护主义思路,并不适合于数据这种新生事物,对于数据问题的解决,需要探索新的思路。

数据分配的核心思想不是为某个人或者企业服务,而是实现数据的开放与共享。超级平台垄断数据资源不仅破坏了公平的市场竞争环境,而且打破了数据共享的整体格局,阻碍了数据公共价值的实现。〔57〕同前注[18]。针对数据垄断,最根本的解决办法并非仅仅制止垄断,让超级平台守住固有的数据规模不得扩张,或者在特定情形下允许企业对超级平台的数据进行使用,而是让超级平台事实上拥有的数据能为更多的人所利用,产生更大的价值。这一方面源于数据的特性,因为数据可以被反复使用却不会损耗其价值,另一方面源于数字经济的要求,因为数字经济就是共享经济。

其次,应该建立数据产权。数据的形成太过于复杂,从现象上来看很难得出它属于谁这个简单答案。但是作为重要财产,必须要对其进行利益分配,为此应该进行价值判断,其要有利于公共利益而非个人利益。因为,只有将数据定位为公共产品,才符合它作为生产要素的性质。数据属于基础设施或者基础设施资源,这个定性表明数据是数字经济的基本生产资料,相当于工业时代的铁路和公路一样。正像铁路和公路能为所有人利用一样,数据也应该为每个人所使用,而非为超级大企业所独享。

数据的自由流动和排他性控制之间存在着某种权衡。一方面,数据是许多经济活动开展的重要投入,开放数据的获取将降低企业进入相关市场的壁垒,可以促进相邻和新兴市场的竞争和创新。另一方面,对数据的独家控制有助于其货币化,从而激励数据的收集和处理。控制方法会承受数据使用效率低下的风险,但激进的“开放获取”方法可能导致“公地悲剧”,导致对数据创建的进一步投资降低。如何实现两种利益的平衡,需要在实践中创设自我产权的概念。具体而言,既然数据不能为平台或者用户所拥有,数据就应该留给公共领域,根据罗马法,此概念为“公共物品(res comis)”。这样界定可以更好地实现数据的开放和共享。将数据视为由一群人和利益相关者共同生产和共同拥有的资产,并将其理解为产生个人和平台共同要求的利润和决策,可能会符合市场需求。〔58〕Bietti,Locked-in.

最后,应该建立产权分置体制。笔者认为可以构建数据法人制度,用来诠释超级平台数据的产权分置体制,实现数据的开放与共享。

第一,以数据内容的产生方式为标准,可以将数据区分为原生数据和衍生数据。原生数据是不依赖于现有数据而产生的数据,是最初的、尚未开发的数据,主要包括网络用户自愿提交的数据(自愿数据) 和在网络上留下的痕迹数据(观测数据),其中痕迹数据如用户发表的评论数据、用户的行踪记录数据。衍生数据是原生数据被记录、存储后,经过算法加工、计算、聚合而成的系统的、可读取、有使用价值的数据。在数据的产生过程中,用户贡献了原生数据,超级平台对该数据进行加工形成了有价值的衍生数据集,并在衍生数据基础上开发出了算法。超级平台应该贡献原生数据,交由政府机构管理,贡献之后就不得继续占有原生数据。由于原生数据是带有个人敏感性信息的数据,政府机构在获得这些信息后应该进行脱敏处理。超级平台为了合法和高效使用数据,不仅要对原生数据经过脱敏技术等多种技术处理,而且要在衍生数据基础上形成自己的算法。因为原生数据归国家机构管理,超级平台不得占有原生数据,超级平台需要深度开发出与原生数据有所区别的衍生数据,或者开发算法,这种设计调动了超级平台创新的动力。

第二,我国颁布的《关于构建数据基础制度更好发挥数据要素作用的意见》中指出,“要完善数据要素市场化配置机制,更好发挥政府在数据要素收益分配中的引导调节作用,建立体现效率、促进公平的数据要素收益分配制度。”为了保证国家行使数据许可的权利,应该由特定的政府机构设立平台数据池,充当数据管理人。超级平台要定期申报自己收集的原生数据状况,并按照一定的分类〔59〕譬如,可以将数据划分为网络销售类数据、生活服务类数据、社交娱乐类数据、信息资讯类数据、金融服务类数据和计算应用类数据等。将数据集交由政府机构管理。政府收到超级平台传递的数据集后,再对这些数据集进行脱敏处理或者梳理加工,以方便企业的使用。作为管理者,政府机构的最终任务在于让数据提供者和使用者可以放心地获得和使用符合目的要求的数据,识别和降低可能出现的风险。

第三,将数据集视为其他人的所有权或者他物权的客体与法理的逻辑相悖,又不利于人们对于数据的共享,因为要想获得数据的使用就必须经过权利人的授权同意。因此,数据集的法律性质需要重新构造,以促进数据的开放和共享。此处可以借鉴英美法系的信托和大陆法系的财团来对数据的属性进行构建。〔60〕关于数据的信托,英美两国发展出两种不同的思路:美国是“信息受托人”思路,即数据控制人对个人数据主体承担受托义务,英国是“数据信托”思路,引入第三方作为信托义务主体。两种不同思路的信托其目标却相同。由于数据所有权难以确立,在数据新型财产权构建过程中,数据信托一方面可以悬置所有权问题,另一方面可以平衡利害关系人之间的利益。参见翟志勇:《论数据信托:一种数据治理的新方案》,《东方法学》2021年第4期。上述两种思路的目的在于悬置数据产权问题,本文的数据信托思路却是确立数据产权。愈来愈多的现代法律默示地承认信托是法律实体(legal entity)成为“一个不受剩余权利控制的人管理的实体”。信托法创设信托效力,使信托成为可独立于委托人、受托人及受益人的实体,依信托财产独立性原则,信托财产虽然在受托人名下,但信托财产系归属于信托财产,非属于委托人、受托人或受益人。〔61〕参见王延川:《现代商法的生成:交易模型与价值构造》,法律出版社2015年版,第97页。大陆法系的财团与信托在针对特殊财产设定法人方面可谓殊途同归。财团对于其下财产享有所有权,这种权利具有独立性,非属于设立人和受益人。

就像上述的信托和财团一样,可以将大数据这种新型财产自身法人化。为了保证数据不受侵害,并且发挥其价值最大化,需要赋予数据集自身以人格,以免其受到他人侵害,这种人格称为数据法人。基于这种法人产生的权利不属于任何个人或者集体,也不属于国家所有,而是属于自己所有,称为自权利。

第四,在数据之上成立自权利,即作为主体的数据集合对于作为客体的数据享有权利。但是,数据集不能自己行使权利,这个权利可以交由专业的政府机构行使。比起企业和社会组织而言,政府比较中立,适合作为数据的管理者。这样,围绕数据最少产生了数据利益持有人、数据利益许可人和数据利益使用人三个主体,数据利益在三个主体之间进行分割。按照国家发展改革委创新和高技术发展司起草的《数据基础制度若干观点》的说法,“建议探索建立现代数据产权制度,推动数据持有权、使用权等相关权利有序分离与流通,满足数据流通使用需求。”该观点提出应该按照权能分离的思维设计多重数据产权结构,数据法人对其下的数据享有持有权,而政府机构对该数据享有许可权,其他社会主体对数据享有使用权。

立法上也将应该以社会利益最大化作为数据法人及其自权利运行的出发点。设立自权利的目的是为了实现数据的开放和共享,因此,凡是遇到合格的数据使用申请人,政府会尽可能地审核通过,这样就可以促成数据的多次和反复使用,以实现数据利益最大化。这也显示出数据法人与传统的信托法人和财团法人不同的公益目的。

数据法人的优势在于:其一,如果在数据之上设定自权利,并让政府介入推进数据的开放和共享,可以产生对反垄断法的替代效应,即必要设施原则、平台并购治理和限制平台资本无序扩张等制度便不再有存在的必要,真正遏制数据垄断问题。其二,可以让数据为社会使用,在更大程度上实现数据的公开与共享,为数字经济打下坚实的基础。其三,数据法人可以让更多的人使用政府机构加工的原生数据,又不会导致数据权能过度分离。其四,政府可以对数据池里的数据进行梳理,然后分门别类地整理出优质大数据。其五,通过数据法人设计,企业花费最小成本就可以获得原生数据,可以更好地开发对自己有用的更深层次的数据或者算法,实现企业之间的科技竞争。

数据法人会不会成为新的数据垄断者呢?答案是否定的。也就是说,数据法人系《民法典》中的非营利法人,且属于特殊的以数据为凝结的法人。数据法人获得超级平台传递的数据,其目的不在于经营,而是为了公益,不是让数据垄断,而是让数据更加开放和共享,即让更多的企业和个人使用该数据。

数据法人设计是否会导致超级平台的利益无法保障,从而丧失对数据收集和处理的主动性呢?答案是否定的。一方面,超级平台的工作就是收集和处理数据,不会因为权属问题而“因噎废食”;另一方面,为了鼓励平台,也可以做利益上的平衡:首先,政府机构会给超级平台一定的金额,以补偿其收集原生数据的费用;其次,平台可以自由使用由其收集和处理的原生数据,虽然其不再占有原生数据,但可以在原生数据的基础上开发出衍生数据和算法等,超级平台对衍生数据和算法这样的创新要素享有产权。当然开发的新数据系统是否具有创新性需要有关机关进行审核。政府赋予各种企业或个人使用原生数据可以提升企业开发新技术的积极性,从而增强市场的竞争性。同时,政府机构经由授权企业使用数据而获得的使用费可以用来维护和优化数据集,或者自己从事数据创新开发工作。

结语

对数据的需求来自于三个方面:一是第三方向控制广泛数据集的超级平台请求访问捆绑的个人级数据或聚合数据集,第三方声称需要访问相关数据才能在互补市场中进行有效竞争;二是科技公司要求访问超级平台的大量使用数据宝库,以便在人工智能领域进行竞争和创新;三是政府部门需要访问超级平台的数据集,以开展有效的社会治理。第一种情形可以按照反垄断法路径去获得,虽然获得也比较困难。第二、三种情形需要别的路径获得,如果从具有控制地位的超级平台处通过合同获得并不公正,因为这些平台并未合法获得数据的权属。如果通过某种架构使得数据成为自有性资产,并能够借政府之力实现数据的开放和上述三种利害相关人的共享,才符合数据这种市场基本生产要素的本义。围绕数据成立法人,在数据之上成立自我产权,并将这个权利的行使委托政府机构,机构行使数据权利的目的是数据开放和共享,尽量将数据赋予申请企业使用,这是比较妥当的应对超级平台数据垄断的方式。