○何金海
广西民族大学广西知识产权发展研究院 广西南宁 530006
自1996年Tapscott首次提出“数字经济”这一概念以来,数字经济已成为世界主要国家经济发展的关键性驱动力。当前,我国数字经济步入纵深发展阶段,数字经济已经由经济的组成部分,转变为经济发展的引领力量,2021年我国数字经济占GDP的比重达到了39.8%。数字经济若要成为一种经济形态,数据就必须成为可流通,且可以市场化配置利用的资源,而满足数字经济发展的开放流通应当是“覆盖所有主体的(不限于政府数据开放)、多种方式的全面数据开放”。2017年12月8日,习近平总书记在中共中央政治局就实施国家大数据战略进行的第二次集体学习时强调,推动实施国家大数据战略,加快完善数字基础设施,推进数据资源整合和开放共享。依据收集和控制的主体来分,数据可大致区分为政府数据和企业数据两类,其中我国政府数据的开放流通已得到快速推进,而企业数据的流通及其规范则尚待发展。
在数字经济与后疫情时代重叠的历史时期,为充分释放企业数据价值,国家对企业数据的开放流通日益重视并持鼓励态度。2022年3月,国家发改委发布《关于对“数据基础制度观点”征集意见的公告》,鼓励互联网企业开放公共属性数据。2022年4月,中共中央、国务院发布《关于加快建设全国统一大市场的意见》,要求加快培育数据要素市场,建立健全数据安全、权利保护、跨境传输管理、交易流通、开放共享、安全认证等基础制度和标准规范。2022年7月,中国信息通信研究院发布《中国数字经济发展报告(2022年)》,在“做强做优做大我国数字经济的关键举措”中提到,鼓励企业推进数据分级分类管理,探索可信的数据流通架构。此外,《数据安全法》第七条明确规定,“保障数据依法有序自由流动,促进以数据为关键要素的数字经济发展”。该规定为本文所研究的企业间数据流通提供了基础性制度供给。
国内对于企业数据流通的相关研究如下:一是“企业数据”的概念。学界普遍认为,该词具有广泛的内涵并牵涉多种基本数据类型。周樨平(2022)认为,从企业数据的构成和来源看,大体可分为用户提交的网页数据、平台生成的个人数据以及机器生成的非个人数据。二是“数据流通”的概念。高富平(2019)认为,数据流通是向他人提供数据或使他人接触或使用数据,在流通形式上可归纳为一对一数据许可、互为数据许可及一对众数据许可。三是流通的必要性。李牧翰(2020)认为,数据资源的真正价值唯有在动态的、合法合规的流通与利用中才能充分体现;程军军(2021)认为,开放共享是数据生产要素发挥价值的前提;张铭慎(2022)主张完善我国数据开放流通制度,促进企业与企业间的数据共享、企业向个人的数据开放及企业与政府的数据互动。四是流通的正当性。梅夏英(2019)认为,数据作为天然的公共品服从固有的互惠分享原理,数据法理论应实现从私益保护面向到公益保护面向的思维转变,确立“分享”作为数据法基本价值取向,以释放数据潜力;李兆阳(2022)认为,当数据需要构成关键设施,支配企业拒绝开放数据的行为所产生的消极效果明显大于积极效果时,支配企业需要承担数据访问的义务。
国外对于企业数据流通的相关研究如下:一是流通的正当必要性。莫里斯·E.斯图克等(2019)研究了企业数据与竞争政策并指出,作为数据控制者的企业,为了其自身的竞争性商业利益,通常会拒绝向其他下游企业开放数据,此种做法扰乱了下游市场竞争环境;Scassa(2019)撰文研究了各类主体如何对可公开访问的平台数据提出“所有权”主张,并讨论了重复利用这些数据的权利性质和范围。二是流通的激励措施。Richter&Slowinski(2019)认为,参与数据经济的企业对访问其他市场参与者的数据非常感兴趣,然而数据掌控公司似乎仍然不愿意分享他们的数据,故其研究了数据可信中介平台作为提升共享数据意愿的做法,并提出了数据自由流动的自我监管范式;Evgeny Morozov(2020)对企业间数据共享的全球发展趋势、既存问题、解决方案进行了研究。三是欧盟数据流通。Zoboli L(2020)指出,尽管私营企业之间的数据分享是数字驱动创新的重要驱动力,但在欧盟仍然少见,对于欧盟委员会制定的一项旨在鼓励B2B数据共享的政策,作者试图验证该框架是否能够有效支持B2B数据分享,并讨论了有利于和阻碍欧盟B2B数据分享实践的因素。
根据《数据流通关键技术白皮书(1.0版)》,“数据流通”可以被定义为以某些信息系统中存储的数据为流通对象,按照一定规则从供应方传递到需求方的过程。此概念虽非新创概念但却是近年来才开始备受关注。总体来看,现有研究缺乏企业数据流通的系统性视角和普适性思路,呈现零散而不协调之样态。本文认为,对企业数据流通机制的研究,割裂式的做法无法满足数字经济快速发展的需要,相反,应将企业数据流通作为一个整体机制进行探讨,才能摸清企业数据流通的整体实践图景,并在此基础上架设企业数据有序、合规流通的法治框架。
1.企业数据开放。企业数据开放是实现数据跨组织、跨行业流转的重要前提。我国数据开放的概念主要应用于政府数据开放的场景,2017年5月1日起实施的《贵阳市政府数据共享开放条例》将政府数据开放定义为行政机关面向公民、法人和其他组织提供政府数据的行为。我国政府从2019年开始陆续探索政府数据开放的立法,但企业数据开放的立法仍处于探索阶段,企业数据孤岛问题尚待解决。从近期的政策导向看,国家有意改变企业数据独占的局面:2020年6月,工信部提出要支持上下游企业开放数据,建立互利共赢的共享机制,鼓励平台企业、龙头企业向中小企业开放数字能力;2022年3月发布的《关于对“数据基础制度观点”征集意见的公告》提出,要鼓励互联网企业开放公共属性数据;2022年5月通过的《江苏省数字经济促进条例》第三十五条提出,引导互联网企业、行业龙头企业开放数据资源。
2.企业数据共享。如果说数据开放是企业向外部提供数据的行为,那么数据共享就既包括数据内部交换(企业部门数据交换),也包括数据外部流通(企业间的数据交换),狭义上的数据共享是指后者。相对于数据开放的单方性而言,企业数据共享具有主体合意性,从数据流向看,企业数据共享过程中数据流通是双向的。2018年1月,国务院办公厅印发《关于推进电子商务与快递物流协同发展的意见》,提出要健全企业间数据共享制度,完善电子商务与快递物流数据开放共享规则;2021年2月,国务院国资委印发《关于加快推进国有企业数字化转型工作的通知》,提出要加快大数据平台建设,创新数据融合分析与共享交换机制。实践中,2018年Facebook与华为等4家中国企业达成了数据共享协议;2021年蚂蚁集团与国有企业商议共享数据;2021年7月,有消息传出,中国互联网两大巨头腾讯与阿里巴巴在考虑互相开放生态系统,其中将涉及企业数据共享问题。
3.企业数据交易。所谓数据交易,是对有潜在价值的原始数据进行权属界定后形成数据资产,进一步规范和治理后转化为数据要素,最终进入市场流通。国外数据交易产业始于2007年,此后数据交易业务得到快速发展,微软数据市场、甲骨文在线数据交易等数据服务商密集涌现。我国数据交易产业起步较晚,2015年8月,国务院发布《促进大数据发展行动纲要》,提出“引导培育大数据交易市场,开展面向应用的数据交易试点……促进数据资源流通”,成为国内最早提及数据交易的政策文件;2020年4月,数据作为生产要素被正式写进《关于构建更加完善的要素市场化配置体制机制的意见》;2021年1月,《建设高标准市场体系行动方案》提出研究制定加快培育数据要素市场的意见,加快培育发展数据要素市场;2022年1月,《深圳经济特区数据条例》实施,其第五十八条规定“市场主体对合法处理数据形成的数据产品和服务,可以依法自主使用,取得收益,进行处分”,这意味着企业数据产品和服务可以成为交易对象。
4.企业数据抓取。数据抓取是指通过网络爬虫等技术程序,实现自动从网站上提取图片、链接文本等任何公开可用的数据,并将数据导入计算机的本地文件中。数据抓取作为一种常用的数据收集方法,具有效率高与成本低的特点,因而成为众多企业在进行数据收集时的首选方案。数据抓取本身并无褒贬之分,但其具有两面性,既可促进数据流通也可能侵犯数据主体相关权利。当前,数据抓取已渗透至电子商务、在线旅游、广告营销、市场研究、科学教育等多个行业,我国网络实践中企业数据的抓取现象较为普遍,其中进入司法程序的企业数据抓取纠纷案件也呈现逐年增长态势。如2021年蚁坊公司与新浪微博数据访问纠纷案中,蚁坊公司在被新浪微博限制和禁止访问平台数据后,向法院提起诉讼,诉请解除数据禁止访问限制或者附合理条件开放数据。这表明,第三方企业对大型平台企业所掌握数据的流通具有较高的呼声与期待。
5.用户数据携带。用户数据的携带转移是互联网用户行使数据可携带权的应然结果,在概念层面,数据可携带权亦称数据迁移权或移植权,是指数据主体有权接收其先前提供给数据控制者的个人数据,也有权将数据迁移至其他数据控制者,其权能包括数据副本获取和数据转移权。数据可携带权的概念成文于《欧盟通用数据条例》(GDPR),被世界主要国家和地区相继引入本土立法进程,以促进企业间数据流通和维持竞争秩序,我国《个人信息保护法》第四十五条也对数据可携带权作出了规定。在实践中,数据携带已经展开,例如,阿里巴巴在2021年初关停虾米音乐时,为用户提供了导出歌单服务,这为用户将相关信息转移到其他音乐平台提供了便利。
1.企业主观限制数据流通。以用户为核心的竞争环境导致了数据流通的能动性不足,网络实践中企业不愿意分享其所掌握的数据,甚至存在企业通过用户协议试图单方面垄断数据的现象,成为企业数据流通的主观障碍。例如,互联网企业通过用户协议要求用户同意将用户数据转让给平台(《艺龙旅行网服务条款》第6条)或者授权平台独家且无限制的数据使用权(《陌陌用户协议》第10条第5款)。2017年,新浪微博单方修改《网络服务使用协议》,修改后的数据许可条款规定微博是用户数据独家发布平台,该事件引发社会广泛关注。时至今日,此种要求数据独家授权的现象仍十分普遍,这种消极的主观意愿既源自企业经营者独占数据利益和避免潜在法律风险的心态,也受到法律规定不明、成本分担不合理及技术障碍等客观层面因素的间接影响。
2.企业数据流通形式被动化。在企业数据流通实践中,因数据控制企业普遍不愿意将其所掌控的数据流向社会甚至意图进行数据垄断以壮大和稳固其商业实力,即便有数据可携带权的加持,但因权利范围和用户主导的局限,数据供给不足的窘境无法得到消解,故而迫使数据需求主体通过技术抓取手段来获取企业数据。笔者通过“中国裁判文书网”输入“数据+抓取+竞争”关键词进行全文检索,得到相关裁判文书400余份,另据本文梳理发现,截至2022年初,已经涌现了40余例由数据抓取而引发社会关注的典型裁判案件,这表明以抓取形式被动流通数据的现象在我国网络实践中较为普遍。数据开放、数据共享、数据交易等企业数据主动流通形式虽然得到政策的鼓励,但实践应用却不尽如人意,相比政策的出台速度和热情,实践发展效率明显滞后。据广州数字金融创新研究院调查指出,从经营业绩来看,各数据交易机构整体数据成交量低迷、市场能力不足。
3.企业数据流通秩序混乱。第一,在企业数据流通实践中,数据垄断与数据违规获取并存。在企业数据被限制流通后,其他企业为开辟竞争市场或谋求生存经营,通过技术手段抓取数据控制企业所掌握的数据,甚至铤而走险实施“数据搭便车”等不正当竞争行为。例如,蚁坊公司与新浪微博数据纠纷案中,蚁坊公司就因为未经允许获取和使用微博平台后端数据的行为被判定为不正当竞争。第二,在企业数据流通过程中,侵犯国家数据主权、社会公共利益、企业数据权益和公民个人信息权益的情形常有发生。例如,滴滴未经审查批准赴境外上市事件;抖音诉小葫芦网直播数据侵权案;2022年初,美国Crisis Text Line公司在数据共享的过程中涉嫌侵犯用户肖像、隐私等人格利益。
1.数据一元权属论及简要述评。在数据权属讨论初期,有观点认为数据属于用户个人;姬蕾蕾(2019)基于劳动正当论,认为数据所有权应赋予数据产业者;张玉洁(2021)基于宪法确立的干预经济的职能,认为数据资源归国家所有。然而,无论数据被单一地归于何方主体,均存在逻辑缺陷:若个人拥有数据的权属,但数据实际上掌控在企业或其他组织手中,数据个体的分散性将导致数据活动难以展开,数据资源无法充分利用;若企业拥有数据的权属,则所谓的“个人数据”将与“个人”脱离,最终名不副实,并对个人的信息、隐私及知识产权造成影响;若数据完全交由国家所有,同样会产生上述困境,并由此产生“个人或企业开展数据活动是否需要国家批准或许可”的问题。故而,此种单边保护信息主体的权属体系与数据流通理念相悖,无法满足数据经济发展的客观需求。
2.数据二元权属论及简要述评。二元权属论认为个人及企业分别对不同的数据类型或不同阶段的数据享有权益,其中代表性观点有“用户的基础数据所有权+数据处理者的增值数据所有权”数据二元所有权模式(丁道勤,2017)、“原发者数据所有权+数据处理者用益权”二元权利结构模式(申卫星,2020)、“普通个人数据属于数据从业者与数据主体共同共有,敏感个人数据则为数据主体所有”(黄锫,2021)等。二元权属论的问题在于,个人数据是企业数据的基础元素和组成颗粒,企业的数据权益无法撇开个人的数据权益,数据权属问题的界定必须利于解决个人数据保护的合规问题。此种劳动赋权式的简单论证无法回应实践中的数据治理需要。而数据个人与企业共有的观点,将会增添数据流通与数据共享的成本,面临难以获取用户同意的困境。
3.数据多元主体论及简要述评。任文岱(2021)认为,应结合不同的数据类型对数据权属以比例原则进行设定,数据的主体涉及个人、企业、政务机关等多元主体。陈智敏(2021)基于“数据是生产资料”这一观点,主张数据为全民所有。虽然数据多元主体论的思路具有积极意义,但论证逻辑仍有待进一步厘清——尽管“数据牵涉多方利益”,但能否必然得出“可以将权属归属多个不同主体”?此外,从数据权属规则的初衷考察,若各方均对数据持有控制权利,则数据个体均享有数据活动参与决策权,数据活动必然难以开展,多元数据财产权属在实践中因高概率的冲突而难以操作;而若将数据认定为公共产品,尽管有利于数据流通与共享,当前却难以协调保护个人、企业等数据主体的合理数据权益。
企业数据并不意味着企业对其享有完全的控制权和利益获取权利,企业数据的流通,涉及数据原始生成主体、数据处理主体、数据供给主体和数据接收主体的权属、权益分配问题,然而,当前数据确权理论陷入迷境,尚无法为企业数据的规范流通提供周全的底层理论支撑,致使企业数据流通活动的正当性评价、流通主体的责任承担、利益相关者的利益收获等关键问题不确定。
1.企业数据流通促进要素立法不完善。其一,缺乏数据流通促进立法的顶层设计。有关数据经济促进立法仍处于探索阶段,致使企业数据流通制度缺乏基础性制度铺垫和系统性规范。其二,缺乏企业数据流通的最低要求规定。这导致企业在数据流通问题上拥有几乎绝对式的决定权和控制权,这将加速数据割据现象。其三,企业数据流通的主动型立法与激励机制不足。反垄断立法具有事后性的局限和调查周期长的缺点,促进企业数据流通的主动型立法缺失,在数据流通激励措施上,也未出台重大利好的实质性政策。其四,基于公共利益的流通机制缺位。企业拒绝访问数据可被视为滥用市场支配力,原则上可以强制进行数据访问,即便对于企业所掌控的商业数据,若是为了国家或者社会公共利益,也存在特定范围开放流通的可能性。其五,既有的数据流通规范内容需要进一步明晰。以数据可携带权为例,因为我国可携带权制度设置于个人信息保护法框架下,其可携带的客体范围受到“个人信息”这一客观限制,企业数据中的大部分数据类型仍不能纳入携带流通的范畴,意味着可携带权的客体范围仍需探索拓展。
2.企业数据流通保障要素立法不完善。相关保障性立法散落于《民法典》《数据安全法》《个人信息保护法》《网络安全法》《著作权法》等法律及其配套规范中,且多为原则性规定,各个阶段、各个主体的行为规范与责任承担有待进一步明确。数据流通会对用户隐私、个人信息、企业的数据权益乃至国家数据主权构成潜在威胁,如若不能解决其中最重要的数据安全问题,那么企业数据的开放流通就会成为泄露数据、侵犯隐私的重要途径。对于用户而言,数据流通既是数据开发与再利用,也是个人信息的收集、储存、利用,因此应当强化个人信息的保护;对于企业而言,企业数据权利边界与第三方不正当竞争模糊不清,企业数据权益的保护陷入困境。此外,数据质量保障立法也十分重要。在2020年杭州互联网法院审理的蚂蚁金服诉企查查案中,企查查就因发布误导性数据而被诉至法院。
数据自由流通并不意味着无需或无法监管。一方面,数据成为大型互联网企业无限制谋取利益并限制中小型企业尤其数字企业发展的工具,需要公权力部门介入调整。例如,谷歌2017年曾因滥用其市场支配地位,在搜索结果中推广自主比较购物服务被欧盟罚款24.2亿欧元;国内企业阿里巴巴及美团都曾因利用数据进行垄断而被巨额罚款。另一方面,随着大数据对用户进行画像或计算用户偏好的营销行为广泛展开,个人信息与隐私泄露问题引发民众强烈关注,也迫切需要监管部门及时介入调整,以全面规制数据流通中的不法行为。
监管问题已成为企业数据有序流通的最大难题之一。从监管态度来看,政府相关部门针对数据流通这一特殊市场认识不一,对于数据监管的态度也未达成一致。从监管主体来看,企业数据流通的监管部门尚不明确,法律法规的笼统与缺失,造成数据流通有关监管主体及职责不明,而多种类型、不同领域的数据融合,也增加了数据流通的复杂性,迫切需要监管部门明确相应的监管规则。从监管技术来看,缺乏必要的技术手段使有关部门对数据流通监管力不从心,暴露出企业数据流通市场的“无标准”“无监督”状态。从监管环节来看,尚未形成监管闭环,缺乏主体准入审查制度、数据流通前期安全评估制度、安全风险预警制度、流通授权核验制度和争议处理机制。从监管及时性来看,监管部门主要是针对企业限制数据流通的行为进行反垄断执法、对数据流通中的侵犯个人信息权益行为进行事后监管和规制,这种监管模式具有滞后性和调查期长的局限,无法满足数字经济时代的效率要求。
司法部门对于平台数据的开放流通与利用持较为审慎的态度。本文通过对大众点评诉爱帮网案、大众点评诉百度地图案、奋韩网诉58同城网案、微博诉饭友APP案、微博诉脉脉案、腾讯诉搜道公司案、淘宝诉美景案、微博诉蚁坊案、阿里巴巴诉码注公司案、谷米科技诉元光科技案、蚂蚁金服诉企查查案、抖音诉六界案等关于互联网企业间数据纠纷的典型司法案件的裁判结果考察发现,数据抓取行为通常被认定不具有正当性。这表明我国司法机关在第三方抓取企业数据问题的态度上较为严格,此种司法裁判态度容易对企业数据的开放流通造成消极导向。
在新浪诉脉脉案中,法院提出了“三重授权原则”,即通过“用户授权+平台方/公司授权+用户授权”三重授权,保障数据获取与利用行为的合法性与正当性。然而,徐伟(2019)就企业数据获取“三重授权原则”进行了批判性反思,认为将这一原则普遍适用于所有数据类型并不妥当。金励(2020)也指出,该原则运用到数据流通的争议解决和实践中仍存在“对企业而言该原则的执行将提高合规成本,不具可操作性”等弊端。虽然企业的数据权益需要得到保护、数字市场竞争秩序需要得到维持,但低门槛、普遍性地适用竞争法规范去规制数据抓取行为和提升企业数据获取的正当性门槛,容易造成反不正当竞争条款泛化适用,不利于营造促进企业数据开放流通的司法环境。本文并非否定上述司法裁判的正当性,而是强调在具体的数据流通纠纷司法个案中,需要结合数据类型、社会创新、公共利益及普遍期待进行考量,而非机械适用规制性条款进行处理。
目前,相关基础设施的发展滞后已成为制约企业数据流通的主要因素之一。一方面,数据交易机构运营发展未达到预期效果。2015年4月,全国第一家数据公开交易所——贵阳大数据交易所正式运营,自2021年初以来,北京、上海、深圳等地积极筹建由本地政府牵头的大数据交易所,目前全国已建成或在建的数据交易所达40余家。然而,从机构数量来看,绝大多数交易机构已停止运营或转变经营方向,持续运营的数据交易机构非常有限;从业务模式来看,除中介撮合业务外,确权估值、交付清算、数据资产管理等一系列增值服务尚未落地展开。这表明,数据交易机构虽然在数量上已经形成一定规模,但在建设质量上仍不尽如人意。
另一方面,企业数据共享缺乏统一平台和可信平台。当前,企业数据共享平台匮乏,即便是企业与政府之间的数据共享,国家层面也尚未搭建涵盖各级政府部门和各类企业的政企数据双向共享平台。而对于企业间的数据共享,共享平台主要由市场主体自发建设,共享平台建设标准、数据处理格式、数据对接端口、数据存储标准等不一致问题,也限制了数据共享的范围、增大了数据共享的成本,导致企业数据无法实现双向、适时和高效共享。与此同时,企业自主搭建的数据共享平台会引发数据共享主体对数据安全、商业秘密窃取等问题的担忧。
数据处理与数据流通技术不成熟等问题已成为企业数据流通的客观障碍之一。一方面,企业数据流通的传输技术支撑不足。数据共享要求数据格式和数据传送端口统一,这对企业的数据共享技术提出了要求,但技术层面尚未提供兼容式的解决方案。同时,超大文件数据传输、海量文件数据传输等大型、多类式数据集合的传输也出现传输效率低等问题。
另一方面,企业数据流通的保障性技术不足,风险防控能力有待加强。当前,数据攻击手段与路径越来越复杂,而传统较为单一、被动的安全监测和防御手段难以识别和应对新型数据攻击,致使数据安全风险防御水平难以与数据共享需求相匹配,造成数据要素流动危险系数激增。例如,2020年3月,新浪微博发生5.38亿用户数据泄露事件,而这些敏感数据即从新浪平台抓取获得;2022年5月,全国首例短视频平台领域网络爬虫案中,犯罪嫌疑人丁某利用爬虫技术非法获取后台服务器内的用户名、UID、签名及评论等数据文件,以实现精准定位客户的目的。网络实践中,MRW攻击、Air-Fi、新型木马等大量新型攻击手段不断涌现,且攻击范围广、命中率高、潜伏期长、隐蔽性高,致使企业数据流通面临较大风险。因此,企业对数据流通一直持谨慎态度,而这些问题若不能妥善解决,势必严重打击企业开展数据流通活动的积极性。
1.欧盟有关企业数据流通的立法及政策。作为数据立法先驱和数据治理引领者,欧盟在2017年初就着手建立欧洲数据经济。2018年4月,欧盟公布《关于欧洲企业间数据共享的研究》,提到欧盟应保持最低必要限度的监管以促进企业数据共享。2019年5月生效的欧盟《非个人数据自由流动条例》对非个人数据的跨系统流通问题作出了规定。2020年12月,欧盟发布《数字市场法案》(DMA)草案与《数字服务法案》(DSA)草案,二者的核心目标都在于为商业用户及消费者提供一个安全可靠、公平开放的数字环境。2021年3月,欧洲议会在一项关于欧洲数据战略的决议中指出,数据集中导致市场失衡和自由竞争受限,阻碍了数据访问和使用。同时,该决议敦促欧盟委员会提出一项数据法案,以鼓励和促进更为公平的数据流动。2022年2月,欧盟发布《数据法案》(DA)草案,旨解决数据流转障碍,加强企业间数据共享,并引导和促进数据利用。随着该法案的发布,欧盟拟强制亚马逊、微软或特斯拉等科技巨头向第三方分享数据,迫使企业达成数据共享协议,实现企业对企业的数据共享。
2.突出强调数据共享,构建数据共享的信任机制。2022年4月,欧盟通过《数据治理法》(GDA),法案基于“促进各部门和各成员国中的数据共享”目标,为企业间的数据共享实践提出了“数据中介服务”。相关平台以建立商业关系为目的,区别于传统网络服务供应商,是以实现数据在不特定个人信息主体、数据持有者与数据使用需求方之间分享的中介平台,旨在解决企业数据共享中的不信任问题,促进企业自愿开放其数据,防止大型平台形成商业锁定而限制小型竞争企业的发展。立法者认为,长期阻碍数据共享的原因是没有消弭商业合作不信任的制度或机制保障,而“数据中介服务”被欧盟寄予厚望——“可期待成为数字经济的一个关键性角色,尤其是支持与促进企业间的数据共享实践”。从内容来看,数据中介服务具有三个亮点:其一,数据中介服务独立于数据持有人或数据需求方的数据供需关系之外;其二,数据中介服务的个人信息处理应符合特别法要求;其三,经认可的数据中介服务主体,可发放通用认可标识,并通行于欧盟全域。Richter&Slowinski(2019)认为,数据共享中介机构的出现,会增加企业共享数据的意愿,在数据经济中发挥至关重要的作用。
1.美国企业数据流通的法治实践。在开放数据领域,美国被认为是先行者和引领者。2021年12月,美国公布了一项法案,要求Facebook等社交媒体向独立研究人员分享其平台数据。司法领域,美国审理了多起数据抓取纠纷典型案件,针对非公开数据的爬取和使用,在Facebook,Inc.v.Power Ven⁃tures,Inc.案中,法院认为,被告需要满足“用户+平台”授权规则才可抓取用户好友数据和其他企业数据。针对公开数据的爬取和使用,法院以服务器私有为依据认定Bidder's Edge对eBay网站进行数据爬取的行为属于非法入侵动产,这意味着爬取公开数据也需要平台的授权。对于公开数据的爬取,在HiQ v.LinkedIn案,法院却采取不同的态度。2022年4月18日,美国第九巡回上诉法院对长达五年的HiQ v.LinkedIn案作出重审裁决,裁决认为,HiQ“爬取互联网上可公开获取的数据并不违反《计算机欺诈和滥用法》”。该案一审裁决在价值取舍中选择了“公共利益”作为主要裁判依据,再审裁决对此予以肯定。该案中,LinkdeIn曾援引Facebook v.Pow⁃er Venture案抗辩,认为HiQ没有获得平台授权不得获取其网站的公开数据,但该主张并未获得法院的支持。
2.强调公共利益在数据纠纷案件中的比重。HiQ v.LinkedIn案判决的作出,在一定程度上减少了美国国内相关机构关于禁止数据抓取的担忧,并为数据访问和流通活动的实践提供了一个大致的规范框架。通过对中美两国涉“数据抓取纠纷”相关司法裁判的考察,可以发现数据抓取现象具有普遍性。同时,还可以发现两国在对待数据抓取的司法态度上存在一定差异。尽管我国重视公开数据的价值与利用,但当前司法态度趋于保守,即便对于平台公开数据,亦倾向于需要获得用户及企业的授权,而美国法院对于平台公开数据的态度则经历了由“严格”到“宽松”的转变,HiQ Labs v.LinkedIn案中,因被抓取的数据具有公共开放性,法院认为无需数据控制者的授权,即便数据控制者撤销授权也不会对爬取行为的合法性判断产生影响。该案判决或许会对我国同类案件的处理有所启示,数据是否公开以及公共利益考量或许会成为我国今后司法裁判中考量的因素。
1.企业数据流通的日本法治实践。2016年1月,日本政府发布《第五期科学技术基本计划》,促进数据流通成为实现构建社会5.0目标的重要举措。2016年12月,《官民数据活用推进基本法》通过,2017年3月,官民数据活用推进战略会议成立,旨在根据《官民数据活用推进基本法》促进数据流通,解决社会问题。2017年4月,出台《为实现数据流通平台间合作的基本事项》,对打通各数据流通平台所需的数据目录、API接口、数据安全测评等若干事项提出了规划方向。2017年5月,日本完成修订并实施新的《个人信息保护法》,对个人信息的定义及数据跨境流动等方面的规定进行了完善,成为指导数据流通市场健康发展的基本性法律规范。2019年2月,《欧盟日本数据共享协议》生效,允许个人信息在欧盟和日本间自由流动,并由此形成了全球最大的数据自由流通区域,促进了数据的跨域流动。
2.多主体参与数据流通治理机制。日本政府注重对超大型企业的数据流通监管。2017年6月,日本公正交易委员会发布《数据与竞争政策调研报告》,认为“若任由数据流通市场自由发展,则可能产生具备数据垄断超能力的超大型企业,从而压缩初创企业和中小企业发展的空间”,故而日本政府于2019年2月宣称成立反垄断监管机构,并对Face⁃book和Google等大型科技公司进行审查。注重政府主导的数据流通监管的同时,日本政府也强化社会主体在数据流通过程的参与。一是利用数据交易平台和数据银行,为数据流通从基础设施层面提供良好环境。二是通过成立“数据流通推进协会”等行业自治组织对数据流通市场进行标准规范和数据推广。除了强化各数据流通参与主体的合作,日本政府还注重数据流通的国际合作,促使国外企业与国内企业共通数据,实现企业数据资源化跨境的共享、交易和利用。
1.从限制流通到开放流通。我国有必要纳入企业数据开放流通的相关规范,打破数据垄断,以一种更加积极、开放的态度鼓励企业之间的数据流通。首先,企业数据的开放流通是社会分配正义的价值要求。2020年4月出台的《关于构建更加完善的要素市场化配置体制机制的意见》,将数据列为生产要素,作为“原材料”的数据,本质上是通过数据的不断流动、分析加工形成各种大数据产品或服务,从而实现数据的经济价值,这对于企业数据也不例外。其次,企业数据的开放流通是数据生产要素发挥价值的前提。虽然数据具有价值可挖掘性,但是数据资源的真正价值唯有在动态的、合法合规的流通与利用中才能得以充分体现,企业数据经由不同的社会主体对数据的整合、分析与利用,增大数据在交通出行、消费购物、教育科研等社会生活各方面的应用场景,为社会生活提供便利。再次,企业数据的开放流通是破除数据壁垒、预防数据垄断的重要举措,也是数字经济背景下数字经营者集中的补救措施。若数据控制企业滥用其市场优势地位,封闭外界对其平台数据的访问,当这种限制访问的影响“涉及足够多的互联网用户群体、足够广的地域范围时,就会对公共秩序等公共利益产生消极影响”。如果数据被数据控制企业所垄断而限制流通,其他社会主体就无法利用企业数据资源来进行社会创新和社会财富创造。本文认为,在对企业数据流通进行风险控制的前提下,如果数据的利用行为没有打破合理预期,则不宜过度限制对企业公开数据的合理收集与使用。
2.从被动流通到主动流通。企业数据的流通需要各类形态的流通形式,单调且被动的数据流通模式无法满足数据经济的要求。一方面,企业数据主动流通有益于缓解数据被动流通带来的负面影响。通过网络爬虫对企业数据进行抓取的被动式流通模式出现了混杂局面,致使我们难以对其中的合规或非法样态进行清晰界明,而主动式的数据流通模式则可以在一定程度上消解这种非正常化、被动式的企业数据抓取现象,降低数据采集成本和法律风险。另一方面,合规框架下的企业数据主动流通有利于实现商业共赢。数据本身在经整合与分析后可运用到各大领域中,企业数据共享基础上的整合可以为其他组织,如预测犯罪、城市规划、流行疾病筛查及天气状况预报等提供精准、全面的分析,数据分享的相对方还可以基于所获取的数据研发出更符合用户偏好的产品和服务。目前,数据再利用的重要性还没有被企业和社会充分认识到,各大互联网企业分别掌握的搜索、社交和消费等各类数据,本可以在共享整合后进行数据互补后使数据发挥更大的价值,但现实中却是企业竞争大于合作,造成数据被当作纯粹的数字符号冰冷地存储于计算机中。故而,立法及政策应加强企业参与,逐步提升各企业对数据资源性、数据公共价值性及数据共享的认知。
1.禁止损害国家利益与公共安全。从数据属性看,企业数据中详细的地图数据、人口数据、经济数据等具有特殊性质,往往被纳入具有战略意义的国家核心数据,一旦数量足够庞大就会涉及国家安全和主权,国家需要对这类数据行使数据主权。同时,企业数据还可能具有公共利益属性,例如企业自主或受公权力部门委托收集和处理的疫情数据、治安数据等,涉及经济发展及社会安全。当前数据外泄事件频发,数字经济产业的发展对数据安全提出了更高的要求,企业数据的流通必须坚持国家安全和数据安全红线不可逾越。2022年3月起施行的《浙江省公共数据条例》第三十条就对禁止开放的数据类型作出明确规定,根据该条款内容,“开放后危及或者可能危及国家安全的”及“开放后可能损害公共利益的”公共数据均被列入禁止开放范围。
2.杜绝损害市场正常竞争秩序。在反数据垄断的同时,应警惕恶意抓取企业数据、剽取平台数字成果、泄露企业商业秘密数据等不正当行为,将企业数据视为公共资源的自由利用模式不能支撑数字经济的运行和发展。从市场角度看企业数据的开放,其核心在于平衡企业利益与公共利益的关系。数据挖掘活动无法禁止,否则所有的搜索引擎将不复存在,但数据开放流通应有所限制,数据挖掘范围、方式及后续的数据利用行为均应规范。从社会层面而言,企业数据获取和流通应以正当程序作为指引。一方面,提倡企业开放数据,防止其利用数据优势削弱竞争对手的竞争力,损害市场竞争和技术发展。另一方面,也应防止数据挖掘者“搭便车”和窃取企业的劳动成果,损害企业在数据市场上的投资意愿。因为,如果数据像阳光一样可以自由获取,企业将不会投入巨额资金提供免费服务以获取和分析数据。
3.保障用户个人信息安全和隐私利益不受损害。若数据流通潜在危及其他主体的合法权益,应采取合理措施以规避风险。在互联网平台恶意抓取事件中,大量涉及公民个人隐私、个人信息的数据被泄露或恶意利用,严重危害个人人格及经济权益且造成不可逆转的后果。因此有学者指出,我国需要建立多元的治理框架,实现个人信息保护与数据开发利用的二元价值平衡。值得注意的是,对于企业数据开放而言,即便是网络平台上本身就已公开的数据,在跨场景、跨平台传播之后,实际上已经超出了数据初次收集的合理预期,用户对于数据挖掘者或抓取者的后续数据处理行为无法察觉,使得用户数据进一步脱离用户的控制。因此,在定夺平台数据的开放程度、开放方式、开放类型之时,应尽可能减少对用户隐私及信息权益的损害。
企业数据的流通应以数据要素的类型为基础,区分平台中的不同数据类型,只有坚持分类治理,才能最大程度促进数据价值释放。第一,依据数据本身是否公开可访问,可将企业数据分为公开数据与非公开数据。开放的数据首先必须是公开可访问数据,非公开数据或秘密数据显然不具有公开的现实可能性。第二,依据数据的生成模式,可将企业数据分为公共数据与非公共数据。企业公共数据应实施开放,而对于商业性数据则需进一步探讨。第三,依据数据的生成主体,可将企业数据分为平台自身数据、用户数据;根据参与主体,还可分为平台自生成数据与合作、委托加工数据。第四,根据数据的演进阶段,可分为原始数据与衍生数据,从法律特征来看,后者属于智力成果,具备财产属性,开放程度应弱于前者。
基于上述数据差别流通原则,本文以企业数据开放为例展开分析,并将数据开放权限划分为绝对开放、选择开放、不予开放三类。其中,对于企业所掌控的公共数据,应实行绝对开放模式;对于企业所掌握的商业数据,可采取鼓励开放模式,并在个案中适用竞争法规范进行公平调整;对于企业所掌控的非公开数据、禁止开放数据,采取不予开放模式。选择开放模式中,若用户选择公开其用户数据,则一般应采取数据开放模式,允许其他主体对数据进行利用和价值挖掘。在评判其他企业或公众获取和利用数据信息资源的正当性时,应结合用户协议,判断所流通的数据是否为公开数据或公共数据。对于数据控制者采取了技术保护手段的数据,或者说需要访问权限才可访问的数据,通常属于不公开数据。应当强调的是,由于公开数据具有公示性和公益属性,数据控制企业对此应承担容忍义务,针对个人浏览及采用通用技术规则的获取行为应当采取包容态度。
数据权属面临的一系列现实困境表明,可能数据权属这一思路本身就是错误的,以至于出现公开反对数据权属的声音,Aaron Perzanowski(2016)认为,“数据所有权的概念和法律框架正在坍塌”。Lothar Determann(2018)宣称“没有人拥有数据,谈拥有是没有意义的”。Ignacio Cofone(2020)认为,“数据所有权理论目标错误,如果实施将弄巧成拙”。即便经济学家倾向于认为明确界定的私有产权是有效配置资源、促进数据流通的必要条件,但这种观点以区分竞争数据和非竞争数据为前提,数据所有权并不一定能使社会福利最大化。若因数据权属而导致数据流通成本过高,则此时的数据权属界定本身就是无效率的。实际上,产权的概念基本上仅限于指称经济性权利,此种局限决定了数据权属的讨论无法解决财产权框架以外的问题,例如数据主权和信息人格权问题。鉴于此尴尬境地,姚佳(2019)认为,应搁置数据产权争议并构建数据的利用与分享准则,陈越峰(2022)则提出要超越数据界权。
多元赋权模式可以缓解数据简单所有权归属论的窘境。数据权利配置规则应以数据类型化为基础,区分企业数据中的不同数据类型,并以权利差别化为基础,配置不同类型的权利。故而本文作出如下制度设想:第一,用户对于企业数据所体现的个人信息享有人格利益,这种利益在数据流通中应排在优先顺位。但是,数据流通要求承认数据控制者享有用户数据使用权等权利,否则无法构筑数据资源的流通秩序。第二,企业对平台中的自有数据享有绝对的数据处置权,当然,这种处置权必须在法定框架下行使。第三,对用户原始数据基础上的加工数据、衍生数据或产品数据享有较高的排他性数据财产权,应基于实质性价值增值的考量,赋予企业限制性财产收益权,立法上应鼓励此类数据通过数据交易、数据共享方式进行流通。此外,为挣脱用户个体介入数据活动的束缚,可以引入个人数据权利用尽原则。第四,对于合作或委托加工形成的数据权益则依据合同约定或法定规范进行个案处理。第五,对于企业平台中公开数据不宜采取赋权保护模式,可以在遵从不损害社会公共利益及所涉主体利益的情况下,准许自由流通。第六,对于企业收集的公共数据,应从一种数据利用主体的视角,赋予公共数据的公平利用权,并将其作为数据开放流通制度的权利基础。
1.完善企业数据流通促进要素立法。第一,出台《数字经济促进法》,并以该法为核心和统领,出台关于不同数据类型的流通促进立法或规范,以“统领+多元”立法模式为包括企业数据在内的数据流通提供规范供给。第二,保持最低必要限度的数据共享要求以促进企业数据流通。由相关部门或行业协会针对不同的企业类型,对流通的数据种类、流通方式及流通权限等进行差别设置,建立企业数据流通的最低标准。第三,健全企业数据流通的主动型立法与激励机制,合理设置成本分担机制。在积极推进企业数据开放、数据共享、数据交易等促进企业数据流通的主动型立法的同时,规定企业数据流通的法定形式、法定类型,出台利好政策,鼓励并引导企业进行数据尤其是商业数据流通,促进数据有条件地释放给社会,并使企业在数据流通中有利可得,激发其主动性与积极性。此外,根据不同的流通样态,配置不同的成本分担机制,一是国家对特定数据的流通及数字基础设施进行鼓励性补贴;二是建立多主体合作机制,数据共享所产生的成本由受益方合理分担;三是采取数据盈利模式,开展数据有价流通。第四,完善既有的主动型数据流通规范内容。以数据携带为例,应拓展可携带权的客体范围,设置可携带数据的最低限度要求,明晰可携带数据的类型要求、格式要求、数据传输的接口要求、数据接收的第三方平台资质要求等,促进可携带权制度真正落地。然而,面对阻碍创新的市场倾斜,数据可携带权不足以解决这一问题,因此迫切需要强制要求在数据驱动的市场中共享用户信息。第五,设置平台数据强制许可与数据合理使用制度,均衡数据流通公私利益关系。当企业数据并非企业的私有财产,甚至其中的部分数据具有公共价值属性时,强制企业对具有公共价值的部分数据进行适度开放,或者赋予其他社会主体合理使用数据的权利,这样既可以促进数据的充分利用和社会创新,在数据垄断情况下,还可以修复数据市场竞争。在对强制许可行为进行价值判断时,应将企业数据资源对下游企业生产经营活动的必要程度与可替代程度和替代成本大小等因素作为企业开放数据资源的条件。值得注意的是,数据强制开放并不意味着免费开放,应允许数据控制者从数据投资中获益,避免对社会创新产生负面影响。
2.完善企业数据流通保障要素立法。推动企业数据的流通,需要强化数据流通的保障机制,完善企业数据流通从风险预防到责任承担的全过程法律规范体系,明确企业数据流通中各主体的权利义务关系,通过立法规范为数据流通提供法治支撑。在数据流通方面,应健全企业数据流通的前置规则,构建“数据权制度”,构建多维度的数据权利约束体系,统一数据流通的基本规则。既要明确数据流通操作模式,也要统一数据流通的格式、授权条件等规范标准,以提高数据可利用性,还要消除数据流通中的法律风险,明确数据流通的非法行为责任。在全面规制数据不法行为过程中,应保障企业与用户的合法权益不受损害。数据的产生与处理需要资金、技术、设备和劳动力等大量投入,企业对其所积累的数据拥有一定的财产利益或竞争利益,故而需要保护企业的需求和利益,消除企业共享顾虑。同时,在构建企业数据流通机制时,也无法回避个人隐私及个人信息保护问题。
1.以制度和技术为基础,构筑多主体参与的数据流通监管模式。要引导数据流通市场法治化发展,就需要做到数据流通监管有法可依。同时,结合先进的技术手段提高监管效率,促进监管技术与制度相结合,例如强化数据报送技术、数据比对技术、数据接入技术、数据展示技术、数字预警技术及数字异常动态提醒技术。企业方面,在数据流通各个环节建立起完善的内部监管体制,加强数据流通的全过程保护机制,在产品服务进入市场前要经过企业的自律检查及数据监管机构的监督。同时,可参考欧盟GDPR的数据监管框架,在企业机构层面建立数据保护专员制度。行业方面,通过制定特定行业的数据监管规则和数据自律规范贯彻实施企业数据流通制度,还可以制定企业数据流通的示范性操作与合同文本,由各企业根据自身实际情况在示范文本内进行具体调整,对于涉重大公共利益类型的企业数据或企业数据出境等特殊流通方式,应在通过审查后再展开数据流通活动。行政部门方面,由网络安全部门、工信部门、数据管理部门会同市场监督管理部门、公安部门等政府相关部门对数据流通活动展开外部审查与监管,同时,还应对各主体职责进行明确。国家层面,设立独立的数据流通监管机构,该监管机关可授权成立认证机构,赋予企业数据处理、流通的认证权利。
2.强化企业数据事前监管。事前规则上,根据不同的平台数据类型设置资格准入门槛,建立数据流通利用的资格认证与审核制度,对于黑名单中的个人或企业,限制开展特定数据流通活动。就企业数据挖掘及后续数据利用的安全保障而言,对互联网平台上公共数据的挖掘与利用前应作出数据安全的承诺,大规模数据抓取者应登记备案,具备相应的数据安全资质,确有必要的可以对数据抓取行为实行行政许可制。重要数据、大量数据建立安全流通评估制度,所有开放流通的企业数据必须是依法已经脱敏、脱密等技术处理的数据,对涉及国家利益与公共安全的数据要进行分类、筛选和审查。此外,监管部门可以为数据流通主体提供数据交易、数据共享、数据出境等数据流通活动的标准化合同,还可以要求企业将拟流通的数据类型写入其用户协议相关条款之中,用户对数据是否流入市场具有选择的权利。当然,强化事前监管并不排除事中与事后监管。
在涉数据流通与竞争行为正当性的判定标准上应引入比例原则,增加公共利益考量在数据纠纷裁判中的比重,重塑企业数据的利益分配格局,进而协调数据之上的利益冲突。数据尤其高质量的数据通常被大型互联网平台控制,市场的新进入者因数据干涸而无法进行商业创新和效率提升。司法裁判中,对平台数据抓取行为的不正当竞争法律适用应当有所谦抑,当数据抓取行为发生时,需要在竞争法中给予数据抓取者以合理抗辩权,如考虑赋予以教育或研究目的抓取使用平台数据的行为之正当性。
数据市场的竞争充分是提高创新激励的重要途径,对于具有创造性的数据抓取行为,宜放宽平台数据抓取限制,促进数据驱动型创新。法院实务论者在2022年第六届“三知论坛”上也表示,对利用数据行为违法性的判断,可以着重考量数据使用行为有没有进行创新、创新程度、是否有利于长期市场效能的提升,以及被诉行为对个人信息保护等公共利益的影响等因素。即便认为企业对数据享有权益,在认定第三方获取企业数据是否构成侵权时,也需法院基于数据纠纷个案对相关权益进行权衡。对于企业数据权益的保护限度也需要基于司法个案予以综合考量,企业虽然可以采取技术控制与协议控制来保护企业数据,但此种保护措施应在合理限度内展开,超出合理限度的保护措施,法院有权裁定撤销。
1.实现数据交易从数量主导到质量主导的转变。数据交易作为数据流通的主要样态,无法摆脱数据交易平台的建设,数据交易平台的建设数量与质量直接关乎数据交易实践的展开幅度。在当前数据交易平台迅速崛起的情况下,应推动数据交易平台的质量发展。在建设力量上,可采取多元力量主导模式,鼓励企业参与数据交易平台建设,既可以政府部门为建设主体,也可以社会组织等市场力量为主导,鼓励数据交易平台创新业务模式,通过市场化的竞争促进数据交易平台的高质量发展。
2.加快建设企业数据共享的统一平台与可信平台。其一,通过政府和行业协会力量,推动企业数据共享统一平台建设,对企业数据共享的数据格式、传输标准、对接端口、存储要求等制定统一标准,推进企业数据双通向、高质量、高效率共享。其二,建设企业数据共享的中间平台,消解企业数据共享流通的信任困境。数据中介的准入资格方面,除要求具有专业知识和技术设备外,还应满足“独立性”要求,即不隶属数据供需关系的任何一方。数据中介的市场准入应由主管机关评估后颁发行政许可,国家应将符合条件的数据中介平台集合起来构建国家数据中介数据库。数据中介的运作方面,由数据共享双方在合格的数据中介数据库中进行选择,数据共享的格式、标准、接口等均可由数据控制者与数据共享相对方约定或协商选择。
全面推进企业数据合规流通,需要加强技术创新。一方面,提升企业数据传输技术,促进海量数据的高效传输,同时,加速推进数据存储兼容性技术开发,促进不同种类、不同格式的数据实现快速接收与整合。为了实现对特定数据的跟踪,部分企业数据的流通还需引入区块链技术提供支撑。另一方面,强化企业数据流通的安全技术支撑,解决数据流通中面临的隐私泄露及信息安全问题。其一,数据流通并不意味着所有数据均可流通,当数据涉及国家机密、商业秘密、公民隐私时,应当经过技术处理以后再向社会开放,这就要求数据流通主体具备数据分级分类的处理能力;其二,企业数据流通应当在合规框架下展开,流通的数据应当是去识别化后的特定种类数据,这就需要数据流通主体具备去识别化技术、加密技术。