数据交易如何破局

2022-05-30 00:05丁晓东
东方法学 2022年2期

丁晓东

关键词:数据要素市场 数据交易 阿罗信息悖论 数据产权 反不正当竞争 信用品

中图分类号:DF529 文献标识码:A 文章编号:1674-4039-(2022)02-0144-158

引言

数据交易是数据要素市场建构的关键一环。在我国数据要素市场的规划与建设中,通过数据交易所的模式推动数据交易与数据流通,已经成为了我国数据要素市场建设的重要政策。早在2015年,《国务院关于印发促进大数据发展行动纲要的通知》就提出“引导培育大数据交易市场,开展面向应用的数据交易市场试点,探索开展大数据衍生产品交易,鼓励产业链各环节市场主体进行数据交换和交易,促进数据资源流通”。2021年,《国民经济和社会发展第十四个五年规划和2035年远景目标纲要》明确,应“建立健全数据产权交易和行业自律机制,培育规范的数据交易平台和市场主体”。同时,2021年生效的数据安全法第19条规定:“国家建立健全数据交易管理制度,规范数据交易行为,培育数据交易市场。”北京市、上海市、山东省、广东省、安徽省等地更是纷纷出台法规、政策或文件,要求或鼓励地方政府组建大数据交易所,推进数据场内交易。

数据交易的重要性毋庸置疑,但从目前各地的探索来看,通过数据交易所进行的交易却困难重重。贵州、深圳、北京等地虽然都成立了大数据交易所,但其交易额却寥寥无几。以最早成立的贵阳大数据交易所为例,在2015年成立时,当时的负责人期待“未来3~5年交易所日交易额会达到100亿元,预计将诞生一个万亿元级别的交易市场”。但后来的运营却与此相距甚远,数据交易“并没有想象中活跃”,2019年“交易所大概只做了500万~800万元的项目”,2020年更是低于500万元。〔1〕其他数据交易所也面临类似困境。在由国家发改委等机构召集的各类研讨会上,不少数据交易所都谈到了类似的情况,数据交易并不像土地交易所、证券交易所那样活跃,也不像商场里的商品那样高效流通。

数据交易为何困难? 六十年前经济学家肯尼斯·阿罗就给出过一个理论与解释。该理论认为,数据或信息交易存在一个“根本悖论”:交易需要买方事先了解或获取数据或信息,以确定数据或信息的价值;但卖方一旦向买方详细披露数据,买方就等于免费获取了信息或数据。〔2〕其后,这一问题在法学与经济学文献中不断被提起和重构。例如,库特教授认为,关于信息与数据的交易常常面臨“双重信任困境”,即提供思想或信息的一方“需要相信投资者不会窃取他的想法”,投资者则“需要相信他的投资不会被欺骗”。〔3〕

部分观点认为,解决阿罗信息悖论的关键在于财产化确权。一旦对数据进行财产化确权,那么作为卖家的一方就不会担心数据公开会导致其价值丧失,买家和第三方也无权在未经许可的情形下获取数据。在数据产权理论看来,借鉴财产权与知识产权的经验确立数据产权,也是解决数据交易的关键。否则,不仅数据交易很难发生,而且数据要素市场还会产生诸如公地悲剧、“搭便车”、激励不足等问题。缺乏数据确权与数据交易流转,企业或社会主体将不会有动力对数据进行加工利用,很多社会主体可能都想不劳而获地获取他人数据。

本文从真实数据交易场景出发,结合法学与经济学的相关经典理论与前沿理论,对阿罗信息悖论以及数据产权方案进行分析。在本文看来,数据交易尽管面临重重困难,但数据产权却并非解决这一问题的良方。即使是知识产权制度,其产权体系与传统财产权也存在重大区别,交易模式也与传统财产交易不同。一般数据更是如此,无论是数据交易中的信息悖论,还是公地悲剧、“搭便车”与投资激励问题,数据财产化确权都无法有效解决,反而可能带来更多问题。〔4〕为了解决阿罗信息悖论及其相关问题,应当重新理解数据的特征与数据交易的模式,建构合作沟通型的数据交易模式,以中介撮合模式重构大数据交易所的定位,完善相应法律制度。

一、数据交易的现实场景与服务型特征

为了对数据交易市场进行全面分析,本部分首先分类阐述数据交易的类型。〔5〕在此基础上,本文指出真实世界里数据交易的共同特征是将数据作为服务,围绕数据缔结合同或进行合作;而非将数据作为财产或流通产品。〔6〕

(一)真实世界的数据交易

1.基于平台的数据交易

基于平台的数据交易指的是报纸、电视、网络平台通过广告或接口为相关企业提供曝光度或数据流量,让相关产品在更多用户或观众面前曝光,增强产品的知名度和接受度。报纸、电视等传统媒体平台为各类产品所做的广告,虽然看上去并非典型的数据交易,但也可以视为一种广义上的数据交易与合作。只不过这类数据交易比较初级,报纸、电视往往针对不特定群体投放广告,按时间段、时长收取企业费用。到了互联网时代,基于流量与数据的合作变得更为多元。互联网平台可能为商家提供类似传统媒体的流量与数据支持,例如,淘宝、京东等电商企业可能给某家企业以大量的流量支持,在首页提供某个商家的入口;微信可能在其“支付”页面(俗称九宫格)为合作企业开通小程序的流量入口;百度等搜索引擎可能通过竞价排名等机制为不同企业配备不同的流量。同时,互联网平台也可能为商家提供个性化的流量支持,例如,针对用户提供“千人千面”的购物体验与产品推荐。

2.基于数据库的数据交易

基于数据库的数据交易指的是基于数据库的数据服务。数据库企业常常汇集海量信息,为相关企业与用户提供数据查询和数据服务功能。例如,高校里常见的中国知网、万方数据库、Jstor、Lexis、Westlaw等数据库,这类数据库常常通过购买版权或其他方式收集论文、案例、法律法规,再通过汇总的方式形成数据库,为高校等研究机构提供服务。在商业领域,也有很多类似的数据库企业。例如,企查查立足于企业征信,经过深度学习、特征抽取和使用图构建技术,为用户提供相关数据信息。对于普通用户,企查查提供一般查询服务,而高级检索的用户要通过购买VIP资格来获取。此外,平台企业也可能衍生出自己的数据库。例如,淘宝基于对自身数据的分析,打造了“生意参谋”数据库,为淘宝内的商家提供有偿服务。通过生意参谋,淘宝内的商家可以看到口径标准统一、计算全面准确的店铺数据和行业数据,进而为企业决策提供参谋。

3.基于采集加工的数据交易

基于采集加工的数据交易指的是数据型企业与科技类企业之间的数据交易。在这类交易中,数据型企业通过数据采集、数据标注、数据清洗等数据加工的方式,为医药、人工智能等科技类企业提供数据。例如,针对新冠肺炎疫情,数据采集与加工企业可以为药企和疫苗研发提供大量病人的临床数据。针对自动驾驶,数据采集与加工企业可能收集大量街道驾驶数据,通过标注现实生活场景中的车辆行驶轨迹,为自动驾驶提供训练数据。针对语音类的智能客服,数据采集与加工企业可能收集大量的不同方言、不同音色的语音数据,为人工智能识别不同语音提供训练数据。针对人脸识别,数据采集与加工企业可能收集大量的人脸信息,并通过标注为相关企业提供人脸识别训练。数据采集与加工企业往往根据企业需求,收集大量的语音、图像与文本数据,为客户提供数据标注与数据定制服务。以我国企业“数据堂”为例,其采集了“成品数据集覆盖20万小时语音数据、50万ID图像视频数据、4.5TB文本数据等,涵盖80多种语言及方言”,提供“智能辅助标注技术”与“专业个性化数据采集定制与标注”等各类服务,其客户包括了华为、百度等一大批国内外企业。

4.基于经纪商的数据交易

基于经纪商的数据交易指的是通过经纪商而发生的数据交易。在实践中,数据经纪商经常从事与个人信息相关的数据型服务,为企业与用户提供各类不同服务。有的数据经纪商专注于营销,创建包括个人年龄、位置、教育程度、收入、网络记录、购买历史和兴趣的数据库,为商家或用户提供有针对性的广告和营销。数据经纪商可能收集了某台设备识别码或某个IP的位置信息,当某家企业希望对某个地区投放广告时,该数据经纪商就将该广告推送给某个IP地址段或到过某个位置的设备。另外,有的数据经纪商可能专注风险防控。例如,銀行或贷款机构在发放贷款之前,可能会求助于数据经纪商,帮助其确定所提供的信息是否准确合法,从而降低向欺诈者发放贷款的风险。网约车企业在审核其签约司机时,外卖企业在审核其快递员时,可能也希望从数据经纪商那里获取有犯罪记录或严重违法行为的人员信息,从而帮助其履行安全保障义务。目前,数据经纪商在美国等国家和地区发展非常成熟,但在我国仍然处于起步阶段。〔7〕

(二)从数据合同到数据财产

上述对数据交易的总结与分类并非齐全,但却可以从中大致总结出一个共同现象:数据交易几乎都是点对点的交易或通过服务合同的交易,数据的流转也更接近于类似“私人定制”的数据服务或小范围流转,并没有产生类似土地、房产、消费用品的市场化流转交易,更没有形成类似证券、黄金、石油期货的高频交易。例如,在平台类企业中,平台为商家或用户提供的是流量或流量入口;在数据库企业中,数据库提供的是查询、查重等服务;在数据加工类企业中,企业所提供的是基于用户需求的定制数据或数据标注;在数据经纪商类企业中,企业所提供的是企业用于广告、风控等服务。在数据交易与合作中,企业更多将数据当作一种合同与服务,而没有将数据当作一种财产进行交易。

数据交易是否可以超越基于数据的服务,成为一种基于数据产品本身的商品交易,甚至成为一种类似证券商品的高频交易? 从而构建一种数据交易的“厚市场”?〔8〕有的观点认为,实现这一目标的关键在于数据确权。正如阿罗的信息悖论所述,数据或信息难以交换的关键在于:交易的公开性需求与公开导致数据泄露之间存在悖论。面对这一难题,有理论主张,以财产权或知识产权的方式对数据进行确权,可以有效地解决信息悖论问题。例如,科基教授指出,知识产权“创造了一套双方在谈判开始时就知道的明确的法律权利”, 知识产权的所有者可以“披露受合法垄断范围保护的此类信息”。〔9〕莫杰斯教授也指出,产权制度可以解决阿罗的信息悖论问题,当数据交易的双方“难以通过合同”进行交易,信息产权制度仍“可以有效运作”。〔10〕

综合数据产权理论,可以发现这一理论的正当性主要从两方面论证。首先,数据财产化确权可以减少交易费用,避免阿罗信息悖论中的猜疑链或库特教授所说的“双重信任困境”。正如科斯所言,当交易费用较低时,权利的初始赋予并不重要,交易双方总是可以通过市场谈判而获得最优的资源配置;但在交易费用较高时,高交易成本就会妨碍市场交易。〔11〕沿着科斯的这一进路,围绕着交易成本的分析成为了法学与经济学研究中的重心,交易成本被认为是分析市场交易的“关键维度”。〔12〕在支持财产权的学者看来,现实社会中往往存在高额的交易费用,这决定了财产权的优势,财产权可以为交易双方特别是多方交易主体提供清晰的信息,使得交易主体不必为复杂的社会现实和高交易成本所担忧。

在过去几十年里,这一理论在多个领域都产生了影响。例如,在公司法理论中,公司被认为是一种财产制度安排,公司可以成为多重契约的联结,〔13〕解决公司内部复杂的资产分割问题,〔14〕避免社会主体需要和公司内部的每个成员打交道。在以史密斯为代表的新私法理论中,产权制度则被视为具有制度模块的优势,产权可以为市场交易提供有效的交易认知,提供比霍菲尔德以来各种权利束理论更低的信息搜寻与交易成本。〔15〕在数据等无形财产权问题上,支持财产权的理论认为,数据与动产和不动产并无不同之处,甚至可能更需要财产权保护,因为数据存在信息披露的悖论问题,比一般动产与不动产更难解决信息问题。有观点甚至认为,所有“太阳底下任何人类创造的事物”都应当受到财产权保护。〔16〕

其次,数据产权的支持者指出,缺乏数据交易将导致公地悲剧、“搭便车”与投资激励不足等问题。1968年,生物学家和哲学家哈丁发表了《公地悲剧》一文,指出没有产权安排的公共资源使用将导致公共资源的浪费与“悲剧”。哈丁的理由是,每个用户都可能过度使用没有产权的公共资源,例如在公共草场上,农户尽可能多地进行放牧,最终造成草场的退化。〔17〕哈丁的公地悲剧理论虽然建构在有形财产的基础上,但这一理论也被应用在知识产权等无形财产上。〔18〕在知识产权的支持者看来,信息与数据等无形财产虽然与土地、商品等有形财产具有重大差异,但信息与数据也同样存在公共悲剧问题。对符合条件的信息与数据进行一定期限的著作权、专利、商标的财产化保护,可以促进信息与数据的开发。信息与数据的开发利用者在采集、加工与提炼数据后,可以有效开发相关资源,将数据资源应用于最具有需求的交易方,并在保护期届满后允许公众对其进行利用。这样,数据等财产权设计可以有效促进公共领域的数据开发,更好地开发数据这一公地资源。〔19〕

“搭便车”、激励理论和公地悲剧理论密切相关,但更关注数据产权对于促进市场预期、激励市场主体与建构市场的作用。按照其推理,在缺乏产权保护的制度安排下,人们不会对相应资源进行投资、加工与维护,无法通过市场激励与市场流转的方式来激发市场活力。因为人们可以搭公共资源的“便车”,过度使用公共资源;或者搭他人的“便车”,对他人产品进行免费占有和利用。用经济学的术语来说,这意味着缺乏产权保护将导致负外部性问题。对于支持数据产权理论的学者来说,产权制度正是解決外部性问题的良方,可以通过将外部性问题内部化而解决“搭便车”与激励问题。在其经典著作《产权经济学》中,德姆塞茨曾指出,在一个没有交易成本的世界里,明晰产权将使所有者的活动成本和收益内部化,并允许将该权利出售给可能更重视该权利的其他人。〔20〕即使在具有交易成本的情形下,当产权保护所带来的负外部性问题内部化超过产权保护带来的成本时,产权保护仍值得追求。〔21〕

总之,数据产权理论认为,现实场景中数据交易以服务为对象,而非以数据本身为对象,其根源在于产权保护制度的缺失。一旦形成完备的数据产权制度,针对数据本身的交易需求就会被激发出来。就像在农业社会,人们之间的交易更多是劳务等形式的互助,只有到了工业化与商品化时代,各类商品、土地、技术等生产要素才出现市场交易。从这一逻辑推论,一旦关于数据的产权制度落实,针对数据本身的交易市场就可能出现,甚至可能出现类似证券市场的高频交易。

二、数据特征与产权保护的困境

数据交易的困境是否可以通过产权制度解决? 对数据的特征进行分析,可以发现数据具有价值不确定性、一定程度的非竞争性和非排他性等特征,这使得数据确权难以解决,或不适宜解决上文提到的交易成本、公地悲剧、“搭便车”等问题。在知识产权保护中,就已经存在上述问题,并引发了很多学者对知识产权过度财产化的批评。知识产权中的部分制度具有财产化特征,但也与传统财产权存在较大区别。另外一些制度则更接近于非财产化保护。知识产权制度存在的问题,正从另一个侧面反映了数据产权保护的困境。一旦对不满足知识产权条件的数据进行产权保护,法律所面临的困境将更为严重。

(一)数据价值的不确定性

数据本身的价值具有不确定性。产权理论的支持者认为产权制度可以降低市场交易费用。例如史密斯教授曾经指出,信息的知识产权保护可以降低市场的信息成本:“如果没有这些制度,人们将没有太多的动力参与与信息有关的某些活动,无论是发现信息、将信息商业化,还是利用信息降低消费者搜索成本。”〔22〕但数据特别是大数据的价值本身非常不确定。即使企业对外披露其数据,仅仅凭借数据本身也难以确定其价值,难以减少市场主体搜寻与利用数据的交易成本。〔23〕数据价值的不确定性有如下若干原因:

其一,大数据对相关问题的“预测”并不一定比已有的决策更加正确。舍恩伯格曾经指出,大数据的核心在于“预测”,并认为在不久的将来,“世界许多现在单纯依靠人类判断力的领域都会被计算机系统所改变甚至取代”,但舍恩伯格也同时强调,大数据的特征是“混杂性”而非“精确性”,是“相关关系”而非“因果关系”。〔24〕这就意味着,大数据所带来的预测优势仅仅是概率性的,并不意味着基于数据的决策在所有情形下都更准确。在实践和各类研究中,也有大量的例子证明,数据未必总是能够发挥正面作用,在不少情形下,数据甚至可能给企业带来错误的决策。〔25〕

其二,数据本身往往很难进行兼容和集成,很难有效融合到企业已有的数据和决策体系中。数据的价值常常被类比为“石油”。但离开场景与服务,数据本身就是一堆表格和数字,对企业而言并无用处。〔26〕有的数据可能面临结构化的问题,难以和用户已有数据实现技术层面的融合。〔27〕有的数据虽然已经实现结构化,可以和企业已有数据在技术上实现整合。但在应用层面,这些数据可能难以有效和企业决策整合,帮助企业作出更佳决策或更有效的商业服务。〔28〕数据真正成为有价值的商品,必须结合需求方的具体场景,为企业提供看得见摸得着的服务。而要完成这种转换,就需要网络平台、数据库企业或数据经纪商对数据进行持续性加工,使其能够持续性地嵌入企业发展需求。这也说明,为何数据的购买方或需求方往往并不直接购买数据,而是要求数据供给方为企业提供能够解决现实生活场景的一对一服务。只有在相关数据能够直接接入企业需求,成为契合企业内生数据一部分的情况下,数据才能真正成为企业的资产或助推器。就此而言,数据并不像“石油”、黄金或货币等资产,可以直接嵌入已有资产中;也不像土地、产品、专利那样,可以相对容易与已有的生产要素进行匹配或融合。

其三,即使能够确认某一数据的价值,数据也很难成为一种标准化产品。一般而言,能够进行大规模流转的产品都是那些能够标准化的交易品, 交易品只有脱离了供给方和需求方的个性化因素,价值保持相对稳定,才不会因产品的供给方和需求方的不同而不同。但数据却具有高度场景化特征,很难脱离场景成为标准化产品,也很难产生一个大规模流转、适用于所有平台和所有用户的数据流量市场。从供给侧来看,数据的供给方所供给的数据常常具有场景化特征。例如,在平台类数据中,即使相同的数据与流量服务,其效果也会因为各平台的受众类型、消费习惯、观看时间的不同而不同。比如,电视平台的受众可能年龄偏大,网络用户可能相对年轻,两者对于不同产品的敏感度、接受度与购买兴趣都不同,其收费价格也并不相同。从需求侧来看,用户常常只需要数据的很小一部分,很少需要对数据整体进行开发利用。以数据库为例,数据库可以说是标准程度最高的数据类型,但用户在购买这类数据后,往往只需要对其部分进行利用。因此,数据库企业在与不同高校、研究机构所签订的合同中,虽然都出售同样的产品,但其所提供的服务和收取的费用往往相差巨大。

综合而言,数据价值的不确定性使得数据本身难以成为一种可以流转的标准化商品。能够进行市场流转的商品,一般需要具有相对确定和标准化的使用价值或交易价值。例如土地、产品具有工业或消费使用价值;黄金、货币、虚拟货币则具有交易价值,这些商品的价值都可以通过信息披露而大致确定。但在数据的例子里,很多数据的价值处于不确定或待定状态。这样,即使法律对数据进行财产化确权,也难以降低交易方的信息成本和交易费用。

(二)数据的非竞争性与非排他性

数据还具有一定程度的非竞争性和非排他性,这使得上文提到的公地悲剧理论不能简单应用在数据问题上。上文提到,缺乏产权制度会导致公共领域的过度利用,或者导致对公共领域的开发利用不足。但首先可以指出,数据具有一定程度的非竞争性特征,并不像土地、商品或货币一样是稀缺资源,一旦被他人占有,其价值就会完全丧失。〔29〕即使数据被他人复制或获取,原始数据仍然存在,数据拥有者仍然可以对数据进行开发利用。正如罗斯教授所言,在数据与无形财产领域,不存在过度利用的问题,公地悲剧的理论并不适用。〔30〕

缺乏产权制度会否导致数据产品的激励不够,从而导致上文提到的“搭便车”问题,最终造成公共领域的开发利用不足? 这一问题较为复杂,但可以指出“搭便车”行为并不一定都是负面行为。“搭便车”经常被认为是一种负外部性问题,因为“搭便车”会对他人财产造成损耗,而财产遭受损害的一方却得不到补偿。但即使在有形财产中,“搭便车”行为也不一定受到道德谴责和法律调整。〔31〕在无形财产或有形财产产生的无形资源中,“搭便车”更为普遍。一般而言,对无形财产的“搭便车”不会对对方物品造成损耗,因此“搭便车”很可能成为一种正外部性活动,产生所谓的“溢出效应”。〔32〕例如,当某户人家在院子里种植花草树木,路人和邻居因此享受了花草的香味和美感,此时路人和邻居的“搭便车”行为有利于社会的整体福利;当游客对当地房屋进行外部参观或拍照,只要此类行为不侵害对方隐私或其他伤害,那么游客的此类“搭便车”行为也会产生正外部性。〔33〕

“搭便车”行为也未必妨碍投资激励,更不一定需要以财产权制度进行投资激励。“搭便车”行为经常会被认为不利于投资,因为付出投资成本的主体将无法在“搭便车”的情形下通过收费而收回成本。但正如莱西格等学者指出,“足够的激励”并不意味着“完美的控制”。〔34#〕即使邻居与路人享受了花草的香味、房屋的视觉美感,也不会打击户主种植花草与修建房屋的动力。法律只需要保证投资者能够有效获取比成本更高的回报,而不必禁止所有的“搭便车”行为。如果对所有个人投资都进行绝对化的产权保护,那么结果将是过度的投资激励,造成社會资源与社会福利完全被私人所占有。例如,承担修建桥梁或高速公路的公司可以拒绝某些车辆的通行, 或者通过对车辆收取高额的通行费,在这些涉及正外部性的例子中,赋予个体以绝对性控制的权利,都会造成社会福利的整体下降。在数据问题上,由于数据的非稀缺性与竞争性,法律更应谨慎以财产权制度来进行投资激励。因为一旦采取财产权和排他性保护,就剥夺了社会其他主体对于数据的利用,大幅降低社会的整体福利。

此外,数据还具有一定程度非排他性的特征,这使得每个社会主体都会进行大量的“搭便车”等行为。〔35〕传统的动产与不动产之所以能够确立财产权制度,除了法律对于违法行为的打击,一个重要原因在于动产与不动产的所有者往往能自我保护。对于不能自我保护的财产,法律对其保护往往较为谨慎,因为这需要花费大量的执法资源。这就是为什么对于花草的香味、植物与房屋的视觉美感,法律常常并不进行保护。在信息与数据问题上,传统农业社会更容易对信息与数据进行自我控制,例如手抄书籍往往只能在小范围内流通,但在工业化时代,印刷术与现代媒介的形成使得所有者对信息与数据的控制能力越来越弱。特别是随着互联网与信息技术的发展,信息与数据可能“以零边际成本为无限多的用户”所获取。〔36〕在这样的背景下,如果对数据进行绝对化的财产权保护,就可能导致少数大型企业垄断数据,〔37〕大量社会主体数据侵权的困境。面对“零边际成本”和“无限多的用户”,数据的产权保护将面临法不责众的困境。

(三)知识产权的启示

或许有观点会问:数据具有非竞争性与非排他性,但作为知识产权客体的智力成果也具有同样的特征,为什么法律对智力成果确立了产权保护制度? 如果说知识产权的财产化可以有效解决阿罗信息悖论以及与之相关的公地悲剧与激励问题,〔38〕那么为何数据不能? 对知识产权制度进行简要分析,可以从反面论证数据产权的困境所在。

首先,知识产权并非传统财产权,知识产权虽然被冠以“产权”的名称,但不能完全以财产权进行理解。莱姆尼曾经指出,知识产权的“产权化”是一种修辞性的转变。〔39〕从实际制度运行来看,知识产权与动产或不动产存在重大区别。产权的标志性特征是排他性,〔40〕但知识产权中的各种制度都规定了宽泛的例外。例如各国著作权都规定了合理使用制度,只对思想表达而非对思想本身进行保护;专利制度一般都允许反向破解,〔41〕且必须以登记和公开作为保护前提;无论是著作权还是专利,都规定了保护期限。〔42〕而商标和商业秘密则与财产权的区别更大,商标保护只针对商业化使用,商业秘密则以保密为前提,这两者都更接近行为主义保护,而非对世(in rem)的财产权保护。

其次,即使非传统财产权保护,知识产权也已经遇到了前文所提到的种种困境,并且试图寻找非产权化的保护途径。例如在著作权领域,莱西格等人提出的知识共享计划就试图淡化著作权的财产权特征,为创造者提供保护与非保护中间的选择。在专利保护领域,专利恶意注册所引发的“专利流氓”问题已经成为公害,带来了漫天要价、知识私有化等一系列问题,引发了淡化专利财产权保护的呼声。〔43〕此外,在公地悲剧、“搭便车”等问题上,也有学者指出,这些理论框架不适宜运用在知识产权上,不能以此论证智力成果的财产化保护。〔44〕

最后,也是最重要的,知识产权对于数据保护有严格的限定,大大缩小了数据的保护范围。知识产权中的著作权、专利、商标,法律也都要求其具有原创性、新颖性与实用性、显著性等特征,通过此类限定,法律将不具有价值的信息与数据排除在保护范围之外,从而大幅降低了信息交易的成本;同时,这一限定也大幅减少了数据财产化保护可能带来的问题。如果法律不加限定,对所有数据进行财产化保护,其结果必将是信息搜寻与认知成本进一步增加和负面问题也进一步增加。

对非知识产权的数据整体进行保护, 最为接近的法律制度是TRIPS协议和欧盟等部分国家或地区所采取的数据库的特殊权利保护。〔45〕但这一法律制度存在若干重要限定。其一,这一法律的立法目的是为了保护对数据库的投资激励。只有当数据库的持有者付出了重大投资,相关数据库才受到法律保护。其二,这一法律制度仅仅保护数据库的整体或实质性部分,并不保护数据的部分或非实质性部分。〔46〕其三,在很多国家和地区,数据库并未受到各国通行的法律保护。〔47〕综合数据库的法律保护制度,可以发现这一法律制度存在争议,而且更接近于反不正当竞争法制度,与传统的产权制度存在较大差别。因此,即使是数据库保护的法律制度,也未对数据进行财产权保护。

三、数据交易的模式重构

如果说产权并非解决数据交易困境的药方,那么数据交易的种种困境如何破解? 大数据交易所应当采取何种模式? 法律制度应当采取何种制度设计? 要回答这些问题,可以首先回到本文第一部分留下的一个问题。第一部分指出,尽管大数据交易所的场内交易困难重重,但场外的点对点的数据交易却非常普遍。这就留下了一个疑问:为何缺乏数据产权保护,场外的数据交易仍能发生,场外点对点的数据交易如何克服本文所称的阿罗信息悖论? 回答了这一点问题,我们就能进一步推论,如何可能吸引企业去大数据交易所进行交易。毕竟,数据交易所一般要对交易双方收取交易佣金。而且在数据交易所进行交易, 意味着数据交易所也可能掌握数据交易双方的数据或至少部分商业情形,增加数据泄露的风险。同样,只有充分理解数据交易的特征以及大数据交易所的模式,我们才能对相关法律制度进行进一步设计。

(一)数据交易的合作模式

先来分析数据交易的发生模式。场外数据交易已经说明,阿罗信息悖论并不能阻止数据交易的产生。这其中的原因在于,阿罗信息悖论的前提假设:数据的非排他性是相对的。当阿罗等学者论述排他性时,他们往往都以排他性/非排他性的二元框架进行论述,〔48〕即人们可以对有形物品进行排他性控制,而无法对数据等无形物品进行非排他性控制。〔49〕但排他性与其说是一项事物的本质特征,不如说是一种成本。当“利益可由所有者或提供者以零成本持有,此商品具有可排除性;而一旦商品被提供,所有人都能获得利益,则这种商品具有不可排除性”。〔50〕在现实生活中,有形物品很难实现完全的排他性控制,例如书店、商场的所有者在营业时间不能排除一般顾客进入;但数据等无形物品并非不可以进行排他性控制。少量数据虽然可能在数据互联的场景下以零成本被复制,但一旦数据的体量巨大,或者数据控制者并未和他人进行互联,此时数据控制者就仍然可以通过商业程序或技术而实现数据的排他性或一定程度的排他性控制。〔51〕

与此相应,数据公开也是一个相对的概念与过程。在有形商品中,产品的信息公开就可能处于完全公开与非公开之间。例如,普通水果从外表上就能辨别其产品特征,而柠檬的外表则可能造成信息不对称;新车可能仅通过品牌与说明书就能了解产品的大致特征,而二手车市场则可能具有与柠檬市场类似的特征。〔52〕大部分产品则可能通过披露其信息而让交易对象对其进行一定程度了解,但要對产品进行详细了解,则需要和交易对象进行持续性沟通,简单的信息披露往往无法实现。〔53〕数据亦是如此。数据即使公开,其披露的也往往只是部分的信息。〔54〕同时,即使数据控制者完全公开其数据,交易对象完整复制了交易数据,这也不意味着交易对象就能完全获取信息。〔55〕正如上文所述,大数据的价值具有不确定性,其价值的实现往往依赖于具体场景与数据提供者的服务。即使某一企业复制了知网、Lexis、Westlaw等数据库,这一企业也很难为用户提供搜索查询服务。

对数据非排他性与数据公开的反思可以说明,为何数据在面临阿罗悖论的情形下仍然可以进行交易。通过数据的合理控制与数据的合理公开,数据控制者既可以向数据交易方披露其数据的价值,帮助数据交易方评估交易数据的成本与收益,又可以防止数据完全脱离其控制,导致价值的彻底丧失。在现实的商业场景中,这种逐步披露、有限控制与渐进式合作的模式非常普遍。即使是向外披露其信息的专利制度,也有研究表明,专利也经常面临阿罗信息悖论问题,在专利制度交易中,双方仍然需要借助有限披露与渐进合作的模式进行专利转让与合作。〔56〕

在经济学文献中,交易方难以通过信息披露或体验而了解的商品可以被归入信用品的类别,〔57〕相比起非信用品,消费者或交易方对于此类商品的价值往往难以在事前完全确定,只有在购买使用之后,消费者或交易方才能确定信用品的价值。但正如经济学文献所指出,信用品虽然面临信息披露与交流的难题,但其难题并非不可解决。例如交易双方可以通过渐进式了解促进信息的不断沟通,〔58〕例如通过电影片花与电影介绍来了解影片。在类别区分上,数据也属于典型的信用品,〔59〕数据的价值高度依赖场景,难以进行事先披露,但数据也可以和其他信用品一样,借助合作机制、声誉机制等方式促进信息交易。〔60〕在数据交易中,数据提供方经常为数据需求方提供部分数据或试用期,以帮助数据需求方了解其数据的价值;数据需求方在寻求数据服务方时,也经常通过市场声誉机制而寻求合作者,而非直接购买数据本身。因此,数据交易采取的是一种更接近于服务合作的模式,而非一种去人际化的产品交易模式。

(二)数据交易所的模式与制度

数据交易的服务合作模式也为大数据交易所的模式与制度设计提供了反思基础。大数据交易所不宜模仿类似证券、期货之类的商品交易所。过去数年,在大数据交易所的创建过程中,证券交易所的交易模式成为不少人的理想模型。由于大数据价值的日益凸显,而数据又不像有形商品一样,需要实物交接。因此有不少观点认为,可以证券交易所为模型,促成数据产品的高频交易。但事实与理论都说明,证券交易所的模式并不适合大数据交易所,数据交易只能采取基于数据服务的合作模式,而非基于完全市场化的合同模式。〔61〕

从数据交易的信用品特征与合作模式出发,大数据交易所应采取类似房产中介特别是婚姻介绍所的中介与撮合模式。在现实社会,类似的中介型的交易模式已经普遍存在并运转良好。例如,在房产买卖与租赁中,房产中介采取的就是较为积极主动的中介与撮合模式。房产中介之所以采取这种模式,原因之一在于房产也具有一定的信用品特征,其价值难以进行标准化界定。房产中介可以发挥居中撮合的作用,为交易双方提供前期的信息搜寻、信息沟通等服务,增强彼此信任。此外,房屋中介还能够为交易双方提供一定的安全保障,为交易双方解决后顾之忧。基于这些增值服务,房屋中介虽然同时从交易双方那里收取佣金,但交易双方仍然愿意通过中介进行房屋买卖。婚姻介绍所存在的原理与此类似,在婚恋市场上,单身青年对于彼此的期望往往非常个性化,因此绝大部分婚恋都通过自由恋爱解决。但婚姻介绍所或媒人仍可以通过信息搜寻、信息沟通、信任建构为单身青年提供增值服务,向双方收取佣金或获得人情上的回馈。〔62〕

与房产和婚姻中介类似,大数据交易所也可以为交易雙方提供增值服务。首先,在交易形成前的阶段,市场中有大量交易信息搜寻的需求,例如银行、网约车公司可能希望进行风险控制,对违约赖账、有犯罪风险的群体进行风险预防,这些企业可能不知道去何处寻求有价值的数据;从事药品与疫苗的药企也可能不知道去何处寻求所需的临床数据。大数据交易所完全有可能扮演中间商的角色,为双方提供更准确的信息搜寻服务。其次,在商谈环节,交易双方也可能面临上文提到的信任问题,交易双方可能因为信息不对称而草草放弃交易,或者在中间环节形成合作的囚徒困境。此时大数据交易所就可能发挥其中介功能,促成交易形成。

此外,大数据交易所也可能发挥关键的安全保障与安全认证功能。〔63〕目前,场外的数据交易虽然活跃,但也面临若干重大风险。随着我国数据安全法与个人信息保护法的落地,企业在数据安全与个人信息保护方面都存在合规的巨大压力。一方面,数据安全法对于数据安全、重要数据等关键问题的界定仍然较为模糊,企业的场外交易存在重大的不确定性。另一方面,个人信息保护法对个人信息的收集、融合与利用都进行了严格规定,而企业所处理与利用的数据又存在海量的个人信息。在个人信息保护法生效的背景下,原先很多场外的数据交易与合作是否合法合规,也处于不确定状态。〔64〕在此种背景下,如果具有政府背景的大数据交易所能够为企业的数据安全提供合规科技、风险评估与安全认证,并且为个人信息提供可交易的规则,则企业将会有较大的动力进入场内交易。〔65〕

综上所述,撮合型的大数据交易所可以视为对场外点对点数据交易的促进、服务与保障,以此吸引数据交易从场外进入场内交易。如同本文第一部分指出,场外的点对点数据交易已经非常普遍与有效。撮合型的大数据交易所并非完全替代场外的交易模式,而是在此基础上发展起来的一种模式。在这种交易所模式下,数据的价值不确定、非竞争性与非排他性问题将有效得到解决。因为数据的交易方可以在数据交易所的撮合下进行渐进式的沟通、谈判与互动,就像房产买卖双方在中介的撮合下互动,或者单身青年在中间人的撮合下互动。当大数据交易所提供足够专业化的中介服务,撮合型的交易所就有可能克服数据的价值不确定问题。在大数据交易所的安全保障下,交易双方也将有更多信心进行交易,克服数据的泄漏或排他性问题。

(三)数据交易的法律规则

除了大数据交易所提供的规则,法律还需为数据交易提供兜底制度或缺省规则。首先,法律应要求大数据交易所承担安全保障义务和守门员责任。随着社会生活中具有公共组织功能的社会主体日益出现,〔66〕特别是随着网络平台等组织的兴起,安全保障义务日益为我国法律所认可。〔67〕大数据交易所具有典型的组织性功能,作为一种撮合性中介,在促进数据交易的同时也放大了相关数据风险,可能造成个人信息的再识别与数据流入上下游的黑产手中。在这样的背景下,大数据交易所在承担数据交易促成功能的同时,也应当承担相应的数据安全风险防范与数据治理功能。特别是当大数据交易所提供安全认证、风险评估等服务时,更应承担安全保障义务。对大数据交易所施加此类义务,要求大数据交易所承担类似守门员的责任,不仅可以有效促使大数据交易所对数据交易的上下游风险承担预防责任, 而且还将倒逼数据交易所创新交易模式, 承担积极的数据治理责任。〔68〕2022年年初,《国务院办公厅关于印发要素市场化配置综合改革试点总体方案的通知》指出,应当探索“原始数据不出域、数据可用不可见”的交易范式,在一定程度上可视为对风险可控数据交易的一种有效指引。

其次,法律可以利用专利、商业秘密、合同等已有法律制度为数据交易提供法律保障。这些制度有的可以为数据提供一定程度的财产性保护,例如专利;有的制度则属于责任规则,例如商业秘密和合同。〔69〕专利制度的优点在于,这一制度可以成为一种对世权,实现排他性保护,但专利制度保护需要符合相关要件,且必须进行登记以及向外公开披露其信息。这使得专利制度只适合很少一部分的大数据保护,例如,对符合专利申请条件的医药数据进行保护。相对而言,具有责任规则性质的商业秘密和合同虽然无法提供排他性保护,但却可以为数据交易与谈判提供保护,促进交易的成功。〔70〕莱姆尼曾经指出,商业秘密正是一种克服阿罗信息悖论的方式。〔71〕即使在没有明确保密协议的情况下,法律也可以在某些情形下推断出保密关系,从而使盗用商业秘密的一方承担责任。〔72〕

最后,法律可以审慎地应用反不正当竞争法,对某些数据进行保护。反不正当竞争法也属于典型的责任规则类或行为性规制法律,但比起合同法,反不正当竞争法又可以保护数据同时免受非交易方的侵害,为数据控制者提供比商业秘密与合同更多的保护。从中国和其他国家和地区的情况来看,数据的反不正当竞争主要涉及若干类型的案例,例如平台类数据爬虫所引发的纠纷;以及由热点新闻等信息或数据所引发的纠纷。在前者的案例类型中,典型的场景是一方平台企业爬取另一方平台企业的公开数据,但被爬虫的一方不愿意其数据被爬取;〔73〕而后者的案例类型中,典型的场景是一方新闻机构拥有热点新闻的信息或数据,另一方新闻机构在未获授权的情形下,利用这一信息或数据进行报道。〔74〕

法律对于反不正当竞争法的使用应注意和其他法律协调。法律为数据提供合同与商业秘密之外的反不正当竞争法保护,其好处是可以维护数据原来持有者的权益,激励数据持有者公开其数据。但其可能存在的风险也非常明显。首先,反不正当竞争法本身就存在一定的不确定性,在欧美等国家,反不正当竞争法的应用领域一直非常有限;在我国,反不正当竞争法的泛化也引起了学界不少争议。〔75〕因此,反不正当竞争法本身就具有探索与实验性质。其次,在数据问题上,反不正当竞争法的泛化应用可能导致数据的财产化保护,如果反不正当竞争法的保护范围与力度过大,那么其结果就可能导致数据的财产化保护,进而造成上文所述的数据私有化、违法普遍化等问题。正如上文所述,在保障数据交易的法律工具箱中,专利、商业秘密、合同等制度已经为数据交易提供了基本制度支持。在此背景下,数据的反不正当竞争法保护不宜过于激进。数据的反不正当竞争法保护可以采取个案化、场景化进路,对准财产性权益与准合同性权益进行探索性保护,〔76〕将其视为拓展数据知识产权与合同保护的工具。

结语

自从数据要素市场的概念提出以来, 商品市场特别是证券市场的模式支配了数据交易的想象。在不少观点看来,既然大数据的价值已经充分体现,数据已经成为一种类似土地、劳动力、技术的重要生产要素,那么数据交易就应当模仿传统各类生产要素搭建交易市场。例如,针对土地、劳动力,各地都已经建立了土地交易或拍卖所、劳动力交易所并且运转良好,针对技术,各地也已经建立了技术交易所,搭建专利、著作权、商标等知识产权交易的平台。

但需指出,不同生产要素与商品的交易模式非常不同,各类交易所的交易规模与频率也非常不同。仅就土地、劳动力、技术而言,土地拍卖与劳动力市场的运转就较为顺畅,交易规模与频次较高,而技术交易所的交易规模与频次要低很多。究其原因,专利等知识产权与土地、劳动力等生产在性质上存在较大不同,很难完全复制类似前者的交易模式。而相比知识产权,数据更具有独特性,数据具有价值上的不确定性,即使数据完全公开,其价值也处于难以了解的状态。因此,数据确权并不能解决阿罗信息悖论问题。此外,与知识产权类似,数据也具有一定程度的非竞争性、非排他性等特征,这些特征使其即使缺乏产权保护, 数据也不会面临传统动产与不动产所面临的公地悲剧问题、“搭便车”所造成的投资激励不足问题。相反,如果对数据进行财产权保护,则会造成公共资源私有化、正外部性与溢出效应丧失、普遍违法等困境。〔77〕基于这些原因,就可以解释为何现有的大数据交易所面临交易规模与频次低下的困境,也可以得出结论:数据的财产化确权无法解决数据交易的困境,反而会带来种种问题。〔78〕

但数据交易的困境却可以从其他途径破解。在传统市场中,商品的交易就并非都采取去人际化的产品交易模式,很多服务型与信用品类的商品都采取合作型的交易模式。在合作型交易模式下,交易双方往往进行个性化或非标准化服务, 或者通过信息的渐进式披露和声誉机制而进行谈判和交易。数据具有典型的信用品特征,也可以借用合作模式进行交易。数据虽然具有非排他性,但这种非排他性也是相对的。因此,数据可以通过部分逐步公开与有限控制,实现数据交易双方的互动型合作,或者借助声誉机制、社会规范而克服阿罗信息悖论,实现数据成功交易。

从合作型交易模式出发,可以发现大数据交易所不宜采取市场流通商品的交易模式,更不宜追求类似证券、期货的高频交易所模式。相反,大数据交易所应当定位为撮合型与中介型交易所,大数据交易所在为数据交易提供平台的同时,应当成为主动撮合双方数据交易的中介,减少交易双方的信息搜尋成本,搭建交易双方的沟通与信任机制。大数据交易所还应当探索数据交易的风险评估、安全认证等功能,为数据交易双方提供增值服务。当大数据交易所成为类似房产中介或婚姻中介的交易所,为交易双方提供场外交易不具备的优势,大数据交易所就可能吸引数据交易从场外交易转为场内交易。

在法律层面,首先应当确立大数据交易所的安全保障义务,要求大数据交易所对数据交易的上下游风险担负守门员责任,预防相关数据风险,承担数据治理责任。其次,法律还应运用已有的知识产权、合同等法律制度,为数据交易提供传统法律保护;同时审慎运用反不正当竞争制度,为数据提供财产性权益与合同性权益的探索性保护,避免陷入数据财产权保护的窠臼。总而言之,法律对数据应当采取非财产权的法律保护,为数据交易提供治理型的制度回应。〔79〕