李 刚 张钦坤 朱开鑫
循着这一思路,Grossman和Hart一文为分析经济学中“企业和市场的边界”这一经典问题提供了一个新视角,并通过一个两阶段博弈模型对企业的“整合-交易”二元选择进行分析。在第一阶段,合作双方(企业1和企业2)签订合同并作出专属性投资(relationship-specific investment,a1和a2)。在第二阶段,两家企业分别行使控制权,对自己所做投资作出生产性动作(q1和q2),并依照一定的生产函数(Φ)收获投资收益Bi[ai,Φi(q1,q2)]。合同的“不完整性”体现在不论是专属性投资a还是生产动作q都无法在第一阶段的合同中进行事先约定。模型之后分为无垂直整合、企业1控制企业2、企业2控制企业1三种情况进行讨论。无整合的情况下,双方各自依照自身利益选择专属投资水平a和后续生产动作q,结果往往是次优的纳什均衡。后面两种整合的情况是对称的,只需讨论其中之一,另外一种不言自明。假设是企业1整合企业2,得到a2的控制权,则企业1可在第二阶段指定q2以便达成在前期专属投资水平a1和a2前提下的产出最优。企业1通过整合取得所有专属性投资a的控制权,并通过剩余控制保证产出优化,此即获取产权的“收益”。但相应的,企业2也失去投资动力,导致a2投资不足(under-invest),使得最终产出水平扭曲。当企业1专属性投资a1对价值产生边际贡献显著高于另外一方,则扭曲的幅度会大大小于纳什均衡的效率损失,整合成为较好的选项。边际贡献差异越大,扭曲的幅度越小,整合的结果越接近最优产出(2)受到篇幅限制,这里的讨论对Grossman和Hart (1986)两阶段模型进行了简化,但基本结论一致。。
Grossman和Hart借用了以往在研究“企业和市场边界”问题中占据主流的交易成本理论的核心概念,如专属性投资(asset specificity)和打劫风险(hold up),但分析方法和思路与交易成本理论有一些显著的区别,也回答了后者视野中缺失的一些关键问题,例如应该由谁来整合谁。即便是在三十年后的今天,这一研究对我们理解一些当下重要的经济现象仍是非常有启发的。例如,如何理解互联网等高科技产业中的投资模式选择?在创新驱动、竞争激烈的市场环境中,是取得完全的控制权,还是保留被投资企业的自主性?再如,数据要素的产权是掌握在消费者手里还是平台企业手里对数字经济的长远发展更为有利?又如,数据要素的交易是通过一对一的所有权移转方式还是通过大型数据聚合平台的数据服务方式更为可行?
本文试图将这些问题放在现代产权理论的框架中进行分析解答。在接下来的第二部分比较了现代产权理论与交易成本理论的不同之处,并用一个火电厂和煤矿的例子对这两个重要理论的异同进行比较。第三部分讨论现代产权理论在生物制药、互联网等高科技领域的不同投资并购模式中的应用,用以说明现代产权理论的指导价值。第四部分将现代产权理论的应用于数据要素产权归属问题。由专属性投资带来的数据资产的快速积累,为数字经济的发展提供关键动力,而互联网平台企业的专属投资和生产函数的边际贡献率显著高于用户的投资和生产函数。因此,数据要素的产权归属,从产出最优的角度来判断,结论很明确。第五部分将现代产权理论的应用于数据要素交易流通机制的设计中。数据交易达成的只能是不完全合同,从边界贡献和剩余控制着手,依托大型数据聚合平台的数据服务模式更为可行并已经被商业化和公共服务属性的数据流通实践所认可。第六部分总结全文。
从上面的简单讨论中可以看出现代产权理论与交易成本理论有两个显著的不同。一是在Grossman和Hart看来,所有权的重要性不单在于保障在事后利益分配中取得合理份额,还要保障事前的投资达到可以使事后总产出最优的水平。预见到事后会被打劫,交易相关方在事先就会决定保守投资以减少被打劫时的损失,结果导致最终产出是一个次优的纳什均衡——虽然降低了被打劫的风险,但因为保守投资,产出也达不到最优水平,重新谈判筹码变少,收益也变少,也就没有再次谈判重写合同来打劫的动力。但若通过整合掌握合作中形成的资产的所有权,整合方也就掌握对所有事后例外的控制权,有效保障合同的执行,避免事后打劫的发生。获得产权的一方也就更有信心在事先充分投资以保障事后产出水平最优。
二是现代产权理论回答了一个被交易成本理论忽略的关键问题,即应该由哪一方发起整合。在交易成本理论的讨论中,垂直整合通过内化市场合同防范打劫、降低交易成本,但整合后谁是企业主、谁又变成了雇员对这一结果没有影响,反正打劫风险已经被消除,交易成本已经降低。与之形成鲜明对比,在现代产权理论的模型里,谁来整合谁会对最终结果产生重大影响。产权归属应该取决于双方的专属性投资对最终产出的边际贡献。如果出现了错误的产权转移,也就是边际贡献率较低的一方掌握所有权,将导致专属投资边际贡献率较高的一方丧失动力,减少投入甚至不投入,导致产出显著下降,垂直整合还不如市场交易。不是谁都合适做企业主,整合的方向搞错结果比不整合更糟糕。
但在产权理论当中,预见到投资完成会被打劫,火电厂可能会缩减投资规模,或者选址在几个煤矿的中间点,或者要求煤矿负担部分投资建厂成本。煤矿可能会因此在后期供煤的时候做手脚以节省成本。总之,若没有垂直整合,火电厂和煤矿合作的产出往往是一个次优的纳什均衡,在这一点上,交易成本理论与现代产权理论的预测是一致的。两者预测的差异发生在垂直整合的方向上,现代产权理论认为由煤矿来整合火电厂还是火电厂整合煤矿,或者是由第三方投资者同时并购火电厂和煤矿三种情况会导致迥异的结果,因为煤矿和火电厂对最终的发电量贡献是不同的。假设火电厂的边际贡献远大于煤矿,那么由火电厂并购煤矿虽然煤矿因为转交“剩余控制”利益得不到保障投入意愿降低,但其贡献率不大所以对最终结果的影响也较小。相反,如果是煤矿并购火电厂,火电厂因为相同原因投入意愿降低,则最终结果会因此大幅偏离最优产出,甚至比垂直整合之前更糟糕。而由第三方完成并购,只有在合同的完成度很高、出现事后例外状况的空间很小的时候才会成为选项(实际上,这种情况下由谁来主导垂直整合已经不重要,甚至垂直整合本身是否必要都是可以讨论的问题了)。
Grossman和Hart提出的这些原创性方法和分析思路,在产业投资领域得到了验证与体现。例如,新冠疫情引发全球对药物和疫苗研发的关注。新药研发风险高、周期长,发现活性物成分的小团队会早早为自己的发现注册专利,但却没有资源和实力来支撑后面漫长、高风险、所费不赀的临床试验,往往需要引入外部投资者,通常是实力雄厚的制药公司来支持临床实验。那么面对这样的情况,大型制药公司是否买入小团队和专利取得控制权来保障自己的高额投入不会在研发成功后被“打劫”——掌握专利的小团队反悔,宁愿挨罚也要转投其他出价更高的制药公司怀抱?
从制药行业跳出来,放在一个更一般性的情景下考虑大型科技企业与初创企业或快速成长的独角兽的关系,产业投资的股权结构安排也应该做类似的平衡。ICT、互联网与医药行业一样,都是技术和资本密集型行业,都是研发强度高、创新驱动、投资并购非常活跃的领域,而且投资并购的主导力量也都是大型科技公司。大型科技企业处在竞争激烈创新活跃的前沿科技领域,从某种程度上讲有点像上面提到的大型制药公司,往往需要通过投资来应对快速变化的市场和科技研发带来的不确定性。站在这些公司的角度,框架合同、少数股权、合营、控股、合并,哪一种安排更为合适?对此,曾有不少讨论。相当一部分舆论站在控股甚至合并一边,认为这样才能指挥得动,才能打通“中台”,才能推动新打法、颠覆固有的商业模式。但是,与这些商业模式一起被颠覆的,往往还包括创始人和创业团队。初创企业的“剩余控制”被买断,创始人和创业团队变身为打工仔,都会让创业团队至少丧失大部分继续奋不顾身投入企业运行和市场开拓的动力。而对于初创企业来说,能够区别于其他赛道和模式类似的企业的最重要资产,往往就是创始人和创业团队的特性和拼搏精神。沿用现代产权理论的逻辑,创始人和创业团队的投入程度a1对业务运营的边际贡献很可能高于大型科技企业的资源投入a2,在这种情况下,控股/合并不一定是能够保障项目产出最大化(初创公司快速健康发展)的合适安排。让创始团队保持控制权的收益,有很高的概率大于取得项目控制权的收益。
2020年4月10日中共中央、国务院印发的《关于构建更加完善的要素市场化配置体制机制的意见》将数据与土地、劳动力、资本、技术等传统生产函数中的要素并列,有关“数据生产要素”的话题引发热烈讨论,培育数据要素市场、促进数据资源流通也被提上议事日程。数据确权、数据定价等话题成为讨论的焦点,但讨论结果往往因为所持立场和讨论场域的不同而相差很大。从现代产权理论的角度来分析这个问题,以让数据要素产生的价值最大化为确权和流通的目标,可能会帮助我们厘清一些关键点,让讨论更为深入。
数据作为要素投入,本身具有的与土地、劳动力、资金等传统要素不一样的独特性质可以简单归纳为三点,易复制(复制速度快且成本低,一块硬盘搞定)、一致性(复制无损,在谁手里都“长”得一样)、非排他(non-rivalry, 复制给A并不妨碍复制给B;A在用不妨碍B也同时使用)。当采用完全静态的角度看数据要素的这三个特性的时候,往往会产生这样的错觉——如果数据作为生产要素可以产生价值,且可以在保持一致性的前提下以极低成本大量复制,不会有排他性,那岂不是复制越多、分享范围越大、价值自然就最大化了?这可能是对数据要素特性的最广泛流传的误解。事实并不是这样的:易复制不等于易加工;数据一致性不等于价值一致性;使用非排他不等于使用无成本。
首先,数据的易复制不等于易加工。原生态数据不是生产要素,加工后的数据才是;复制一台PC上的数据很简单(但往往也要一两个小时),传输、存储、计算、挖掘分析互联网大数据需要巨大的资源投入和技术积累,很贵很难——这个很贵很难需要大量前期投资的数据深加工过程,可以称为数据的“要素化”。移动互联时代的大数据与PC时代的小数据有本质的区别——量大、多维、格式多样、价值稀疏。一张40行×5列的班级成绩表,可以通过简单排序,花几分钟时间理解清楚;一张300行×30列的地级市GDP历史数据,可以通过多绘几张图,花几十分钟得到趋势性结论;一张2000行×200列的股市交易数据,需要通过描述统计、方差分析,甚至更复杂的统计模型来进行判断。再升高两个数量级,Excel能做的已经不多,需要换专门的统计软件了。这些还是定义直观明确容易理解的情况,若是处理对象从Excel表换成数以亿计的文章、照片、视频,这样的原始数据素材依靠人力或者高性能PC来处理已经不现实了。当样本越大、维度越多、数据越复杂、定义越模糊,从原始数据产生出可以用做决策的结论所需要的加工深度就越大,工作量也就越大。移动互联时代实时产生的海量数据绝大部分已经托付给机器和算法自动处理,最终送到决策者面前的都已经是深度加工的成果。没有经过这样深度加工过程实现要素化的数据,如同没有被光电板捕捉到的日照、从风电机旁边吹过的疾风,是无法利用的也就谈不上产生价值。
其次,数据的一致性不等于数据要素价值的一致性。即便是完成要素化的数据,也与一般意义上贵金属、石油、大豆等大宗商品不一样,难以简单进行标准化分割,拆成单位商品标价交易。数据要素作为一种资产是高度场景化的,有很强的专属特性。银行、运营商、互联网企业等都是目前数据要素化的关键主体。各家面对的场景不同,具体的数据源、存储结构、分析方式方法也有较大的差异。一家搜索公司与一家电商公司的数据结构、使用数据的方式和流程,分别是以优化搜索结果和最大化电商推荐为目标并不断迭代演进的结果。两者的数据要素化过程必然会有显著的差异,搜索公司拿着电商的数据做不来搜索的业务,电商公司拿着搜索的数据做不来电商的业务。让搜索公司与电商公司互换自家赖以生存的数据要素来做自己的现有业务,必然是一地鸡毛。也就是说,各家经过多年积累培养的数据要素化能力也是保障要素化数据在自家手里才能发挥最大价值。从这个意义上讲,未来的数据定价和数据市场建设需要围绕着已经要素化的数据产品和服务展开,而不是针对未经加工的原始数据素材。价值评估不应是以芜杂多样难以理解的原始数据素材为标的物按量计价,而是针对特定的使用方式、使用场景开发出的特定数据服务来估价——数据完成要素化之后,进一步与实际需求相结合、与应用场景相结合开发成为专门的服务产品,再基于公平公开自觉自愿的原则进行市场配置。
第三,非排他不等于无成本。数据的要素化过程需要大量投入,不仅仅是搭建平台的硬件投入,还包括在要素化的过程中,随着开发量的积累和原创性想法的加入,出现的特异的具有知识产权属性的价值增量。非排他是知识产权普遍具有的特性,虽然在A使用的同时不妨碍B的使用,但并不等于因为非排他就无成本,就应该无偿分享。
用现代产权理论的框架来分析数据要素化过程,可以帮助我们更好理解各方关系。平台1和用户2在第一阶段签订使用合同,并分别作出专属性投资a1和a2。具体来看,a1包括开发社交、电商、搜索、支付等各类移动应用的投入,以及搭建云计算后台、保障网络安全、接入稳定、用户体验一致等运营维护的投入。a2包括购买智能硬件设备、购买网络流量、下载应用等投入。第二阶段,用户2使用各项移动互联网服务q2,并在后台留下使用痕迹,也就是原始数据。平台1经过云计算后台传输、存储、计算、挖掘分析等加工处理q1,完成要素化过程,再复用于提升用户体验或开发新的服务项目。双方合作的收益主要体现在平台价值和消费者体验的双重提升。平台与用户的使用协议显然无法穷尽所有数据要素使用场景,是一份不完全合同,那么数据要素的产权应该如何归属才能达到产出价值最优,或者接近最优?在平台1—用户2这一合作中,显然数据要素掌握在平台1手中才能转换为价值,用户2并不具备利用数据要素进行生产必需的能力和资源,Φ1(q1,q2) ≫Φ2(q1,q2)0。对于最终的产出Bi[ai,Φi(q1,q2)],平台1的投入边际贡献也很明显高于用户2投入的边际贡献。实际上,对于已经拥有一定规模的互联网平台来说,用户数量的边际变化对于其数据要素的价值贡献几乎可以忽略∂B1/∂a1≫∂B2/∂a20。这样看,数据要素的产权或者在用户协议之外的剩余控制权如何划分,结果不言自明——在数据要素化起到关键作用的平台,更应该取得相应数据要素产权。一方面,数据要素化需要依托强大的计算存储等基础能力和专业化的人才队伍,前期投入巨大耗时费力;另一方面,数据要素化有很大的规模效应和范围效应,适于专业长期持续投入的平台化发展。相比之下,单一用户或者用户联盟对数据要素化的边际贡献较小,也缺乏让数据要素充分发挥作用的技术和资源。因此把数据的要素化过程交给个人用户、多个个人用户的代理者/联盟、第三方数据公司来完成,至少是低效的,甚至大部分情况下是不可能的(13)此段论述为借用Grossman和Hart的语言分析数据产权的最佳归属。。
确定数据要素的产权是数据要素市场建设的基础。目前国内在数据要素市场建设方面已经有一些尝试,也积累了一些有益经验,但总体上取得的成效与原本的预期有较大的落差。这可能是由两方面的原因造成的:一是数据要素权属的划分需要考虑到各方面的顾虑,在认定上仍存在灰色地带,给数据交易带来很多的不确定性;二是在数据要素市场的机制设计上,目前仍处在摸着石头过河的阶段,对于数据要素本身、数据要素的使用场景、提供方和需求方的真正诉求尚缺乏深刻的理解,交易体系的设计尚不能充分发掘数据要素价值,也不能充分满足各方需求。数据的易复制、一致性、非排他与实物资本在物理特性上根本不同,交易中交付的只是使用权而非真正意义上的所有权。数据使用也存在很大的信息不对称,站在提供方的角度,已经发送给需求方的数据无法撤回或销毁,只能停止更新;站在需求方的角度,在拿到服务之前是个“黑匣子”,只有通过使用和试错才能发现是否符合自身需求,而这一试错成本不菲。如何在数据供需双方之间建立起合适的交易流通模式是亟待研究解决的重大课题。
大数据交易中心一度曾是各地重点建设的对象,但短短几年之间这种依靠一手托两家模式的居间撮合交易模式便陷入了停滞状态。2015和2016这两年间,全国各地共有13家大数据交易中心密集成立。但2017年以后,各地的新增数量骤降为零。直到2020年4月发布《关于构建更加完善的要素市场化配置体制机制的意见》后,大数据交易市场才又焕发出活力,天津、广西、北京等地相继宣布成立大数据交易中心。作为一种全新的生产要素类型,数据无论是在产权界定还是交易规则方面都与土地、资本、劳动、技术等传统生产要素存在本质区别,数据要素的交易流通规则也必然存在其自身的特殊性。从前述现代产权理论对数据要素确权的启示,可以继续推演论证传统交易规则下的所有权转让方式对于数据交易流通存在实施困境,依托于大型数据聚合平台的数据服务方式更为可行。
按照各地大数据交易中心预想,其仅作为一个独立的第三方中间市场,数据供需双方按照各自需求在平台进行匹配、交易。上述模式之所以难以为继的原因在于,一方面数据本身并不存在价值,只有将数据进行分析加工成数据产品才能满足特定需求,而大量中小数据供需主体都缺乏上述数据开发应用技术;另一方面《中华人民共和国网络安全法》等法律法规颁行以后,数据交易的合法性面临很大的不确定性,需要获得数据主体的授权或者对数据进行匿名化处理,而一般数据供需主体缺乏必要的技术和资金能力来满足上述法律要求。虽然各地大数据交易中心几近停摆,但现实中数据分享和交易一直都在进行。从企业间交易实践来看,掌握海量数据资源的互联网主体通过开放数据平台(OPEN API)等模式,推动数据要素的有序流通。微信、支付宝、抖音等大型移动应用平台近年来发展迅速,集聚了海量的用户和流量。上述平台并没有将聚集的数据要素资源封闭起来,而是通过开放接口的方式将数据和流量向万千中小应用开发者开放,在保障用户数据隐私和平台运行安全的基础上,数据聚合平台凭借这些应用开发者丰富了自身产品生态,而中小应用开发者则获得了赖以发展的多样化的数据服务。从近年来政府数据开放的制度建设和现实操作来看,政府数据会在内部跨部门和跨层级打通之后,设置一个统一的接口平台来实现数据的对外开放。(15)例如,2019年4月公开《北京市公共数据管理办法(征求意见稿)》第23条便规定数据开放方式应当为:“市经济和信息化部门通过全市公共数据统一开放平台,向自然人、法人和其他组织提供公共数据开放服务。”2019年8月发布的《上海市公共数据开放暂行办法》第17条也规定;“市大数据中心应当依托市大数据资源平台建设开放平台,数据开放主体应当通过开放平台开放公共数据,原则上不再新建独立的开放渠道。”
从现代产权理论出发,由统一的数据聚合平台来实现数据要素的交易流通更为科学和高效。因为现实中数据要素的应用场景多种多样,合同不可能穷尽的所有的交易服务情形。相较零散的数据交易主体,数据聚合平台无论是在开发技术还是运营规则等方面的优势使其在数据交易流通中的“边界贡献”更大。因此应当由数据聚合平台向零散的数据供应主体提供同一数据开放接口,掌握“剩余控制”。实践中,上述商业化和公共服务性质的数据流通实践也验证了现代产权理论下数据交易流通应有的机制。一方面,应当避免建立仅具备信息撮合功能的数据交易平台,由零散的市场主体进行一对一的数据供需交易。此前各地建立的数据交易中心,作为第三方中间市场提供交易居间服务,由供需双方在平台上自由选择自己想买卖的数据,但是运行现状是双方只是通过平台来接触客户,交易过程本身并不依赖平台,数据交易中心被直接架空。另一方面,数据交易应当依靠掌握大宗数据资源的聚合平台,集中开展一对多的数据供需服务。无论是微信、支付宝等大型互联网平台的数据还是政府数据,都应当由专业性的大宗数据资源聚合平台向下游不特定的数据需求方提供数据服务。只有如此,才能在保障交易合法性和安全性的基础上,通过成熟的数据分析利用技术最大限度满足主体多样化的市场需求。
之所以在数据交易中无须过分强调和关注所有权的移转问题,是因为数据具备前文提及的非排他性。因此,不同于传统生产要素的流通,所有权移转在数据要素交易流通中的重要性大为降低。一个使用者对数据的利用并不减少数据对其他使用者的供应,增加一个数据利用主体也不会影响任何其他主体对数据的使用。并且由于数据具有规模报酬递增和边际成本为零的特性,对于数据利用的越多、越深入,数据的整体价值会越大(16)陈昌盛:《把握数字时代趋势 创新宏观治理模式》,http://www.xinhuanet.com/tech/2020-09/02/c_1126441661.htm, 访问日期:2020年11月2日。。数据作为一种新型要素资源,理论界和实务界对于其法律属性和权属界定目前尚无统一结论和科学的认定方式,这也使得以所有权转移为基础的传统交易方式变得难以施行。从我国立法来看,新颁布的《中华人民共和国民法典》对于数据和个人信息采用的都是权益而非权利的保护路径。究其原因在于,一方面数据确权规则解释不了现实生活中的数据交互性问题,即同一数据为多个主体共同分享的情形,例如电商平台的交易数据是买卖双方共同形成的,无法精准的进行数据权利的分割;另一方面,数据绝对权又很难被完全控制,登记、占有等物权公示公信制度对其难以适用(17)梅夏英:《在分享和控制之间 数据保护的私法局限和公共秩序构建》,《中外法学》2019年第4期。。
从数据行业的发展实际来看,数据的开放和交易无须所有权移转,完全可以通过数据服务的方式来加以实现。一方面,数据的易复制性和非排他性使数据本身是否发生移转并不存在现实意义;另一方面,基于数据的一致性不等于数据要素价值的一致性的论证,对于一般市场主体来说,掌握大量的原生数据本身并没有价值,真正有价值的是对数据进行分析挖掘后得出的数据产品和应用模型。数据需求方只要能通过数据服务的方式来满足自身的商业需求即可,对于获得以代码形式展现的数据并不存在现实需求,因为未经加工的原始数据无法直接加以应用。在数据流通商业实践中,单纯数据的交易和拷贝实际上并不多见。原生数据的移转,不仅很难实现匿名化的处理,还容易诱发一系列的数据安全问题。数据交易流通价值的实现基本都是建立在数据需求方希望获得特定数据模型和分析结果以实现特定商业实践的基础之上的。
用现代产权理论的框架来分析数据要素交易的过程中存在的“供需双方不信任”以及“数据的高时效性”等问题,能对“为何数据交易中服务比所有权移转更为可行”这一问题给予我们更多的验证和启示。数据要素不同于土地、资本等传统生产要素一方面在于它的价值不易进行事前预估,所以需求方在购买数据之前无法确定数据的价格,存在一种买方不信任感。而易复制性和非排他性的特点,又使得数据一旦被获知就可以被无成本的复制和利用,供给方也不会轻易把数据展示给潜在的买家,存在一种卖方不信任感。这就产生了与“专属性投资”和“打劫风险”类似的问题,任何一方都不愿先迈出一步,无论是提供数据还是提供资金,因为二者都具有一定的专属性,一旦出现合同未能预见的情形,就会出现被打劫的风险。而数据服务模式则可以解决此种双方不信任问题,供给方根据需求方的具体数据应用场景需求,向其提供基于数据要素的分析模型或结果,直接满足需求方的现实需求。另一方面,数据具有高时效性的特点,用户的需求和兴趣具有转瞬即逝的特点,数据一旦无法得到有效及时的更新便会丧失预期价值。这在互联网自动化商业决策实践中最为明显,若定向广告和信息推送背后的数据丧失时效性,整个商业模式的基础便会坍塌。在此背景下,拷贝等所有权移转的一次性数据交易模式的价值愈发降低。因此,从现代产权理论来看,数据交易合同也是一种不完全合同情形。只有由大型数据聚合平台来提供一对多的数据服务而非简单的移转原始数据的所有权,才能解决供需双方的不信任问题和数据要素高时效性要求的问题。所以,数据服务模式大都以长期的服务合作形式开展,数据服务供给者能够及时更新数据库从而满足数据的高时效性要求,最大限度地满足数据需求方的现实需求。
与传统的生产要素相比,数据要素具有存在方式上的虚拟性和价值实现上的聚合性等特点,这导致了数据隐私与安全问题愈发突出。存在方式上的虚拟性决定了数据要素的流动高度依赖信息技术系统的稳定性和安全性,因而更容易泄露和遭受安全威胁。价值实现上的聚合性决定了,规模化存在的数据要素一旦遭到泄露,不仅会损害单个用户的隐私权益,还将诱发大规模的公共安全事件。这在一定程度上验证了数据交易服务不应当由零散的供需主体通过一对一交易方式实现,而是应当尽可能地统一数据服务出口,由专业性的大型数据聚合平台通过一对多的交易方式加以实现。相较于零散的数据供给主体,大型数据聚合平台无论是在数据存储设备、数据安全技术以及网络安全人才储备上都具有明显的优势,可以通过更加专业的数据安全保护技术和制度设定,防止自身数据出现泄漏等问题,进而对数据背后的用户隐私和商业秘密进行有效保护。
但从现代产权理论视角来看,不能因为用户隐私和商业秘密的保护,就对数据要素的剩余控制进行错配。在论证完只由大型数据聚合平台通过数据服务的方式来构建数据要素交易机制的前提下,对于数据交易中安全问题我们可以通过更为科学可行的方式来加以实现。值得注意的是对于数据安全问题,无论是2016年11月颁布的《中华人民共和国网络安全法》还是2020年7月公开的《中华人民共和国数据安全法》草案,都明确提出应当建立健全数据分级分类管理制度。之所以要强调对于数据进行分级分类保护,是为了适应数据要素应用场景不断扩大背景下数据安全保护形势日趋复杂的现实要求。伴随数据经济的迅猛发展,一方面市场中存在的数据类型日益多样化,既存在政府数据,也包括企业数据,还包括大量的个人的原始数据,此外个人数据又可以分为一般个人数据、敏感个人数据以及个人生物识别信息数据等;另一方面市场化的数据存在的应用场景日益丰富和细化,差异会形成不同的受保护权益和安全风险,需要适应动态保护的需求。特别是对于数据交易流通行为而言,无论是政府数据的开放还是企业数据的交易,都存在利益主体众多(政府、企业、个人及其他社会组织等等),数据类型多样(不同主体收集的数据和不同敏感程度的数据融合在一起),应用场景复杂(纯粹商业化应用场景下的定向营销、短视频推送,公共服务性质的城市交通拥堵状况预报以及应急情形下的疫情防控)等特征,因而更应当强调数据分级分类保护。
数据要素交易流通过程中,对于数据安全与隐私保护问题,我们可以从作为数据供给方的数据聚合服务平台和作为数据需求方的下游主体两个方面着手进行制度安排。一方面,作为数据要素资源出口的数据聚合平台应当在参照既有立法和标准的基础上,建立数据安全分级分类管理制度。数据聚合平台应当保障自身的数据分析加工活动和数据服务交易行为合法性和安全性,对涉及个人信息和用户隐私的数据取得用户的合法授权或进行匿名化处理。对于政府数据(公共数据)开放平台而言,更应当加强数据安全保护,防止数据泄露引发大规模社会安全问题。另一方面,应当要求作为下游主体的数据需求方具备保障数据安全的能力。相较于所有权移转的交易模式,数据服务因为不涉及原始数据的转移,实际上在安全性方面已经存在比较优势。但从数据要素流通规则的角度出发,数据聚合服务平台基于自身一对多的特殊地位,仍应当关注和把控数据交易和流动过程中可能存在的安全隐患,并将下游数据接收方是否具备保障数据隐私和安全审查的能力,作为是否达成数据服务交易的一项关键考量因素。
它山之石,可以攻玉。在中国特殊的国情和制度之下,发展数字经济等新的经济形态,不仅需要学习借鉴国内外历史经验,降低试错成本,更需要谨慎客观的研究态度和科学的研究方法来探索未来发展道路。期待未来更多的思考者和观察员加入这一讨论。