摘要:数据交易中心是实现数据融合与大数据红利的主要场所,但目前为止仍然存在定位不清、责任不明、监管缺失和规范功能不全等多种问题。这些问题不仅影响到数据场内交易的数量与质量,还将进一步阻碍数据生产要素的功能发挥和大数据红利的最终实现。解决问题的关键在于重塑交易中心的规范功能与法定职责。本质上,数据交易中心不宜成为数据交易商或者中介商,而应当成为数据交易的监管者和数据融合的主要场所。从可信数据交易的角度看,数据交易中心应当承担数据交易市场信息公开和透明监管的主要职责。从数据资源效用发挥的角度看,应当给予场内数据交易一定的豁免权限,并规定数据交易中心的合规与安全保障义务。
关键词:大数据;数据交易;场内交易;数据要素;数据融合
2022年12月,中共中央、国务院发布《关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称“数据二十条”),其中明确提出要“建立合规高效、场内外结合的数据要素流通和交易制度”。数据流通问题引起中央层面的高度重视,一方面是因为我国数据资源极为丰富,数据对经济增长的贡献率逐年提高,数据赋能实体经济已经成为重要的社会发展路径。另一方面,尽管数据资源规模宏大,数字基础设施建设名列前茅,我国数据利用率却持续走低,呈现出场外交易与黑市交易并行的局面。概括而言,数据流通与汇聚是实现大数据红利的基本前提,而数据交易又是实现大规模数据汇集最有效的途径。相比企业间自发的数据共享和交易,数据交易中心具有规则统一、交易透明、安全可追溯等优点,还可以作为数据融合的主要场所,具有场外交易所不具备的独特优势。对此,本文将在详细梳理数据场内交易的困境及其形成原因的基础之上,提出我国数据交易中心的改进方案与完善路径,以期真正发挥数据场内交易制度的强大功能。
一、数据场内交易的现状
(一)交易中心遍布,但交易量有限
数据虽被誉为“新石油”,但对于这类“新石油”的发掘与利用却无先例可循。2015年我国最早成立的贵阳大数据交易所曾被寄予厚望。成立之初它的目标为“在三至五年内达到日交易额破百亿,从而诞生一个万亿级别的数据交易市场”。然而,这一目标很快被缩减至“力争全年突破亿元”,最后在年交易量不足五百万之后已经不再对外公布有关交易量的数据。事实上,有类似困境的绝非只有贵阳大数据交易所一家。在一大群蜂拥设立的数据交易所中,已有超过一半的数据交易中心年交易量低于50次,大量的交易中心实际上已经处于停运或者半停运的状态。最新发布的《数据二十条》第9条明确指出要“统筹优化交易场所的规划布局”和“严控交易所的数量”,也能从侧面反映这一问题。
(二)数据交易门槛低,处理能力有限
数据交易中的个人数据权利侵害问题如影随形。但实践中各交易中心可交易的数据种类却各不相同,比如有的交易所宣称自己不进行“底层数据”的交易,但对于何为底层数据却语焉不详。有的交易所虽然从事个人数据交易,但对于如何避免交易过程中的权益风险却没有设立具体规则。从数据分类交易的情况来看,现阶段精细化的行业数据仍未出现,已有的数据交易多围绕某些巨型企业开展,大部分中小企业仍被排除在外。对某些专业化程度较高的数据,比如医疗数据和金融数据等,仍未能形成有效的市场规则,更不用说针对特定类型数据的处理规则。
(三)数据交易的标准与种类不一,交易风险仍然存在
数据交易中心是私有数据进入公有领域的必要通道,但企业数据同时存在着标准不一和种类混杂的特点。一方面,数据交易的标准各异会使得不同类型数据之间难以兼容,影响数据的可利用价值,即数据的商品属性难以彰显。另一方面,数据流通采用不同分类标准会影响数据交易的定价和监督机制的有效运行,使得数据流通和利用成本骤增。有实证研究表明,数据之间缺乏统一的标准不仅会阻碍新兴商业模式的产生,而且会阻碍中小企业的发展和大企业的数据分享意愿。相反,数据标准化除了具有便于数据流通等显性好处,还会使机器学习和数据分析更加简便易行,从而能够建构出一个更具竞争力的数据生态系统。现阶段交易中心的核心目标在于追求数据交易的数量,交易的品质和效果,则并非其所能兼顾的领域。正如有学者所言,数据交易中心作为数据交易市场的重要载体,不可避免地承载着数据融合与风险控制的双重功能,但现阶段数据交易中心各自为政,严重影响了数据的安全和可利用价值。
(四)以点对点的交易为主,无法实现大规模的数据融合
现阶段的数据场内交易仍以“点对点”“撮合式”“定制式”的数据交易为主,无法体现数据交易集中的场所优势。数据交易与普通商品交易的最大区别,在于数据具有非消耗性和非排他性的特征。数据交易并不必然以转移所有权的方式来完成,授权使用或者授权处理可能是更加符合现实需要的选择。毋庸置疑的是,数据场内交易并不是数据流通的唯一形式。但强调数据的场内交易不仅可以克服数据供给方与数据需求方之间的信息不对称,还可以有组织、可追溯、安全并符合标准地汇聚大量有价值的数据。从这一点看,数据场内交易具有不可比拟的优势,而点对点的交易有其难以克服的局限,即数据永远是以交互的方式流通,无法实现大规模的数据融合,也就难以真正实现大数据的红利。就此而言,集中融合式的数据交易和信息处理至少可以满足不同交易主体对不同种类数据的客观需求,而且数据量越大,数据越具有利用价值。因此,以所有权转移为主的交互式数据交易并不能完全发挥数据交易中心的制度优势,反而可能因其数据中间商的定位,丧失了中立者的身份,从而失去数据交易市场交易者的信任。
二、数据场内交易困境的原因分析
(一)合法性存疑
对于交易者而言,确定性的减弱势必会造成交易风险。对于数据交易而言,尤其如此。从法律规范的层面而言,现阶段对于哪些数据可以用于交易,交易者又享有哪些权益,并不十分明确。根据我国《个人信息保护法》第23条之规定,向第三人提供个人信息的,提供者不仅应当告知“接收方的姓名或名称、联系方式、处理目的、处理方式和个人信息的种类”并取得个人的“单独同意”,接收方还需要在前述告知的“处理目的、处理方式和范围内处理个人信息”。如果接收方变更了个人信息的处理目的和处理方式,则有义务“重新取得个人同意”。从数据交易的角度,如此繁杂的告知要求和处理限制,已经实质性地阻碍了个人数据的交易价值。再看非个人数据,如果数据交易中心仅从事非个人数据交易,那么交易对象需要满足《个人信息保护法》第73条“无法识别+不能还原”的标准。即便不论该标准是否有损数据的利用价值,单就匿名化技术而言,能够在客观上满足这一要求的交易数据便屈指可数。此外,数据的识别性还会随着应用场景、数据规模、时间与成本的投入而呈现出不同的识别可能。换言之,即使双方交易的是非个人数据,也可能因数据汇聚、处理场景和处理技术等因素的不同而变成个人数据,即完全不具有识别可能性的数据只在理论上存在。从数据交易的角度看,采纳如此严格的标准,要么会完全阻断有价值的数据流通,要么会使数据交易永远游走在违法的边缘,此即实践中的大多数企业不愿意从事数据交易的深层次原因。对此,允许数据场内交易在符合特定条件的情形下豁免上述义务,可以减少当前市场对于交易不确定性的担忧,也可以让数据场内交易更具有制度优势。
(二)责任不明
根据《个人信息保护法》第五章的规定,对于企业所收集的个人数据,数据控制者负有一系列义务,如合规保障义务、审计义务、影响评估义务、泄露通知义务等。但对于数据交易的标准、交易方式以及责任承担等重要问题,目前并无相应的法律规范进行调整。对于数据交易过程中始终存在的责任承担、质量保证和隐私风险等问题,现阶段并没有统一的法律规则可供遵循。各交易所虽然出台了一些规则,但多是倡导性的内部规范,且多对自己的责任予以规避,难以给数据交易者和数据权益主体提供足够的安全保障。数据交易,本质上是信赖交易。为此,比较法上数据治理改革主要在于提升数据的真实性与信赖性,其中最为典型的就是数据银行。由客观中立的第三者负责数据的合规使用与交易监管,与本文所倡导的数据场内交易可豁免部分义务具有内在的一致性,即在不伤害数据可利用价值的基础上,明确数据交易场所的主体责任,对数据交易参与者的信赖而言具有重要意义。这与其说是数据治理改革,还不如称其为数据信赖改革。对于我国而言,既然建立了统一的数据交易场所,那么交易所就应当为交易各方提供可资遵循和值得信赖的交易标准,并承担交易安全、质量评估、信息披露等法定义务,这也是数据交易中心可能具有的天然优势之一。
(三)评价难题
经济学的研究表明,通过界定产权可以降低交tZ19Bg1qcX/ud8Lwhz20ow==易成本。对此,需要明确的是,什么是交易成本?交易成本实际上由一系列不确定的因素所组成。比如前文提及的权属问题、责任问题和风险问题等均可能产生相应的交易成本。除此之外,价格因素也是交易成本产生的重要原因之一。在数据交易市场,定价难是一个普遍存在的现象。当人们无法对某类商品形成一个统一的价值评价标准的时候,交易中的不确定性增加,交易的成本也就产生了。在数据交易中,议价已经成为必不可少的环节。原因在于,不同的数据之间,甚至是相同的数据之间,其价值也很难用统一的标准进行评价与衡量,数据的商品属性因此减弱。另一方面,价格与价值难以匹配也将阻止下一轮交易的产生,尤其是当价值缺乏客观的评估手段之时。与货币、劳动、土地等生产要素相区别的是,数据的价值具有非均质性。典型表现在,我们几乎无法采用统一的标准来衡量或者比较数据的价值。此外,数据的有用性也很难用市场价值评估的方法来解决,某类数据对某一企业有用,但对另外的企业却可能毫无价值。通过第三方进行数据交易的核心优势在于,交易双方可以通过第三方了解数据的基本信息与可能的利用价值。由此决定了数据交易中心应当肩负起数据价值的评价功能,而非仅仅从事中介式的撮合交易。
(四)交易标准与规则不一
当前我国仍未统一可交易数据的标准,实践中各交易中心与交易平台均以自律性的交易规则为主。一方面,由于交易机构之间缺乏具有共通性质的数据分类标准,对于可交易数据的种类及其技术标准和措施等,均未能形成统一的标准。不同交易主体之间的数据遵循不同的处理标准,不仅实质性地减损了数据的商品属性,也不利于大规模的数据融合与处理,造成数据资源的浪费和处理成本的大幅度提高。另一方面,对于数据交易的责任承担机制,不同的交易中心均有自己的规则,但多数以单方豁免自己的责任为主,这使得通过交易中心的数据交易也难以令人产生可信赖之感,损害了交易中心的形象。最后,对于数据交易中的第三方权益保护问题,现有的交易规则大多语焉不详,比如有的交易所虽然宣称自己不进行底层数据交易,但对何为底层数据以及如何进行监管又缺乏明确的规则,如此则交易中心可信赖的交易形象难以树立。
三、数据场内交易困境的解决方案
(一)完善数据交易的外部环境
1.分行业而非分区域的数据交易市场布局
自2015年我国首个数据交易市场建立以来,数据交易市场遍地开花。其中非常重要的原因是政策的扶持,不少地方政府都推出了自己的数据发展战略和地方性的数据发展条例。不过,数据交易市场的建立并不意味着数据交易的繁荣,反而由于数据交易中心林立,交易标准各异,导致规模化、标准化的数据交易中心难以形成。加之数据交易市场的设立成本较低,容易令人产生数据交易简便易行且成本低廉的错觉。事实上,现阶段我国大部分数据交易市场面临不同程度的生存困境,其中因欠缺顶层设计而使得数据交易难以进行的问题愈发凸显。
从现实而言,建立全国统一的分类数据交易平台势在必行。其一,数据利用的必然要求。数据发挥作用的关键之处在于聚合与分析,只有聚集足够多有效的数据,才能使数据发现新知的作用得以发挥。由此还可能产生诸多意想不到的效果,比如在关联性分析中可以发现某种药物的潜在治疗功效等。其二,统一行业数据交易标准,才能使数据驱动战略成为现实。不同类型的数据具有不同的需求,比如医疗数据强调数据的关联性,完全匿名化将使数据失去利用价值,而可控制的假名化可以发挥其最大功能。又如,消费数据具有隐私特性,但与数据主体失去关联后并不会影响其利用价值,因而类型化的消费数据既有利于隐私保护,又有利于资源的有效配置。其三,加强数据的场内交易,可以削弱大型数字平台的垄断效应。随着大型互联网平台的出现,其在限制竞争与扰乱市场秩序方面的负面效果逐渐显现。由于数据反垄断具有事后监管的性质,而数据垄断又与市场垄断行为交织在一起,使得经由数据垄断进行的市场垄断行为往往更具隐蔽性与危害性。对此,强制具有市场支配地位的企业提供标准化的数据以及将该类数据注入数据公共池,不但可以消除其垄断效果,还可以避免其数据沦为公物,保障其合法的数据权益。
2.明确数据交易的技术标准与交易各方的主体责任
数据权属界定是世界性的难题,一方面因为数据之上利益的多元性,使得数据界权难免会对一方或者多方的正当利益产生影响。另一方面则是由于数据非竞争性的特性,人为界定数据权属可能会阻碍数据的流通,反而有损数据的利用价值。然而,前述论断成立的前提是数据控制者正当、合理、合法地利用其所掌握的数据。虽然立法可以选择不去界定数据的权益归属,但企业事实上掌握和控制着数据却是无法否认的现实。当数据一直作为事实上的财产存在于企业的控制之下,隐秘地交易与流通难免会侵害数据主体的权益,由此导致普遍的数据权益侵害和数据黑市交易猖獗的弊端。当前各数据交易所对可交易数据的种类莫衷一是,部分数据交易在商业利益的驱动下游荡在合法性的边界,甚至存在违法和虚假宣传的现象。值得注意的是,数据交易并非仅指买卖,互易也是重要的交易形式。对于行业数据而言,参与数据互易可以使企业更好地掌握本行业的现状,调配资源和改进生产计划。对于数据收集能力较弱或者用户群体较少的企业而言,将数据融入交易中心而换取相应的数据使用权限将是更为便捷和有效的数据利用途径。对此,数据交易中心应当在清晰划分权限的基础上,为数据融合的市场主体提供标准化的数据和规则清晰的利用标准。
3.建立数据交易的专门监督指导机构,统一数据内容与价值评估机制
从现阶段数据交易的现实困境来看,缺乏统一的数据交易指导与监督机构是重要原因之一。数据收集、利用与共享天生具有隐蔽性的特点。数据价值又具有不确定性的特征,对于数据违法、数据权益侵害和数据交易保障而言,数据交易专门监督机构的建立具有决定性的意义。从当前交易所公布的业务范围来看,其交易市场的定位过于显著,而交易监督与公平保障的功能并未得到充分体现。在实践中,大部分交易所既制定规则,又参与交易,存在裁判与运动员的双重身份。如此,则事实上存在着职能定位不清的问题。本质上,数据交易与普通商品交易最大的区别在于,数据的价值与市场价格之间难以形成一一对应的关系。再加上数据交易中,卖方与买方对数据的最终去向和用途难以形成有效的监督与制约,数据交易的积极性与主动性因此受到消极影响。在可信数据交易的理念下,数据交易的上述难题将得到有效地缓解。当然,此类机构的建立并不一定是行政机关,由行政机关主导下的专门委员会制度具有得天独厚的优势。具体而言,首先由数据交易中心成立数据委员会,负责整个数据交易中心的数据监管。然后,由数据交易各方选举代表组成专门委员会,负责各自参与融合数据的利用监管。最后,由国家数据局统一监管各数据交易所的数据利用和安全保障情况。由此可形成统一监管和分层监督的多层次数据监管体系。
4.完善数据权益侵害的法律责任
对于制止侵权行为而言,“胡萝卜”和“大棒”同样重要。各类数据权益侵害事件频发的背后,一方面是监督机制孱弱,无法形成有效威慑;另一方面在于数据侵权的成本极低,而违法收益巨大,致使机会主义者不惜铤而走险。从当前数据权益侵害案件来看,一种类型是数据控制者侵害用户的数据权益,这种类型通常由个人信息保护法加以规范,但实践中的突出问题是数据控制者的行为失范,侵害用户数据权益的行为频发,难以得到有效的规制。另一种侵权行为更为典型,即数据控制者在与第三人的数据合作中,由于第三人违反数据合作协议而侵害用户数据权益。此种类型的数据侵权通常难以得到有效规制,原因在于用户数据被当作商业交易的筹码,数据控制者要么对该问题视而不见,要么仅在触及自身利益时才会采取行动。概言之,数据利用行为具有隐蔽性,数据合作者之间又存在复杂的利益纠葛,在缺乏必要监督机制的情形下,往往选择优先牺牲用户利益,以交换数据合作方的数据利用权限。
以数据交易中心为主导的数据合作治理机制可以很好地解决这一问题。一是由数据交易中心建立数据控制者之间的数据合作与交流平台,可以解决大规模数据融合与利用问题。二是由数据交易中心承担起数据权益合规的监督与利用问题,可以解决数据私人合作时的信任难题,即由数据控制者建立失信者惩戒与出局机制,定期公布失信数据控制者名单,以遏制数据侵权行为的发生。三是由数据交易中心建立数据融合机制可以优化竞争环境。在数据竞争中,实时地获取高质量的数据对于优化企业的经营策略具有重要意义,而在数据合作中让人产生“可以把数据交给你”的信任感,可以使得数据合规带来额外的“附加价值”和“奖励机制”。易言之,由数据交易中心作为中立者,实时地发布企业数据合规与交易报告,在增强市场信心的同时,可以使优质企业获得与努力相对应的合规价值。
(二)数据交易中心的职能重塑
我国目前大部分数据交易中心所从事的业务为撮合性交易服务,其本质上与中介服务场所无异。有的数据交易中心还从事行业数据的采集服务,此时其已经异化为数据服务的提供者,难以从根本上发挥数据交易中心的监管与指导职能。从职能来看,现有数据交易中心的监管职能缺位,难以发挥数据交易信任桥梁的作用,以至于数据交易促进功能难以完全体现,数据交易安全保障职能更是无从谈起,其规范功能与定位亟待澄清。
1.数据交易中心应当承担数据交易的监管职能
数据交易具有一般交易的特点——自愿、等价、有偿,但也具有自身的特点,即数据真实性、准确性和交易价值难以评估。数据交易具有可重复性和交易方式的多样性,但缺乏必要的保障形式,又可能因复制和传播失去商业价值,则是其共性问题。数据交易可以在不断重复和持续更新中进行,但由此带来的问题是交易对象的价值难以衡量。交易双方的信息不对称进一步加剧了数据交易的可靠性问题。由此可能带来数据交易市场的群体性失败。数据交易内容虽然可由双方自由约定,如可为期限性授权使用或受访问次数的限制,但交易数据的质量和真实性通常难以得到保障,出售方又难以控制买受人的数据利用行为,由此可能带来巨大的交易风险。本文认为,数据交易只有在受控的环境中进行,才能避免上述交易风险和体现数据交易市场的存在价值。由此,数据交易中心应当在数据评估、信息披露、交易安全等方面提供保障,以打破数据交易中的不确定性风险。
2.数据交易中心应当发挥交易促进功能
与普通商品交易不同的是,数据交易最大的特点在于价值上的不确定性。这种不确定性一方面源于数据本身的价值难以确定,有学者将其称之为“阿罗悖论”。其问题的本质是,数据交易中买方有了解数据内容的需求,而一旦数据内容被披露,则相当于卖方已经获取了数据内容,由此数据交易陷入了交易对象和内容不可预知的尴尬境地。但在数据场内交易中,数据交易中的“阿罗悖论”将有机会得到极大地缓解,甚至是根本上的解决。一方面,数据交易中心可以充当数据价值披露中介者角色,即由数据交易中心定期发布和评估可交易数据的信息,以便于交易主体在市场中能够寻找到合适的交易对象。另一方面,数据交易中心还可以充当数据交易指导者与监督者的角色,即由数据交易中心来评估数据交易的价值和效果,从而为不同种类的数据交易提供参考。
数据的价值不仅取决于买方的用途或目标,还会遭遇因信息不对称导致的“柠檬市场”问题。现阶段已有交易中心通过数据价值评估、数据可用不可见等手段来确保数据价值不因数据披露而产生损害,从而在某种程度上确保数据交易目标的最终实现。但这种交易模式仍然缺乏效率、安全以及稳定的特质。想要顺利完成数据的商品化,就需要一个权威、客观和中立的角色对数据交易进行全面而完整的评估。这一方面有赖于数据交易中心提供适当的技术支持,比如数据预处理、预分析和数据内容的预披露。另一方面有赖于数据交易中心承担数据交易监督者的角色,比如由数据交易中心评估买卖双方在数据交易中的诚信与合规程度,再比如由数据交易中心发布数据交易的数量和质量标准,定期对数据交易的效果进行评估。由此,可以产生经由数据交易中心而形成的数据合规的外部监督力量。如此,则数据交易中心将褪去市场参与者的角色,变成中立的交易促进者和监督者。
3.交易中心应当成为数据开放与融合的主要场所
数据依其开放程度,可以分为无条件开放和受控开放。无条件开放是将数据完全作为公共物品看待,任何人都可以不受限制、无条件和免费地利用数据。受控开放则是指数据开放是有条件、受限制和需要支付对价的。从当前数据交易的发展现状来看,数据无条件开放只能是一种理想类型。这是因为,无论是数据的收集、加工还是整理都需要支出一定的成本。如果这些成本不能通过受控开放的形式获得补偿,数据控制者将从根本上失去数据交易的动力。从这个角度看,数据受控开放实际上是允许数据控制者对由其收集、生产和加工的数据享有一定的财产性权益。现行数据交易中心的职能受传统交易市场的规则影响较深,并没有体现出数据交易自身的特点。传统交易主要是双边或者多边交易,以提供交易机会(中介式交易)和安全保障(保障型交易)为主要功能。但数据交易具有根本性的不同,即数据的使用价值会因汇聚而产生增值效应,随之而来的是数据整体价值和用途的提升。数据交易并不必然表现为数据买卖和数据互易,也有可能是以数据共享为目的的使用权交换,或者是以数据共享为条件换取更大范围的数据使用权限。如此,数据交易中心不但可以成为数据共享和交换的中介者,还可以成为数据价值的维护者。当前阶段我国数据交易中心的会员制已经预示了这种可能性,但其将会员局限于交易参与者的资格,事实上还未充分认识到数据交易的独特性。数据交易中心并不必然是撮合式交易的提供者,其还可以提供数据加工、整理、增值、管理等服务,成为行业数据融合服务的提供者,以收取管理费或者服务费的形式获取合理报酬。如上所言,则数据交易中心有望成为我国数据融合的主要场所,也由此可以破解个别式数据交易的局限,发挥大数据技术的根本优势。鉴于数据交易中普遍存在的信任缺失问题,数据交易所还可以发挥信任桥梁的作用,如主动承担起数据质量监管和数据内容披露的任务、定期发布数据诚信交易的市场主体名单、对外公布数据交易的数量和交易效果等。
4.数据交易中心应当具有交易安全的保障机能
数据是一种风险资源,而数据交易会使得这种风险呈现无限扩张的趋势。对参与交易者而言,数据交易的首要风险是因个人数据的保护范围难以界定而存在可交易数据的种类始终难以确定的风险。事实上,至今为止仍无任何确定性的标准能够指向个人数据与非个人数据之间的精准区别,导致数据交易的合法性备受争议。而在“非个人数据”的语境下,不同类型的数据是否应当采纳统一的匿名化标准也存在疑问。这是因为数据的匿名化虽然可以减少数据主体被识别的风险,但同样也伤害了数据的可利用价值。更何况,数据还具有累积效应。越多的数据聚集,意味着重新识别的风险越高。正如学者所言:“想要把数字经济建立在非个人数据之上不过是一种不切实际的幻想,任何对数字经济有益的要么是个人数据,要么是在数据累积过程中将要变成个人数据的数据。”在充分平衡数据的可利用性和数据安全的前提下,若数据交易中心能够明确数据可交易的标准,甚至能够在充分互信的前提下,针对不同行业的数据,制定不同的规范与准则,那么数据场内交易的优势将得以凸显,并且由此形成安全、互信、统一的行业数据交易中心。
5.数据交易中心应当为公共数据开放提供场所与制度支持
公共数据是最具开发潜力和最有价值的数据资源。但迄今为止,公共数据的开放仍然面临诸多体制与机制障碍。首先是公共数据开放中的风险问题,即数据开放虽然有利于数据资源的利用,但客观上会产生一定的风险,比如侵害个人数据权益,直接或间接地危害数据安全等。其次是开放公共数据中的成本问题。数据开放并非行政部门的主要职责,而开放过程中又面临着风险和成本问题,因此缺乏主动开放的动力是制约公共数据开放的另一类瓶颈。最后是公共数据的高效利用问题。数据的运营与管理均需花费一定的成本,特别是对数据集的维护、去识别化、标记与分类等均会产生相应的成本,而政府部门又普遍不具备大规模数据开发与管理的能力,因此即使开放也并不能够保证数据获得有效利用,是公共数据开放中的又一难题。针对上述困境,有学者建议通过授权市场主体参与运营的方式,缓解公共数据开放中的困境。
然而,授权市场主体开发公共数据将产生如下疑问:第一,遴选参与者的标准不明。在客观标准模糊又缺乏有力监督的背景下,向市场主体开放极易产生权力寻租和公共利益受损的风险。第二,监督运营的问题。当前阶段政府部门普遍缺乏监督数据开发与利用的能力,更不用说如何规避其中的风险。第三,缺乏正当性。授权市场主体参与公共数据的开发不仅会造成数据融合的多种困境,也难以解决私法主体运用公共数据的正当性。鉴于上述困境,本文认为由数据交易中心承担公共数据的运营、开放、维护和监督者的角色更为合适。一方面,数据交易中心可以为公共数据的开放提供安全保障、技术支持以及对利用行为的监督,由此公共数据的开放可以在受控的环境中进行,一定程度上避免了因数据开放所产生的客观风险。另一方面,由数据交易中心承担公共数据开放的职责,可以通过付费利用的方式抵销数据开放过程中产生的成本,剩下的收益不仅可以用来改善数据开放的技术标准和手段,也可以用来进一步激励和加大公共数据开放的力度,在条件成熟后甚至可以将数据开放至普通个人免费利用的层面,以最大限度地发挥数据的利用价值。
6.数据交易中心应当承担数据资源的开发职能
数据资源依其价值的发生机制,可以分为资源租金、管理增值和产品增值。现阶段中介式的经营方式,本质上是为企业之间的数据交易提供信息平台,类似于房产中介,甚至未达到数据资源开发的第一层次。数据要素的市场化配置本质上是通过市场的手段配置数据资源,从而达到提升数据资源利用效率、为高质量经济发展赋能的目的。对此,数据交易中心需要解决的问题主要包括:第一,为数据资源的配置提供市场途径。数据交易中市场主体的能力、资源和地位的不平等客观存在,大型企业与中小企业之间围绕数据资源难以形成平等、有效的竞争环境。对此,数据交易中心可以为中小企业融入数据市场提供可靠的途径。第二,为数据资源的科学管理提供增值服务。数据交易并不必然表现为互易的形式,以数据使用为目的的数据融合可以在更大范围内发挥数据的可利用价值。数据交易中心的出现不仅解决了交易双方互信的难题,而且为更大规模的数据融合提供了可能。然而,数据融合并不等于数据价值的发挥,数据交易也不等于数据市场价值的实现。数据发挥生产要素功能的关键在于数据的真实性、可靠性与关联性。数据并不能直接为生产服务,关键在于基于预定目标的收集、整理、汇聚和分析。对此,数据交易中心一方面需要为数据资源的分类、管理和传输提供可靠的保证,另一方面还应当为数据资源的准入、质量检测、数据预加工和预处理提供专门服务。如此,则数据交易中心可以为数据资源充分发挥其功能提供制度保障。第三,为数据产品的开发提供技术支持与维护服务。相比于大量的数据而言,正确的数据更加重要。数据分析需要大量的准备工作,包括数据集的创建、数据的清洗和更新。有研究指出,数据分析项目中80%的时间用于数据的收集和准备。数据分析结果的准确性首先取决于数据的质量与分析方法的科学性。由此,数据交易中心需要解决的不仅是数据的来源问题,还包括为数据产品的开发和维护提供支持。
四、结语
数据本质上是一种信息,但又有别于传统的信息。数据具有可操作性,其控制者可以运用不同方法从相同的数据集合中提取出价值不同的信息。数据还具有非竞争性和非排他性,这使得数据的利用与传统的生产要素有所不同,需要作出更为复杂的制度安排。数据因累积和分析而产生价值,大数据的利用方式不仅使更大规模数据利用成为现实,也为数据权益归属的多样化提供了可能性。虽然现阶段数据交易中心仍以促进数据的市场化流通作为主要职责,但未来亦不能排除数据交易中心能够以数据持有权、数据加工使用权或者数据产品经营权的方式在更大范围内充分发挥其应有的职能。
The Dilemma and Breakthrough of Data Field Trading
Abstract: The data trading center is the main place to realize data fusion and Big data dividend, but so far there are still many problems, such as unclear positioning, unclear responsibility, lack of supervision and incomplete regulatory functions. These problems not only affect the quantity and quality of transactions in the data market, but also further hinder the function of data production factors and the ultimate realization of Big data dividends. The key to solving the problem lies in reshaping the normative functions and legal responsibilities of the trading center. Essentially, data trading centers should not become data traders or intermediaries, but rather become regulators of data trading and the main venue for data fusion. From the perspective of trusted data trading, data trading centers should bear the main responsibility of information disclosure and transparent supervision in the data trading market. From the perspective of maximizing the utility of data resources, on-site data trading should be granted certain exemption privileges, and compliance and security obligations of data trading centers should be stipulated.
Keywords: Big Data; Data Trading; OTC Trading; Data Elements; Data Fusion