陈融雪
上海数据交易中心
“自2017年正式开展大数据交易以来,我们每年都实现了100%的增长。”上海数据交易中心CEO汤奇峰接受本刊记者采访时称,2020年上海数据交易中心的数据流通总量超百亿条,上海大数据产业的商业数据交易已占到了全国公开交易量的一半以强。
近年来,各地数据交易中心不再公开交易额,被观察者解读为折戟沉沙、经营惨淡。但上海数据交易中心表示,经过五年发展,已开发出系列可持续、连续性的数据服务——“真正以线上服务,实现了真正的有开票收入”。
不过,相比交易成交额,更令汤奇峰骄傲的是交易的“合规”。大数据交易谁能入局?玩家们怎么玩?如何定价、如何兼顾效益、公平和数据安全?上海对大数据交易的边界和规则进行了谨慎且不乏成效的探索。
“上海比较谨慎,明确提出不追求时间上的第一,要摸清楚,再扩大。”中国网络空间安全协会秘书长李欲晓接受本刊记者采访时表示,“尽管如此,上海数据交易中心仍是国内首批成立的数据交易中心之一。”
追溯起来,2014年被视为中国大数据元年。赶在该年的最后一天,全国乃至全球第一家大数据交易所于在贵阳成立。随后的两年里,各地大数据交易所和交易中心迎来密集布局期:北京大数据交易服务平台、长江大数据交易所、东湖大数据交易平台、西咸新区大数据交易所、河北大数据交易中心、哈尔滨数据交易中心和江苏大数据交易中心等纷纷宣布成立。
中国(重庆)自由贸易试验区内的重庆两江新区数字经济产业园
“2016年4月,上海数据交易中心正式挂牌。”汤奇峰回忆称,但其实,上海酝酿此事已久——早在2013年,上海市科委就已组织专项课题,成立了数据流通和交易的相关机构。
长达四五年的时间里,专项课题组的首要任务就是要摸清业务边界。“换句话说,就是要摸清上海做数据交易的立足点和合法性在什么地方。为此,上海方面翻译了1991年以来欧美国家制定的所有与信息和数据相关的法律和修正案。”汤奇峰表示。
华东政法大学知识产权学院院长高富平领衔了该项任务。
“大数据交易中的各种数据需要清晰界定,弄清楚来源及其合法性,是否涉及个人信息、商业秘密、国家秘密等。”在高富平看来,如果涉及个人隐私信息、商业秘密和国家秘密信息,那么该数据不可交易;如果涉及个人信息,那么需要进行去身份化处理,才能进入交易。以及,数据的使用不具有排他性,如何界定转让人与受让人之间、使用人与其他使用人之间关系,都需要建立数据交易规则。
“这是大数据交易最难的部分,需要进行研究,制定详细的规则才能进行。”高富平说。
2021年3月23日,广东省政务服务数据管理局率团到上海大数据交易中心调研,为筹建中的广东省数据交易中心取经。他们直言不讳地提出,此行重点关注的问题之一便是平台股权架构如何组建。
不同于国内其他数据交易中心要么由民资、要么由国资主导,上海数据交易中心是由政府许可并批复,企业共同参与,属于国有控股混合所有制企业。
“我们的股东既有中国联通、中国电子等央企,有上海市信息投资股份有限公司、申能集团、上海仪电控股等地方国企,也有如晶赞科技、万得信息、万达信息这样的民营企业。”汤奇峰表示,“组建股东结构的时候,我们既考虑了股东在市场上的影响和地位,也考虑了股东在数据流通和交易上的需求,既兼顾了数据交易的公信力,也希望能发挥市场的力量更有效率。这就是大数据交易的‘上海模式。”
至今,上海数据交易中心已接待了 5222个来访观摩团。这些来访团想了解的重点内容还包括,数据交易和流通到底怎么做?
“ 换句话说, 就是要摸清上海做数据交易的立足点和合法性在什么地方。为此,上海方面翻译了1991 年以来欧美国家制定的所有与信息和数据相关的法律和修正案。”
据介绍,各地路径各不相同,而上海数据交易中心采用的模式主要是利用成員准入和交易产品挂牌,以确保交易有据可依。
上海数据交易中心副总裁王润垠向本刊记者表示,在上海数据交易中心诞生之前,数据交易更多以自由市场的形式出现,谁都可以进去。无论对数据供方还是需方而言,这样的自由市场不仅混乱,也无法保障他们的合法权益。
出于对数据安全、隐私和风险评估等方面的考虑,上海数据交易中心采取了会员制。交易并不对个人开放,而只是面向企事业单位。所有有意向的成员,第一步都需要提交申请材料,通过审核之后才能获取成员账号。
“任何(法)人在数据流通里都有一个非常重要的purpose。你的目的是什么?如果用途不明,就不会通过。”汤奇峰称,“目前,上海数据交易中心服务的成员已超过一千名。”
关于会员来源,他进一步解说道,“除了有数字化转型需求的企业,创新驱动强的企业更是迫切需要原始数据的供应,以实现对数据要素在知识加工层面的融合与创新。”
据介绍,成为会员的数据供应方,需要按照一定的标准,对数据的属性进行准确描述,然后才能进行挂牌。数据需求方则可在上海数据交易中心的平台上看到一个个“数据标签”。 截至目前,上海数据交易中心已梳理出了近百个一级“数据标签”可供会员使用。
不过,对于所有的数据交易方来说,定价都是道难题。比如阿里数据经济研究中心秘书长潘永花就曾发问:“数据与其他商品不一样,数据是零边际成本,销售出去之后它依然存在,而且数据销售给不同的用户其价值也不一样,对于数据这样的特殊商品如何来定价? ”
对此,上海提供的解决方案是为供需两侧提供线上竞价的平台,平台公布成交价格,并为需求方提供多供应方间的数据路由配送策略。
“在上海数据交易中心线上平台,我们可以看到所有卖家标注的数据标签和数据价格,这就省去了比较数据价格、判断数据价值、顾虑数据真实性的种种烦恼。”致力为脑科学研究提供数据服务的麓联数据CEO陆王天宇告诉本刊记者,上海数据交易中心还会根据历史数据、相关模型给出一个官方指导价格区间,让购买数据的企业做到心里有底。而之前,他帮客户购买数据时总会陷入“价格过高怕吃亏、价格过低不敢信”的两难境地。
一个数据到底是谁的?从法理上看,业内专家尚未达成共识。比如“ 个人信息属于个人吗”?高富平就认为并不属于个人。
“无论是数据标签还是线上竞价,这里面都有很重要的技术,比如匿名化算法、数据的标准化、流通中的数控分离等。”汤奇峰称,即便是传统意义上的物品流通,也在随着技术的发展而不断变革,不论B2C、C2C、O2O还是C2F,都离不开技术的支撑。大数据本身技术含量就非常高,因此想要推动其流通,更需要强大的技术支撑来实现。
另一方面,作为人口多、流量大、功能密的超大型城市,上海每时每刻都在产生海量数据,除了国内最大新能源车公共数据监测中心,上海还拥有国内最大的个人健康信息数据库。
基于这些技术实践和数据优势,2017年,上海数据交易中心成为“大数据流通与交易技术国家工程实验室”的牵头单位、国家大数据交易标准化试点单位,被寄望于破解我国大数据共享交换及交易流通不畅、标准不明、数据质量参差不齐、资源与服务确权估值建模等问题。
我国首批数据交易发生于2015年的贵阳大数据交易所,彼时的卖方为深圳市腾讯计算机系统有限公司、广东省数字广东研究院,买方为京东云平台、中金数据系统有限公司,京东买走了腾讯的“数据产品”。
“相比固定对象一次性的购买,我们更注重连续性交易——对每天都要依赖,每时每刻都会发生的数据进行的连续性交易——这也是上海数据交易中心有特色的地方。”汤奇峰表示,上海基于应用场景,已开发发布的产品包括中国企业画像服务产品、数据流通安全合规产品、数据开放平台产品、通用数据治理服务产品等。
以中国企业画像服务产品为例,王润垠向本刊记者介绍了该产品面向金融行业提供的服务模式:“金融机构可在企业授权情况下,获取政府机构向数据利用主体开放的工商、税务、社保、商标、专利、科技、环保、法院等维度的数百项数据,有助于金融机构提高基于数据的数字化风控能力。”
据介绍,2019年底,上海市公共数据开放普惠金融应用正式上线,成为上海公共数据开放的首个行业应用。
在上海市金融局、经信委、市大数据中心等主管部门的积极推动下,来自上海市科委、市人力资源社会保障局、市规划资源局等8个政府机构向包括中国建设银行上海市分行、交通银行上海市分行在内的4家试点银行提供了首批与普惠金融相关度较高的300多个维度的公共数据资源,赋能试点银行开发 “沪惠贷”“数据e贷”“浦发数聚贷”“沪信优贷”等创新型信贷产品。
上海数据交易中心总监卓训方表示,过去传统金融机构对中小微企业存在“不敢贷”心理,主要原因就在于这些中小微企业的数据标签不足。而大数据时代的到来,使得数据平台可以将每一家中小微企业都拆解成一个个细致的数据标签。
比如中国建设银行上海市分行,在利用大数据对潜在客户进行风险评估和画像后,将客群扩大了10倍,但不良贷款率保持稳定,为“普惠金融”树立了样板。
2020年4月9日,《中共中央 国务院关于构建更加完善的要素市场化配置体制机制的意见》正式公布,将数据与土地、劳动力、资本、技术等传统要素并列为生产要素。2021年3月31日,北京国际大数据交易所强势入局,成为数据作为生产要素写入中央文件后,和隐私计算技术结合的首个交易所。
普华永道预测,“十四五”时期,我国数据量预计增长近10倍,数字化的新动力带来的增值将替代日渐消失的人口红利。然而,中国信通院发布的另一份报告——《中国数字经济发展白皮书(2020年)》亦指出,我国在数据确权、数据定价、数据交易等数据要素市场化、流通机制设计等方面依然存在很多空白。
业内人士坦言,目前,不少数据交易都卡在了数据所有权的问题上。2017年以后的几年间,各地数据交易中心的新增数量骤降,很大程度亦源于这一年《网络安全法》实施,侵犯公民个人信息罪的定罪量刑标准得到明确。
显然,数据权属界定不清、定价机制缺失等问题已成为数据经济发展的关键“命门”。其中,确权又是任何资源市场化利用的前提。
一个数据到底是谁的?从法理上看,业内专家尚未达成共识。比如 “个人信息属于个人吗”?高富平就认为并不属于个人。
高富平的理由是:“一方面,个人信息并非智力成果,也很难由个人支配。人们在从事交易、接受服务的过程中,必须提供个人信息,而不以主观意志为转移。这些信息一旦提供给他人,个人就难以再控制。另一方面,大量的个人信息是用户浏览或利用网络从事各种活动的记录,这些信息不是由个人保管,也不为人控制。”
从实践层面看,浙江大数据交易中心早在2017年5月推出過数据确权平台。但该平台副总经理来磊告诉记者,“做过几单之后就发现外地企业对这个平台的认可度好像不是很高。”来磊解释道,一方面,数据交易中心层面的确权没有太多法律效应,并不能为数据供需双方提供担保;另一方面,因为不是独立第三方的认定,确权结果的权威性也得不到保证。
“大数据交易中的数据确权不仅需要方法论的研究,更需要技术支撑。”汤奇峰对本刊记者表示,数据交易中心应当在数据交易中扮演更重要的角色,譬如解决数据的存储、清洗、脱敏、标准化、接口的统一化、数据交易中的分发加速等。
传统买卖是物权转移,数据买卖则不尽然。事实上,数据所有权的界定在全球都是一个难题。
在本次调研中,不少受访者都提到:1790年出现股票买卖、经纪人时,也曾缺乏规则。为了回应市场、政府和参与交易人的质疑,规范交易行为,1792年5月17日,二十几个股票经纪人在纽约华尔街68号的一棵梧桐树下签署了梧桐树协议。梧桐树协议保障各方利益,是纽约证券交易所成立的标志,也为后面股票交易规则的建立起到了奠基的作用。
“现在,大数据流通领域也到了这样的时刻。”李欲晓说。
大学生在安徽淮南市大数据展示中心参观,了解大数据产业在智慧城市建设中的作用