杜冉乐 吴若凡
大数据市场规模5年将达8000亿交易平台
今年8月19日国务院常务会议通过《关于促进大数据发展的行动纲要》,这意味着我国大数据发展迎来顶层设计,将有助于培育经济发展引擎。
在商业界,大数据已经开始成为很多企业的生意,贵阳大数据交易所等交易平台也纷纷成立,以抢占各区域、细分领域市场先机。但是目前,有意愿交易大数据的企业和机构还不多。大数据交易的安全性、定价的合理性、客户信息的保密性,都在一定程度上影响着大数据业务的规模和发展空间。
今年5月,成立仅一个月的贵阳大数据交易所推出的《2015年中国大数据交易白皮书》显示,预计到2020年,中国大数据产业市场规模将超过去年规模的10倍,由2014年的767亿元扩大至8228.81亿元。
面对如此庞大的市场潜力,大数据交易平台应运而生,试图占得市场先机。前景固然美好,不过,诸多数据商却仍持观望态度。贵阳大数据交易所官网也未透露目前旗下会员有多少,尤其是VIP会员的数量。
大数据全国扩张地图。
今年4月14日,贵阳大数据交易所正式挂牌成立,注册资本5000万元,涉及贵州阳光产权交易所、中天城投、亚信数据、九次方大数据等6大股东。
贵阳大数据交易所可以交易30种大数据,包括金融、政府、医疗、能源、交通、社交、物流、征信、房产等,类似“网上商城”,实行会员制。
除了贵阳大数据交易所,不少地方也在酝酿发展大数据交易系统。早在2011年5月,北京软件与信息服务交易所由工信部、北京经信委和海淀区投资推动成立,旗下运作的“北京大数据交易服务平台”于2014年底上线。
数据“质量”驱动需求。
大数据能为企业带来什么解决方案?什么样的数据才是企业需要的?
碧桂园集团云贵区域投资拓展部相关负责人周灵梓说,“从去年到现在,我一共拿了8个地块。在拿地过程中,对准确、真实和全面地获取拿地信息有着深刻的感受和强烈的需求。如果拿错地,后续的负面影响很大。”
在周灵梓看来,通过大数据交易的电脑程序分析,得到大家共同认可的数据很重要,以前地产机构的很多数据来源不同,结论差异较大,势必困扰房企的投资决策。
金科股份品牌总监夏绍飞对此也深有感触,“我们一直跟中国指数研究院、克而瑞等机构长期合作,一年要支付咨询费几十万元。光拿到数据没用,关键是数据本身的质量,尤其是机构的分析。”
东原地产集团战略投资部相关负责人周大佐打比方说,房企拿地就是一个“算账”的过程,真正拿地时只有几个数据,但决策前往往需要成千上万的数据支撑。他认为,大数据交易的关键是数据要有用。
“我觉得现在一些第三方机构就很厉害。为了确定一块地周边的客源结构,他们专门派人站在街上‘数车,比如价值30万以上的车辆有多少。”周大佐说,他们暂时还没看到交易所有这么强大。
贵阳大数据交易所相关人士解释说,“我们也不会简单地充当数据搬运工的角色,交易所将积极发挥数据质量认证、数据格式标准化、数据金融工具的作用。”定价暂难市场化大数据平台交易欠活跃
大数据时代,如果你是某家实力房企的营销操盘手,想尽快知道某个片区的有效消费客群情况,通过贵阳大数据交易所这个平台购买数据。但如果数据出错造成推盘失败,这怎么办?
一位业内资深人士指出,目前,大数据的价值由买卖双方根据自己所认定的价值进行评估,决定数据的价格。而交易的困惑实际上就在于交易双方信息的不对称性,更具体一点就是买方需求与卖方供给之间存在大数据交易信息的“错位”。
交易“定价”之惑。
在北京大数据交易服务平台上,点开“数据交易”一栏,针对数据类型一项,共分为原始数据、加工后数据、其他和行业报告,95%以上的数据为行业报告,一共13个页面,挂牌价仅为100元。
唯有“企业大数据精准分析服务”一项属于原始数据,挂牌价30万元,而“舆情监控分析”一项,数据类型不明确,挂牌价为50万元,这些数据几乎都出自九次方大数据终端。
在贵阳大数据交易所,针对产品定价,专门划分了数据的6个维度,包括数据实时性、数据样本覆盖面、数据完整性、数据品种、时间跨度与数据深度,推行实时交易。
贵阳大数据交易所表示,不同品种的大数据价格机制是不一样的,实时价格主要取决于数据的样本量和单一样本的数据指标项价值,而后通过交易系统自动定价,价格实时浮动。
交易存信息不对称风险。
按照贵阳大数据交易所的设计,大数据交易最终要在买卖双方之间达成共识。如果买方急需的数据信息并非卖方所提供的信息,如何解决?发生纠纷之后,交易所将如何处理?发生这种情况的根源又是什么?
一位业内人士说,这种情况下,交易风险又会反馈到交易所的大数据定价机制。
关键问题是,目前大数据交易所在定价机制上仍然难以做到市场化。那么,到底如何看待上述可能会发生的潜在问题?
贵阳大数据交易所工作人员解释说,如果数据买方对购买的数据信息与其描述的内容不符,他们可以向交易所投诉,由交易所及时处理。此外,他们对数据提供商有相关的资格审查,比如企业资质够不够,审核相关数据信息是不是涉及隐私等。
基于此,大数据交易所需要投入多大的人力、设备等成本?上述业内人士说,“这个是非常难的事情,你要看贵阳或北京集聚了多少人才去搞这个事情。”
在该人士看来,现在有一个基础技术有待突破,即数据标签、数据水印,也就是说,从这个交易所里出来的数据必须打上数据水印,这涉及到信息安全技术,目前只有国家信息中心有这个能力解决。
大数据时代的隐私:边界正变得暖昧不清
人们重视隐私的保护,但同时也相信未来是一个由数据推动的时代。不过,大数据使用的普及必然会涉及到侵犯隐私的问题,这听起来的确是相互矛盾的事情。
不可否认,大数据是座金矿,通过数据挖掘,人类所表现出的数据整合与控制力量远超以往。但大数据又是把双刃剑,国家和企业在大数据获益的同时,个人隐私保护的话题却变得暧昧不清,也使业内外对隐私保护的争论延绵不绝。
大数据打破宁静。
说到个人隐私,有这样一个段子:一个客户打电话订购比萨,客服人员马上报出了他的电话和家庭住址,推荐了他喜欢的口味,报出他最近去图书馆借过什么书,信用卡已经被刷爆,了解他房贷还款金额,知道他丈母娘刚动过心脏搭桥手术,甚至还准确定位出他正在离比萨店20分钟路程的地方骑着一辆摩托车……
分散在各个系统中的海量数据乍一看价值不大,但如果把它们深入整合、挖掘,就能知道一名消费者的性格、爱好以及消费习惯等信息,这些信息对商家非常有价值。但对消费者来说,你的宁静生活却从此被打破。
数据如果是在相同业务范围内使用,没有必要去界定隐私;但业内人士也承认,在大数据交易过程中,用户的隐私存在泄露风险。一旦形成大数据模式,各个系统之间产生的数据就会互联互通,数据被用于他途,用户隐私泄露的可能性就会加大。
直接过滤掉个人信息,是否就能防止信息泄露?有业内人士认为,大数据在涉及交换、分析、挖掘时,个人信息是无法直接过滤的。
此外,不同商家的所谓信息共享也会让你的隐私信息有被整合、挖掘的“危险”。这些个人隐私数据散落在中介、银行、保险、航空公司等机构间,危险性可能不大,但如果被共享之后,又被系统整合、相互印证的话,消费者的个人基本信息,甚至性格、爱好以及生活轨迹等信息将被他人一览无余,很多普通人在他们面前将变成“透明人”。
隐私保护应跟上步伐。
大数据系统与传统数据系统不同,区别在于,前者包含了很多外源性数据,这些数据本身存在价值。比如你在淘宝购物创造了一个数据,这个数据对于淘宝而言就是外源性的。当无数外源性的数据整合并被分析之后,便构成了大数据系统。一旦形成大数据模式,各个系统之间产生的数据就会互联互通,从而产生极大价值。因此,传统数据时代的“隐私”与大数据语境下的“隐私”,无论是内涵还是外延,均有极大不同。
一般而言,人们对于隐私的定义是:一种与公共利益、群体利益无关,当事人不愿他人知道或他人不便知道的个人信息。其本身并不涉及公共、群体利益。业界有一种声音认为,随着大数据时代的深入,这个社会对隐私的定义一定会逐渐改变,考虑到技术的发展,眼下认为是隐私的信息,或许几年后就不再敏感。
在监管层面,由于现阶段《民法通则》没有完整的关于“隐私”的概念,国家也无明文规定来规范大数据交易市场,诸如云计算和大数据应用都或多或少在灰色地带游走。
上海杜跃平律师事务所律师杜跃平表示,可以从源头上抓起,即默认禁止状态,未列举的内容默认为不被允许。
美国目前仍在使用的是1970年就通过的《公平信用报告法》,旨在对大型主机侵犯人们的隐私进行防护。该法案允许信用咨询公司收集个人财务信息,但收集所得信息只能用在三个方面:信用、保险以及就业。
很显然,美国的法律在大数据时代滞后了。我国关于个人隐私的保护,也未跟上大数据技术的发展步伐。
杜跃平指出,许多网站和电子商务平台对用户进行行为习惯分析,然后推送相关商品信息,这本身已涉嫌侵犯用户隐私。解决的办法是,网站必须尽告知义务,“网站在采集信息前应告知和征询消费者,消费有权授权或不授权。”即使在授权之后,电商平台也不能将消费者行为信息用于商业用途。