何培育+王潇睿
〔摘 要〕 大数据交易平台的兴起促进了数据的开放与流通,使数据资源价值得以体现。基于国内主要交易平台的比较分析,我国大数据交易平台在数据隐私风险、交易标准化体系的构建、价格机制的探索以及专业人才队伍建设等方面有待突破困境。为完善大数据交易市场与流通体系的建设,大数据交易平台应从建立安全稳定的交易系统、统一行业交易标准和严格交易监管机制等方面强化自身建设,辅之健全的政策法规环境和有力的政策扶持为保障。
〔关键词〕 数据开放与共享;大数据产业;交易平台
DOI:10.3969/j.issn.1008-0821.2017.08.014
〔中图分类号〕 F49;C913;G203 〔文献标识码〕A 〔文章编号〕1008-0821(2017)08-0098-09
〔Abstract〕The rise of big data trading platform promote the opening and sharing of data,so that the value of data resources can be released.Based on the comparative analysis of the major trading platforms in China,Chinas big data trading platform needs to break through the dilemma in the aspects of data privacy risk,the construction of transaction standardization system,the exploration of price mechanism and the construction of professional personnel. In order to improve the construction of big data trading market and circulation system,big data trading platform should strengthen its own construction from the aspects of establishing safe and stable trading system,unified industry trade standard and strict transaction supervision mechanism. In addition,sound policy and legal environment and strong policy support are also necessary.
〔Key words〕 data sharing;big data industry;trading platform
“大数据”的产生与应用无疑推动了世界范围内科学技术领域空前的创新,更驱动了商业模式和管理理念歷史性的变革。数据资源日益成为人类社会重要的生产要素和战略资产[1],更被誉为是21世纪的“钻石矿”[2],采集、分析、应用数据的能力迅速占据国际竞争的焦点。大数据成为政府社会治理、公共服务的工具,提升了政府效能、惠及民生[3]。我国高度重视大数据在经济社会发展中的作用,党的十八届五中全会提出“实施国家大数据战略”,国务院印发《促进大数据发展行动纲要》[4],2016年12月18日工业和信息化部发布实施的《大数据产业发展规划(2016-2020年)》[5]中指出“推动数据开放与共享、加强技术产品研发、深化应用创新”,为数据产业的发展做了具体部署[6]。此外,2016年工信部、国家林业部、农业部等部门从不同行业、不同细分领域也陆续推出了发展意见和方案。目前,大数据的应用已经极为迅速地拓展至经济社会管理的各个领域,世界各国也在不断加大扶持力度,加紧战略布局,使得全球大数据市场规模呈现出高速增长的态势。从整体上来说,大数据进入了从理论研究到落地实践的关键转折期。我国探索发展大数据具有数据资源积累充沛、数据基础理论和应用研究实力雄厚、数据产业价值链辐射带动能力强等得天独厚的优势,但信息孤岛现象依然普通存在,跨部门、跨行业的数据共享和流通仍有待于进一步提高、有价值的公共信息资源和商业数据的开放程度和流动还不够顺畅[7]。因此,大数据交易平台的设立具有现实的紧迫性与必要性。海量、跨域的数据只有通过汇聚融合才能发掘价值,满足市场的需求。数据割据、行业信息壁垒等痛点的破除是推进大数据政策落地,构建产业生态环境的前提[8]。
1 生命周期视角下我国大数据交易平台的发展脉络
企业的生存发展遵循一定的周期规律,在各个发展阶段呈现出不同的特征,大数据交易平台作为一种新兴的商业模式也有其在技术周期、产品周期等方面的发展轨迹[9]。理论研究层面,通常按照组织结构的演化将企业的生命周期划分为初创期、成长期、成熟期、衰退期等四个阶段。在此理论基础上,本文拟对我国大数据交易平台的发展脉络进行梳理,分析其不同生命周期的阶段特征,并根据生命周期规律作出前瞻性的预测,从内部管理以及政策环境的优化等方面寻求较优的发展路径。
1.1 初创期:技术突破和市场需求催生数据交易平台
2011年,美国著名的咨询公司麦肯锡(Mckinsey)在研究报告《大数据的下一个前沿:创新、竞争和生产力》中首次将大数据描述为大小超出了典型数据库软件工具收集、存储、管理和分析能力的数据集[10]。继云计算、物联网之后,大数据广泛巨大的应用潜能和一片向好的市场前景催生了新型商业模式、驱动了大数据价值产业链的形成。大数据的价值逐渐为社会所认知,数据科学决策成为政府、企业的共识,数据开放共享的迫切需要与日俱增[11]。围绕大数据出现了相关的交互、整合以及交换,大数据交易在此基础上雏形初现。国际上,也出现了“数据市场”、“数据银行”等概念形态[12]。国内规模和性质较为完备的数海大数据交易平台于2014年初在北京中关村启动,其他大数据交易平台紧随其后迅速设立、发展。综观国内,从电信、金融、医疗等跨域部门,到制造、教育等传统企业,再到电子商务、社交平台等新兴媒体[13],中国潜在的大数据资源非常丰富且覆盖广泛。当前,中国在大数据的存储和挖掘方面有了突破,但依然存在大量的“数据孤岛”。另外,整个交易是在交易规则缺失、定价标准不确定、交易双方信息不对称的情况下进行的,交易成本很高而且数据质量也无法得到保障,这极大地制约了数据资产的流动。第三方数据交易平台应运而生,对接了数据市场的需求。
我国大数据交易平台的诞生有赖于两方面的现实条件,一方面云计算技术的深度发展为数据存储提供技术支撑;数据获取方式也呈现多样化,如传感器技术、移动终端设备、智能可穿戴设备等[14];Hadoop(基于批处理技术的开源云计算平台)、Storm(实时、分布式且具备高容错性的计算系统)、Spark(是用Scala语言写成的一套分布式内存计算框架,核心模型为弹性分布式数据集,可构建一系列分布式API)等数据处理工具日趋成熟发展,大数据技术的突破进展是大数据基础设施搭建的技术支撑,同时也是大数据交易平台产生的前提和基础[15]。另一方面,从社会分工来看,大量的数据供应方与数据需求方之间缺少透明、可控的交易桥梁,存在信息不对称、沟通不顺畅等现象,由此产生了社会资源配置的不合理,大数据交易平台可以说是社会化分工的产物,它既能引导数据资源的合理分配,又能通过规范交易流程,推动数据流动形成良性的循环创造新价值,因此巨大的市场需求是数据交易平台产生的内在动力。
1.2 成长初期:大数据交易平台的数量与规模迅速扩大
成长期是大数据交易平台发展最为迅速的时期,2015年是大数据交易平台成立速度最快数量猛增的一年。2015年4月,贵阳大数据交易所在贵阳市国资委的支持下挂牌运营,并完成了首次交易;8月,华中地区第一家数据交易所——长江大数据交易中心落户武汉,此后华中大数据交易所、武汉东湖大数据交易所、河北京津冀数据交易中心也相继成立。由上海经济和信息化委员会指导的上海大数据交易中心也于2016年挂牌成立[16]。此外北京数海科技、数据堂、TalkingData、中关村大数据产业联盟等也走在了行业前列。在这个时期,大数据交易平台突出表现为以下几个特点:交易平台数量规模迅速扩大、市场占有率持续提高、业务范围也在不断地尝试拓宽、有部分企业已经逐渐占据市场影响力,享有一定的知名度[17]。2015年大数据交易平台的纷纷涌现可谓是大数据火热概念下的集体爆发,至此,大数据潜在的商业价值也得到了进一步地释放并逐步形成交易规则,产生定量化的交易指数,从而实现真正的实时线上交易。大数据交易平台作为大数据交易的第三方,在交易过程中发挥着制定规则和标准的作用,审查发布的数据,在数据上线后负责撮合交易。相互割裂的数据通过聚合打破了碎片化的状态,在经过数据加工分类后建立起逻辑关联,产品化的数据为政府企业等机构在实际解决问题中提供参考。
1.3 过渡期:大数据交易平台的发展遭遇困境
由于大数据产业市场前景广阔、前期行业的进入壁垒相对较低,许多大数据交易平台性质的企业机构纷纷挂牌成立,交易平台一时炙手可热。数量猛增的热潮虽然还未完全趋于缓和,但欣欣向荣的发展景象之下,交易市场并没有达到预期的活跃程度,尽管多数交易平台在成立之初设立了非常喜人的數据交易目标,但在市场运营中却遭困境,较为直观的表象是目前多数交易平台的线上交易情况并没有呈现出预期的活跃性。以最具影响力的贵阳大数据交易所为例,“2016年4月14日,贵阳大数据交易所挂牌运营一周年,交易金额突破7000万元,发展会员逾300家,单笔交易突破1000万元…”[18]这与该所全年计划实现的2亿元交易额以及期望在2020年达到日均交易量100亿的目标还有一定差距。究其原因,一方面大数据、数据交易以及交易平台属于处在发展初级阶段的新兴事物,多数企业、机构甚至政府在如何开放共享数据以及开放的程度、力度方面都持谨慎、观望的态度;另一方面目前成立的大多数交易平台在投入市场运营的过程中问题层出不穷,诸如数据获取的实时性难以实现可持续,不同数据主体数据开放格式不一致,特别是不同行业之间的数据维度、语义不协同,其次交易平台流通效率、质量管理方面良莠不齐等,这些问题在很大程度上制约了交易市场规模化发展[19]。目前,交易平台建设发展中面临的交易规范缺失、交易权属不明等问题已经得到重视,地方政府企业等也在积极探索推进交易标准化体系的建设和交易规范的确立。
1.4 发展趋势:机遇风险并存的数据蓝海
加快现代大数据交易平台与流通体系的建设,一方面是促进大数据产品与服务的革新;另一方面也是发展现代化、合理化数据流通方式的必由之路。数据挖掘、机器人学习、深度网络神经等概念可能会带来大数据基础理论级别的突破,与此同时个人隐私安全保护将面临重大挑战。总体而言,大数据交易平台的发展将呈现以下几种趋势:①围绕大数据交易安全的相关法律法规以及行业标准将出台;②区块链、分布式存储等新技术的发展一方面会改变大数据存储交易方式,另一方面也将丰富大数据交易的类型;③不同类型的大数据交易平台之间逐渐寻求合作,数据交易更为普遍;④大数据交易的行业范围也将从金融、医疗等领域不断扩大;⑤大数据交易路径短期仍处于探索期。
总之,大数据交易平台以推动政府及社会各领域数据的开放、融合为出发点,落实到最终的场景应用,将聚合大数据领域具有优势数据资源、大数据技术、产品及服务的企业、机构以及科研院校的力量,推行交易标准、交易规则的制定,维护交易市场的安全有序,解决数据流通过程中出现的困局,逐步构建大数据产业生态,让大数据真正成为推动我国社会发展、经济转型升级的强大动力。
2 我国大数据交易平台的现状分析
整体上来看,目前国内多数大数据交易平台创立建成后还处于生命周期的成长初期阶段,市场规范并没有得到同意,交易模式、业务类型等也处于探索过程中,但也向稳定的成熟期逐步过渡。另外,2017年3月,国家信息中心最新发布的《2017中国大数据发展报告》中显示大数据发展指数为47.15,从定量研究的角度也说明了我国大数据产业整体处于起步阶段[20]。大数据交易平台是以数据作为商品进行交易的运行模式,分析大数据交易平台建设模式及其数据交易行为,对于了解当前我国大数据交易、大数据产业链发展有着导向作用。本文通过梳理国内较有影响力的大数据交易平台,并进行分类对比研究,初步归纳现阶段我国大数据交易平台建设的特点,同时针对平台建设存在的问题提出建议措施,为促进大数据产业健康发展,推动数据生态的构建提供借鉴。
2.1 国内知名大数据交易平台的比较分析
笔者通过对已经挂牌成立,注册运营的大数据交易平台进行统计,整理出以下具有代表性的交易平台,从公司成立情况、功能与定位、平台运营管理、以及相关交易规则的制定情况等对主要数据交易平台进行比较分析,初步归纳出大数据交易平台的分类情况、代表性的交易流程、提供的服务内容、交易的数据类型以及平台的管理体系方面的特点。
2.1.1 大数据交易平台的分类
国内现有大数据交易平台可以简单划分为两类:一类是中立的第三方,其定位就是数据供给侧和数据需求侧的中介,其功能比较清晰,只提供交易的场所,自身并不存储沉淀数据;另一类是交易平台更多的是提供服务,这类平臺往往是和数据拥有者、技术平台合作,对原始数据进行清洗、脱敏、加工,最终指向特定的应用场景或者形成可视化的数据产品。当然,在实际的运营中会发现这两种类型的平台的划分界限并不是完全明确,许多交易平台是二者的整合,只是在业务平台的搭建中有所侧重。根据公开资料以及中国工商局公司公示信息统计,对以下部分交易平台依据其主要业务范围和成立的依托背景进行分类:一是政府主导,以贵阳大数据交易所为代表,包括湖北长江大数据交易所、华中大数据交易所、陕西西咸新区大数据交易所等均是在地方政府的支持下建立的;二是自身拥有大量数据资源或者本身以技术为优势的企业以市场需求为导向建立的交易平台,比如数据堂是一家专注于互联网综合服务的交易平台;三是目前具有产业联盟性质的交易平台,以中关村大数据产业联盟为主,其服务和商业模式更为综合[21]。从统计到的交易平台可以看出我国目前成立的大数据交易平台多是在政府批准下成立的,这在一定意义上体现政府信息公开路径的探索,同时也反映出政府对于大数据的应用需求较大(如表1)。如陕西西咸新区大数据交易所是国内首个围绕“一带一路”经济带的大数据交易所;长江大数据交易中心是武汉市政府推出的“互联网+”产业创新工程“11711”行动计划中的一项部署。
2.1.2 大数据交易活动的流程
通过对目前国内具备大数据交易平台性质的企业进行统计,并通过各个交易平台网页或终端在线注册会员进行用户体验,可以发现多数交易平台均采用会员注册制度,通过申请注册、平台进行审查、核准注册、在线发布需求或上传数据、交易所在线撮合、交易结算等流程完成一系列的交易活动(如图1)。数据交易流程中包括数据源(数据生产者、拥有者)、第三方数据交易平台以及最终的应用对象(数据需求方、最终用户)[22],交易平台作为中立的第三方负有用户资格审查、数据安全等审核义务。大数据交易平台在交易过程中为买卖双方提供了交易平台,节约了寻找成本,提高了企业的运营效率,同时融合了多源异构的数据,让信息不再是一座座“孤岛”。数据交易平台在数据卖方和数据需求方之间承担着媒介的作用,整合了跨行业、跨领域的多源数据,按照统一的数据模型进行处理分析,提升了数据质量,实现了数据交易,为政府治理、企业决策提供了数据支持(如图2)。
2.1.3 数据来源或数据采集方式
根据分析结果,大数据交易平台大致通过以下渠道获取采集数据:一是政府数据的开放共享[23];二是数据提供者发布数据,包括企业、科研机构及个人;三是互联网数据爬取,例如八爪鱼采集平台每天海量用户产生的亿级数据支持作为供应链;四是基于业务范围内平台沉淀、产生的数据(如表2)。此外数据采集获取过程是最易发生数据权属和个人隐私侵权纠纷的环节,关于数据交易过程中的许可机制[24]、数据权属的分配、以及个人信息立法保护等问题一直是学术争鸣的热点话题。
2.1.4 交易的数据类型
单个的数据以及原始数据无法具体体现数据潜在的价值,从跨行业跨领域的多源数据中找到其关联、规律,并加以利用,获得有巨大价值的产品和服务或深刻的洞见,才能更好的实现数据价值。分析贵阳大数据交易所、万象平台、数据堂等六大主要平台,交易的数据多通过对原始数据的采集、脱敏、分析、可视化等技术流程得到以下数据类型:①数据商品:实时数据(API接口实时更新数据、调用灵活);②数据包:经过清洗、脱敏的原始数据(除禁止的个人隐私、国家机密等);③数据分析成果:不同主题的分析结果、行业分析报告;④数据应用:技术服务的交易和技术应用(舆情云平台等)的交易等(如表3)。
大数据交易平台所提供的服务内容大致分为以下几类:1)数据定制服务:从采集到清洗加工到挖掘分析的过程,区别于一般的数据商品的交易,需要多方数据源的糅合后再加工呈现。此类服务见于多数交易平台,蕴藏巨大的市场需求,例如,①一些企业、机构拥有许多原始数据,而自身数据处理能力不足,因此需要第三方进行数据的加工、可视化呈现;②一些企业基于发展业务的需要,而自身的渠道有限,因此需要借助第三方交易平台。2)技术支撑服务,例如:精准扶贫云平台[25]、金融风险防控等场景的应用;3)数据托管服务:数据服务商将数据存储在交易平台,由交易所进行交易变现,体现数据的价值;4)大数据的培训服务:基于大数据人才的需求,推行工程师、分析师、管理师的培训。
2.2 我国大数据交易平台的现实困境
以上大数据交易平台在实际的数据交易中多数是停留在原始数据“粗加工”层面,深层次的数据加工还需要拓展,即便是最先起步的交易平台目前成交额成交率也并未如预期的高。数据开放进程缓慢、缺乏有效的法律规范、数据质量和有效性无法切实保障,一定程度上制约了数据交易整体规模,影响数据变现能力。初步归纳得出我国大数据交易平台目前所面临的现实困境主要体现在以下几个方面:
2.2.1 多重壁垒阻碍数据开放共享
政府、企业以及科研机构等交易主体对数据开放共享的程度、力度影响着数据交易平台的业务范围以及交易质量。尽管当前各个主体已经有意识地基于自身发展需求或服务公共的目的逐步在开放共享机制方面有多探索,例如全国可信网站数据库、百度数据开放平台,此外多地政府也相继开通政府数据开放网站,但面对巨大的市场需求以及数据本身依然未被合理发掘利用的商业价值和社会价值,我国数据开放共享也只是走出了试水的一步,是否打开共享的大门在一定程度上体现了一种开放的态度,但同时更需要完善的管理和责任机制、技术支撑,这也体现为一种能力,即是否能够把控开放共享的安全、效益。目前开放共享的主体主要集中于拥有大数据的政府、互联网企业运营商以及科研机构等多个主体,阻碍开放共享进度的因素主要表现在开放共享的理念、完善的平台和技术支撑、成体系的管理监督机制以及最终的开放共享反馈效果等多个维度多重因素。以政府为例,对数据决策、现代化治理等的认识不足,共享理念并未形成;即便多数政府部门已经认识到大数据带来的效能,但缺乏成熟的管理机制,更为主要的是对于共享机制探索中出现错误承担责任的躲避;另外已经走在开放共享前沿的部门面临技术上的现实困境,对数据的维护和管理不足。开放共享的壁垒体现在企业之间多是存在竞争关系,出于商业利益的考虑,开放程度并不是很高。企业普遍意识到数据决策的科学化正在成为一种趋势,但出于商业秘密、同行竞争、数据安全等考虑,缺乏输出自身数据的价值观念,这种因制度、地方主义、部门主义等人为因素造成的数据分散现象,称为数据割据。
因此有效的激励主体的参与度和可用性,首先需要融合结构化和非结构化数据,消除数据孤岛;打通企业内部和外部的数据,消除数据割据现象;另外在配套的信息安全保障措施下提升政府企业等主体的参与,共同推进数据标准化建设,完善交易规范,通过响应参与主体对数据的应用需求为导向,撬动数据交易市场更大的潜能。
2.2.2 原始数据的质量及有效性偏低
数据源(原始数据)是大数据生态圈良性运转最重要的根源。数据的分析处理、可视化、场景应用等都是建立在数据源的基础之上。只有从多源头、跨领域的数据融合中建立关联分析才能實现数据价值的深度挖掘,单一孤立存在的数据无法呈现具有价值的信息,因此能否实时迅速地从多源、异构的海量数据中加以甄别获得有价值信息,逐渐成为决定国家和企业发展水平、发展速度的核心指标。《2017中国大数据发展报告》研究显示,互联网、政府领域数据开放应用范围较广,而金融、医疗领域是应用需求最大也是安全问题最为突出的,农业、餐饮等领域数据开放基本未涉及,潜藏巨大的商业价值。足以看出我国当前数据资源的开放范围、利用方式以及数据是否有效可用等方面依然存在障碍[26]。具体到数据的质量及有效性方面,数据价值的最终体现包含多个环节,而原始数据的质量和有效性的缺乏影响了数据交易的质量和准确可靠程度,具体原因在于,一是因为大多数地区交易平台在规则缺失的市场下自成体系,不相统一的开放格式、数据维度以及语义等共性问题制约了交易市场流畅的沟通。二是数据是否真实、完整、一致,数据质量的好坏直接决定数据资产的价值,因为大数据环境下,数据种类纷繁多样、干扰数据的取舍难以保障、数据本身的真实可信度难以有效辨别等;三是技术层面的支撑力仍有待提升,数据能否全面采集检索、获取的数据在格式规范上是否便于后续的交互流通、实时有价值的数据能否及时获取、更新、维护等均对数据交易质量产生影响。
2.2.3 数据交易过程潜伏隐私安全危机
大数据最核心的技术特征就是非结构化的数据存储方式和及时精确地处理分析数据的速度以及精准的预测能力,这些特征无疑对隐私存在天然的威胁。一是大数据时代超强的数据采集能力、多样的数据获取渠道增加了隐私侵犯的可能性,裸奔的互联网时代,使得信息收集变得十分容易,滥用信息、倒卖个人数据的情况屡见不鲜[27];二是数据分析、挖掘是一种依赖于数据相关性对未知事实进行预测和推断的方式。数据的收集与分析是以消费者看不见的方式进行的;三是反向身份识别技术,无疑又给数据脱敏清洗带来更大挑战。即便是经过脱敏、匿名化处理后可视化的数据商品依然存在对多个数据整合后关联分析得到原始数据的可能性,另外数据商品可能涉及国家机密、商业秘密和个人隐私的内容,数据流动过程会造成隐私的泄露。
首先大数据的发展使得个人信息保护面临的形势更加复杂,其次平衡数据跨境流动与确保安全成为当前和未来我国立法的一个重要方向,此外数据权属问题仍待明确,解决数据权属问题一方面要着眼于明确产权归属[28],另一方面仍要关切数据交易带来的隐私与信息安全风险。
推动数据开放共享与规避信息安全风险之间如何平衡,将是大数据时代的一个重大挑战。
2.3 交易市场缺乏合理定价机制
我国大数据交易市场尚处在初级阶段,大数据交易平台对于数据商品的定价尚未形成统一的行业标准,更多的是卖方市场,缺乏合理性和持续性。造成上述现状的现实原因在于:1)目前我国的大数据商品交易定价多采取明码实价和平台撮合自动交易两种,均未考虑数据购买者的支付能力和意愿,较高的交易价格,致使终端买者群体规模扩张速度缓慢。2)大数据体量巨大(Volume)、类型繁多(Variety)、价值密度低(Value)、处理速度快(Velocity)的基本特征是影响大数据定价的因素。3)大数据的价值具有不确定性、稀缺性和多样性,且大数据交易存在买方和卖方的信息不对称问题。目前通过对上述各平台的注册体验可以发现,交易平台存在多种定价方式混合,灵活且有弹性空间。一是主要由数据提供者、数据发布者制定,在线实行标价模式,但平台往往会在购买者报价后进行撮合,最终确定一个买卖双方协商一致的价格,平台会根据交易额从中抽取服务费获益。另外一种主要针对产品化的数据包、数据分析报告等基本采取一次性收费的模式或者按调用次数定价。
数据产品与传统的工业产品存在很大的差异,数据商品定价、数据资产评估本身受到包括数据品种、时间跨度、数据完整性、数据样本覆盖和数据时效性等因素的影响,因此合理的定价机制是保障数据交易可持续性的前提,需要综合使用定价模式、定价策略[29]。
2.4 专业人才短期无法满足需求
数据相关产业链的发展将推出一批新的就业岗位,大数据建设的每个环节都需要依靠专业人员完成,掌握应用数学、统计学、计算机等多学科知识掌握的应用型复合性人才需求缺口最大,因此,满足大数据产业链的蓬勃发展必须加紧培育建设一批专业人才队伍。目前大数据领域相关人才供需不均衡的短板问题已经逐步显现,一方面大数据领域技术、知识更新迭代速度较快与专业人才供给周期缓慢之间的矛盾较为突出;另一方面区域产业发展活跃程度与人才流动方向不一致,就业市场偏向于集中在京津冀等区域。人才队伍的短缺将阻碍大数据市场的发展,未来各行业中数据分析师、大数据技术工程师等人才将炙手可热。如何应对大数据市场出现的人才缺口问题,需要政府顶层规划,聚合企业、高校、科研院所的力量,搭建产学研培养路径,以市场需求为导向,制定合理科学的课程体系和培养计划,采取多种培养模式。值得欣喜的是我国政府已经在大数据人才培养方向有所探索,2016年2月,北京大学、中南大学等高校首批开设了数据科学与数据技术(专业代码080910T)本科专业,同年9月,教育部新增专科专业“大数据技术与应用”(专业代码610215)[30]。
3 完善大数据交易平台的对策建议
大数据交易平台要突破数据采集、管理以及交易等环节存在的现实困境应从平台自身出发建立安全稳定的交易系统、统一的行业交易标准和严格的监管机制,从完善政策法规和加大政策扶持出发优化外部政策环境。
3.1 探索建立安全的数据交易系统
安全、稳定、标准化的交易系统是平台发展的基石,数据交易平台应为数据需求方和数据供应方提供规范透明的数据第三方交易平台,首先保障数据交易是在合法、透明的环境中进行,其次交易的产品或服务其质量和后续的维护应该得到保障,另外公开透明合理的定价应为买卖双方所公知,最后交易的主体可追溯、交易質量可申诉。
此外,还需要规范交易流程,把控交易数据的质量,进行数据类型细分,实现有序交易。大数据交易平台应具备广泛的合法的数据采集渠道、强大的数据建模能力、设计应用场景的能力等。因此,一方面寻求新技术作为交易体系的技术安全支撑,部分交易平台已经尝试利用区块链等新技术进行数据源及交易过程的可追溯体系建设[31]。另一方面除了实现数据交易功能之外,交易系统还能够基于数据服务,支持自身和第三方研发各行业的智能服务系统,形成基于大数据交易所的生态系统,在保障用户隐私及数据安全的前提下融合数据,推动数据流转,消除企业信息孤岛。因此,需要研发新型存储技术、研制传输交换机理,以对接大数据时代对数据的海量存储以及数据的跨层、跨域、实时和完整传输的需求。
3.2 加快制定统一的数据交易标准
当前,大数据市场并未形成一套统一严格的交易数据格式、交易管理方法等标准体系,数据交易处于自我约束、各平台自行探索规则的状态。标准化是规范大数据交易的最佳方式,也是打通跨区域、跨行业之间数据交易的前提。交易标准体系具体应包括基础数据描述的标准、数据处理标准、数据安全标准、数据质量评价标准、产品和平台标准以及应用和服务标准。通过规范数据的开放格式、描述方式、访问接口、管理技术等,为大数据的市场化应用提供支撑,因此我国的大数据标准化工作主要集中在两个方向:一是大数据术语、架构等通用标准的研制;二是根据行业特定需求,例如通信、金融、医疗等领域制定行业大数据应用标准[32]。目前部分交易平台探索建立了平台交易标准,对国家制定标准体系具有借鉴作用,例如华中大数据交易所制定了《大数据交易安全标准》、《交易数据格式标准》、《大数据交易行为规范》、《大数据交易管理条例》等规则,贵阳大数据交易所参与全国信息技术标准化技术委员会的大数据交易标准制定,成为其“大数据交易标准试点基地”。地方数据交易对探索建立国家层面数据交易的法律法规和行业标准起到积极地推动作用。此外,全国信息技术标准化技术委员会自2014年已经启动建立数据标准数据的计划,《信息技术数据交易服务平台交易数据描述》、《信息技术数据交易服务平台通用功能要求》等系列标准预计将很快发布实施。
3.3 完善严格的数据交易监管机制
首先,平台自身首先对其从业人员要求负有高度诚信义务,不得以任何形式篡改交易数据的真实性,对离职人员进行离任审计。其次严加管控注册会员的资格准入条件,另外对数据交易和清算业务有关的数据交易流程进行安全监管,同时明确大数据交易平台对会员的违规行为的惩戒,最后在对会员交易行为的监管上,对数据源审核、交易协议的订立内容、数据交易对象信息等层面进一步细化,对存在或者可能存在严重违反国家有关法律、政策的行为,履行重大事项的汇报义务。
其次,交易市场除在行业自律的约束下规范运行,也需要在自我监管失灵的情况下加强政府干预。首先大数据交易是一种特殊的商品交易形式,因为数据蕴含个人信息、企业核心资料甚至国家机密,不当利用可能危及社会秩序、国家安全;其次为避免大数据持有的垄断,政府层面的调控和监管是必不可少的。因此理顺政府与平台关系,探索协同治理实施路径,才能保障加以市场持续、健康、稳定的发展。
我国大数据交易平台具体的监管规则尚在探索。推动建立数据流通与交易与隐私保护问题之间的行政监管如何落脚平衡;政府在明确数据开放基本原则之后,如何将监管规则落实到诸如默认开放、可重复利用等原则要求。从目前探索实践看,上述监管规则将更多通过地方或者个案方式逐步推进,面对全新问题,要建立政府、企业、用户等多方主体参与的协商机制,使监管机制既符合产业发展规律,又广泛凝聚社会共识。
3.4 优化大数据产业发展的政策环境
2016年国家发改委、工信部、国家林业部、农业部等均推出大数据发展意见和方案,大数据政策从宏观的顶层设计向细分领域的政策落地延伸,优化大数据产业的政策环境是大数据交易平台健康发展的保障。
第一,健全相关政策法规制度。一是制定政府、公共信息开放共享的管理方法,扩大范围,提高质量;二是加强数据管理,健全数据和个人信息的安全防护措施;三是推动完善个人信息保护立法,加大信息泄露、侵权惩戒力度;四是强化数据领域的知识产权保护意识;五是加强跨境数据流动的管理,尤其是敏感数据的法律体系和管理机制。
第二,加大政策扶持力度。首先是加大对大数据相关技术研发、重点应用场景搭建、应用广泛的项目等的投入;其次是鼓励企业探索新型大数据商业模式,突出区域特色,优化布局;三是积极促进创业宽松环境,为产业发展吸纳更多人才;四是支持大数据领域的理论研究,大数据基地、实验室的搭建,探索围绕大数据产业链的创新活动;五是注重校企合作,补齐产业发展过程中人才紧缺的短板。
参 考 文 献
[ 1 ] Mayer-Schnberger V,Cukier K. Big Data: A Revolution That Will Transform How We Live,Work,and Think[J]. American Journal of Epidemiology,2014,17(9):181-183.
[ 2 ]Nir Kshetri. Big Datas Impact on Privacy,Security and Consumer Welfare[J]. Telecommunications Policy . 2014(11).
[ 3 ]蒋水林. 社会治理和公共服务成为大数据产业重点[N]. 人民邮电,2017-01-23(007).
[ 4 ]国务院关于印发促进大数据发展行动纲要的通知(国发〔2015〕[EB/OL].2017-02-25. http:// www. gov.cn/zhengce/ content/2017-02-25/content_1 0137.htm.
[ 5 ]规划司.《大数据产业发展规划(2016-2020年)》正式发布[EB/OL]. 2017-02-25. http://www.miit.gov.cn/n1146290/ n4 388791/c5465401/content.htm.
[ 6 ]大数据产业发展规划(2016-2020年)[N]. 中国电子报,2017-01-20(005).
[ 7 ]朝乐门,马广惠,路海娟. 我国大数据产业的特征分析与政策建议[J]. 情报理论与实践,2016,(10):5-10.
[ 8 ]杨世龙.《揭秘大数据交易的真正意义》[EB/OL].http://news.xinhuanet.com/fortune/2017-02-25/c_1115186527.htm.
[ 9 ]宋智慧. 企業生命周期理论[J]. 知识经济,2010,(24):105-105.
[ 10 ] Manyika J,Chui M,Brown B,et al. Big Data:The Next Frontier For Innovation,Competition,And Productivity[J]. Analytics,2011.
[ 11 ]何军. 大数据对企业管理决策影响分析[J]. 科技进步与对策,2014,(04):65-68.
[ 12 ]屈一平. 揭秘大数据买卖在中国[J]. 小康,2014,(14):56-58.
[ 13 ]杨琪,龚南宁. 我国大数据交易的主要问题及建议[J]. 大数据,2015,1(2):38-48.
[ 14 ]徐子伟,张陈斌,陈宗海. 大数据技术概述[C]// 系统仿真技术及其应用学术论文集. 2014.
[ 15 ]彭庆. 基于大数据技术的数据共享平台方案研究[J]. 电信技术,2014,1(10):22-25.
[ 16 ]胡寅. 静安区促进大数据产业发展的探索与思考——以上海数据交易中心为例[J]. 上海经济,2016,(03):94-100.
[ 17 ]祁顺生,蔡海中. 企业生命周期不同阶段战略导向的选择与调整[J]. 中国科技论坛,2016,(10):65-71.
[ 18 ]樊荣. 贵阳大数据交易所成立一年实现五大突破[N]. 贵阳日报,2016-04-14(001).
[ 19 ]唐斯斯,刘叶婷. 我国大数据交易亟待突破[J]. 中国发展观察,2016,(13):19-21.
[ 20 ]国家信息中心发布《中国大数据发展报告(2017)》[EB/OL].2017-03-06.http://www. sic.gov.cn/News/79/7727.htm.
[ 21 ]丁道勤. 数据交易相关法律问题研究[J]. 信息安全与通信保密,2016,(10):54-60.
[ 22 ]荆浩. 大数据时代商业模式创新研究[J]. 科技进步与对策,2014,(07):15-19.
[ 23 ]钱晓红,胡芒谷. 政府开放数据平台的构建及技术特征[J]. 图书情报知识,2014,(03):124-129.
[ 24 ]王忠. 大数据时代个人数据交易许可机制研究[J]. 理论月刊,2015,(06):131-135.
[ 25 ]莫光辉,张玉雪. 大数据背景下的精准扶贫模式创新路径——精准扶贫绩效提升机制系列研究之十[J]. 理论与改革,2017,(01):119-124.
[ 26 ]数据堂:大数据产业调研及分析报告[EB/OL].2017-03-06.http://chuansong.me/account/BigDataDigest.htm.
[ 27 ]何培育,蒋启蒙. 个人信息盗窃的技术路径与法律规制问题研究[J]. 重庆理工大学学报(社会科学),2015,(02):159-162.
[ 28 ]王玉林,高富平. 大数据的财产属性研究[J]. 图书与情报,2016,(01):29-35,43.
[ 29 ]刘朝阳. 大数据定价问题分析[J]. 图书情报知识,2016,(01):57-64.
[ 30 ]周晓燕,尹亚丽. 基于国内市场需求的大数据管理人才知识结构分析[J]. 情报科学,2017,(01):29-34.
[ 31 ]顾彦. 区块链+大数据:给数据“加戳”、“加密”[J]. 中国战略新兴产业,2016,(19):38-40.
[ 32]韩晶,王健全. 大数据标准化现状及展望[J]. 信息通信技术,2014,(06):38-42.
(本文责任编辑:郭沫含)