顾钊铨,张 尼,李树栋,仇 晶,殷丽华,田志宏
(1. 广州大学 网络空间先进技术研究院,广东 广州 510006; 2. 中国电子信息产业集团有限公司第六研究所,北京 102209)
在大数据时代,掌握数据即意味着拥有财富。阿里巴巴多年前就通过买卖商品收集数据,通过挖掘数据中有价值的信息进行持续盈利,并表示“数据是阿里最值钱的财富”。随着科技的不断发展和信息的共享流通,越来越多的企业开始注重数据可能带来的价值,并致力于从数据中挖掘信息,提升企业综合实力。
现如今,大数据已逐步成为世界各国作为国家创新战略、国家安全战略、国家产业发展战略以及国家信息网络安全战略的重要研究方向。全世界各国政府、企业及研究机构等各司其职,制定促进大数据产业发展的政策,开发数据挖掘、数据服务等创造价值的产品,研究大数据底层框架和关键技术等,共同促进大数据产业的快速发展。
图1 大数据产业生态划分
《大数据产业发展规划(2016-2020年)》[1]中指出,大数据产业指以数据生产、采集、存储、加工、分析、服务为主的相关经济活动,包括数据资源建设、大数据软硬件产品的开发、销售和租赁活动以及相关信息技术服务。本文认为,大数据产业贯穿数据产生、采集、存储、加工、分析、利用、服务等各个环节,并以软硬件产品开发、数据加工和分析产品开发、数据交易和共享平台、数据的信息技术服务等作为主要经济活动。
数据越来越成为国家基础性战略资源,成为推动社会进步、经济转型发展的新动力。从国家层面而言,推动大数据产业蓬勃发展能更加有利于国家掌控和运用大数据提升国家综合国力,因此各国政府纷纷将大数据及大数据产业发展规划作为国家的发展战略之一,不仅出台大数据产业发展政策,制定相关法律法规,完善管理规范和措施,还通过税收优惠、人才奖励等多种渠道鼓励更多人才参与大数据产业发展、鼓励更多初创的大数据企业快速成长等。
大数据推动了社会生产要素的优化共享、资源集成整合、协作开发、高效利用,对传统的生产方式产生改革,能显著提升行业水平和效率,并持续激发创新商业模式等。近年来,大数据产业链涵盖了数据生产、数据采集、高效存储、数据管理、数据挖掘和分析、数据交易和共享、数据应用和服务等,产业链日趋成熟和完善。大数据产业正逐渐成为新的经济增长点,必将对信息产业格局发展趋势产生重要影响。
大数据产业围绕数据资源,将产业的数据经过采集、存储、加工、分析、利用及服务,最终实现数据转变为价值。大数据产业链的成熟和完善,为大数据产业提供了良好的生态环境。
大数据产业生态主要包括数据产生、采集、存储、加工、分析、利用、服务等各个环节,中国电子信息产业发展研究院、赛迪智库等联合发布的《中国大数据产业生态地图》[2]将大数据产业生态分为:基础支撑产业、融合应用产业和数据服务产业。其中基础支撑产业主要针对数据存储、计算、可视化等数据基础处理;融合应用产业包含工业大数据、政务大数据、交通大数据、金融大数据等多个行业大数据的应用;数据服务产业则包含数据采集、交易及增值服务等。
从数据资源的角度划分大数据产业生态,如图1所示,大数据产业生态主要包括:数据资源建设产业、数据处理和分析产业、数据应用和服务产业。
(1)数据资源建设产业包括数据采集、数据整合、数据集成、数据存储等过程,典型的数字资源企业包括电商(阿里巴巴、京东等)、社交平台(腾讯、新浪等)、搜索平台(百度、搜狐等);数据存储平台包括华为、阿里云、浪潮等大型数据中心和云平台。
(2)数据处理和分析产业主要包含数据管理、加工、分析、挖掘、交易等过程。其中平台级包括数据管理平台、数据处理平台、数据交易平台和数据分析平台等,工具级包括数据加工工具、数据分析工具、数据挖掘工具和数据可视化工具等。典型企业包括talkingdata、百分点、科大讯飞、出门问问、数字冰雹等;典型的数据交易中心包括贵阳大数据交易所、长江大数据交易中心、东湖大数据交易中心等。
(3)数据应用和服务产业包括大数据在不同行业中的应用,如电子商务、智慧物流、智慧交通、智能制造、大数据医疗健康、数据金融、虚拟现实、在线教育、智慧旅游、视频娱乐等不同行业。典型企业和产品包括:淘宝、顺丰、京东金融、陆金所、滴滴、海尔、携程、途牛等。企业结合大数据挖掘和分析数据蕴含的内在价值,并进一步研发大数据驱动的产品,提升自身价值。
我国大数据产业蓬勃发展,不仅政府提供各种优越的政策环境,各大投资机构也大力支持大数据产业的高速发展,当前大数据产业的环境十分优越。
在产业政策上,我国出台了一系列促进大数据产业发展的政策法规,通过制定大数据战略和行动计划,培育大数据产业生态体系。
2015年,国务院印发《促进大数据发展行动纲要》[3],系统地部署了大数据的发展工作,其中包括 “加快政府数据开放共享”、“健全大数据安全保障体系,强化安全支撑”等。2016年,国务院继续发布《“十三五”国家信息化规划》[4],并在规划中明确指出“实施大数据安全保障工程,加强数据资源在采集、传输、存储、使用和开放等环节的安全保护”。该规划的提出使得大数据产业发展开始致力于大数据采集、清洗、存储、分析、发掘、可视化、安全与隐私保护等关键技术攻关。2016年4月,发改委通过《促进大数据发展三年工作方案(2016-2018)》和《促进大数据发展2016年工作要点》,规划了大数据产业发展路线图。为了推进政府数据开放共享,2016年9月,国务院又发布了《政务信息资源共享管理暂行办法》,进一步鼓励政府数据开放,并用来深入挖掘创造社会价值。
2016年12月,工信部印发《大数据产业发展规划(2016-2020年)》[1],提出要在“十三五”期间大力推动我国大数据产业持续健康发展,贯彻国家大数据战略,规划指出目前我国信息化积累了丰富的数据资源,大数据技术创新也取得明显突破,大数据产业体系初具雏形,大数据产业支撑能力日益增强,并以创新驱动、应用引领、开放共享、统筹协调、安全规范作为大数据产业发展原则,把强化大数据技术产品研发、深化工业大数据创新应用、促进行业大数据应用发展、加快大数据产业主体培育、推进大数据标准体系建设、完善大数据产业支撑体系、提升大数据安全保障能力作为重大任务和重大工程。
除了国家政策扶持,地方政府也纷纷出台相关政策加快大数据产业布局,突出产业集群效应。例如贵州省贵阳市先后出台《贵阳大数据战略行动实施方案》、《贵阳市大数据产业发展“十三五”规划》、《贵州省大数据发展应用促进条例》,建立国家发展大数据安全技术和产业的试验场,打造首个国家级大数据产业集聚示范区和大数据安全产业园,培育和壮大战略性新兴产业,全力推动大数据产业的发展,促进经济发展。广东省出台《广东省促进大数据发展行动计划(2016-2020年)》等,旨在打造全国大数据应用先导区和大数据创业创新集聚区,抢占大数据产业发展高地,建立具有国际竞争力的国家大数据综合试验区。
不仅如此,全国各地政府相继成立大数据管理部门,统筹数据管理和应用;北京、上海、深圳等多个省(直辖市)市引导建设了大数据产业联盟,推进大数据产业生态体系的建设;多个省市建立大数据交易平台,促进大数据共享和流通。
近年来大数据企业数量急剧增长,从中国信通院研发的中国大数据人工智能产业分析平台[5]可以看出,北京地区、长三角、珠三角及成渝经济圈是大数据企业热度最高的区域,其中近七成大数据企业注册于北上广深四大城市。大数据渗透各行各业,其中集中在金融、医疗、社交、交通等行业居多。
大数据企业有着十分良好的投融资环境,2012~2016年五年内,大数据领域投融资事件超过1 600件,总金额超1 200亿元,其中以大数据早期企业为主,天使轮及A轮融资比例超70%,B轮和C轮融资企业较少,而少量成熟的大数据企业正经历PE阶段,逐步上市。而这些企业的融资估值普遍很高,平均估算A轮融资估值均值在2亿元左右,B轮融资估值均值5亿元左右,C轮融资估值均值能达到10亿元。通过和其他行业融资情况相对比可以明显看出大数据企业的融资环境很好,投资公司对相关企业发展前景十分看好。各大IT公司也逐步通过并购等方式进行技术整合,同时也有很多大型企业依靠自身研发实力纷纷推出自己的大数据产品。
在大数据企业中,以数据分析、数据应用为主的企业备受关注。如数据分析中的文本分析、日志分析、商业智能都能成为投融资关注焦点;数据应用中的广告营销、运营优化、风险管控等也是投资热点。近年来,大数据金融行业融资火爆,包括量化分析、银行征信、风控管理等都是大数据金融行业中的关注点;随着人工智能技术的发展,大数据驱动的人工智能企业越来越多,融资额度也越来越高,已经成为一个巨大的投资风口。
虽然大数据产业蓬勃发展,但是受限于市场机制、数据共享的价值鸿沟、数据隐私等多种问题,目前大数据产业发展还面临着诸多挑战。
虽然国内多个省市建立了大数据交易中心,但是数据拥有者存在价值认知的鸿沟,很多数据拥有者不放心让自身的数据进行交易和流通,担心泄露个人隐私和企业机密;同时,社会普遍还并未形成数据交易的传统,大数据交易市场需要一个用户培育的阶段。
在大数据交易过程中,现有数据付费模式为先付费、一次性付费、按次付费等,目前大数据企业盈利能力整体偏弱,数据变现存在难度,在这样的付费模式下,大数据企业很难购买大量的数据进行分析和挖掘, 这也是导致数据交易不畅的原因之一。
数据交易过程中数据所属权很难界定,当同样的数据被多次交易时,如何充分保证数据拥有者的利益也是目前大数据交易市场面临的难题和挑战。
数据产生于各行各业中,综合不同行业的数据能促进各行业业务的进一步开展。然后,目前行业大数据流通性较差,行业数据处于分隔状态。
对于部分大型企业,其自身能够实现数据业务闭环,因此公开数据资源的动力不足,导致很多小型企业很难获取其数据资源;其次,不同行业的数据标准不统一,很多行业内的数据格式、质量差异都很大,而数据治理的成本十分昂贵,导致行业数据统一化管理难度加大;另外,不同领域、不同行业数据关联难度很大,在出台数据隐私保护相关政策以后,如何根据行业间的非敏感信息对用户数据进行关联是跨行业数据流通急需解决的难题。
数据共享和隐私保护是数据利用的两个对立面。数据共享是为了充分结合各方面的数据,挖掘数据背后潜在的价值,而在这个过程中势必会涉及分析出用户、企业甚至国家相关的隐私信息,从而导致隐私信息的泄露。因此,各国纷纷制定了数据隐私保护政策法规,我国颁布了《网络安全法》等进行数据隐私保护,上海大数据交易中心颁布的《个人数据保护》、《数据流通禁止清单》,信标委发布的《个人信息去标识化指南》等都强调对于数据隐私的保护。
从企业发展层面而言,企业间的合作必然牵扯到数据合作。如果对数据仅进行脱敏处理,合作企业亦能通过数据的关联性分析出用户敏感信息,从而出现隐私风险;如果企业对数据进行过度处理,共享的数据
存在的有用价值就大大降低,制约企业的深入合作和高速发展。因此,如何在数据共享和隐私保护中进行政策法规的权衡、如何进行关键技术的研发是影响大数据产业发展的重大挑战。
随着数据的积累、关键技术的研发、国家政策的大力支持,大数据产业拥有优越的发展环境,产业生态也逐渐形成。然而,目前大数据产业在数据交易、共享、流通、隐私保护等重要过程中面临难题和挑战,必须积极应对,高度重视,创新大数据关键技术研发,加快推进大数据产业蓬勃发展。
参考文献
[1] 中国工业和信息化部.大数据产业发展规划(2016-2020年)[Z].2016.
[2] 中国电子信息产业发展研究院,《软件和集成电路》杂志社,赛迪顾问股份有限公司.中国大数据产业生态地图[Z].2016.
[3] 国务院.促进大数据发展行动纲要[Z].2015.
[4] 国务院.“十三五”国家信息化规划[Z].2016.
[5] 中国信通院.大数据人工智能产业分析平台[EB/OL].http://www.allindata.cn/.