刘 传
(1 北京易华录信息技术股份有限公司博士后工作站,北京 100043;2 中国财政科学研究院博士后流动站,北京 100042)
数字经济的基础是大数据的发展,2001年Gartner第一次在其研究报告中对“大数据”给出了明确的定义,他认为大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。2011年5月麦肯锡全球研究院在其题为《大数据:下一个创新、竞争和生产力的前沿》报告中将“大数据”定义为一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。2012年奥巴马政府首次颁布《大数据的研究和发展计划》,启动涉及12个联邦政府部门、82项相关研究、耗资2亿美元的发展计划。2012年4月SPLUNK公司经过十年的发展成为第一家依靠大数据处理业务而成功上市的公司。2012年英国建立世界上首个政府数据信息开放研究所;2013年澳大利亚、法国等国家先后将大数据发展确定为国家战略。
而中国的大数据研究也是从2012年开始启动,以阿里、腾讯、百度为首的中国互联网企业及传统运营商企业纷纷开始启动大数据的开发和应用研究。2014年中国首次在政府工作报告中提到“大数据”的概念;2015年初李克强总理提出“互联网+”的政府工作行动计划,旨在推动互联网、云计算、大数据、物联网等产业发展用以带动现今制造业的升级改造。2016年G20杭州峰会上发布《二十国集团数字经济发展与合作倡议》,在该倡议中将数字经济定义为以使用数字化的知识和信息作为关键生产要素、以现代信息网络作为重要载体、以信息通信技术的有效使用作为效率提升和经济结构优化的重要推动力的一系列经济活动。2017年3月5日召开的十二届全国人大五次会议上,国务院总理李克强在做政府工作报告时表示,将促进数字经济加快成长,让企业广泛受益、群众普遍受惠。这是“数字经济”首次被写入政府工作报告,而且政府工作报告中还提出扩大数字家庭、在线教育等信息消费,促进电商、快递进社区、进农村,推动实体店销售和网购融合发展。
数据产业链的形成集合了数据衍生、发展、价值再造的各个环节,按照其价值实现的流程可以分为采集—挖掘—交易—应用—回流等5个阶段,在每一个阶段都包含了硬件和软件的设施与技术开发及信息服务。
在采集阶段,数据收集是整个数字经济发展的基础环节。由于中国大数据产业起步较晚,虽然数据量已达到世界第一但还未形成规模化,现阶段主要数据来源为政府数据、行业数据、企业数据、互联网数据、物联网数据、移动数据、第三方数据等。
在数据挖掘阶段,数据资源就像一个矿藏一样,随着技术水平的不断提高,挖掘与利用的程度也会不断提高。这其中涉及了传感器、智能终端、传输、存储、服务器、网络安全等软硬件设备。在大数据不断扩展的当下,越来越多的硬件产品都开始了智能化创新之路,智能硬件在改变人们生活方式的同时,也在24小时不断采集着诸多数据,他们支撑着数据时代的快速发展,智能硬件+数据采集技术的发展将推动大数据浪潮的不断延伸。
根据Statista的统计和预测,2019年全球的数据量预计达到41ZB①,2020年将达到50.5ZB(见图1)。根据中国国家规划,到2020年中国的数据总量有望达到8.4ZB,届时将占全球数据总量的17%,成为“世界数据中心”[1-2]。
注:图中2018年、2019年、2020年数据量为估算数值,数据来源于中国信息通信研究院图1 全球每年产生数据量估算图
数据安全是数据交易的前提,除了要严格控制数据访问权限以外,还应具备动态加密和审计能力,需要了解数据的流向、使用人和用途等。目前的数据安全主要集中在对数据泄露的防护上,包括对重要数据的分级、识别、标注、跨平台管理等。目前大数据交易的主要模式有交易所模式、电商模式、API模式,数据的价值通过确权、清洗(脱敏)、交易等形式得以体现。
数据通过交易后的再利用是数据价值的重要体现,是数据产业链的下游阶段,也是参与公司最多的阶段,大量为软件应用开发公司,他们即是数据产业链中的数据使用者、特色服务运营者、数据应用软件产品分销商,也是新数据资源的提供者。这一阶段的竞争最为残酷,因为目前很多企业还在进行着简单的数据分析工作,在这一环节谁分析的结果最有效谁就将成为数据智能产业的领跑者。
数据回流是数据进一步发展的新阶段,也是数字经济不同于其他经济体的表现形式,数字经济产业中的数据其自身即是“产品”又是“原材料”。按照北京易华录信息技术股份有限公司提出的“数据湖生态概念”,只有当数据回流产生并源源不断地流回数据交易市场,丰富交易市场中数据的结构与内容,这样才形成了一个完整的封闭式产业链条(见图2)。
数据来源:北京易华录信息技术股份有限公司图2 数据湖生态:天上有云、地上有湖
由图3可知,全球大数据产业市场规模近年来在逐年递增,虽然自2017年以来年增长率在放缓,但市场规模份额屡创新高,在最近短短6年的发展过程中2019年市场规模就已经是2014年的7.74倍,达到了7 278亿美元。
数据来源:贵阳大数据交易所图3 2014—2020年全球大数据产业市场规模及增长率变化
2012年5月,国家工业和信息化部发布了《通信业“十二五”发展规划》,这是中国较早推动云计算和大数据技术发展的政策。2013—2014年,随着政府的积极介入推广以及大数据产业价值的不断扩大,地方政府开始陆续出台关于推进大数据业发展规划,包括2014年北京中关村颁布的《加快培育大数据产业集群推动产业转型升级意见》、贵州省颁布的《关于加快大数据产业发展应用若干政策的意见》、重庆市颁布的《重庆市大数据行动计划》等,截至2018年10月22日,海南、福建、山东、江苏、广东、湖南、辽宁、云南、浙江、吉林、黑龙江、宁夏、山西、安徽、北京、河北、河南、甘肃以及重庆19个省份成立了大数据管理局(见图4)。
图4 2006—2016年中国数据产业发展政策推进汇总
2016—2018年间,国家发改委、环保部、国务院、自然资源部、中国煤炭协会、国家林业和草原局、交通运输部、农业农村部、工业和信息化部、水利部、国家测绘地理信息局、公安部、气象信息化领导小组、民政部、中央网信办、教育部、财政部、中国银保监会、工信部都分别根据自身管理范围及行业特点,制定了有针对性地大数据发展政策,这些政策涉及了产业转型、政府治理、科技攻关、产业扶持和安全保障等社会发展和居民生活的方方面面。
根据贵阳大数据交易所的统计数据来看,中国大数据产业2016年末市场规模达到2 485亿元,随着政策的不断推进和落实,到2020年中国大数据产业规模或将达到1.36万亿元。根据中国信息通信研究院的测算,2017年中国数字经济规模达到27.2万亿元,同比增长20.3%,占GDP 32.9%;数字技术与实体经济不断融合,2017年融合部分规模超过21万亿元,同比增长20.9%;同时,数字经济对就业也有很强的拉动作用,2017年中国数字经济就业人数达1.71亿人,占当年就业总数的22.1%(见图5)。数字经济不仅带动了传统产业的升级,也带来了新增就业,数字经济领域就业人群中72%来自传统产业升级,28%来自新增岗位[3]。
数据来源:中国信息通信研究院图5 中国数字经济总体规模年度变化及其GDP占比
目前中国信息通信研究院对于数字经济的测算,主要是以信息通信产业(信息产业增加值)+数字经济融合(数字技术与其他产业融合应用)两部分的内容进行测算。信息通信产业部分主要包括电子信息设备制造、电子信息设备销售和租赁、电子信息传输服务、计算机服务和软件业、其他信息相关服务,以及由于数字技术的广泛融合渗透所带来的新兴行业;数字经济融合部分主要是核算数字技术对传统产业增加的边际贡献。
根据这一核算方法在数字经济总量方面,2017年排名前十位的省市具体信息如表1所示。
表1 2017年数字经济总量排名前十的省市
中国的数字经济已经有了快速的发展,各省份也都出台了相关的发展政策,数字经济在全国GDP的占比已达30%以上,如北京、上海、广东、天津、浙江等东部地区的占比已经达到40%以上。同时,数据经济的快速发展在当地也取得积极的效益和回报,不仅提供了大量的税收来源,还提供了大量的就业岗位。2012年数字经济新增就业人数为215万人,占当年新增就业的17%;2016年数字经济新增就业人数为467万人,占当年新增就业的35.9%;2017年数字经济新增就业人数为552万人,占当年新增就业的40.9%。
虽然数字经济的发展对带动就业促进地方经济发展做出了重要贡献,但同时我们还要注意因为数字经济所带来的技术性失业风险,“互联网+”、人工智能等数字技术在提高效率的同时也代替了很多基础性工作,造成一线基础工作员工的失业。如深圳雷柏公司用机器人取代了75%的员工;富士康近年来因机器人的投入也减员超过6万人;银行业也纷纷推出无人银行。但值得庆幸的是这一批失业人员很快被数字经济在服务业创立的新岗位所吸纳,并未造成太大影响,同时中国的工业机器人密度此前就远低于韩国、日本、德国、美国等国家,所以未来机器替换人工的空间巨大。
除了技术性失业以外我们还要注意结构性失业发生的可能性。随着互联网交易的不断开展,电子商务巨头不断出现,同时带动了传统零售业的转型。2013—2018年,亿元以上商品交易市场数量逐年减少,现存的传统商品交易市场的成交额年平均增速也不足4%,仅为互联网销售的1/10。据《制造业人才发展规划指南》显示,预计到2025年中国新一代信息技术产业、高档数控机床和机器人等行业人才缺口将分别为950万人和450万人,未来提高人才素质是填补人才缺口以应对结构性失业的主要途径。
虽然各地区都相继出台了针对数据安全的相关法律,但随着交易的不断扩大,数据的衍生也在成几何倍数的增长。目前各数据挖掘、开发、交易企业都有着自己独到的数据标注和加密方式,这些方式需要得到权威机构的检验,对于交易后的使用和流通过程国家也应当介入监管。不同的标准虽然为数据的交易提供了多种选择,但其在一定程度上也阻碍了数据的交互和融通,所以急需尽快出台类似“信息保护法”“数据安全法”“数据基础设施管理办法”“数据交易管理”“数据使用标准”等法律法规,尝试建立数据银行,以银行的职能与监管责任进一步规范数据资产的使用,为数据要素的市场化发展铺平道路。
实体经济数字化转型是数字经济和实体经济融合的主要方向,中国要充分利用已有的网络优势,借助工业、农业、服务业转型需求,大力发展智能融合产业,构建智能化、协同化、网格化数字经济体。逐步实施工业网络创新化发展;开展制造业与互联网融合试点,加快培育新的“双创”平台建设;推动农业智能化集约化发展,以云计算、物联网、大数据、移动互联等先进技术建立智能农业链条体系,提高农业产业附加值,科学指导农业生产,健全“三农”网络服务体系,完善农业一条龙监管建设。
数据银行是未来数字经济发展的高阶产物,它是经营数据“信贷”业务的数字金融新业态。通过大型数据存储基础设施的存储服务能力,采用类银行的经营模式、商业理念和管理方法,在法律和政策合规的前提下,面向政府、企事业单位及个人用户,提供数据确权、数据隐私保护、受托存储、受托数据治理、受托数据交易等服务,加快数据资源富集,促进数据资产流通,加速数据红利释放,助力数字经济发展[4]。
美国虽然在数据商品化的立法上较为谨慎,但其鼓励互助式数据分享[5]。美国政府首任首席信息官在负责Dava.gov建设的过程中,从没有争议的数据入手,快速上线、不断迭代,从具体的立法中可以明显看出,美国通过鼓励互助式数据分享,以实现数据交易有序和双赢的发展。
日本富士通的数据交易市场匿名化处理、杜绝商业秘密和个人隐私传播,其主要特点是对数据进行匿名化处理,杜绝商业秘密和个人隐私的传播,他们将交易中介服务的培育作为主力业务之一[6]。
中国目前大数据交易主要存在的问题在于数据交易监管缺少法规及标准,虽然深圳等地区已经开始着手颁布数据交易相关的标注和监管法律,但要想让数据能够真正地通过交易的流动产生价值,还需要完善对数据确权的立法工作。数据权属界定尚未明确,特别是在经过挖掘和利用后的数据权属的划分问题上不够明确。数据资产价值评估困难,缺乏具有公信力的数据资产评估指标体系。交易技术链条不够完善,目前的交易主要以撮合交易为主,更多的是以政府数据的交易为主要内容。数据交易方式较为粗放,主要以API、数据包等基础原始数据交易为主。数据潜在价值难以发挥,缺少与之相匹配的数据挖掘、开发场景与技术人员。
数据是国家基础性战略资源,也是21世纪的“钻石矿”。根据国务院印发的《促进大数据发展行动纲要》和工信部印发的《大数据产业发展规划(2016—2020年)》相关内容,当前中国正在推进供给侧结构性改革和服务型政府建设,加快实施“互联网+”行动计划和中国制造2025战略,建设公平普惠、便捷高效的民生服务体系,为大数据产业创造了广阔的市场空间,是中国大数据产业发展的强大内生动力[7]。
近年来,伴随着大数据市场份额细分化的不断发展,硬件市场在2015年达到峰值并出现下降,但由于其成本及门槛较高,所占硬件市场的总体份额缺不低。在新技术投入层面,自2014年达到顶峰后出现每年2%~3%的下滑,这表明未来技术迭代更新将成为重点,单纯新领域的技术开发进入瓶颈期。在应用市场方面,2016年交易金额突破了400亿大关,预计2020年增长率将达到40%,这主要依赖于政府采购推动了大数据应用的迅速发展,同时随着应用场景的不断创新,大数据衍生的市场规模已经进入了快速发展阶段,预计2020年这一市场规模将达到2 521亿元。此外,随着大数据存储与交易机构的不断增多,大数据交易市场也在不断成熟,不同机构间的数据交易也会出现,数据服务已经进入发展黄金期。