张欣怡
(安徽财经大学统计与应用数学学院,安徽蚌埠 233030)
随着信息时代的发展,互联网的高度覆盖以及信息技术与人类生产生活关系日益密切,人类活动带来的信息导致全球数据呈现爆发式增长,信息时代进入了新阶段——大数据时代。大数据产业则是在这种背景下,基于各种来源广泛、数量庞大的数据资源而形成的数据存储、价值提炼、智能服务与应用的新兴产业,并且近些年随着物联网、云计算技术和移动互联网的迅速发展,大数据产业的发展已经成为经济增长新的制高点,引起各级政府的高度重视。2014年,大数据首次写入政府工作报告;2015年,国务院印发《促进大数据发展的行动纲要》,成为中国发展大数据产业的战略性指导文件;2016年发布的《中华人民共和国国民经济和社会发展第十三个五年规划纲要》阐释了国家大数据战略,成为各级政府制定大数据发展规划和配套措施时的重要指导。目前总体来看中国的大数据产业面临着前所未有的发展机遇和向好的发展趋势,与大数据产业相关的企业数量也在逐年递增,除少数能够自己生产数据并将其作为企业发展驱动力的大数据“巨头”企业,这些企业多为大数据第三方服务公司,他们专业针对大数据抓取、处理、分析、挖掘,可以通过将网络上和现实中散乱分布的信息集中起来,通过强大的处理功能,准确挖掘出所需数据并提炼其深层价值为需求者提供服务。经营能力评价可以判断这些企业的经营效益和未来发展的支撑能力,分析大数据相关企业的经营能力创造的经济效益的有效程度,可以为不同经营能力的比较、论证和寻求提高的途径提供依据。
查阅现有文献发现,目前对大数据产业的学术研究主要分为三类:第一类是在大数据层面上的研究,一些学者用理论论证了大数据当下的应用价值、技术壁垒并构想了大数据在各个部门和产业的应用手段[1-2];第二类是直接基于大数据产业的研究,一些学者以发达国家对比,从政策、技术、人才、法律和产业结构等角度用理论论证对大数据产业的现状进行了分析与评价[3-5];第三类则是大数据产业绩效与效率实证研究,这类研究较为少见,根据目前搜集到的文献,韩先锋等[6]首次运用DEA方法对中国大数据产业上市公司的技术效率及分解指标变动趋势进行了测度和分析;张铁山等[7]使用因子分析方法研究了大数据产业公司经营绩效与研发投入的关系;茶洪旺等[8]则从创新能力的层面对大数据产业上市公司再次进行了DEA技术效率评价。归纳以上文献,发现现有的大数据产业研究多集中于理论上的对于大数据产业结构化、规范化的论证,缺乏定量化的实证分析,而仅有的实证研究也多是对大数据产业创新能力方面的探讨,缺少基于经营能力评价指标体系的大数据产业发展现状评价,另外,大数据企业由于数据处理技术和提供的数据服务侧重点不同,可以划分在不同的大数据产业链层级,而以上研究多侧重于地区差异的探讨,缺少对产业链层级的分析。有鉴于此,本文将运用因子分析法,根据大数据产业相关的43个上市企业2017年度的17个指标数据对企业进行经营能力评价,并且基于产业结构对样本大数据企业进行层级划分,得出研究结果并给出相应的发展建议。
企业经营能力是一个系统反映企业运营现状和健康可持续发展潜力的概念,包括企业的偿债能力、盈利能力、营运能力、发展能力、现金流能力和技术支持能力6个方面,根据这6个方面,选取17个指标,构造经营能力评价指标体系,见表1。
表1 经营能力评价指标体系
依据数据处理流程,大数据产业一般划分为以下层级[8]:
(1)数据组织与管理层,是利用云储存、分布式文件系统以及各种数据库对收集到的数据进行组织与管理的大数据产业经营层级。
(2)数据分析与发现层,是对数据使用多种分析手段以获取大数据潜在信息并为其他经营单位提供分析工具、分析技术、分析服务和数据可视化服务的经营层级。
(3)数据应用与服务层,是利用大数据来赋予模型价值,并利用获取的模型对现实问题进行预测或指导,包括机器学习、人工智能、空间信息流等技术手段,从而基于大数据开发应用、维护应用运营或对基础应用二次开发的经营层级。
(4)全产业链,在大数据产业链中,有一部分企业的业务和能力覆盖了整个大数据产业链,这些企业包括传统的IT厂商和大型互联网企业,将其定义为全产业链企业。
基于以上分类,本文选取了比较有影响力的43家开展大数据业务的上市公司2017年度经营数据,数据来源为Wind数据库,这43家企业的信息及分类如表2所示。
表2 中国大数据产业链层级划分与代表企业
本文所选指标均为比率指标,因此不存在企业规模造成的差距问题,但指标中存在正指标(x4~x15)和适度指标(x1~ x3),通过公式-|X-K|将适度指标正向化,其中X是该适度指标变量的值,K是适度值,根据经验,x1、x2、x3的适度值分别为 200%、100%、50%。然后使用R软件对处理后的数据进行因子分析,主成分的提取使用的是主成分法,旋转方法使用的是最大方差法。
因子分析要求变量之间存在较强的相关关系,对各个指标变量进行相关分析,得出相关系数矩阵,由该矩阵观察得到大部分变量间的相关系数都大于0.5,比较适合做因子分析。另外,各指标数据间的KMO检验值为0.703>0.7,因子分析效果较好;Bartlett球形度检验值为973.180,相应的sig.值为0,小于给定的显著性水平0.05,因此可以拒绝原假设,认为各指标变量适合做因子分析。
根据企业经营能力属性的个数选择提取6个主成分因子,提取后的6个主成分因子的方差累积贡献率为88.56%(见表4),大于85%,说明这6个主成分因子构成的模型对本文所选企业经营能力的评价能够达到88.56%的解释度,符合因子分析要求。
表3 KMO和Bartlett的检验
表4 使用最大方差法旋转前后的因子贡献
表5 旋转成分矩阵
由表5的旋转成分矩阵的成分构成观察可得,第一个因子F1的主要构成指标为现金流量比率、债务保障率和营业收入现金比率,对应现金流能力F1;第二个因子F2的主要构成指标为净利润增长率和主营业务,认为是发展能力因子F2;同理F3、F4、F5、F6、根据各自的主要构成指标,分别对应营运能力因子、偿债能力因子、盈利能力因子、技术支持能力因子。
再结合表4观察每个因子对样本的方差贡献率,得到根据每个因子的方差贡献率数值对6个因子由大到小的排序如下:现金流能力因子、盈利能力因子、偿债能力因子、营运能力因子、发展能力因子、技术支持能力因子,此排序代表了每个能力在企业经营能力评价中的重要性,这一结论基本符合现代企业经营理论,可以用于企业经营能力评价。
在对每个企业各个因子的得分进行分析时,以0为分界点,认为企业的因子高于0且得分越高代表该企业在此项因子代表的能力表现越好,反之则认为表现较差,接下来将基于单个因子得分对每个产业链层级的企业进行各项经营能力的评价。
图1 基于产业链层级差异的现金流能力因子与发展能力因子得分散点图
如图1所示,观察这43家企业各个因子得分的散点图,首先,在现金流能力方面大部分企业的得分都大于0,表示它们的现金流能力能够维持企业正常运转,组织与管理层和应用与服务层的企业现金流能力大于0的公司占比最高,且组织管理层的一家公司得分为2.19,远超其他企业,可以认为这两个层级的企业在现金流运转方面较好。
其次,在发展能力方面,4个层级得分大于0的公司均不多,应用与服务层的企业表现相对突出,有1家企业得分为5.38,得分大于0的企业也相对较多。
图2 基于产业链层级差异的营运能力因子与偿债能力因子得分散点图
如图2所示,在营运能力方面大部分企业得分小于0,在发展能力与现金流能力方面得分不高的分析与发现层营运能力大于0的企业反而最多,其中还包括了一家营运能力得分为3.59的企业,可以认为分析与发现层企业在营运能力这一项表现最好。
在偿债能力方面,观察到得分大于0的企业较多,其中大部分是应用与服务层的企业,其他三个层级的企业在偿债能力因子F4得分上均呈现“对半分”的情况。
图3 基于产业链层级差异的盈利能力因子与技术支持能力因子得分散点图
如图3所示,在盈利能力方面,大部分企业的盈利能力得分都大于0,在盈利能力方面表现较好的是分析与发现层的企业,盈利能力得分大部分都大于0并且其中几家企业此项得分较高;表现较差的是全产业链层级的企业,仅有1家企业的得分大于0,其余的几家均小于0。
在技术支持能力方面,观察到除了分析与发现层的企业之外,各个层级表现较好的企业相对于该层级企业个数都较少,另外,在此项能力评价中有2家企业在此项得分远远领先于其他企业,它们分别来自应用与服务层和组织与管理层,说明这两家企业对技术的投入力度较大。
根据每个主成分因子的贡献率加权计算43家企业的综合得分,并根据产业链层次划分对各企业综合得分进行排序,结果见表6。
由表6可得,从总体上看,在选取的43家大数据上市企业中,经营能力综合得分大于0的企业有23家,占企业总数的58.13%,综合经营能力小于0的企业有18家,占总数的41.87%,我国大数据产业相关企业整体经营能力一般。
从不同产业链上看,分析与发现层的平均企业得分排在第一,而后全产业链企业、应用与服务层企业和组织与管理层企业排名依次下降。一方面分析与发现层的企业综合得分方差最小,离散程度最小,企业发展最平衡;另一方面,应用与服务层的企业综合得分方差远大于其他产业链的企业,离散程度最大,企业发展程度最不平衡,经过观察,发现应用与服务层内存在一家综合得分为-2.412 7的企业“数据堂”,使得该层级的企业综合得分离散程度变大。
表6 基于产业链层级差异的因子综合得分与排名
通过对选取的43家大数据产业的17个经营指标划分为6个方面的经营能力的因子分析,得到了以这些企业为代表的我国大数据产业经营能力的相关结论。
(1)纵观我国大数据产业相关企业的综合经营能力,数据分析与发现层的企业综合经营能力最好,企业之间发展最平衡;其次是全产业链的企业,企业综合经营能力较好,企业间发展水平较平衡;第三则是数据应用与服务层,企业间的综合经营能力有优有劣,发展非常不平衡;最后则是数据组织与管理层的企业,这些企业的综合经营能力都比较一般。
(2)在经营能力的不同方面,每个层级的企业有着不同表现。首先,数据组织与管理层的企业现金流能力最好,部分技术支持能力较强,然而其他方面表现均不理想,这意味着该层级的发展中经济支撑能力强,经济投入力度也比较大,但收效甚微,资本市场效率和技术效率并不高,这可能与我国数据开放度低、数据壁垒严重、数据安全法律和市场规范不完善存在很大关系。其次,数据分析与发现层在因子得分中整体呈现的经营特点是盈利能力良好,其他方面表现一般;值得注意的是,在大数据产业整体水平低下的营运能力方面,数据分析与发现层的企业仍然保持稳定良好水平,这说明该层级的大部分企业经营能力各方面发展均衡,从而在综合能力的评价中能够获得最优。这一现象表现了社会对数据中潜在信息的需求之大,使得数据分析发现层的企业得以在现金流能力一般的情况下获得较高的盈利水平。再次,数据应用与服务层的企业整体上与数据组织与管理层的企业类似,现金流能力和偿债能力较强,部分企业技术投入力度很大,然而其他能力一般。数据应用与服务层是基于大数据进行应用开发和运营,主要靠技术推动,这种经营情况能够反映出资本市场效率和技术效率的低下,以至于无法较好推动企业良好盈利和运营。最后,全产业链的企业有两家企业浪潮信息和阿里巴巴表现较为突出,在现金流能力、偿债能力、营运能力、发展能力、技术支持能力等方面均表现优异,其余的企业在各项能力上表现一般,但整体上发展比较平稳。
(1)完善大数据产业发展保障机制。一方面要加快大数据相关法律的立法进程,结合我国大数据应用需求,推进全国和地方大数据法律和市场规范的完善,对数据的采集、共享、安全等方面建立相应的规章制度并纳入法律范畴;另一方面,在大数据重点发展地区成立大数据产业发展领导部门,负责开展各地区大数据产业发展规划、扶持大数据产业企业和建设大数据综合实验基地等工作。
(2)加大核心技术自主研发财政投入力度。设立大数据领域的关键技术研发专项资金,提高核心技术的自主研发创新效率,支持突破一批关键核心技术研发创新与应用,打造属于我国的具有核心技术自主权的大数据产业链,形成自主可控的大数据技术架构,从而突破制约产业发展的瓶颈。
(3)鼓励大数据技术应用与推广。完善政府部门、事业单位采购大数据服务的配套政策,鼓励社会各界部门、经营企业采购大数据技术,推广大数据技术和服务在各个产业中的应用,让大数据共享理念引导产业更好发展。
(4)加强大数据专项人才培养。各地政府要主动引领,以当地大数据领域研发项目及产业化项目做载体的基础上实施大数据相关人才的吸引,并且联合高校与科研院所,大力培养一批懂数据采集、懂数学算法、懂数学软件、懂数据分析、懂预测分析、懂市场应用的复合型“数据科学家”队伍。