李成刚
(贵州财经大学,贵州 贵阳 550025)
大数据发展是一个地区发展扩大大数据规模、提升大数据应用效益、激发大数据企业潜在实力的能力,即地区大数据发展的成长能力。[1]目前许多国家地区将大数据的发展上升到战略层面。2011年,麦肯锡全球研究院发布研究报告,将大数据认定为“第四次产业革命”,与蒸汽机的发明、电力的使用和互联网的发明相提并论。报告系统描绘了大数据在商业中的应用,并将大数据定义为一种新的生产力;2013年大数据列入我国科技部“973”基础研究计划;2014年“大数据”首次出现于我国《政府工作报告》,之后,我国将大数据定义为基础性战略资源,将在预防、调查、审批及决策中发挥重要作用;2017年中共十九大报告进一步指出,随着信息技术和人类生产生活交汇融合,全球数据呈现爆发增长、海量集聚的特点,对经济发展、社会治理和人民生活都产生了重大影响。
鉴于大数据的快速发展和巨大作用,我国设立了八大大数据综合实验区,包括贵州省、京津冀、珠江三角洲、上海市、河南省、重庆市、沈阳市、内蒙古自治区。八大实验区中比较有代表性的是贵州大数据实验区、京津冀大数据实验区与珠江三角洲大数据实验区。这三大实验区代表了不同经济水平、地理位置、产业结构下大数据发展对实体经济不同的促进作用。其中,京津冀大数据实验区依托北京大量的大数据人才储备与互联网科技公司,大数据技术在全国处于领先地位,并向外辐射至天津与河北等他,实现京津冀协同发展,最终促进实体经济发展。珠江三角洲大数据实验区地处沿海地区,科技型公司与经济发展均位于全国前列,外资企业数量较多,便于引进国外大数据先进技术,拥有较好的大数据发展条件。贵州大数据实验区则有别于其它实验区,利用自身气候、电力、人才培养、制度建设等独特的优势,成为国家的大数据储存基地,不断完善大数据硬件设施建设,积极引进相关人才,运用大数据助推实体经济发展,实体经济增速近几年居全国前列。
随着我国对大数据的重视程度不断提高,学者们深入探讨了大数据的作用及其对经济发展的影响。大数据将会经历软件开发、科学研究、商业应用、国家战略、社会生活等五个动态发展阶段,因此,随着网路技术的完善发展,大数据将会是未来社会经济发展中的新动力,必须挖掘其蕴藏的巨大潜在价值。[2]Gokalp等指出网络信息技术的发展使得存储和处理大量数据成为可能,完善和应用大数据技术是未来工业的发展方向,有效应用大数据工具对企业发展至关重要。[3]胡海波和涂舟扬指出大数据将会有效提升传统企业的生产能力。[4]Akter和Wamba指出大数据对市场划分、创新决策、商业模式开发起到促进作用。[5]大数据的应用使得资源在实体经济中的配比更加有效。通过获取数据资源,为实体经济改革创新提供方向,针对客户需求做出个性化服务。大数据技术的应用可以有效提升实体经济企业的管理效率,促进企业的发展。但是,近几年的《中国大数据发展水平评估报告》(1)《中国大数据发展水平评估报告》是由工业和信息化部针对我国大数据发展水平做出的权威调查报告。显示,我国大数据发展不均衡,仍处于起步阶段。对大数据发展的度量以及对实体经济的影响研究还不够全面,如何提升大数据发展并将其作用于实体经济生产中受到学术界的重视与关注。
因此,本文将建立大数据发展指标体系,利用主成分分析对各省(市、区)大数据发展水平进行评价,构建面板数据模型,实证分析大数据发展助推实体经济的提升效果。本文的贡献体现在以下方面:(1)建立了大数据评价指标体系,利用主成分分析评价了各省(市、区)大数据发展水平;(2)将大数据作为新的生产要素引入Cobb-Douglas生产函数,对Cobb-Douglas生产函数进行修正,并构建面板数据模型实证研究大数据发展对实体经济的影响作用;(3)将全国各省(市、区)按大数据发展水平进行分组,探寻大数据发展的不同阶段对实体经济的促进作用。
近年来,国内外学者对大数据发展水平的研究越来越重视,并不断深入采用更加合理的方法评价大数据发展水平。国外Berner等通过对比大数据企业与传统企业在创新决策、商业模式变革、产品市场占有率以及客户满意度等方面的不同,研究了大数据信息如何从数据转换成价值的作用机理。他们采用公司专利数量、公司成本利润率、公司市场占有率以及公司客户满意度等指标测评了大数据的作用机理,结果发现数据信息所带来的价值主要表现为信息可以为企业变革、系统整合优化提供改革方向,这种变革能提升企业管理效率以及产品销售效率。[6]Yoo等从产业规模、市场需求和技术创新等方面引入 9 个指标,评估大数据发展水平与成长阶段。[7]Abawajy提出大数据的传输需要超宽带的支持,网络基础设施是大数据发展的一个制约因素。[8]国内学者费方域和闫自信提出大数据是一种规模在获取、储存、管理、分析等方面都大大超出了传统数据库软件工具能力范围的数据集合,具有海量数据规模、快速数据流转、多样数据类型和价值密度低等特征;大数据属于数字经济范畴,作为一种技术经济范式,与互联网发展息息相关;大数据的发展将紧紧依托于互联网的普及与信息技术的发展。[9]沈俊鑫等通过构建信息基础设施占GDP的比重、信息资源开发利用指数、信息产业规模水平与信息化发展等指标,刻画了大数据发展。[10]国家信息化办公室参考俄罗斯与韩国的网络信息评价体系,对我国网络信息化发展做出评价。[11]俄罗斯联邦政府在2002年构建了网络信息指数评价体系,一级指标分别为信息通信技术、技术应用、业务环境、人力资源、政府支持等;韩国政府则从韩国计算机软件技术、互联网发展、广播、通信 4 个分类以及 7 个互联网用户数的详细指标构建了信息化指数评价模型。我国2015年发布的《中国信息化发展水平评估报告》(2)《中国信息化发展水平评估报告》是由中国电子信息产业发展研究院对中国信息化产业发展情况做出的权威统计与分析。利用发展基础能力、网络就绪度指数、信息通信技术应用指数与应用效益指数等指标衡量了信息化发展水平,其中政府信息公开率指标采用地区政府网站公开信息总条数表示。
大数据发展如何有效提升实体经济受到国内外学者广泛关注。国外学者Cavanillas等指出,整合大数据信息可以有效配置现有资源,为市场创新提供动力与方向。[12]Baban认为,随着网络信息技术的发展,大数据逐步走向成熟,将给实体经济带来新的机遇和挑战;大数据发展使市场透明度更高,加速企业创新发展。[13]Gokalp提出,大数据发展是网络技术、信息技术、存储技术发展的产物,工业企业将大数据技术应用于管理和生产中是工业企业发展的必然趋势。[3]国内学者杨汝岱提出,在新经济时代,传统经济增长理论的很多元素被赋予了新的含义,有必要对其进行修正,例如数据已经成为了生产要素,可以引入到传统经济增长理论中。[14]丁文联也指出,目前是数字经济时代,是一个以数据为核心竞争力、资源共享的时代,数据资源的获取与利用成为这个时代极为重要的一种资源配置。[15]黄丽秋和王媛玉指出,基于大数据技术的供给侧精准化管理模式在一定程度上解决市场信息不对称问题,促进产品的大规模定制生产、引导产业结构和社会治理的转型升级,推动社会进步与经济可持续发展。[16]王如玉提出,新一代的信息技术会促进新一轮的产业变革,变更资源空间配置的新方式,为中国制造业转型升级提供新路径,大数据技术将在新一代信息技术发展中得到进一步提升。因此,大数据发展与投入将促进大数据在实体经济中的应用,提升实体经济的发展。[17]
国内外学者的研究表明,大数据是网络技术、信息技术发展的产物,大数据技术发展使得数据本身成为了新的生产要素,促进实体经济发展。学者们从大数据对实体经济的作用机理、作用方式以及作用条件进行了大量的研究,但是对大数据发展水平的全面评价、大数据作为生产要素对实体经济发展的提升效果、大数据发展对实体经济影响的地区异质性等方面的研究还较为缺乏。鉴于此,本文将基于学者们的研究成果以及相关政府机构的已有评价体系,构建更完善的大数据发展评价指标体系,包括网络就绪度、信息通信技术应用指数、大数据效益指数与大数据关注度等,客观评价我国大数据发展水平,按照大数据发展水平对各省(市、区)进行分组检验。在此基础上,构建面板数据模型,实证分析大数据发展助推实体经济提升的效果,检验大数据发展对各省(市、区)实体经济影响的异质性。
本文将大数据发展作为新的生产要素引入实体经济的生产过程,基于Cobb-Douglas生产函数,研究大数据发展对实体经济的影响。
美国学者Cobb和Douglas[18]在讨论投入和产出的关系时,提出了Cobb-Douglas生产函数,如下所示:
Q=ALαKβ
(1)
其中,Q为生产水平,A为技术水平,一般为常数,L为劳动力,K为资本,α和β为劳动力和资本的弹性系数。
如前所述,本文将大数据发展作为一种新的生产要素投入实体经济生产活动,劳动力与资本为全社会对实体经济投入的劳动力与资本。因此,本文修正的Cobb-Douglas生产函数形式如下:
QR=ALβ1Kβ2Dβ3
(2)
其中,QR表示实体经济生产水平,K为对实体经济的投资,L为人力资本投入,D为大数据发展,β1、β2和β3分别表示以上三种投入要素的边际贡献率。如果β1+β2+β3>1,表示规模报酬递增;如果β1+β2+β3=1,表示规模报酬不变;如果β1+β2+β3<1,意味着规模报酬递减。
基于模型(2),对模型(2)两边分别取对数,得到如下模型:
lnQR=lnA+β1lnL+β2lnK+β3lnD
(3)
基于模型(3),本文可以建立如下的面板数据模型,用于研究大数据发展对实体经济的影响:
lnQRit=αit+β1lnLit+β2lnkit+β3lnDit+εit
(4)
其中,αit为常数项,β1、β2和β3为待估计系数,εit表示随机误差项。
1.数据来源及处理
本文选取的2013-2018年全国30个省(市、区)的大数据发展评价指标数据、实体经济发展数据、资本投入数据和人力资本投入数据均来源于2014-2018年各省(市、区)的统计年鉴、中经网统计数据和国家统计局网站。其中,大数据发展评价指标中的大数据关注度以各省(市、区)名称加大数据作为关键词在百度新闻与百度网页中进行索引,利用网络爬虫技术将2013-2018年所有有关该地区大数据发展的新闻标题和大数据事件标题进行爬取,按年份将新闻与事件数量整理计数作为该地区的大数据关注度。
2.指标选取
本文各指标选取如下:
(1)实体经济发展(QR)为被解释变量。刘雅娇和胡静波[19]、肖功为[20]等学者采用各地区GDP总量减去金融业和房地产业产值表示实体经济的发展。因此,本文借鉴他们的研究方法,选取全国30个省、直辖市及自治区GDP总量减去各地区金融业与房地产业产值表示各地区实体经济发展。
(2)大数据发展(D)为解释变量。由前文的研究可知,大数据发展将成为一种新的生产要素作用于实体经济生产中。基于Berner[6]、Yoo[7]、Abawajy[8]、费方域和闫自信[9]等学者的方法,本文选取网络就绪度、信息通信技术应用指数、大数据应用效益指数与大数据关注度等指标刻画大数据发展。其中,网络就绪度、信息通信技术应用指数、大数据应用效益指数由主成分分析计算得到,大数据关注度指标,通过网络爬虫技术获取大数据新闻数与事件数,相加计算总数作为关注度。大数据发展评价指标体系如表1所示。
(3)实体经济的投资(K)为控制变量。借鉴肖功为[20]、温涛和刘渊博[21]的研究方法,本文采取全社会固定资产投资总额衡量各省、直辖市及自治区实体经济投资情况。
(4)实体经济的人力资本投入(L)为控制变量。人力资本的积累和投入是实体经济生产中的一个关键影响因素。本文采用学者马亚明、[22]王维国[23]的研究方法,采用全社会就业人口表示实体经济人力资本的投入。
表1 大数据发展评价指标体系
本文将利用SPSS软件对大数据发展各指标进行主成分分析,计算得到衡量大数据发展水平的评价指标。
首先,进行KMO检验和Bartlett球状检验。主成分分析的KMO检验值均大于0.6,Bartlett球状检验Sig值均小于0.05。检验结果表明,数据指标相关性较强,适合进行主成分分析。在数据通过检验后,利用SPSS软件进行主成分分析,分析得到相关系数矩阵、共同度、方差、特征值与主成分载荷矩阵。利用各自主成分载荷向量除以各自主成分特征值的算术平方根得到主成分系数。根据相关数据,得到大数据发展水平指数如下:
D=0.649Y1+0.633Y2+0.101Y3+0.410Y4
(4)
其中,D表示大数据发展水平指数,Y1表示网络就绪度,Y2表示信息通信技术应用指数,Y3表示大数据应用效益指数,Y4表示大数据关注度。根据式(4)计算各省(市、区)大数据发展的主成分得分,得到各地区大数据发展指数。各地区大数据发展能力评价结果如表2所示。由表2可知,广东、江苏、浙江、北京、山东、上海的大数据发展水平一直保持在我国前列,而甘肃、海南、宁夏、青海的大数据发展水平则一直位于后几位;从大数据发展得分来看,发展较好的地区得分要远高于发展较弱的地区,说明我国大数据发展水平两级分化严重;四川、河南、贵州、重庆、内蒙古等地区大数据发展水平排名有较为明显的上升,其中,贵州省更是从2013年0.4211分提升至2018年2.7882分,排名从第25位跃升至14位,可以看出由于贵州省对大数据的投入以及大数据发展战略的实施,大数据发展取得了较为显著的成果。
表2 大数据发展评价得分与排名
为更好地反映不同区域大数据发展的差异,本文根据计算所得的大数据发展指数,将各省(市、区)划分为3组,分组结果如表3所示。由表3可知,第一组为大数据发展最快的地区,包括北京、上海、江苏、浙江、山东、广东、福建、四川八个省(市、区),代表我国大数据发展最高水平;第二组为大数据发展较快的地区,包括河北、天津、河南、辽宁、湖北、重庆、湖南、贵州、陕西,这些地区的大数据发展潜力巨大,其中河北、天津、河南、辽宁、重庆、贵州都位于国家大数据综合实验区,其大数据发展水平提升很快;第三组为大数据发展较慢的地区,包括山西、内蒙古、吉林、黑龙江、安徽、江西、广西、海南、云南、甘肃、青海、宁夏、新疆,这些地区的大数据发展水平还有待提升。
表3 大数据发展分组结果
各省、直辖市及自治区的实体经济发展水平描述性统计结果如表4所示。由表4可知,我国实体经济发展平最高的几个地区分别为江苏、广东和山东,均值分别为75135.25亿元、78489.18亿元、65797.92亿元。而较为落后的几个地区分别为青海、宁夏、海南,均值分别为2484.16亿元、3093.12亿元、3954.80亿元。实体经济发展水平变动率(标准差)变动最大的地区是广东,为12159.63;变动能最小的是青海,为238.44。
表4 实体经济发展水平描述性统计结果
为避免“伪回归”现象,需要对数据进行面板单位根检验。检验方法包括LLC检验、IPS检验等。[24]面板单位根检验结果如表5所示。检验结果显示,原时间序列是非平稳序列;一阶差分时间序列是平稳序列。
表5 面板数据单位根检验结果
为分析实体经济发展与大数据发展、实体经济投资、实体经济人力资本投入是否具有长期稳定的均衡关系,进一步进行面板协整检验,检验结果如表6所示。由表6可以看出,KAO检验的P值为0.0839,小于0.1;Pedroni检验P值小于0.05。在1%的显著水平下,拒绝没有协整关系原假设,LNQR与LND、LNK、LNL之间存在协整关系。因此,实体经济发展与大数据发展、实体经济投资、实体经济人力资本投入具有长期稳定的均衡关系。
表6 KAO检验与Pedroni检验结果
面板数据模型一般分为三类,分别为混合估计模型、固定效益模型和随机效应模型。针对不同的面板数据类型,选取不同形式的模型进行处理。[25]在面板数据模型的形式选择方法上,首先采取F检验确定选用混合估计模型还是固定效应模型,然后在固定效应模型下利用Hausman检验,进一步确定随机效应模型与固定效应模型的选取。因此,采用混合估计模型与固定效应模型对样本面板数据进行回归。面板数据模型类别判断检验结果如表7所示。根据表7可知,F检验的F统计量为26.59,P值为0.00,小于0.05,拒绝模型为混合模型的原假设;Hausman检验的统计量为44.34,P值小于0.05,拒绝模型为随机效应模型的原假设。因此,本文的样本数据更适合固定效应模型。
表7 面板数据模型类别判断
1.整体回归结果分析
本文利用固定效应模型实证研究大数据发展助推实体经济提升的效果。实证结果如表8所示。由表8可知,Adjusted R-squared 检验值为0.958,F统计量检验结果显著,说明模型拟合效果较好。在5%的显著性水平下,大数据发展对实体经济呈显著的正向影响,影响系数为0.106,说明大数据发展水平提升1%,将助推实体经济将提升0.106%。原因在于,大数据发展可以使实体经济企业资源配置效率提升、管理成本下降、创新能力增强,将直接或间接促进实体经济的发展,这与实证结果相吻合,大数据发展将有效促进实体经济的发展。
在资本对实体经济的影响中,在5%的显著性水平下,资本投入每增长1%,实体经济将增长0.1782%,可以看出资本对实体经济的发展具有显著的正向影响。这说明资本投入在实体经济发展中具有重要作用,保证资本的投入,将维持实体经济健康稳定发展。
在人力资本投入对实体经济的影响中,在5%的显著性水平下,人力资本投入每增长1%,实体经济将增长0.760%,可以看出相较于大数据发展和资本投入对实体经济的发展影响,人力资本投入的系数最大,说明人力资本的投入对实体经济增长的影响最大。因此,在发展大数据产业时,也要保证对人力资本的投入。
表8 整体回归结果
2.分地区回归结果分析
按大数据发展水平分组后对各地区的数据进行面板回归分析。回归结果如表9所示。从表9可以看出,在大数据发展较快的地区,大数据发展对实体经济的影响系数达到0.208;在大数据发展最快与较慢的地区,大数据发展对实体经济的影响系数分别为0.188与0.081。这表明在大数据发展较快地区与其它两个地区相比,大数据发展对实体经济提升的影响最大,这些地区对大数据发展较为重视,其代表省份就是贵州。国家在贵州省设立大数据实验区,贵州省也积极推进大数据产业发展与实体经济的深度融合,大数据发展有效助推了实体经济的提升。
实体经济投资对实体经济发展的影响随着大数据发展水平的提升而增大,呈现递增趋势,影响系数从0.164增加到0.171,再增加到0.339。这说明随着大数据发展水平的提升,实体经济的投资对实体经济生产的影响越来越大。其原因可能是大数据发展水平的提升使得资源配置更加合理,资本可以更有效率地应用于实体经济投资中,从而资本投入对实体经济的影响随着大数据发展水平的提升而增加。
人力资本的投入对实体经济发展水平的影响随着大数据发展水平的提升呈现影响系数先下降后上升的趋势,在大数据发展水平较低的地区,影响系数最大,为0.798;在大数据发展水平高的地区次之,为0.502;在大数据发展较高地区,系数最低,为0.391。大数据发展水平的提升可以看做生产函数中的技术要素,技术水平的提升使得资本要素投入更有效率,从而减少了人力资本的作用,当大数据发展水平达到一定阶段以后,若大数据发展水平不能取得新的突破,人力资本对实体经济发展的影响会逐步上升。
总体来看,在大数据发展水平高与较高地区大数据发展对实体经济的影响系数要明显高于大数据发展水平较低地区,说明大数据发展能够促进实体经济的提升,因此需要继续推动大数据发展。
表9 分地区回归结果
本文建立大数据发展评价指标体系,利用主成分分析评价我国各省(市、区)的大数据发展水平,构建面板数据模型,采用2013-2018年我国30个省(市、区)的样本数据,实证研究各地区大数据发展助推实体经济提升的效果,得到以下结论:
第一,大数据发展不平衡,两级分化严重。从我国大数据发展水平评价结果来看,部分地区,如广东、江苏、北京等地区的大数据发展水平指数高,说明这些地区大数据发展快。而我国还存在一部分地区,如青海、宁夏、海南等地的大数据发展水平指数偏低。造成这一结果的原因可以概括为大数据发展较弱地区普遍受到经济水平、地理条件、政策环境的影响,导致大数据发展水平较为滞后,严重影响当地的实体经济企业对大数据技术的应用。
第二,大数据发展、资本和人力资本投入有效促进实体经济水平提升。从面板数据实证结果可以看出,大数据发展对实体经济的提升具有显著的正向影响,大数据发展有效地促进实体经济生产的进步。资本与人力资本投入对实体经济也存在显著的正向影响,且人力资本投入对实体经济的影响最强。
第三,大数据发展水平的差异对实体经济影响不同。分地区实证结果发现,在大数据发展水平高与较高的地区,大数据发展对实体经济的促进作用较大,而且明显高于大数据发展水平较低的地区。大数据发展水平较高地区,近两年大数据发展水平提升很快,得益于国家大数据实验区的设立与当地政府政策的支持,大数据发展对实体经济提升的影响系数最大,说明大数据发展有效促进了当地实体经济的提升。
根据以上实证结果,本文提出以下政策建议:
第一,对于大数据发展快的地区,不断寻求技术突破,向外辐射大数据资源。第一,积极引入国外先进技术。这类地区因自身经济条件与地理位置,有更多机会与国外先进大数据科技企业进行投资合作交流,积极引入相关大数据技术,进一步为大数据与实体经济深度融合提供保障。第二,积极进行技术创新。发挥人才储备优势与技术优势,探寻大数据产业与实体经济发展在更多领域的结合,探寻技术上的突破,使大数据技术更好地服务于各个领域。第三,合理调配发展资源。大数据发展快的地区应适时地将部分大数据资源调配到大数据发展较慢的地区,形成经济协同创新发展,将提升大数据发展较慢地区大数据发展水平,提高发展较快地区的大数据资源利用效率,减少我国大数据发展水平的两级分化,使大数据更有效地服务实体经济。
第二,对于大数据发展较快的地区,结合本地区大数据发展优势,探索大数据和实体经济深度融合新途径。第一,推动大数据与实体经济深度融合。通过搭建大数据服务平台、完善电子生产系统、建设云平台等一系列举措,推动实体经济的标准化统计、智慧化生产、数字化管理。将大数据发展技术融入到实体经济生产、经营、销售等领域,使大数据发展有效提升资本的投资效率与人力资本的生产效率,促进当地实体经济的发展。第二,发挥自身地域优势,探索大数据发展新路径。例如贵州省利用自身环境气候的优势,成为全国大数据的储存中心,不断完善相关设施建设,尝试大数据推进实体经济发展的新路径与新模式,使得经济增速连续数年位列全国前列。第三,总结发展经验。积极推进大数据产业与实体经济的深度融合并总结发展中的问题,不断探索解决方法和发展经验。
第三,对于大数据发展较慢的地区,完善大数据发展实施条件,积极引进发展资源。第一,完善自身大数据硬件设施。大数据发展依托于通信技术、信息技术的发展,硬件设施的完善是大数据技术发展的基础。第二,积极引进大数据发展人才。大数据人才是是大数据发展的重要生产力,政府要制定优惠的人才政策,积极引进大数据发展人才,促进大数据技术的广泛应用。第四,争取设立大数据发展实验区。我国成立大数据实验区的地区,大数据发展水平提升较为明显,有效促进了当地实体经济的发展。总结当地发展优势,争取政策支持,设立大数据发展实验区,推进当地大数据发展与实体经济发展。