孙玉东,喻喜沩,喻紫陌
(1.贵州民族大学 政治与经济管理学院,贵州 贵阳 550025; 2.贵州民族大学 数据科学与信息工程学院,贵州 贵阳 550025; 3.湖南大学 经济与贸易学院,湖南 长沙 410079)
推动经济高质量发展是解决新发展阶段社会主要矛盾的重要途径, 而数字经济的发展质量将直接影响一个国家的整体经济发展水平。近年来,数字经济已成为引领经济增长的新引擎,成为改变全球竞争格局的关键力量。《数字中国发展报告(2022年)》显示,2022年我国数字经济规模高达50.2万亿元,占国内生产总值的比重提升至41.5%。在数字经济高速发展的背景下,为避免数字经济粗放式发展,更应该关注其发展质量,重构数字经济发展模式,实现数字经济高质量发展。2021年 10月18日,中共中央政治局第三十四次集体学习时,习近平总书记强调“不断做强做优做大我国数字经济”,从而加快推动以国内循环为主体、国内国际双循环相互促进的新发展格局,进一步推进“十四五”期间数字经济高质量发展。2022 年国务院发布《“十四五”数字经济发展规划》,指出当前我国数字经济发展仍存在不平衡、不充分、不规范的问题,要加快补齐短板,坚持走数字经济高质量发展道路。数字经济高质量发展是经济高质量发展的必然要求,有利于推动构建新发展格局,有利于推动建设现代化经济体系,有利于推动构筑国家竞争新优势。在新发展阶段,构建科学合理的评价指标体系、准确测度我国数字经济高质量发展水平已成为学界的一个十分重要的研究课题。
数字经济的概念最早由Tapscott(1996)提出[1],随着数字经济规模的快速扩张,学界开始关注数字经济发展质量问题。其研究主要包括如下两个方面:一是针对我国数字经济发展过程中存在的问题提出数字经济高质量发展的政策建议。相关研究从创新落实推进机制、创新政策支持方式、激发数字经济创新活力、创新数字经济治理体系四个方面提出浙江省数字经济高质量发展的推进举措[2];提出以“枢纽经济、门户经济和流动经济”的发展助推陕西省数字经济高质量发展的建议[3];从强化顶层设计、突破核心技术、优化要素供给这三个方面提出实现数字经济高质量发展的路径建议[4];认为数字经济高质量发展应体现发展的前瞻性、综合性与联动性,应聚焦于设施、技术、平台、资源、应用等重点领域,有的放矢、因地制宜地推进[5];建议破解操作系统、数据库、服务器等系统级安全问题,建立全生命周期的数据质量治理方式与战略[6];认为必须推动产业之间及产业内部数字化均衡发展,加大数字经济领域对外对内开放力度,政府与市场各得其位,着力优化数字经济高质量发展营商环境[7];提出要加快数字科技发展、加快数字基础设施建设、加快完善数字经济治理体系,实现数字经济高质量发展[8];建议推进数字经济关键核心技术攻关,推动区域数字经济统筹协调发展,打造多链融合的数字化应用场景,构建包容性的数字治理规则体系[9];认为实现数字经济高质量发展理应持续优化数字基础布局、加快数字产业化和产业数字化步伐、完善数字经济创新环境、加强数字经济可持续发展基础支撑、加大数字经济开放共享力度等对策[10]。还有研究从降低数字化发展与转型成本、强化企业合规管理体系建设、加大数字关键核心技术攻关力度、强化数字监管治理、增强数字经济全球引领力这五个方面提出促进数字经济高质量发展的建议[11];建议从关键数字技术、数字消费市场、数字企业群落、数字产业集群、数字基础设施五方面入手,积极拥抱新技术革命成果,充分对接数字化浪潮,推动数字经济高质量发展[12]。二是数字经济发展质量的指标体系构建与测度。已有研究关于数字经济发展水平的测度较多,而关于数字经济发展质量的测度较少。目前,社会各界常用数字经济与社会指数(欧盟)、ICT发展指数(国际电信联盟)、数字经济指数(中国信息通信研究院)、“互联网+”数字经济指数(腾讯研究院)、中国(苏州)数字经济指数等测度数字经济的发展状况,主要用以反映数字经济的发展速度和规模。有的探索性地从经济效率、社会进步、结构优化、可持续发展的角度构建指标体系,在此基础上运用熵值法测度了2007—2016年各年度的中国数字经济发展质量[13];有的从数字设施、数字产业、数字生产、数字应用、数字创新五个方面构建了指标体系,但并未进行定量分析[5];有的研究从数字基础设施、数字产业、数字应用、数字创新和数字政务五个维度构建指标体系,并运用熵权TOPSIS方法测度了我国各省(区、市)2016—2018年的数字经济发展质量[14];有的基于新发展理念构建评价指标体系,分别运用熵值法和主客观融合赋权法测度数字经济高质量发展水平[15,16];也有的从数字经济投入和产出两个方面构建评价指标体系,并用因子分析法测度了四川省各城市的数字经济发展质量[17]。
综上所述,学术界关于数字经济高质量发展的研究尚处于起步阶段,尚未形成反映数字经济发展质量的具有国际可比性的指数及严密的理论框架,需要进一步拓展和深化。在指标体系的构建方面,主要有如下几点不足之处:一是没有很好地区分数字经济发展质量的评价指标和影响因素,比如,人力资本和研发投入等应该是数字经济发展质量的影响因素,而不宜把它们作为评价指标。二是把不少经济发展质量的评价指标作为数字经济发展质量的评价指标,如全员劳动生产率、每万元 GDP 能耗、社会发展指数、工业单位产出用水量、工业固体废物综合利用率、生活垃圾无害化处理能力、人均公园绿地面积、单位企业产出废水排放量、科技进步贡献率、国内专利授权量、城镇平均每百户年末户均耐用品拥有量、人均知识产权转换等,用这些指标来评价数字经济发展质量的合理性存疑。三是对于体现协调发展的指标没有给出合适的评判标准,如城乡宽带接入用户数之比、城乡有线电视用户数之比、农业数字经济增加值占行业增加值比重、服务业数字经济增加值占行业增加值比重等。在综合评价方法的选用方面,学者们大都选用熵值法及其相关方法,该方法作为常用的客观赋权法,能在一定程度上保证指标赋权的准确性与可比性,但它无法处理各指标之间所存在的信息重叠问题。
鉴于此,本文在对已有研究中有关数字经济高质量发展的内涵进行分析和综合的基础上,基于尽可能体现数字经济发展质量的本质特征和所含信息相似的评价指标不重复选用的原则,以及数据的可得性,海选30个评价指标,通过使用稀疏主成分和信息熵方法构建含有17个指标的评价指标体系,测算评价指标体系相对于海选指标体系的信息贡献。同时,为解决各指标之间的信息重叠问题,选择稀疏主成分方法对我国数字经济发展质量进行综合评价,并运用灰色预测方法预测我国未来几年的数字经济发展质量,进而为我国数字经济高质量发展提供政策参考。
指标体系的构建是综合评价的第一步,也是十分关键的一步,厘清高质量发展的内涵是构建数字经济发展质量评价指标体系的基础。迄今为止,学界尚未对高质量发展形成清晰且一致的内涵。相关研究认为,新时代的高质量发展应体现创新、协调、绿色、开放、共享这五大新发展理念[18];高质量发展的本质性特征是以各种有效和可持续方式满足人民不断增长的多方面需要,实现从总量扩张到结构优化的转变[19];高质量发展应着眼于解决“人民日益增长的美好生活需要”和“不平衡不充分的发展”这个新时代我国社会主要矛盾[20]。总之,高质量发展既要体现新发展理念,也要兼顾产业规模壮大、产业结构优化、经济效率提升等方面。数字经济作为一种加速重构经济发展与政府治理模式的新型经济形态,更应该体现高质量发展的时代特征。本文基于对数字经济高质量发展内涵的理解,参考相关研究,并结合中国数字经济发展的客观情况及具体数据,从数字基础设施、数字经济效率、数字技术创新、数字产业、数字应用、数据开放、数据共享七个方面选取互联网宽带接入端口、光缆线路长度等 30 个指标构建中国数字经济发展质量综合评价指标体系,见表1。
1. 数据来源。由于大部分指标的数据只到2010年,因此,把2010年作为研究的起始时间,测度2010—2022年中国数字经济发展质量。其中,数字经济核心产业发明专利授权量、信息技术领域专利申请数的相关数据来自《中国信息年鉴》,互联网网上支付用户规模、互联网普及率、数字支付在日常支付中的占比、人工智能相关专利申请数、互联网即时通信用户规模的相关数据来自《中国互联网络发展状况统计报告》,数字产业化规模、产业数字化规模、数字经济全要素生产率的相关数据来自中国信息通信研究院网站,高技术产业主营业务收入占比、电子信息制造业营业收入、软件业务出口额的相关数据来自《中国高技术产业统计年鉴》,地级及以上政府数据开放平台数量、电子商务交易规模占比、大数据市场规模、数字产业化领域发明专利授权数占授权总数的比例、云计算市场规模、数字经济规模的相关数据分别来自《中国地方政府数据开放报告》、电子商务研究中心网站、《中国大数据平台市场研究报告》《数字经济核心产业专利统计分析报告》《中国云计算产业发展前景预测与投资战略规划分析报告》《中国数字经济发展研究报告》,其他指标的相关数据来自国家统计局网站(其中多数来自历年的中国统计年鉴)。对于个别缺失数据,采用指数平滑法或线性插值法填补。
2. 海选指标体系的筛选及信息量的测算。海选指标体系含有的指标偏多,需要对其进行筛选,该过程在减少指标的同时也损失了部分信息。Tibshirani(1996)提出了能同时进行变量选择和参数估计的LASSO方法[21]。受该方法的启发,学者们相继提出了多种稀疏主成分方法,如简单自适应稀疏主成分、自适应稀疏主成分、非负稀疏主成分、稳健稀疏主成分、聚类稳健稀疏主成分等。相较于主成分方法,稀疏主成分的载荷比较稀疏,它能有效地反映出计算结果与变量之间的变动关系,且往往能对应于某些实际的含义,因而它更适合对复杂数据进行指标筛选和综合评价。Zou 等(2006)将稀疏主成分的求解直接转化为LASSO回归问题[22],从而使得该方法广泛应用于化学、生物学和经济学等领域[23,24]。
稀疏主成分的计算如下:
基于变量的相关系数矩阵求出前k个主成分α1,α2,…,αk,由此及设计矩阵X求解如下的极值问题:
βj=arg min (αj-β)′X′X(αj-β)+
λ‖β‖2+λ1,j‖β‖1
(1)
其中, ‖β‖2、‖β‖1分别表示向量β各分量的平方和与各分量的绝对值之和。
记A=(α1,α2,…,αk),B=(β1,β2,…,βk),对矩阵X′XB进行奇异值分解X′XB=UDV′, 更新A=UV′, 重复上述步骤,直至收敛。最后对βj(其中j=1,2,…,k)进行标准化。
现有研究往往只关注如何筛选指标,而忽略了筛选出的评价指标相对于海选指标的信息贡献。本文拟基于稀疏主成分与信息熵方法测算评价指标体系的信息含量,在海选指标的基础上得到最终的评价指标体系。由于指标体系的各指标之间往往会存在较大的信息重叠,因而无法直接使用信息熵对指标体系的信息含量进行测算。迟国泰等(2014)证明了指标体系的信息含量等于其所有主成分的信息量之和[25]。为此,可基于原始指标得到信息不重叠的稀疏主成分,进而测算指标体系的信息含量。具体测算过程如下:
首先,由样本数据得到评价指标的相关系数矩阵,求相关系数矩阵的特征根及相应的标准正交化特征向量,得到主成分,进而得到稀疏主成分。在此过程中根据BIC准则选择稀疏参数。
其次,计算单个稀疏主成分的熵,进而计算单个稀疏主成分的信息量,单个稀疏主成分的信息量即它对应的最大熵值与当前熵值之差。计算各稀疏主成分的信息量之和,得到相应指标体系的信息含量。
最后,测算评价指标体系相比于海选指标体系的信息贡献。
3. 评价指标体系的构建。在对海选指标进行挑选时,首先对指标进行分类,含义相近的指标集只保留一个或两个指标,如互联网网上支付用户规模与数字支付在日常支付中的占比这两个指标的含义比较相近,其相关性较大,为此,只保留互联网网上支付用户规模。同理,互联网普及率与每百家企业拥有网站数这两个指标的相关性也较大,为此,只保留互联网普及率这一指标。其次,适当兼顾各一级指标之间的均衡,如数字技术创新、数字产业、数字应用这三个一级指标中所含的二级指标较多,因而它们中被删除的二级指标也较多。经筛选后所得到的最终指标体系见表2。指标筛选一定会伴随着信息的损失,如果保留的信息太少,那么再完美的评价方法都没有意义[24]。经测算,最终指标体系相对于海选指标体系的信息贡献率为88.47%, 而我们仅保留了56.67%的指标,说明海选指标体系也存在比较严重的信息重叠问题,最终指标体系的信息量损失低于20%。
基于表2中的指标体系,对2010—2022年各年度的中国数字经济发展质量进行综合评价。虽然表2中的指标体系是对海选指标体系进行指标筛选后所得到的最终指标体系,但该指标体系的各指标之间仍然存在一定的相关性。因此,考虑使用稀疏主成分方法对17个指标进行降维,用少数几个稀疏主成分代表指标中的大部分信息,从而进一步简化模型与计算。
表3报告了各指标的描述性统计结果。从各指标的最大值和最小值来看,地级及以上政府数据开放平台数量增长最快,然后是云计算市场规模和人均网络零售额,在13年增长了20多倍。电子信息制造业营业收入占GDP比重的变化不大,且呈现出微弱的下降趋势。数字经济全要素生产率、软件和信息服务业收入占GDP比重、软件业务出口额、互联网普及率、数字产业化领域发明专利授权数占授权总数的比例等指标的增长相对比较缓慢。数字经济规模占GDP比重的偏度为-0.07,近似为零,说明其分布接近对称分布。云计算市场规模和地级及以上政府数据开放平台数量的偏度都大于1,呈现出较强的右偏分布,软件业务出口额与数字经济全要素生产率则呈现出较强的左偏分布。进一步可得到各变量的标准差系数分别为0.468、0.503、0.035、0.666、0.289、0.383、1.152、0.143、0.221、0.249、0.739、0.507、0.316、1.332、0.204、0.537、0.235。在各指标中,数字经济全要素生产率的标准差系数最小,说明各年度的数字经济全要素生产率比较集中,其平均值有较强的代表性。
表3 各指标的描述性统计
各指标的相关系数矩阵所对应的特征根及累计贡献率见表4。由于后面的各指标的特征根等于零或近似等于零,所以,表4只列出了前面七个指标的特征根及相应的累计贡献率。
表4 特征根及累计贡献率
不难发现,各指标的相关系数矩阵的条件数大于1000,说明各指标之间的信息重叠问题仍然比较突出。前面两个主成分的累计贡献率为96.394%,远超80%,降维效果很好,因此,选择PC1、PC2作为新的综合变量:
PC1=0.2507zx1+0.2540zx2+0.2272zx3+0.2467zx4+0.2516zx5+0.2531zx6+0.2214zx7-0.2050zx8+0.2524zx9+0.2533zx10+0.2534zx11+0.2351zx12+0.2543zx13+0.2273zx14+0.2216zx15+0.2538zx16+0.2541zx17
PC2=0.1139zx1+0.0080zx2+0.4174zx3-0.1978zx4+0.1417zx5-0.0514zx6-0.4612zx7+0.2137zx8-0.0998zx9+0.0814zx10-0.0576zx11+0.3141zx12+0.0180zx13-0.4398zx14+0.4235zx15-0.0287zx16+0.0033zx17
其中,zxj是将xj经过标准化后所得到的变量,j=1,2,…,17。
在此基础上可得到相应的两个稀疏主成分:
SPC1=0.2707zx1+0.2586zx2+0.2074zx3+0.2568zx4+0.2637zx5+0.2263zx6+0.1892zx7+0.2830zx9+0.2754zx10+0.2854zx11+0.2185zx12+0.2838zx13+0.1706zx14+0.1851zx15+0.2745zx16+0.2748zx17
SPC2=0.4412zx3-0.5504zx7+0.1008zx12-0.5248zx14+0.4686zx15
在求解稀疏主成分时需要选择惩罚系数,通常将λ设置为零,而对λ1进行选择。本文在选择惩罚系数时,兼顾了主成分的稀疏度和解释程度。用各稀疏主成分的方差贡献率加权可构造如下中国数字经济发展质量的综合评价模型:
F=0.936SPC1+0.064SPC2
(2)
其中,F即中国数字经济发展质量指数,SPC1前面的系数0.936=90.259÷96.394,SPC2前面的系数0.064=6.135÷96.394。
将2010—2022年各年度各项指标的标准化值代入上述各式可得SPC1、SPC2与F的得分,具体数值如表5所示。
由表5可知,近13年来,我国数字经济发展质量在逐年提高,即使在2020—2022年的疫情期间也保持了快速增长。由于表5中第四列的部分数据为负值,为便于比较,也为了后面的预测所需,对它们进行归一化处理,其计算公式为:
归一化后的数值为0、0.056、0.143、0.214、0.285、0.385、0.455、0.548、0.656、0.762、0.879、0.957、1.000。2011—2022年我国数字经济发展质量平均每年增长29.96%,远远高于同期的GDP增长速度,这与张雪玲等(2018)的研究结果大致吻合[13]。
灰色预测的基本原理是先对原始序列进行累加,再用指数曲线拟合累加后的数据,从而得到预测模型,其中GM(1,1)模型是最简单、最常用的灰色预测模型。
则GM(1, 1)模型相应的微分方程为:
(3)
由式(3)可解得:
k=0,1,2,…,n。
上述GM(1,1) 模型需要通过适用性检验、关联度检验和后验差检验后才能进行预测,否则要进行残差修正。
本文在深入分析已有数字经济发展质量评价指标体系的基础上,基于客观、全面和数据可得的原则海选了中国数字经济发展质量的评价指标。在此基础上对海选指标进行了筛选,尽量删除含义相近的指标且适当兼顾各一级指标之间的均衡。基于稀疏主成分与信息熵方法测算了最终指标体系相对于海选指标体系的信息贡献率,减少了43.33%的指标,且仅损失11.53%的信息。基于最终指标体系并运用稀疏主成分方法对我国2010—2022年各年度的数字经济发展质量进行了综合评价,考虑到部分综合评价值为负数,为了便于比较,进行了归一化处理,得到了归一化后的中国数字经济发展质量指数。评价结果表明,我国数字经济发展质量在逐年提高,2011—2022年间我国数字经济发展质量平均每年增长29.96%,远远高于同期的GDP增长速度。最后,基于综合评价值,通过构建GM(1,1)模型对中国2023—2027年各年度的数字经济发展质量进行预测,预计未来五年中国数字经济发展质量平均每年增长19.68%,仍处于快速上升通道,但年均增长速度会相对放缓。
基于以上研究结论,给出如下建议:
1.数字经济发展质量的内涵不是一成不变的,需要与时俱进。厘清数字经济发展质量的内涵是构建其评价指标体系的前提和基础,数字经济发展质量涉及规模、结构、效率、公平、创新、协调、绿色、开放、共享、安全、可持续等多个方面,它与经济发展质量既一脉相承,也有其自身独有的特点。对数字经济发展质量内涵的界定永远在路上,需要不断地更新和充实。在数字经济发展初期,发展质量主要体现在它的规模和效率上,在机遇与挑战并存、“三期叠加”的新发展阶段,数字经济发展质量的内涵应着重体现创新发展与安全发展,着重体现数字经济产业链供应链的韧性和安全水平。
2.评价指标体系要兼顾信息量与指标数。在海选指标时,将所有相关且可量化的指标都选入评价指标体系并不现实。事实上,已有关于数字经济发展质量的评价指标体系存在很大的差异,它们涉及150多个指标,这些指标有相当一部分含义相近,指标之间的信息重叠问题很突出。一方面,评价指标体系中所含有的指标越多,其重叠的信息就会越多,这会使评价结果缺乏可信度;另一方面,若评价指标体系中所含有的指标太少,就会使得评价缺乏客观性与全面性。总之,评价指标并非越多越好,而应该规模适度。评价指标体系要兼顾信息量与指标数,这正是指标体系信息量测算的功效所在。
3.用好数字经济快速发展的战略机遇期,为中国式现代化建设提供持续稳健的新动能。研究表明,我国数字经济发展迅速,且在未来若干年内仍处于快速上升通道。当前,我国正处于由传统的实体经济向数字化实体经济转型的关键时期,面对激烈的国际竞争以及西方国家强加给我们的技术封锁,我国在数字经济方面的某些优势已出现减弱的态势,可谓时不我待。为此,要加快数字基础设施建设,着力解决“卡脖子”的技术难题,营造公平、可持续的发展环境,在用好各类数字资源的同时积极参与国际数字治理,实现我国数字经济高质量发展,助力中国式现代化建设。