张则艺,赵艳霞,崔博宇
(华北理工大学 经济管理学院,河北 唐山063210)
数字经济是一种新型的经济发展形态,它在数字技术的基础上,通过对现代信息技术的创新与应用,促进传统经济实现数字化、智能化、网络化和平台化的转型与增值,为我国经济高质量提供了重要机遇。数字经济的出现给社会带来了巨大变化,从生产到消费都发生了深刻的变革,极大降低了社会成员交易活动中信息搜寻、信息共享的成本[1],促进产业升级和经济转型。数字经济的健康发展,对推进现代化经济体制建设具有重要意义,因为数字化具有五全基因:全空域、全流程、全场景、全解析和全价值[2],将数字技术引入到传统产业链中,就会产生全新的经济结构和发展模式,促进传统产业的转型升级。因此数字经济已成为推动我国经济发展的重要战略。
梳理关于数字经济发展时空演变的相关研究发现,学者大多集中于测度国家层面或者城市群的数字经济发展水平,分析视角偏宏观。在测度数字经济发展水平得分方面,黄敦平等[3]选用熵值法从数字化基础设施、数字化应用和数字化产业变革测算出中国2013年和2018年数字经济的发展水平。何地等[4]使用熵权—TOPSIS法从数字基础设施、数字产业发展和数字经济环境3个方面测度中国31个省域2013—2020年的数字经济发展得分。韩兆安等[5]基于BEA测算方法从数字经济生产、数字经济流通、数字经济交换、数字经济消费4个角度对中国省际数字经济发展指数进行分析。黄佳冰等[6]运用Kernel密度估计、何苗等[7]用Dagum基尼系数、伍国勇等[8]采用莫兰指数以及胡士华等[9]基于空间收敛模型等方法评价数字经济发展的时空演变特征以及收敛特征。分析研究数字经济政策特征的相关文献可知,雷鸿竹等[10]通过构建“主体—工具—周期”三维分析框架分析中国地方政府数字经济政策的文本内容,得出中国数字经济政策主体多元、政策工具不均衡等结论。许恒等[11]通过分析数字经济对传统经济的技术溢出和冲击效应得出结论:我国当前正处于经济转型的关键时期,可以通过制定“竞合型”政策缓解数字经济与传统经济之间的发展矛盾。沈俊鑫等[12]构建PCM指数模型量化并测算出中国西部地区数字经济政策的得分为8. 03,属于优秀水平。齐秀琳等[13]基于“宽带中国”政策试点数据运用多期双重插分法分析得出,数字经济政策的实施可以推动农民工就业率提升的结论。
在数字经济发展水平的测度以及时空特征分析方面,已有较多研究成果,但指标评价体系各异,对数字经济研究角度不同。因此,本文构建更具现实意义的数字经济发展水平指标评价体系以及探讨数字经济发展的时空演变趋势。在数字经济政策文本分析方面,学界对各类政策文件的主题分布进行探讨,鲜有深入分析政府工作报告。而政府工作报告是政府对一年内的工作内容和成效的总结,更能真实反映数字经济发展的实际水平。基于此,本文运用熵值法测度我国数字经济发展水平,基于核密度估计分析数字经济发展水平在时空格局上的特征和演变趋势。对国务院和全国31个省市区2011—2021年政府工作报告中与数字经济相关的关键词频率以及内容进行详细分析,探究各个地区数字经济发展水平产生差异的深层次影响因素。
在借鉴已有研究成果[14-16]的基础上,构建数字经济发展综合指数评价体系,主要包括数字基础设施、数字产业化、产业数字化、数字化环境4个一级指标,互联网普及率、长途光缆线路长度、移动电话年末用户、互联网宽带接入端口等16个二级指标,具体如表1所示。
表1 数字经济发展综合指数评价体系
1.2.1 熵值法
熵值法是以信息熵理论为基础的一种多准则决策方法,可被用来对多个指标或决策方案进行评估和排序,可以客观、科学地确定不同指标的权重,从而避免主观因素对评价结果的影响。具体计算步骤如下:
(1)数据标准化:
(2)确定第j个指标在第i年下占该指标的比重,计算公式为:
(3)确定第j个指标的熵值,计算公式为:
(4)确定第j个指标的差异系数,计算公式为:
dj=1-ej
(5)确定第j个指标的权重,计算公式为:
(6)确定综合发展指数,具体公式为:
1.2.2 核密度估计
核密度估计是以有限的样本推断总体数据的分布,通过加权平均最终形成连续的核密度估计曲线可得到数据分布的性质,如数据的聚集区域和分布形态。具体公式如下:
设(x1,x2,x3,……,xn)是独立同分布的n个样本点,它的概率密度函数是f,于是估计公式为:
其中,xi表示独立同分布的观测值,K为核函数,h表示带宽,一般选择较小带宽以保证较高的精确度。
常见的核密度函数有均匀核函数、三角核函数、伽马核函数和高斯核函数等。由于高斯函数的预测结果是概率形式的,更加平滑,且计算快捷,因此本文采用高斯核函数进行估计分析,如下式所示。
1.2.3 词频分析
词频分析是一种文本分析方法,将文本分词后,统计每个单词在文本中出现的次数。单词出现次数越多,说明该单词在文本中的重要性越高。通过排序,可以将单词按照其出现频率从高到低排列,进而得到文本的主题和重要信息。词频分析可以快速地处理大量的文本数据。同时,词频分析结果的可视化可以展示文本的主要内容和主题。
本文数据主要来源于国家统计局、各省份统计局网站发布的官方数据、《中国统计年鉴》《中国环境统计年鉴》以及各省份国民经济和社会发展公报等,并对数据的缺失值进行插值法处理,可以较为全面地反映我国数字经济发展动态。
基于熵值法计算得出2011-2021年我国31个省市区的数字经济发展综合指数,并按照指数的得分结果由高到低排列如表2所示。广东、浙江、江苏、北京、山东是数字经济发展综合指数排名前5的省份,其中,广东的得分远高于其他省份,体现出积极推动数字化转型,并且取得显著成果。数字经济发展综合指数处于末位的5个省份分别为甘肃、海南、青海、宁夏、西藏,整体的得分水平较低,最低值与最高值相差0.37,反映出我国各地区数字经济发展水平不平衡,区域发展差距较大。我国数字经济发展整体呈现出东强西弱的特征,东部地区经济基础雄厚,技术水平高,拥有良好的基础设施、丰富的人才资源以及广阔市场前景,吸引大量的数字企业和创新型公司入驻,进一步促进数字经济发展;而西部地区数字经济发展起步较晚,但增长速度快,是当前我国数字经济发展的新兴区域。
2.2.1 整体层面数字经济发展的核密度分析
为进一步深入分析我国数字经济在2011—2021年的发展水平趋势和空间演化特征,将31省市区数字经济发展水平得分以三维动态Kernal核密度形式绘制,如图1所示。
从分布来看,2011—2021年我国省际城市数字经济发展水平的核密度曲线分布中心点逐年向右移动,但幅度较小,说明我国数字经济发展水平有所提高,未来仍有较大上升空间。从峰值来看,我国各省份数字经济发展峰值随着时间推移而呈现下降趋势,波峰的范围逐渐变宽,核密度曲线扁而宽,表面各省份之间在数字经济发展水平的差异程度上逐渐缩小。从波峰量来看,我国省际数字经济发展水平分布呈现由多峰—双峰—单峰的转变,波峰跨度逐渐平缓,但核密度曲线的主峰值较高,并处于较低分数区间,说明我国数字经济发展水平两极分化现象减弱,逐渐出现多极化现象,数字经济发展水平较高的核心省份逐渐增多。从形态来看,我国数字经济发展的核密度曲线具有明显的右拖尾现象,而且右拖尾存有逐年拉长特征,表明我国数字经济发展水平空间差距逐步扩大。
图1 数字经济发展水平三维动态分布
表2 2011—2021年各省份数字经济发展综合指数排序
2.2.2 东部地区数字经济发展的核密度估计
分别选取2011年、2014年、2017年、2020年数字经济发展水平得分,根据地区划分标准,进一步分析东部、中部、西部各地区数字经济发展水平的时空演变趋势。
如图2所示,东部地区数字经济发展水平的核密度曲线逐年向右移动,体现出我国东部地区数字经济发展水平逐渐提高。从波峰变化来看,2011年东部地区呈现多峰现象,2014年为双峰,2017年为单峰,2020年的核密度曲线逐渐趋于平坦,说明东部地区数字经济发展水平存有多极分化现象,但在逐渐减弱。从波峰范围来看,东部地区核密度曲线由窄变宽,峰值降低,表明东部地区各省份差异程度变大。从分布形态来看,核密度曲线的右拖尾逐年拉长,也体现出东部地区数字经济发展水平在空间上的差距增大。
图2 东部地区数字经济发展Kernel曲线演进趋势
2.2.3 中部地区数字经济发展的核密度估计
图3 中部地区数字经济发展Kernel曲线演进趋势
如图3所示,中部地区的数字经济发展水平的核密度曲线随着时间的演变右移明显,2020年比2011年向右移动了1个单位的得分,体现出中部地区数字经济水平在10年间的快速增长;从波峰变化来看,2011年波峰范围较窄,并且出现双峰形态,2017年开始就没有显著的峰值,波峰范围较宽,说明2011年中部地区各省份的数字经济发展水平差异较大,有两极化现象,但从2017年开始中部地区数字经济发展的极化现象减弱,2020年的核密度曲线趋为平缓;从分布形态来看,中部地区的核密度曲线具有明显有拖尾现象,且拖尾逐渐拉长,表明中部地区数字经济发展水平虽然在整体上的差异变小,但是各省份之间存在发展差距。
2.2.4 西部地区数字经济发展的核密度估计
如图4所示,西部地区数字经济发展水平的核密度曲线也是逐年右移,表明西部地区整体数字经济发展水平随着时代前进而提升。与2011年相比,2014年、2017年、2020年的核密度曲线峰高连续下降,峰宽显著增加,表明西部各地区数字经济发展水平的地区差距有所扩大。此外,图4显示西部地区的核密度曲线右端逐渐拉宽,表明部分省份数字经济发展较快,而部分省份数字经济发展缓慢,西部地区各省份间存在较大差距。2020年西部地区的核密度曲线出现明显的右拖尾现象,表明西部地区各省份数字经济发展水平不均衡,正处于数字经济普及和建设初期,尚未形成稳定的发展格局。
图4 中部地区数字经济发展Kernel曲线演进趋势
为更直观地展现我国数字经济发展在时空上的水平差异,将数字经济发展的分布情况选取2011年、2016年和2021年3个时间节点进行对比分析。由图5可知,2011年和2016年数字经济发展水平差异不明显,2021年才有较为明显的变化,但是区域间的差异非常显著。东部地区在以上三个时间节点的得分水平都明显高于其他两个地区,尤其是浙江和广东的数字经济水平在全国范围内领先,反观中部和西部地区,只有四川的得分略微高于其他省份,总体还是与东部地区有一定的圈层差距,尤其是山西、内蒙古、黑龙江和西藏等省份,数字经济发展落后。
由此可见,我国数字经济发展水平一直处于上升状态,但存在显著的区域差距,东部地区尤其以长江三角洲和珠江三角洲地区为代表,数字经济起步更早,数字基础设施更为完善和齐全,可以有效吸引资本、技术和人才聚集,所以数字经济发展水平更高,而中部地区和西部地区数字经济发展水平相对较弱。因此,应更加关注数字经济发展过程中的区域水平差距。
注:为方便绘图,在原有得分的数据上整体都加1
政府工作报告对进一步统一全国上下的思想行动,对全面部署今后一个时期的经济社会发展各项工作具有十分重要意义。本文以2011—2021年为研究时段,提取全国31省市区每年发布的政府工作报告中所有提及“数字经济”“数字基础设施”“数字产业化”“产业数字化”“数字化环境”的频数,进一步分析数字经济在政府工作报告中的出现频率及规律,以地理位置为划分标准,按照东部、中部、西部三大区域进行对比描述,并利用Origin2022绘制词频趋势图。
图6 东部地区词频分析
东部地区包括北京、天津、河北、辽宁、上海、江苏、浙江、福建、山东、广东、海南11个省市,提取到有效政府工作报告共计121篇。东部地区词频图如图6所示,最为显著的表现是“数字化环境”均未被任一省份所提及。数字化环境是指基于科技创新和文化创意,将电脑、机器、互联网等纳入系统性的云平台中,使得生活空间和工作空间形成可控制的综合数字化空间,高效地传递和收集信息。数字化环境在2011—2021年东部各省市政府工作报告中的缺失说明数字化进程处于基础建设期,未能到达全局数字化的程度,“数字基础设施”也是在2021年才开始被提及。数字产业化和产业数字化是相辅相成的关系,数字产业化可以为产业数字提供数字科技、产品、服务、基础设施和解决方案,使产业链上下游的全要素数字化升级、转型和再造。“数字产业化”和“产业数字化”两个关键词被提及的时间和频率基本一致,说明东部地区大部分省份越来越重视协同推进数字产业化和产业数字化,着力推动数字经济产业创新发展。
中部地区包括山西、内蒙古、吉林、黑龙江、安徽、江西、河南、湖北、湖南9个省份,共提取到有效政府工作报告99篇。中部词频如图7所示,“数字化环境”中部地区9个省份均未有提及,“数字基础设施”也仅在2019年提到过1次,说明中部地区对营造数字化发展环境方面的关注度不够,未来应多从政府层面引导扩大数字经济规模。数字产业化是实现数字经济的技术基础,产业数字化是数字经济的实践应用,中部地区9个省份政府工作报告中提到“产业数字化”的频率略高于“数字产业化”,但都是从2019年才开始有省份提及,总频次较低,今后中部地区各政府应持续推进数字技术与第一、二、三产业的融合发展,实现从传统经济向数字经济的平稳过渡,只有让数字技术融入人民生活之中,才能让数字化建设真正造福于人民。“数字经济”在整个中部地区在2017年才开始被提到,2021年达到峰值,反映出中部地区数字经济发展起步较晚,但是其发展速度和潜力不容忽视。随着数字化技术的不断发展和应用,以及国家对数字经济发展的支持力度不断加大,中部地区的数字经济发展将迎来更加广阔的发展空间和机遇。
图7 中部地区词频统计
西部地区包括重庆、四川、贵州、云南、西藏、陕西、甘肃、青海、宁夏、新疆、广西11个省份,提取到有效政府工作报告120篇。如图8所示,西部地区均无政府工作报告提及“数字化环境”“数字基础设施”,也仅在2019年提到1次和2021年提到1次,说明西部地区对数字基础设施建设的关注度较低,可能是因为西部地方各省份地形地貌丰富且险峻,政府大部分工作重心仍未能放在数字基建上。“数字产业化”和“产业数字化”在2019—2021年共计被提及13次,体现出西部地区大部分省份可以紧跟时代动向,积极推动数字经济产业发展。西部地区与中部地区情况一样,在2017年才开始有省份提及“数字经济”,之后每年的词频数量增幅明显,具有起步较晚但发展迅速的特征。西部地区土地资源丰富,推广大数据技术和建立计算中心的成本较低。但从整体来看,我国西部地区数字经济发展水平比较薄弱,没有形成完整的产业链,核心数字产业的规模较小。此外,在数字基础设施方面,由于我国西部地区自然条件、地理环境等因素制约,在“东数西算”工程中,很多方面处于起步阶段,基础设施建设任务艰巨;在数字技术的应用和创新方面,核心技术的研发和成果转化尚未形成体系;在数字生产要素的支撑能力方面,尤其是在高层次数字人才方面,存在严重的不足。这些问题已成为制约我国西部数字经济发展的障碍,亟待尽快解决。
图8 西部地区词频统计
总之,我国数字经济发展具有结构性差异,各省份政府工作报告关于数字经济提及的频次与领域也有较大差异,西部地区对数字基础设施、数字产业化、产业数字化都较为重视,而东、中部地区更注重数字产业化和产业数字化。
本文以2011—2021年全国31省市区的统计年鉴、统计公报和政府工作报告等为数据基础,运用熵值法、核密度估计法、词频分析法测度中国数字经济发展水平的综合指数,研究结论如下:我国数字经济发展水平保持连续增长趋势,空间格局的特点为东部地区强西部地区弱,中部地区处于中位水平,数字经济发展水平区域间差异明显,其中东部地区和西部地区内部各省份之间的数字经济发展速度各异,表现出较大的差距,而中部地区数字经济发展的多极化现象明显,各省份之间的发展差距逐步缩小。通过分析各个省份的政府工作报告可以发现词频和数字经济发展水平的高低之间有一定的关系,发展水平较高的东部地区提及数字经济等相关关键词的频率更高,中部地区和西部地区较低。因此,各地方政府应更加注重数字经济发展战略的科学制定,明确数字经济发展的目标、重点领域和措施,同时加强与数字经济水平发达地区的合作交流,不断缩小数字经济发展的地区差距。
首先,应推动东中西部数字经济协调发展,发挥东部对中部和西部的辐射带动效应,促进资金、人才、技术等高效流动;其次,要进一步优化各地区之间的要素分配,发挥核心省市区的带动作用;第三,政府要强化政策扶持,构建适合数字经济发展的社会环境,因地制宜地制定数字经济发展扶持政策,完善政府之间的有效合作机制。