陈 亮,余少华,何 炜
(1.中国信息通信科技集团有限公司 a.光纤通信技术和网络国家重点实验室;b.国家信息光电子创新中心,武汉 430074; 2.鹏城实验室,广东 深圳 518000)
当前,人类社会正处在从以计算机和互联网为代表的第3次工业革命迈向以数字信息技术为代表的第4次工业革命的过渡时期。数字信息技术是决定社会生产力水平高低的关键因素,将成为第4次工业革命的起点。此时,我国正处在优化经济和产业结构,推动新旧动能转换的关键节点。两个窗口期的重叠致使数字化变革成为我国未来发展的趋势之一,因此“加快数字化发展,建设数字中国”的数字化战略已被国家写入“十四五”发展规划。
数字中国是指将先进的数字化信息技术深入渗透到我国经济、政治、文化、社会和生态等全方位领域,形成以数字化战略为核心的现代国家治理体系。从理论上讲,数字中国是一个多维概念,度量数字中国涉及不同维度的多个指标,需要构建一套科学的数字中国指标体系。国外数字经济的指标体系虽可以提供一定的借鉴[1-4],但仍然局限于西方价值观和世界观,其指标体系也仅适用于数字中国的局部。我国学术界对数字中国的内涵界定分歧较大,还没有制定统一的标准,对于数字中国发展多以定性说明为主,少有提供定量测度数字中国的分析方法。
本文以党中央提出的“五位一体”总体布局为依据,设计数字中国的五大核心指标、九大主要指标和五个分项指标,并将一级指标逐步细化,尽可能降低指标的颗粒度,使其可获取、可度量和可执行,尝试构建一套较为完整的数字中国指标体系。同时,利用多类型功效函数对指标进行无量纲化处理,然后使用加权因子分析法和聚类分析等数学统计工具,对指标体系中各因子的影响进行赋权计算和分类,力图客观准确地反映出数字中国体系建设情况,最后提出一些数字中国建设的政策建议。本文指标体系在文献[5]和[6]的基础上进行了修改,但仍不一定能反映我国数字化领域的全貌,仅提供一个数字中国发展程度的粗略度量,权做引玉之砖供各界人士参考。
在人类工业革命代际转换的窗口期,世界主要经济体都相继出台了数字化战略和发展计划(如表1所示),希望通过数字化转型提高社会生产力水平,增强传统产业竞争力。
表1 世界主要经济体数字化战略发展现状
美国国际开发署在2020年4月发布了《数字战略2020—2024》。该战略基于两个主要目标:一是使用数字技术来实现重大发展和人道主义援助;二是加强美国数字生态系统的开放性和安全性;同年10月,美国白宫发布了《关键和新兴技术国家战略》,旨在成为关键和新兴技术的世界领导者,并构建技术同盟,实现技术风险管理,其中包括通信及网络技术、数据科学及存储、区块链技术和人机交互等。另外,美国早期发布的两个数字化战略,《先进制造伙伴计划》和《先进制造业国家战略计划》,依然继续对中小型先进制造企业投资,同时,有针对性地扩大有技能劳动者的规模,增强美国各界之间的合作,并增加先进制造研究的投资总量。
欧盟委员会在2021年6月发布了《地平线(Horizon)欧洲》计划。该计划的目标之一,是使欧洲成为未来的“数字十年”,并为新涌现出来的数字科技奠定基础。该计划将帮助医疗、媒体、文化和创意、能源等领域最大限度地发挥数字技术带来的创新潜力。另外,欧盟之前发布的《数字欧洲》战略,旨在为欧洲数字化转型提供支持,确保民众和企业获得高质量公共服务,提高欧洲在全球数字经济中的竞争力并实现技术主权。
日本在2021年3月发布了《第六期科学技术创新基本计划》,旨在适应新形势并推进数字化转型,构建富有韧性的经济结构,在世界范围内率先实现超智能社会5.0。
其他主要国家和组织也都发布了符合自己国家利益的数字化战略,在此不一一赘述。
党的十八大站在历史和全局的战略高度,提出我国要在经济建设、政治建设、文化建设、社会建设和生态文明建设等5个领域全面推进,即“五位一体”总体布局。“数字中国”与“物理中国”需要同步建设,两者的深度融合必须紧紧围绕“五位一体”,这也是构建数字中国指标体系的主要政治和理论依据。只有成功完成数字经济、数字政府、数字文化、数字社会和数字生态5大领域的数字化战略转型,才能确立完整的数字中国新格局。
数字中国的5大组成部分都尚未形成公认的、严谨的定义,虽然各自都有独特的、适用于自身的发展阶段和过程,但每个部分之间都存在着内在的相互牵引动力。数字经济从数字产业化和产业数字化的“两化”[7],发展为在其基础上增加数字化治理的“三化”[8],最后阶段又增加数据价值化的“四化”[9];数字政府也经历了3个阶段:政府信息化阶段、电子政务阶段和数字政府阶段[10]。数字经济和数字政府之间的内涵有一定重叠,例如:数据价值化特征适用于数字政府,同样也是数字文化、数字社会和数字生态的重要特征。由此可见,随着人们对数字中国的认识不断加深,不同的发展阶段必然诞生不同的内涵界定,每一部分的内涵都或多或少地与其他部分互有牵连,它们相互影响依存,形成数字中国的有机整体。
所谓指标体系,是将各类离散的、具有潜在相关的指标系统化组织起来建立数据分析模型,通过局部离散点窥探目标全局,同时通过宏观全局俯瞰具体问题。其主要由指标和体系两部分组成。其中,指标是量化统计分析的重要依据,具体是指把大颗粒的单元细分后量化的度量值,可使目标可描述、可度量和可拆解,通常分为结果型指标和过程型指标两种;体系是指从不同维度和视角,对目标进行观测、审查和表述,维度是指标体系的核心,主要分为定性维度和定量维度。
为了把数字中国的宏观目标分解,对应到具体可获取、可落实和可衡量效果的方案上,从而使执行计划没有偏离大方向,我们至少需要对3个一级指标分级,从宏观目标、策略量化和度量测度等3个不同维度深度细化指标颗粒度。数字中国指标体系可分为3个层面,分别是:作为宏观目标的“数字中国核心指标体系”、作为策略量化的“数字中国主要指标体系”和作为度量测度的“数字中国分项指标体系”,如图1所示。
图1 数字中国指标体系的3个层面
数字经济、数字政治、数字文化、数字社会和数字生态所组成的宏观目标指标体系就可以定义一个完整的数字中国框架,是数字中国建设的总目标。对于其中每个一级指标都可以作为综合指标进行全面研究,逐个构建相应的指标体系。例如:数字经济指标体系就是学界较为热门的研究对象,由于国内外对数字经济指标体系的研究较多,研究成果值得借鉴。本文仅对一级指标定义少量的二级指标,细分的指标测算依靠策略量化和度量测度另外两个维度的指标体系。
对于策略量化而言,数字中国主要指标体系依据各领域数字化建设的能力和水平进行评估。例如:数字基础设施建设能力、技术创新能力和政策保障水平等。随着指标细分的规模不断扩大,数字中国很多潜在的社会、民生、产业和生态问题都会浮出水面,策略量化的能力和水平设定是否科学直接关系到我国数字化发展是否成功。首先从策略目标入手,明确能够满足国家重大需求的是什么,找准分析方向,然后划定数字中国建设的数据范围,确定分解数据的角度,对分解之后的要素进行比较;其次从量化方法入手,不能生搬硬套现有的数据分析模型和方法,按照数据分析的思维本质,即对比、细分和趋势3种思考维度,对应找出合理的策略量化方法;最后从行业入手,要做到上述两点,必须与具体行业相结合。
对于度量测度而言,将上述两类指标体系中的指标继续细分,形成数字中国分指标体系。将常见的具体指标按一定的逻辑关系归纳分类,分别从宏观和微观的角度,度量与数字中国建设相关的行业发展、企业发展、区域发展和环境发展等层面的二级指标,其内涵与特征是多个维度判断的综合考量,这些具体指标的度量值来自各领域基础数据,“用数据说话”,才能更精准地反映更多真实情况。这些二级指标的界定可以根据经济、社会和行业的发展动态调整。考虑到指标选择应具有科学性、数据可得性和可比性,选取各指标的基础数据需来自国家有关部门或权威咨询机构,对于个别缺失数据,根据变化特征,通过趋势分析,得到相应趋势值替代缺失值[11]。同时,指标定义必须符合国家层面的口径和标准,不可随意定义,要做到与国家统计部门同步。
本文设计的五大核心指标、九大主要指标以及五个分项指标基本组成数字中国的核心指标体系。其中,数字经济发展度、数字政府成熟度、数字社会发展度、数字文化繁荣度以及数字生态和谐度等一级指标是数字中国指标体系的核心,如表2所示,覆盖了我国数字化建设的主要领域。对于每个一级指标,都可以细分为两个主要的二级指标(可根据认知程度逐步增加)。
表2 数字中国核心指标体系
技术创新能力、基础设施能力、信息共享能力、数据开放能力、网络安全保障水平、政策机制保障水平、资金保障水平、人才保障水平和生态保护水平等一级指标,组成了数字中国九大主要指标体系,如表3所示,涉及到我国数字化能力建设的主要方面。
表3 数字中国主要指标体系
行业发展、区域发展、企业发展、事业单位发展和环境发展等一级指标,组成数字中国五大分项指标体系,如表4所示。其中,从宏观和微观两个不同维度选取度量行业发展的二级指标。既着眼大处反映数字中国发展的宏观背景,又从基础和融合两个层面着眼小处,反映数字中国发展的微观变动情况;从产业自身角度,利用总体态势反映支撑我国数字化发展的产业基础,并对行业细化分解,从具体产业情况和重点领域,衡量我国数字化发展对经济和其他相关行业的带动作用。从宏观面逐渐向微观面层层深入递进,能够系统全局地反映我国数字领域行业和产业的发展趋势。同时,利用区域发展指标分别对全国各地不同区域数字中国的发展状况进行量化;将企业发展一级指标分解为智能化运营和数字化创新两个二级指标,对我国企业的数字化能力成熟度进行评估;事业单位发展指标从相互垂直的维度来评估其数字化发展现状;环境发展指标从与人民群众息息相关的环境数字化发展现状进行评估。
表4 数字中国分项指标体系
(续表) (续表)
对任何一套指标系统而言,都存在指标的量纲不同、数量级相差大和数值变化趋势不同的情况,必须首先将计量单位不同的指标进行无量纲化处理,然后再进行加权因子分析和聚类分析。数字中国指标体系五大核心指标的数值性质和类型差异较大,需要针对每一类不同的指标数据使用不同的无量纲处理方法。文献[12]汇总了统计学中大部分的功效函数,可以作为参考依据。由于“数字社会”和“数字生态”指标体系中的常用二级指标互为倒数(如:数字基础设施投入产出比等),当逆向指标接近目标值后,指标评价值增长较快,超出目标值后,也可以进行历史对比,建议使用对数型功效函数;“数字政府”和“数字文化”指标体系可使用简单有效的线性型功效函数;而“数字经济”在数字中国指标体系中占有较大的权重,也是衡量数字中国建设的主要指标,因此建议使用改进型指数功效函数[12]进行无量纲化处理,其基本数学形式为d=Aex-xs/(xh-xs)/B,式中:d为单项指标的评价值;x为单项指标的实际值;xs为不允许值,xh为满意值,两者统称为阈值[13];对于待定参数A和B,可以通过临界点定分来确定。如果将指数功效分值的值域设定为60~100(与传统百分制差异比较),那么:当x=xs时,说明x达到不允许值,取d=60,可知A=100;当x=xh时,说明x达到满意值,取d=100,由于AeB=100,则B=-ln0.6。
我们采用常见的加权因子分析法确定数字中国评价指标的权重,以弱化主观赋权法的影响,对体系中各因子的影响进行赋权计算。尽可能以官方统计数据为支撑的硬指标,不用带有主观评价性的软指标,基础数据来源于国家官方统计和调查数据,或国际组织机构的数据库和研究报告。
加权因子分析法是一种处理多变量数据的经典统计方法。指标体系中的变量往往相关性较强,为了降低分析维度,加权因子分析法可根据指标的相关性大小,用分组的方法将不同组的指标转换为彼此不相关或相关性较低的变量,而提高同组变量之间的相关性。文献[14]提供了一种分组方法,可以作为参考。将变量分组,每组变量代表一个度量结构,并用一个综合变量表示不可观测的少数公共因子。对于某一个具体问题,原始度量变量就可以分解成两部分之和,一部分是公共因子的线性函数,另一部分是与公共因子无关的特殊因子。
假设有n个分析对象,每个对象有p个评价指标,组成样本的原始数据为xij(i=1,2,…,n;j=1,2,…,p)。x.j为任意一列的第j个观测值;F1,F2,…,Fk为k个公共因子;e1,e2,…,ep为不可观测的部分。因子分析模型可以写成:
式中:Fij为第i个指标的第j个公共因子值;cij为公共因子的待估系数。用Thompson回归方法计算出待估系数矩阵C,即C=M′R-1,式中:R为样本相关矩阵;M′为因子载荷矩阵M的实例。最后构造综合分析模型,可表示为
式中:Ei为第i个对象的综合分析值;wj为第j个因子的权重,权重可以根据具体情况设定,例如:可以将第j个公共因子的方差贡献率/累计方差贡献率作为权重。
聚类分析也称群分析或点群分析,是研究分类的一种多元统计方法,也是基于多指标对样本进行分类的一种方法,其实质是根据变量或样本间亲疏程度,将性质最接近的对象聚合在一起成为一类。显然,聚类分析是一种无监督学习,是在缺乏标签的前提下的一种分类模型。文献[14]给出了一种系统聚类的分析方法,步骤是:先定义样本间的距离和类与类之间的距离,将n个分析对象看成是n类,然后将距离近的两个类合称为一个新类,计算该新类与其他类之间的距离,再按照最小距离进行类合并,一直重复合并过程,直到所有分析对象或样本都归为一类,最后画出聚类过程的系谱图,从而得到聚类图;根据聚类图结合实际情况,确定分析对象或样本的聚类数目,得出最后的聚类结果。在聚类分析中,我们一般只关注样品间距离和类间距离,类间距离的不同定义决定产生不同的聚类方法。通常样品间距离采用欧式距离,而类间距离采用最短距离,可作如下定义:xij(i=1,2,…,n;j=1,2,…,m)作为待分析数据样本,表示第i个样本的第j个数据。样本间的欧式距离为
式中:n为样本个数,m为指标个数;drs为样本xr与xs之间的距离;xrt和xst分别为第r和第s个样本的第t个指标值,该数据需要对其进行标准化后才能使用。类间最短距离可表示为
式中:Gi为类i,Dij为类Gi与Gj间的距离;假设Gp与Gq合并为Gr,Gr={Gp,Gq},Drk为新类Gr与其他类Gk间的最短平均距离。
无论采用哪种量化分析模型和手段,都需要经过多次比较和校对,如果结合人工智能和大数据挖掘的方法,有利于在数字中国指标体系分析中提炼出更多有价值的信息。
衡量数字中国建设和发展情况,需要坚持问题导向。要强化对宏观和微观、国家和地方、企事业单位等多个层面的统一把控,将我国数字化转型中的各类问题具体分解落实,并强调顶层设计和规划,实行事中监督和事后考核等手段发现和解决问题。
需要厘清数字中国评估考核的具体内容。其评估体系的科学性、调研的可操作性和数据的可获取性等,都有助于提高对数字中国建设和发展的精准度量。不同层面的组织对数字中国指标理解各有差异,例如:国家管理部门和地方执行部门的评价指标体系就有明显不同,全国和各省市不同区域的评价指标也不尽相同,以盈利为目的和以公益为目的的组织评价指标更是大相径庭。因此,建立一套符合不同研究对象的需求,并且科学公正合理的评估体系至关重要。
数字中国指标体系的制定和完善是一个长期的过程,需要反复推敲,不可能一蹴而就。各领域的学者需要站在国家战略的高度充分理解数字中国这个有机整体。数字经济和数字金融是近年来被社会各界广泛关注的领域,但是对数字政府、数字文化和数字生态等领域却较为忽视,缺乏数字中国的全局认知。本文提出的数字中国指标体系仍然不完善,存在内在缺陷和考虑不周的可能,而且基础数据的缺失也极大地限制了实证研究。例如:由于数据保密的原因,数据的可获得性较低,不同机构的数据不能相互印证和匹配,而仅以一家代表性的机构为数据来源,也不能反映数字中国的完整全景。数字中国研究是一个系统工程,需要信息科学、统计学、经济学、社会学和法学等多学科的研究人员共同为之努力,只有这样我国才能充分掌握数字化大趋势,为实体经济注入强大新动能,让人民群众充分感受到数字中国的磅礴力量。