政府统计大数据应用:评估与改进

2021-07-22 06:00陈瑞华倪一宁
喀什大学学报 2021年1期
关键词:指标政府评价

陈瑞华,王 飞,倪一宁,徐 襟

(1.喀什大学 中巴经济走廊研究中心,新疆 喀什 844000;2.南开大学 经济学院,天津 300071;3.南京大学 商学院,江苏 南京 210093;4.复旦大学 数学科学学院,上海 200433)

党的十九届五中全会提出,要基本实现新型工业化、信息化、城镇化、农业现代化,建成现代化经济体系,基本实现国家治理体系和治理能力现代化。当前,大数据技术作为互联网、物联网、云计算后的新一轮信息技术变革产物,其应用不仅引领当代信息技术领域的创新性变革,而且成为提升政务公开透明度、提高政府工作效率的重要工具。在全球范围内,很多国家和地区相继制定大数据应用的战略性政策,大力支持推动大数据技术的发展和应用。

就统计工作而言,相较于大数据应用,传统的统计工作主要是以小样本为研究对象,并以此推测和描述整体的状况。大数据时代的统计技术在一定程度上与数据挖掘技术相似,二者在进行统计工作之前不需要设定目标,以数据为主体挖掘数据之间的内在联系。借助大数据技术,政府统计可以大幅提升工作效率,推动政务工作信息化、标准化,但在统计实证的研究方式、统计数据的需求分析、统计样本的收集方法、数据分析和数据采集的智能型等具体实践方面都面临着空前挑战。

本文以政府统计大数据应用为研究对象,在梳理国内外政府统计大数据应用研究成果的基础上,基于构建体系—选取指标—测度对象—政策解读—建模统计—统计创新的研究模式,通过主成分分析、层次分析、灰色关联度模型和熵值法等方法,建立政府统计大数据应用的综合测度模型,对当前政府统计大数据应用进行尽可能全面、有效的评价,并提出改进大数据应用的建议。

一、文献综述

在大数据技术推进政府治理体系现代化方面,国内外学者均做了大量深入的研究。Baskaran和Nachiappan[1]较早开始对政府数据开放进行理论研究,认为政府大数据开放既展示了开放数据的技术方法,也体现了政府大数据的透明性与参与性。之后,Malik[2]通过总结开放政府、开放数据的概念内涵,对于政府数据开放的构成基础进行了深入研究。此外,King 和Pan[3]通过研究大数据、开放数据和政府数据开放的关系,分析其交叉形成的6 种类型数据,发现政府大数据应用能够大大提高行政效率,并且可以通过用户最终许可协议开放政府数据,推进政务公开进程,促进社会福利的改善。

国内学者主要基于中国国情对大数据治理体系进行了系统研究。黄璜[4]研究了大数据时代的中国国家治理能力建设,认为执政党和政府主导是国家治理能力建设的关键,应加快制定大数据发展战略;霍小军等[5]从我国的大数据统计政务的实践出发,提出应把握互联网时代契机,应对互联网可能带来的信息泄露风险,推动大数据技术的发展;在大数据技术研究的前沿领域,孟天广和李锋[6]则从全国性网络问政平台的视角,认为网络空间已经成为公民诉求表达和政府回应的主要渠道;而沈亚平和许博雅[7]提出,应为大数据技术的发展提供合理的制度环境,建立统一的政府数据开放平台,为公众行使知情权提供有力的技术支持。

关于大数据统计应用的研究,学界大多局限于政府如何通过大数据技术建立政府的评级体系并进行应用,以及如何评价统计工作的方式和效率。安小米等[8]以贵州省为例,通过分析政府大数据治理体系构成要素,认为贵州省政府大数据治理体系已经初步成型,但在治理主体方面没有明确治理责任等问题。同样是对地方政府利用大数据推进治理现代化进行分析,陈之常[9]发现北京市东城区构建了大数据政府治理能力的应用框架,为大数据政务发展提供了思路。在政府大数据治理体系的框架和实现路径方面,安小米等[10]则认为,应实现政府大数据治理主体和路径的多元化;但王芳等[11]指出,在当前政务大数据环境下,数据治理能力的不足是当前政务大数据建设应用的难题,需要结合数据治理技术和政务大数据治理实际场景,进行大数据治理框架设计。基于已有研究,李樵[12]则对促进我国大数据发展政策工具选择体系结构及其优化策略进行了研究,认为应当加强战略规划和发展理念指引,重视政策工具协同,创新设计应用关键政策工具;马广惠和安小米[13]使用双案例研究法,从大数据汇聚、融合、应用三个阶段展开分析,深化了大数据治理的理论研究。国内的相关研究表明,我国在大数据统计工作方面发展势头迅猛,但仍存在治理体系不完善和治理能力欠缺的问题。

现有文献大多对政府统计的大数据应用进行了理论上的论证,但鲜见通过建立相应模型对政府统计大数据应用进行系统的量化评价。本文首先使用层次分析法建立政府统计大数据应用的评价体系,并对各地政府的大数据业务进行评价;接着使用GCE 模型进行数值模拟,通过仿真数值模拟反映大数据统计技术在我国政府统计中的应用;最后结合我国当前的政府统计工作实践分析当前大数据统计技术面临的机遇与挑战,并为政府统计大数据应用提供建议。

二、政府统计大数据应用的量化评估与分析

在大数据背景下,本文尝试针对政府相关的统计大数据应用建立一个评价系统,从而分析各地政府统计大数据应用的优势与不足,以便更好地推进此项工作。

首先,选取政府统计大数据应用的相关指标(见表1)。

表1 政府统计大数据应用的评价指标

其次,运用层次分析法确定各指标权重。在确定各层次各因素之间的权重时,如果只是定性分析,则受个人主观判断影响较大,导致结果不准确,因此借助Santy 等人提出的一致矩阵法,两两相互比较,尽可能减少各因素性质不同带来的影响。由于各指标的单位不统一,无法直接进行比较,本文采用标准化处理法对各指标进行无量纲化处理。无量纲化的标准化值为:

其中,μj是均值,σj是标准差。如果存在负值,可运用线性函数进行转换:

根据层次分析法,本文建立层次结构模型,分别将一、二级指标设置为准则层、方案层,从而得出评价政府统计大数据应用的指标体系。为了构造判断矩阵,本文采用向相关从业人员发布调查问卷的方式,获得计算判断矩阵的权重所需要的数据,然后利用Matlab 编程计算指标权重并做一致性检验。经过归一化处理,上述计算的特征向量可以代表权向量,其中的每个分量相当于各指标对政府统计大数据应用的影响因子。最后对排序向量进行加权平均,得到政府统计大数据应用的评价指标权重(见表2)。

表2 政府统计大数据应用的评价指标权重

建立指标体系以后,进一步运用灰色模型进行综合评价。首先建立评价矩阵,由于信息量很难用数值衡量,本文只是将信息分成大致几类,分别对应灰度值0~0.2,0.2~0.4,0.4~0.6,0.6~0.8,0.8~1.0。然后建立准则层指标灰色模糊综合评判,即对第一层的一级指标进行评价,模部采用广义“与”运算,灰部采用广义“或”运算。最后确定目标灰色模糊综合评判。由评价矩阵R 和权重矩阵A,可求出评价结果:

运用灰色模型进行评价的关联度越高,说明政府统计大数据应用越成熟。同时隶属度是模糊评价的关键,不过目前理论上还没有完全严格一一对照的标准方法。根据最大隶属度原则和最小灰度原则,可以得到最终评价等级。本文通过wind 数据库,搜集国内各省市的相关数据,最终得出相应省市政府统计大数据应用的评价结果(见表3)。

表3 政府统计大数据应用的评价结果

该结果显示,沿海及东部省份对政府统计大数据应用相对较为成熟,而中西部省份则还有很大提升空间。这一结果也符合各地的经济发展水平,从侧面验证了该模型具有一定的合理性。

三、政府统计大数据应用的影响评估

政府统计大数据应用的影响表现在很多层面,宏观经济的运行及其政府的决策效率均受益于全面准确的数据统计,因此本文从政府的行政效率及其经济发展的影响角度予以分析。

(一)政府统计大数据应用对行政效率的影响评估

为了分析大数据在政府统计中的具体作用,本文选取包括战略目标、过程实现、法律法规、政策制度、标准规范、机构、人员、文化、数据平台、数据技术、管理规则、数据质量、数据共享开放、数据协同、数据安全和相关方参与度在内的16项要素指标(见表4)。

表4 要素指标表

由于要考虑的指标因素较多,且某些因素之间存在交互影响,本文首先采用主成分分析进行降维。主成分分析一般是找到一个从原d 维输入空间到新的k 维空间的具有最小信息损失的映射。设x=(x1,x2,…,xn)T为一个n 维随机向量,,主成分是w1,样本投影之后被广泛散布导致样本之间的差别变得最明显(即最大化方差),选择具有最大特征值的特征向量,主成分w1就是输入样本的协方差阵的具有最大特征值对应的特征向量。在实践中,即使所有特征值均为正数,但由于某些特征值对方差的影响很小,可以忽略不计,本文主要考虑贡献80%以上方差的前k 个主要成分。当特征值按降序排列时,由前k 个主要成分贡献的方差比例为:

本文使用的16 项要素指标数据来源于CCER 经济金融数据库和中国期刊全文数据库(CNKI)2010—2017 年的相应数据。计算16 项要素指标的相关系数矩阵后,接着计算特征值、各主成分的贡献率与累计贡献率,得到相应的结果(见表5)。

表5 特征值及主成分贡献率

根据计算结果,第一、第二、第三主成分贡献度高达86.596%。经过分析,可以将三个主成分归结为战略、管理和科技。得到三项作用要素后,采用熵值法确定其各自的权重。熵值越小,该指标对综合评价的影响权重就越大。熵的一般计算公式为:

其中,Hj为第j 个指标的熵,m 为总指标数。

首先对上述指标体系清洗指标极值,剔除占样本总数不到1%~2%但指标值贡献率超过20%~30%以上的极值样本后,进行归一化处理。接着根据上面的公式,计算指标“熵”和“权”。本文选取了2014—2017 年的每年的中国宏观经济数据作为样本,来源是wind 数据库,得到熵值法的初始数据矩阵(见表6)。通过熵值法可以确定战略、管理和科技的权重分别为0.2614,0.4027 和0.3359。

表6 熵值法初始数据矩阵

(二)政府统计大数据应用对我国经济发展的影响评估

理论上讲,政府统计大数据应用对我国经济发展具有重要影响。为了量化其影响,本文使用可计算一般均衡(computable general equilibrium,简称CGE)模型进行数值模拟。

CGE 模型以一般均衡理论为基础研究经济系统,模拟各种因素的变动对经济产生的影响。出于对政府统计大数据应用的考虑,本文将大数据的应用作为生产要素加入到模型中,考察不同统计政策对经济的影响效果。本文采用的CGE模型主要包括生产、收入、消费、统计、均衡和宏观等6 个模块。除了统计模块,其余模块均参照标准的CGE 模型设定。对于统计模块,本文讨论的政策主要为大数据应用,而大数据应用对消费、生产具有直接影响。基于此,得到如下方程组:

其中,Wk,i,Ck为大数据在生产、消费中的使用量,ak和bk分别为影响系数,P 是最终的总影响因子。首先计算基准情景下的均衡值,然后计算实施统计政策情景下的均衡值,两者的变化率即为大数据应用统计政策使用量的影响。本文数据来源为2010—2017 年全国统计年鉴,模型参数主要根据经典文献进行适当地调整。在考虑大数据应用时,为了研究不同统计政策对国内经济的影响,本文设计了6 种使用量,分别是从20 到70,每10 个单位一个使用量,其中20~30 为较少使用,40~50 为一般使用,60~70 为较多使用。模拟结果见表7。

表7 不同统计政策下宏观经济指标的变化率

从表7 可以看出,应用统计大数据进行分析对GDP、收入、消费、进出口都有正向作用,并且在从较少使用到一般使用时变化幅度较大,影响较为明显。而在超过60 以后,变化范围较小,甚至有可能起负向作用,部分是因为统计政策在我国使用还相对不成熟,相关技术人员培训还不普及。但总体来说,推广使用大数据分析,制定完善的统计政策并加以应用,对国内经济将起到重要的促进作用。

四、政府统计大数据应用面临的挑战及改进建议

大数据的特点是数据量大、结构性弱、难以预测,具有很大的挑战性。在大数据时代,统计工作在事前预测结果或在获得数据后寻求原因的必要性大大降低,探究数据之间的联系则成为重点。统计部门不仅要加强互联网技术,学会如何去规范数据来源,提供有规格的数据,而且要建立有效的体制机制,全面提高政府统计大数据的应用效率。

(一)政府统计大数据应用的挑战

一是建立大数据统计体制机制面临挑战。目前全球范围内主要存在集中型、分散型、混合型三种统计体制。集中型统计体制的特点是国家统一设立机构领导管理,其管理方式分为行政和业务兼顾的垂直领导和仅在业务上进行指导的单一领导,政府建立综合性的统计系统,完成统计的信息、咨询、监督等基本功能。集中型体制的优势在于国家统一进行统计管理,建立统一的统计指标体系和统计标准体系,强化全国统计工作的综合协调性,确保统计工作顺利进行。分散型统计体制的特点是统计工作分别由政府各部门加以执行,更具有针对性和时效性,更能满足社会对统计信息的特定需求。混合型统计体制则是集中型和分散型统计体制的综合体,相对比较灵活。适应互联网经济发展的需要,建立有效的政府大数据统计发布及其运用体制机制,是当前或未来一段时间统计工作面临的重要任务。

二是大数据收集与分析面临挑战。在互联网大数据背景下,政府机构的设置本身需要以数据信息采集和分析为依据,这是政府统计的一项基本任务。数据采集应充分利用互联网的优势收集相应信息并进行处理,确保所采集数据的效度。数据分析则可以利用相应的分析系统揭示数据背后的经济行为,并对市场经济状况进行预测。统计产品一旦开发研究出来,应及时公布,为其他部门、企业和家庭经济决策提供参考借鉴。大数据的数据量庞大且复杂,只有高度专业性的工作才能让相关的处理数据发挥最大效能,因此提升政府大数据收集与分析能力,提高大数据应用的效率也非常重要。

三是大数据统计工作执行面临挑战。统计工作的首要任务是提高统计数据的质量,更加准确客观全面地反映经济社会发展情况。在大数据时代,如何提高统计数据质量,增强数据的针对性和有效性,提升大数据统计工作执行力就成为当务之急。执行力可以分解为执行能力、执行心态、执行资源和执行制度,大数据统计的执行能力就是统计专业素养与统计专业技能,执行心态是统计人员对其工作的态度,执行资源是指开展统计业务所必须的设备设施和必要的经费预算,执行制度是包括统计体制或统计制度在内的所有相关制度。增强大数据统计工作执行力就是要从以上四方面对统计工作进行全面重构。

(二)改进政府统计大数据应用的建议

一是建立健全政府统计大数据应用监管体系。首先,要制定统计大数据的信息发布政策,主要规定官方的大数据政策及希望达到的预期必须事先向社会公开,增强政府统计大数据应用的公正性和透明度。其次,要明确政府对外提供大数据统计服务的要求,提高政府统计大数据应用的服务水平。最后,要同时以新闻发布、电话、出版物、磁介质、网络等多种渠道相结合的方式发布统计大数据信息,同时接受来自社会各界的监督,更好地服务社会。

二是建立统一的大数据统计指标,提高统计大数据应用效率。大数据统计指标的含义、口径、范围、来源渠道、计算方法、计量单位等应统一。在大数据背景下,通用和常用等标准混用依旧层出不穷,海量的数据之间不同标准、不同侧重、重复遗漏的问题日渐凸显,从而引发混乱,需要根据经济社会发展状况不断进行动态调整,建立一种更合理的数据整理分类方式,从而更好满足经济社会发展需求。其次,政府统计大数据工作应保护法人和自然人的隐私,提高数据的保密性,避免数据滥用误用。此外,提高统计大数据工作效率,有效保障统计大数据工作的专业性和完备性,有效提高统计大数据应用的效率。

三是提升统计大数据人员的素质。大数据时代要求统计人员具有更高的职业素质,一方面要通过加强大数据筛选、搜集、整理和分析等相关业务的培训来实现;另一方面要大力引进更多的大数据发掘、加工、整理和分析人才,为统计大数据管理提供强有力的人才保障。加强统计大数据专项培训,既要对各层级都适用的大数据统计理论和方法上进行统一培训,也要针对不同层级的统计工作人员和任务进行有针对性的大数据统计业务培训,还要加强各层级之间的沟通和考核,确保大数据统计培训的效果。当然,加快大数据发掘、加工、整理和分析专业人才的引进工作,对提升政府统计大数据应用的效率是一条必由之路。

猜你喜欢
指标政府评价
主要宏观经济指标及债券指标统计表
知法犯法的政府副秘书长
最新引用指标
莫让指标改变初衷
主要宏观经济指标及债券指标统计表
2006—2016年度C—NCAP评价结果
2006—2015年度C—NCAP评价结果(3)
“政府信息公开”观察
保加利亚转轨20年评价
多维度巧设听课评价表 促进听评课的务实有效