刘园园 段尧清 俞寅天
关键词: 地方政府; 开放数据; 治理效能; 评估
DOI:10.3969 / j.issn.1008-0821.2024.06.008
〔中图分类号〕G203 〔文献标识码〕A 〔文章编号〕1008-0821 (2024) 06-0092-08
政府开放数据治理效能是指政府通过法律法规、管理制度、技术工具等一系列手段, 对数据开放过程中所需要与所产生的数据资源的全生命周期进行有效管控, 以满足开放数据资源的数据管理、价值实现与民众需求的成果体现, 是加快政府职能转变,构建数字化政府、服务型政府、法治化政府的重要举措, 有利于政府数据治理方式方法的细化与创新,形成大数据时代数字治理新格局[1-2] 。政府开放数据治理是政府数据治理在“互联网+政务服务” 背景下的进一步演进与深化。党中央提出, 在数字政府建设中, 要以数字赋能实现数据治理创新, 从而推进政府治理体系与治理能力现代化, 我国数字政府建设方向逐渐清晰, 政府数据开放与数据治理迎来新局面[3] 。政府数据治理涉及政府内部数据与外部数据的方方面面, 这并不是各个要素之间的单纯累加, 而是将数据治理理念嵌入到政府各项工作中。政府开放数据作为政府数据的一部分, 对政府开放数据进行治理, 一方面, 因为大数据、云计算等新兴信息技术在政务服务中的广泛应用, 促使政务系统中的数据数量与体量呈指数级增长, 政府数字化转型速度加快, 与此同时, 数据协同开放、数据责权不明、数据基础配套设施落后等问题凸显, 对政府数据开放提出更高的要求与挑战; 另一方面, 随着政府机构的深化改革, 治理体系逐渐现代化, 民众对政府开放数据的正确性、服务性、安全性、科学性等多方面提出了更高的要求。大数据时代无论是对民众生产生活还是政务管理来说, 都会产生深远影响, 政府与民众之间的社会关系及政府本身的内部机构关系发生重构, 政府数据治理也必定会在大数据时代下发生新一轮的改革与创新, 深入细化是必然趋势, 因此研究政府开放数据治理效能具有重要意义。那么一个有效地衡量政府开放数据治理效能体系如何构建? 本文将尝试对该问题做出解答。
1 相关研究
2004 年, Watson H J 等[4] , 首次在企业管理领域提出“数据治理” 的概念, “政府开放数据治理”是由“数据治理” 概念发展引申而来, 是指政府为了维护开放数据的安全和数据质量, 运用法律、政治等手段, 对行政与服务过程中所对外开放的数据进行多方面的分配与治理, 以更好地发挥政府数据价值[5] 。目前学术界对于政府开放数据治理的理论研究较为丰富, 一方面从政府开放信息管理与开放数据治理概念辨析入手, 认为开放数据治理虽然是在大数据时代对信息管理的一种继承与延续, 但是二者在参与主体[6] 、关注对象[7] 、所处环境[8] 、目标侧重点[9] 等多方面均有所不同, 整体而言数据治理相较于信息管理来说更加微观与细致; 另一方面是从政府开放数据治理本身入手, 专家学者从政府开放数据治理过程中的治理价值[10] 、治理模式[11] 、治理原则[12] 、系统特性[13] 、治理路径[14]等多方面展开研究, 认为开放数据治理要以政府为主导, 从当地数据发展特点入手, 因地制宜, 做到社会多元主体相互协同, 从而构建社会治理新体系, 提高政府数据服务精度与准度。在对政府开放数据治理理论研究的同时, 也有学者通过研究国外已有的数据治理框架实例, 来进一步提出适用于中国的数据治理框架[15] 。在深入研究政府数据治理之前, 先构建体系框架, 这有利于厘清不同数据治理对象与治理主体的逻辑关系[16] 。国外学者在政府开放数据治理体系构建领域倾向于对市场数据进行治理, 主要包括国际数据管理协会的数据治理框架[17] 与数据治理协会的数据治理框架[18] , 意在满足企业发展需求, 激发数据活力。国内有学者从数据融合的角度出发, 按照技术层、业务层、应用层等多个层次的发展周期, 结合数据发展与数据管理生命周期理论, 融合数据创新思想, 探讨政府开放数据治理体系框架[19-21] 。
从现有研究来看, 国内外对于政府开放数据治理的理论与实践研究较为成熟, 集中在内涵概念、体系框架等方面。但从整体上来看, 无论是政府开放数据治理的概念内涵还是治理体系框架研究方面,均缺少了从数据本身的质量进行考量, 且目前的研究体系框架较为宏观, 系统性研究不够。因此, 本文从政府角度与数据角度两方面构建评估指标, 使用熵权-TOPSIS 方法对地方政府数据治理效能进行测度, 得出城市数据治理的综合得分, 利用秩和比法将样本城市分为一般、中等、良好3 档, 然后将综合得分作为母序列, 使用灰色关联度模型找出在政府数据治理过程中起到关键性作用的因素。一方面将数据安全生态与数据质量纳入评估体系中, 使得评估结果更加系统客观; 另一方面分析政府开放数据治理过程中的关键因素, 为地方政府数据治理提供理论与实践上的借鉴与指导。另外, 此次研究是在以往政府数据开放效率测度的基础上进行[22] ,通过研究, 可以找出政府数据开放效率与数据治理能力不匹配的城市, 探究其中原因, 给出相应对策,有利于构建数字化时代政府数据治理新模式, 推动治理体系与治理能力现代化。
2 实验设计
2.1 指标选取与数据来源
2018 年, 国家标准委员会发布了DCMM 数据管理能力成熟度评估模型[23] , 在评估模型中, 给出了数据治理整体框架, 在框架的数据治理域中包括数据管理体系与数据价值体系。其中管理体系着力于管理数据的现状与能力, 分析数据管理成熟度,主要监控管理治理方案的实施, 满足数据管理和数据战略要求; 价值体系着力于数据价值转化实现,体现数据价值的实现绩效, 满足社会数据资产的应用和实现要求。《數据治理标准化白皮书(2021)》[24]结合DCMM 数据治理域中的管理体系与价值体系,给出了更加详细的评估标准, 从基础共性、数据基础设施、数据资产管理、数据流通与数据安全5 个方面进行评估。
因此, 本文的地方政府开放数据治理效能评估融合DCMM 中的管理体系与价值体系两个数据治理域, 并结合《数据治理标准化白皮书(2021)》中给出的具体标准, 经由两名专家具体论证后, 最终管理体系用数据基础设施与数据资产管理进行衡量, 价值体系用数据流通与数据安全进行衡量。由于基础共性主要是为了统一在数据治理领域的基础概念, 为数据治理相关领域的建设提供参考架构、评测评估、通用要求等便利, 因此基础共性作为一种事先拟定好的定性指标就不再纳入本文的定量考察中来。
具体的指标选取依据如表1 所示:
1) 数据基础设施标准主要是用来规范在数据治理工作中所涉及的数据平台、数据机构, 为数据流通、数据资产管理、数据安全等提供技术支撑。基础设施的完善有利于推动国家治理体系与治理能力的现代化, 是提高政府数据治理水平的有效方式[25] 。本文选择使用数字政府发展水平、数据治理平台与系统建设数量以及是否设立专门的大数据管理平台(没有设立的赋值为0; 事业单位的赋值为1; 行政单位的赋值为2)作为数据基础设施的三级指标。
2) 数据资产管理主要是针对政府的核心数据资源的应用、共享、质量等方面进行管理。政府数据具有体量大、类型多、增长速度快等特点, 面对庞大的数据, 政府首先要保证的就是数据的质量性与共享度, 政府开放数据的质量也是政府公信力的最直接体现[20] 。本文选择使用数据应用数量、数据及时性(更新频率)以及元数据完整性作为数据资产管理的三级指标。
3) 数据流通主要是对政府在数据开放过程中的数据开放量、数据开放效率等进行约束, 保证数据在需求方与供应方之间的合规有序流通。政府数据开放是政府进行数据治理的一个重要部分, 开放数据有利于保障公民知情权。数据时代, 政府数据治理现代化建设过程中, 需要多样化主体的参与,政府数据开放有利于激发公民参与到数据治理过程中的主人翁意识[26] 。因此, 政府数据开放服务对政府开放数据治理具有正向化影响。本文使用政府开放数据量、政府开放数据效率与开放数据访问量作为数据流通的三級指标, 其中政府数据开放效率是经由前期计算所得[22] 。
4) 数据安全指标主要是为了确保数据资产在开放、管理、共享、应用等环节的合规合法, 确保数据在任何环节都能够得到有效保护。数据安全建设是政府进行数据治理的一个重要方面, 政府通过相关法律法规的制定, 建立健全数据要素市场规则,规范数据要素市场秩序, 将更有利于政府进行数字治理, 改善数据市场创新环境[27] 。本文使用数据安全法规数量与数据安全政策量作为数据安全的三级指标。
2.2 模型构建
本文的主要模型构建步骤如下, 其中步骤1 到步骤5 是计算指标权重值的过程, 步骤6 到步骤8是计算地方政府开放数据治理效能综合得分的过程,步骤9 到步骤10 是计算关联度, 找出关键性指标的过程。
3 实证分析
3.1 样本城市选择及指标权重计算
3.1.1 样本城市选择
本文选取上海、北京、贵阳、潍坊、宁波、江门、青岛、滨州、福州、临沂、济南、广州、哈尔滨、德州、成都、武汉这16 个地方政府作为研究对象, 主要原因如下: 其一, 通过现有研究发现,对政府开放数据治理研究多是以省级为粒度, 研究不够具体, 因此文本选择更细粒度的城市政府单位。其二, 这16 个城市中, 按照城市行政等级划分, 包含省级城市、副省级城市、地市级城市; 按照城市规模划分, 包括超大城市、特大城市、大城市、中等城市、小城市; 按照地理位置划分, 包括东北地区、华北地区、华中地区、华南地区、华东地区等。本文选择的样本包含了全国不同城市规模、不同发展水平以及不同地理位置的城市, 因此具备一定的代表性。
3.1.2 指标权重计算
本文中的指标均为正向化指标, 即指标与政府开放数据治理效能之间成正比, 指标数值越大越好。由于各个指标之间的单位不同, 因此在进行权重计算之前, 首先采用极差法进行矩阵标准化, 消除指标之间的量纲影响。如表2 所示, 是使用熵权法计算出的各指标的差异系数及指标权重。使用熵权法确定指标权重能够避免层次分析法等方法的主观性,使结果更加科学客观。
3.2 城市开放数据治理效能综合得分及分档情况
3.2.1 TOPSIS 方法计算综合得分
如表3 所示, 是在熵权法的基础之上使用TOPSIS 方法得到的样本城市的开放数据治理效能综合得分及排序。从表3 中可以看出, 政府数据治理综合能力为: 上海>北京>贵阳>成都>广州>福州>江门>滨州>青岛>哈尔滨>潍坊>武汉>济南>临沂>德州>宁波。表明上海、北京等城市政府数据治理能力强, 在全国数据治理体系改革中发挥了良好的领先作用, 而德州、宁波等几个城市的政府数据治理效能有待提高。上海市政府于2021 年发布《2021年上海市公共数据治理与应用重点工作计划》, 此后一直将数据治理作为政府工作重点, 并且打造了“数源工程” “亮数工程” “聚数工程” “联邦数据治理” 四大数据工程, 推动数据创新, 强化数据治理能力。北京市作为我国的政治经济中心, 着力打造全球数字经济标杆化城市, 强调要建成超大城市政府数字化治理体系, 努力将北京打造成数字治理城市高地, 无论在数据治理、数字政府、智慧城市等数字化发展与治理中, 北京市位居全国领先位置。而反观政府数据治理效能排名较为靠后的几个城市, 根据政府每年的财政投入预算、政府数据开放平台等数据可以看出这些城市在城市数字化建设中投入有所失衡, 不少地方政府在数字化建设中忽略了数据治理的重要性, 对数据治理方面的财政投入较少, 因此造成数据治理效能低下。
3.2.2 秩和比法(RSR)进行分档
使用模糊联合方法将TOPSIS 与RSR 方法结合起来, 能够解决TOPSIS 方法无法对结果进行分档的问题, 提高结果的科学性与全面性。根据上文中计算得出的综合得分C 值, 编秩计算RSR 值, 并且进行分档研究。首先将北京、上海、青岛、哈尔滨等16 个城市的政府数据治理效能综合得分以升序的方式进行排列, 计算累计频率及Probit 值等。将Probit 值作为自变量x, 将RSR 值作为因变量y,得到回归方程: y =-0.367+0.141?Probit。进行F检验后得出: F= 197.769, P<0.001, 这说明水平呈现显著性; R2= 0.934, 这说明拟合度高, 模型表现较为优秀。
如表4 所示, 是样本分档结果。按照分档最佳原则, 结合秩和法得出的第一档、第二档、第三档进行科学划分, 将地方政府数据治理效能分为一般、中等、良好这3 个档次。从表4 中可以看出地方政府整体数据治理效能较好, 在第一档中, 只有宁波1 个城市, 而宁波市在政府数据开放与平台建设方面表现较好, 这说明宁波市在政府数据开放过程中忽略了开放数据的治理问题, 这也是今后需要尤其注意的方面; 政府数据治理效能为良好的城市有上海、北京与贵阳这3 个城市; 其余城市均为中等。
3.3 灰色关联度法确定关键因素
将测度出的地方政府数据治理效能综合得分作为母序列, 将各个评价项作为子序列, 使用灰色关联度模型, 计算得到各个评价项与数据治理效能综合得分之间的关联度, 由此找出影响本文效能评估的关键因素。如表5 所示, 是各个指标与政府数据治理效能之间的关联度大小及排序, 从表5 中可以看出, 关联度最高的是数字政府发展水平, 其次是数据开放效率, 最后是开放数据用户权利。
4 综合结果分析
從表3 的TOPSIS 综合得分与表4 的秩和比分档排序中得到, 上海、北京、贵阳这3 个城市的政府开放数据治理效能得分最高, 档次为良好。从3个城市的基本情况可以分析出这3 个城市综合得分高的原因有: 首先, 数字政府发展水平较高。根据《中国数字政府发展指数报告(2022)》, 北京市数字政府发展水平为78.53、上海市78.87、贵阳市74.04, 3 个城市的数字政府发展水平均位于全国前十。其次, 政府数据开放水平高。这3 个城市均有独立的政府数据开放平台, 上海市的政府数据开放平台在全国起步最早, 北京与贵阳市紧随其后,政府在数据开放平台公布数据量大, 透明度高, 元数据完整, 并且数据的及时性、准确性较高。最后,数据开放环境好。北京、上海、贵阳出台的针对数据治理的数据安全法规数量分别为27、18、19,数据治理政策文件数分别为3768、634、501, 无论是法规数量还是政策文件数量, 在全国均处于领先位置。政府使用自身的行政手段与立法手段为数据治理提供了一个良好的环境。
政府开放数据治理效能处于二档即中等的城市有成都、广州、福州、江门、滨州、青岛、哈尔滨、潍坊、武汉、济南、临沂、德州这12 个城市。对这12 个城市进行分析发现, 这些城市能够位于中等的共同原因有: 首先, 政府部门领导的重视。在这12 个城市中, 只有成都未设立大数据管理局,其余城市均设立了专门的大数据管理局, 并且只有哈尔滨的大数据管理局是事业单位, 其余均为行政单位, 隶属国家机关, 更加有利于对数据的监管治理。其次, 政府积极探索政府开放数据治理方面的政策法规, 建设数据治理红线。通过《北大法宝》以及政府官网, 检索这些城市关于数据治理的相关政策与法律, 可以看到不少政府部门正在努力推进政府数据立法及发布相关政策, 指导本地的政府数据开放共享, 如《武汉市公共数据资源管理办法》《青岛市公共数据开放管理办法》等。最后, 政府数据开放水平较高。根据《开放树林指数(2022)》显示, 这12 个城市的政府数据开放水平在全国整体城市中位居前列, 尤其是广州、武汉、青岛、潍坊、德州这几个城市, 政府数据开放水平较高。
宁波的政府开放数据治理效能相较于样本中的其他城市来说较低, 数据开放治理效能一般, 距离效能良好城市来说存在一定差距。在前期的研究中,发现宁波的政府开放数据效率在所有样本城市中排名为11, 比大多数的中等城市的政府开放数据效率要高, 但是宁波的政府数据开放治理效能较低。这可能是宁波政府在数据要素化资源分配过程中出现了资源失衡的状况, 还没有充分认识到数据治理的重要性, 在政府数字化建设中侧重点有所偏差。
5 结论与建议
尽管北京、上海、贵阳城市政府开放数据治理水平处于优档, 但是存在着诸如数据治理创新度不够, 部门协调不够, 机制不够完善等问题, 因此可以做出以下调整: ①在数据治理过程中坚持数据赋能实现治理创新, 构建数字化新时代数据治理创新模式。政府在开放数据治理过程中要进一步加强新兴信息技术的应用, 将技术应用数据治理过程中的采集、组织、分析、提供应用等各个方面, 加强数据深入挖掘与共享, 以数字化技术带动数据治理创新, 推动数据治理能力与治理体系现代化; ②加快构建数据要素市场, 推动数据确权。我国的数据要素市场发展处于高速阶段, 但是数据作为生产要素在流通中仍存在各种问题, 如数据的权责使用不清晰。因此要深入推动数据确权, 政府要发挥领导、治理与规范的作用, 明确数据安全底线与数据监管红线, 打造监管有效、安全可信的数据要素化市场环境; ③完善政府数据治理体制机制, 为政府数据治理提供制度保障。政府要建立健全数据治理过程中的数据使用机制、共享机制、保护机制等, 将数据治理作为诸多数据工作所串联起来的一套完整的运行机制。
对于中等城市来说, 其政府数据开放治理效能仍有较大的改进空间, 因此作为中等城市来说, 应该做到: ①明确政府主导作用, 强化开放数据治理主客体之间的相互关系。在政府数据治理过程中,要始终坚持政府的监管者与立法者的身份, 地方政府作为数据治理的主体, 应该在制度、政策、法律、机制、标准等方面开展工作, 为数据治理建立健全规则秩序与框架体系; ②加强数据人才培养, 为政府数据治理提供人才保障。在中等城市中, 有类似于江门、潍坊、德州这类城市的数字化人才储备量不足, 同时掌握数据统计、政府管理、现代技术的综合型人才较少, 因此这类城市一方面要重视教育,加大人才培育力度; 另一方面, 要制定相关优惠政策, 进行人才引进; ③优化政府数据治理模式, 实现政民共治。数据治理并不是数据要素与政府职能的简单结合, 而是在政府数据工作中, 要将数据治理相关理念融合嵌入进去, 激发社会力量, 以公民为治理中心, 以政府为治理主导, 建立多元主体治理模式。
对于政府数据治理效能一般的这类城市, 政府首先要做好数据治理相关基础工作, 提高政府开放数据治理效能, 应该做到: ①优化打造政府数据开放平台, 开通政务微博等官方账号。政府数据开放平台是数字政府建设的基础, 政府数据治理效能的提升有赖于数字政府水平的提升, 因此对于数据治理效能一般的城市来说, 要以平台为基础, 提高政府数字化水平; ②增强政府开放数据治理认知理念, 突破原本数据治理认知局限。首先正确认识数据资源在经济建设、社会发展、政府治理等方面的作用; 其次, 对政府工作人员进行数据知识培训,加强政府工作人员数据知识建设, 加强数据知识建设有利于建设相关数据标准, 深入挖掘高质量数据信息, 释放政府数据治理潜力; ③加大信息技术应用, 政府开放数据治理以信息技术为支撑如北京、广州等数据治理效能较高的城市采用城市“数据资产” 整合的方式, 搭建跨应用、跨行业的数据底座, 为城市治理、科学建设等提供有力支持。对于这类城市来说, 要以数据治理效能高的城市为借鉴, 结合自身优势,使用现代化新兴信息技术, 促进政府数据治理。