地方公共数据政策量化评价研究

2023-08-14 16:02:06何林莹马海群
现代情报 2023年8期
关键词:公共数据变量政策

何林莹 马海群

摘 要: [目的/ 意义] 旨在通过对现有地方公共数据政策的量化评价, 为后续政策的制定提供参考和借鉴。[方法/ 过程] 本文首先基于25 项地方公共数据政策文本, 通过ROSTCM6 提取高频关键词, 在已有评价指标体系的基础上, 更细粒度地构建了地方公共数据政策的PMC 指数模型。其次对10 项政策样本进行量化评价, 得出各样本的PMC 指数值, 并据此绘制PMC 曲面图, 以更直观地了解各政策样本的优劣情况。[结果/ 结论] 结果显示, 地方公共数据政策整体尚可, 5 项良好, 5 项可接受, 在政策领域、性质、政策部门、内容方面表现较好,需要在政策工具、效力、评价等方面加以改进。

关键词: PMC 指数; 地方公共数据; 公共数据政策; 政策量化评价

DOI:10.3969 / j.issn.1008-0821.2023.08.002

〔中图分类号〕G201 〔文献标识码〕A 〔文章编号〕1008-0821 (2023) 08-0014-13

数据作为一种战略资源, 已得到国家高度重视。尤其关于公共数据资源的开发利用, 始终在国家层面的政策中占有一席之地。2015 年8 月31 日国务院颁布《促进大数据发展行动纲要》, 将稳步推动公共数据资源开放作为主要任务之一。2020年4 月9 日我国颁布《中共中央、国务院关于构建更加完善的要素市场化配置体制机制的意见》, 指出加快培育数据要素市场, 研究建立促进企业登记、交通运输、气象等公共数据开放和数据资源有效流动的制度规范。2021 年3 月13 日颁布的《中华人民共和国国民经济和社会发展第十四个五年规划和2035 年远景目标纲要》中, 再次提及要加强公共数据开放共享, 建立健全国家公共数据资源体系。国家的重视, 推动着地方近年公共数据政策的相继出台。这些地方性的公共数据政策在制定方面有何特点? 涉及内容是否完备? 文本通过构建PMC 指数模型对10 个地方公共数据政策进行评价分析,以了解各项政策的优缺点, 为后续此类政策的设计提供参考和决策支撑。

1 相關文献回顾

对国外相关研究文献的梳理主要从以下两点进行, 一在信息政策评价上, 研究集中于评价体系和模型的构建, 例如Chung[1] 认为, 为了保持信息政策评价体系的合理性, 实现与政府绩效评价体系的衔接, 需要将政策规划、评价和预算过程联系起来,从而提出信息政策评价的综合组织体系; Kim[2] 通过比较两个国家空间信息政策来分析评价体系的变化; Kuan 等[3] 在对国家空间信息政策现状分析的基础上, 构建了该领域政策的评价模型。二在政策文本分析的方法上, 国外研究一方面侧重使用文本挖掘法发现政策讨论的重点问题、分析政策变化和趋势[4-6] 以及评估政府的预测行为[7] ; 另一方面集中于使用社会网络分析法研究政策中的关键概念[8] 、问题[9] 、利益相关者之间的关系[10-12] 等。此外Ber⁃jani D 等[13] 结合话语分析对不同地区的创业政策进行了比较分析; Linder F 等[14] 提出了一种算法来衡量两项法案所提出的政策建议的相似度并进行了实证研究; Debnath R 等[15] 论证了主题模型和扎根理论的嵌套应用在能源政策研究中的潜力。

对国内相关文献的回顾, 着重于数据政策文本的分析。关于数据政策评价的研究开展较少, 马海群等[16] 运用结构功能主义理论, 通过层次分析法建立了期刊数据政策评价体系。分析数据政策文本,通常从定性和定量两个方面进行。在定性研究上多是从政策工具视角出发, 进行文本的分析解读和研究框架的构建。例如李樵[17] 建立了三维的政策工具分析框架, 得出我国大数据政策工具选择中存在的问题并提出建议。刘亚亚等[18] 构建了“政策工具—政策主题词” 二维分析框架, 对2000 年以来国家层面有关的大数据政策文本进行内容梳理。吴杨[19] 运用政策工具和政策网络的研究方法, 得出我国大数据政策在文本内容上存在政策工具使用不当、政策文本与现实问题有所偏差等问题, 并提出了完善大数据政策的技术路径。陈慧等[20] 通过对58 份国务院及各部门的政务大数据政策中表达价值取向的主题进行编码分析, 构建了政治、经济、社会、生态、科技5 个维度的价值取向总体框架。沈慧煌等[21] 基于政策工具视角对我国健康医疗大数据政策文本进行编码分析。在定量研究上, 张涛等[22] 以文本相似度为视角对国家和地区发布的大数据政策文本进行了比较研究。洪伟达等[23] 从政策强度、政策目标、政策工具3 个维度设计了政策量化标准, 构建了政策协同度的度量标准, 以此对开放政府数据政策的协同度进行了分析。

近年来, PMC 指数模型在各个学术领域已成为评价政策的一种有效方法[24] , 有研究学者基于PMC 指数模型分别对长江经济带绿色发展政策[25] 、新能源汽车产业政策[26] 、先进制造业发展政策[27] 、智慧养老产业政策[28]等各个领域的政策本文进行了定量分析, 以为该领域政策的优化提供可靠性依据。

PMC 指数模型的应用, 丰富了国内数据政策的评价研究。胡峰等[29] 、周海炜等[30] 、沈俊鑫等[31] 分别对中央国家机关发布的11 项大数据政策, 8 项包含国家级、省市级和地方级的大数据发展政策, 贵州省发布的8 项大数据政策进行了评价分析。

综上可知, 关于数据政策领域的研究, 相较而言更集中于国内。我国数据政策文本的分析对象广泛, 既有开放政府数据政策, 也有健康医疗大数据政策、科研数据政策等。国内虽已有基于PMC 指数模型进行的数据政策评价研究, 但在政策层级和研究对象上, 缺少地方之间公共数据政策的横向比较。因此, 本文共收集了25 项地方公共数据相关政策(包括条例、办法、规定), 通过文本挖掘和借鉴前人研究成果构建了地方公共数据政策的PMC 指数模型, 然后选取10 个政策样本进行评价分析, 绘制出各自PMC 曲面图, 进而提出参考性建议。

2 地方公共数据政策PMC 指数模型构建

PMC 指数模型(Policy Modeling Consistency In⁃dex)即政策一致性指数模型, 是一种定量的政策评价分析方法, 源于Ruiz Estrada M A 等[32] 提出的“Omnia Mobilis” 假设, 在该假设下, 万事万物都是运动的、相互联系的, 任何一个变量都同等重要, 因而在政策建模中, 应该包括广泛的变量而不是忽略任何相关变量[33] 。

2 1 研究方法

PMC 指数模型既可以对政策样本的一致性水平进行判定, 也可以多维度地分析政策样本的优劣情况。构建PMC 指数模型主要有4 个基本步骤: 变量分类参数识别、建立多投入产出表、测量并计算PMC 指数、生成PMC 曲面图[34] 。

2 2 文本收集与预处理

本文以“政务数据” 或“公共数据” 为标题在“北大法宝” 进行检索, 删除1 个已失效政策,共得到3 个地方性法规和22 个地方政府规章。将其整理后导入ROSTCM6 软件数据库进行文本挖掘, 根据分词结果进行词频统计, 过滤掉“应当”“以上” 等无意义的干扰性高频词, 最终确定公共数据政策的高频词汇并据此生成词云图, 如图1 所示, 绘制出社会网络图谱, 如图2 所示, 本文选取了排名前50 的高频词进行展示, 如表1 所示。直观地显示了公共数据政策文本中的核心词汇及其联系结构, 从而为后续确定二级变量提供了依据。

本文依据政策效力大小和出台部门行政等级高低选取了标题带有“公共数据” 的10 个政策作为评价样本, 如表2 所示。前3 个为地方性法规, 后7 个为地方政府规章。包含3 个市级政策, 分别为沈阳市、成都市、武汉市; 7 个省级政策。

2 3 构建地方公共数据政策PMC 指数模型

2 3 1 设定政策变量与参数

在变量的设置上, 一般由若干个一级变量和不受数量限制的二级变量组成, 一级变量没有固定的排列顺序且相互獨立, 二级变量构成一级变量, 各二级变量权重相等[30] 。本文基于Ruiz Estrada M A等[33] 和已有文献中学者[29-30,35] 对于大数据发展政策评价的既有指标, 确定了政策性质、政策效力、政策工具、政策领域、激励措施、政策内容、政策受众和政策干预8 个一级变量, 并特设了政策部门这一一级变量以更具体的了解政策中职责分工的情况。

为了更细粒度地展示政策内容, 本文根据数据采集、储存、整合、使用、应用、归档销毁的生命周期, 对应高频词汇在一级变量政策内容中分别设置了对应的二级变量。数据安全始终是影响数据开放利用的一个重要因素, 数据监督、分类分级、风险评估、监测预警、应急演练是数据安全的制度保障; 脱敏是数据安全的技术保障。数据交易、数据权益、数据资产对于数据市场的发展不可或缺。数据平台、大数据中心、数据库属于公共数据的基础设施建设。

基于上述步骤, 本文最终确定了9 个一级变量和61 个二级变量, 如表3 所示。除政策效力中的变量外, 其余所有二级变量参数值设为二进制的0和1, 即如果政策文本包含评价指标对应内容, 计为1 分, 如果不包括则计为0 分。为了区分政策效力的强度, 采用赋值法, 政策文本属于法律文件的计1 分, 行政法规计0 75 分, 地方性法规计0 5分, 规章计0 25 分。地方公共数据政策评价指标体系及评价标准如表4 所示。

2 3 2 建立多投入产出表

多投入产出表是一种可供选择的数据库分析框架, 允许储存大量数据来度量单个变量[33] 。根据上文确立的评价指标体系、标准及参数设定, 采用文本挖掘法确定二级变量的取值, 最终建立10 项政策样本的多投入产出表, 如表5 所示。

2 3 3 计算PMC 指数

根据表5 的多投入产出表, 首先计算每个待评价政策的一级变量。如式(1) 所示, 一级变量得分为二级变量得分加总除以二级变量的数量, 该值严格介于[0,1]之间[36] 。然后根据式(2) 将待评价政策各个一级变量值加总计算出PMC 指数。参照Ruiz Estrada M A 的政策等级划分标准, PMC 指数在8~9 之间, 政策等级为完美; 在6~7 99, 等级为良好; 4~5 99, 等级为可接受; 0~3 99, 政策等级为不良。经计算, 10 项地方公共数据政策样本的PMC 指数、排名及等级如表6 所示。

2 3 4 绘制PMC 曲面图

PMC 曲面图是基于9 个一级变量的值来构建的对称曲面, 可以在多维坐标空间上直观地显示每个政策样本的优缺点。本文结合表6, 将9 个一级评价指标绘制成3×3 的矩阵, 具体矩阵计算方法如表达式(3) 所示, 最终绘制出PMC 曲面图,如图3 所示。

3 评价结果分析

根据表6 的PMC 指数结果分析, 可知10 项地方公共数据政策评价等级均在可接受以上, 其中5项政策处在良好, 没有完美等级的政策, 说明整体而言, 政策文本的设计和制定还有很大的提升空间。

3 1 整体评价结果分析

10 项地方公共数据政策的PMC 指数排名从高到低分别为P3>P8>P7>P4 = P9>P5>P6>P1>P2>P10, 本文绘制了10 项政策的PMC 指数折线图,如图4 所示。其中前3 项为地方性法规, 按时间顺序排列, 可以看出P3 为最新发布的法规, 其得分明显高于前两者。后7 项为地方政府规章, 其波动较大, 时间越近的政策得分反而有所下降, 说明在政策的制定上并未出现向好的趋势。

从一级变量来看, 如图5 所示, X4 政策领域、X1 政策性质、X5 政策部门、X7 政策内容、X8 政策受众、X9 政策干预表现较好, X2 政策效力、X3政策工具、X6 政策评价较差。

政策领域中, 涉及经济领域的, 通常是培育和完善数据要素市场, 建立数据交易平台引导市场主体进行数据交易, 以开发利用公共数据, 提升数据资源价值。结合政策内容中有关经济的二级变量数据交易、数据权益、数据资产来看, P8 最为完备,是10 个政策样本中唯一提到数据资产的, 指出应当建立健全公共数据资产登记管理制度和动态管理机制, 由公共管理和服务机构负责登记本机构公共数据资产。另外, 表现较好的为P7, 虽未明确提及数据资产该名词, 但列明开发利用公共数据所获得财产权益受法律保护。且P7 中具体列举了为市场主体提供服务的方式, 例如提供数据分析模型和算法、以统一标准输出数据产品或服务、鼓励利用公共数据创新创业活动等。相比之下, 其余政策样本在该领域的表述较为粗略。在技术领域中, 主要涉及采取身份认证、访问控制、数据加密、数据脱敏、数据溯源、数据备份、隐私计算等技术措施,提高数据安全保障能力, 如P3。其次, 政策中多数划定了优先开放的与民生社会、数字发展密切的公共数据领域。

结合政策性质、政策干预, 因公共数据政策重在监管, 所以多为命令控制型干预, 缺乏经济激励措施, 虽有引导性的表述, 但内容较为笼统。在描述上, 多有与公共数据相关定义的解释, 方便群众理解。政策评价中主要缺少目标的设定。

政策部门和政策受众中, 前者政策中通常会涉及3 个以上的部门, 设有公共数据主管部门, 在数据安全、数据保密上需要与网信、公安、保密等部门进行配合; 后者鼓励高校院所、科研机构、企事业单位就公共数据开展研究利用。政策部门上得分较低的P10 中, 只涉及大数据工作主管部门, 未见其他部门配合, 虽然政策内容涉及数据安全和保障, 但职责分工并不清晰。在政策受众中, P1 得分最低, 其受众范围较窄, 仅涉及企业一类。

在政策内容上, 依据数据生命周期, 多集中前期, 即数据的采集、整合、储存、开放、利用, 在后期数据归档销毁上, 涉及内容较少。多数政策样本在分类分级、风险评估、监测预警、应急演练的数据安全制度都有涉及, 在数据质量上失分较多。除了政策效力外, 政策工具得分最低, 说明政府对公共数据在市场化、产业化的发展上支撑力度远远不够。虽然各政策样本均提及制度标准, 但我国尚未制定国家层面的公共数据标准体系, 地方标准在制定上依据并不充分。政府在资金投入、金融税收等政策工具的使用上需要加强。

3 2 单项政策评价结果分析

3 2 1 良好等级的政策评价

P3 的PMC 值位列第一, 其对应《浙江省公共数据条例》, 在X5 政策部门、X9 政策干预中均为满分, 除X4 政策领域未达到均值外, 其余均超过均值, 说明其在政策的制定上较为完备。较其他同比政策, P3 的X3 政策工具上, 得分最高, 除金融税收外, 其余7 个工具均有提及, 鼓励政府部门通过资金扶持、购买协议、补助奖励等形式提高公共数据开发应用, 产业化发展。因其在X4 政策领域上未明确优先开放的公共数据领域, 在X6 政策评价中未明确政策制定的依据, 在X8 政策受众上未提及高校院所, 因而失分, 未来在这方面可以进行优化改进。

P8 的PMC 值位列第二, 对应《江苏省公共数据管理办法》, 在X4 政策领域、X8 政策受众、X9政策干预中均为满分, 其中唯一低于平均值的是X2 政策效力, 其余方面表现均较好。P8 中特别提及, 鼓励地区部门探索利于公共数据的创新举措,出现失误、偏差予以免责或减轻责任, 为公共数据的开发利用提供了良好的政治环境。

P7 的PMC 值位列第三, 对应《广东省公共数据管理办法》, 在X5 政策部门上满分, 在X7 政策内容上接近满分。同P8 一样, 两者均为地方规章,在X2 效力上得分较低。X4 政策领域未提及环境,X9 政策干预缺少经济激励, 优化路径X2-X4-X9。P4、P9 的PMC 值一样, 均为6 225, 分别对应《成都市公共数据管理应用规定》《江西省公共数据管理办法》。P4 在X8 政策受众上满分, 说明政策覆盖范围较广。X1 政策性质、X2 政策效力、X7 政策内容、X9 政策干预上均低于平均值, 缺少监督数据、监测预警、脱敏技术、数据质量等数据保障的具体内容, 缺乏经济上的激励, 优化路径X2-X1-X7-X9。P9 在X4 政策领域上满分, X7 政策内容上得分也较高, 在X3 政策工具中失分较多,8 個工具中只涉及3 个, 说明在公共数据的应用发展上, 政策实际上给予的支持力度较少, 不利于积极性的调动。优化路径为X3-X2-X9。

3 2 2 可接受等级的政策评价

P5 对应《上海市公共数据开放暂行办法》, 在X8 政策受众中取得满分, 在X6 政策评价中没有得分。首先, 政策中没有标明制定本办法的具体依据, 其次未见目标的设定, 这也是多数政策文本中缺少的一点, 仅P3 和P6 中含有将公共数据发展和管理工作作为年度政策目标责任制考核的内容。在规划详实中, 多数政策有政府回复日期的具体限制, 例如P1 中针对有条件共享的政务数据资源,需求部门申请使用, 提供部门应当在申请之日起5个工作日内予以答复。P5 中并无此类具体规定。此外, X2 政策效力、X4 政策领域、X9 政策干预均低于均值, 优化路径为X6-X2-X4-X9。

P6 对应《武汉市公共数据资源管理办法》, 只有X1 政策性质、X6 政策评价高于平均值, 其余7个一级变量均低于均值, 优化路径为X8-X5-X3-X7-X1-X4-X9。

P1、P2 在X4 政策领域表现较好, 但政策工具使用少、干预方式单一、政策内容缺失严重、政策受众范围小, 因此得分较低, 二者优化路径分别为X8-X9-X7-X1、X3-X8-X6-X5-X7-X4-X9。P10 的PMC 指数最低, 除了X1 政策性质、X8政策受众外, 其余的7 个变量均低于平均值。首先其在X5 政策部门上, 只涉及大数据工作主管部门,没有其他部门的分工责任; 在X3 政策工具中, 只有科技、标准两项得分, 其余6 项均为0。X6 政策内容上没有数据采集、汇聚、监督预警、应急演练等相关规定, 优化路径为X5-X3-X7-X6-X2-X4-X9。

4 结论与建议

本文通过对25 项地方公共数据政策的文本挖掘, 在以往研究的基础上, 通过设置更细粒度的二级变量, 构建了地方公共数据政策的PMC 指数模型; 深度剖析比较了10 项地方政策文本, 利用PMC曲面图直观地展示了各项公共数据政策的优劣现状, 并给出各自优化路径。

通过上文评价分析, 可以得出如下结论: 其一, 10 项地方公共数据政策PMC 均值为5 92, 总体等级为可接受, 没有出现不良等级。其中浙江、江苏、广东的公共数据政策在内容上较为完备,PMC 指数得分较高。其二, 从一级变量来看, 政策效力、政策工具、政策评价得分较低, 原因在于:①本文研究对象为地方公共数据政策, 本身效力存在一定限制; 就整体而言, 只有政策样本中山西省、浙江省、沈阳市, 以及除此之外的抚顺市的公共数据政策为地方性法规, 其余已颁布公共数据政策的省市尚未将该政策上升至法规层级, 政策效力的发挥有限; ②评价指标中所列的8 种政策工具,平均每个政策样本涉及4 种, 尤其在金融税收上,10 个样本均未提及; ③政策评价中绝大多数样本缺少具体目标的设定。其三, 从二级变量来看, 在政策内容上, 失分点主要为数据资产、数据交易、销毁封存、数据质量; 经济干预上, 激励缺失严重; 政策受众方面, 高校院所及其他涉及较少。

对此, 本文提出以下建议。一是在地方上, 加强对公共数据的重视, 加快立法进程; 在国家层面上, 出台专门的公共数据政策, 加大政策效力; 在全国范围内统一各项标准, 使地方政策在制定和完善上有法可依。二是提高政策工具的配套使用, 加强资金投入、技术供给、人才建设、税收优惠, 健全激励机制。公共数据作为促进经济社会发展的重要生产要素, 如何最大化地发挥其价值, 活跃市场, 形成产业化发展, 是重中之重。在公共数据市场的培育上离不开政府的大力支持, 政府應通过应用创新大赛、经济奖补、容错免责等多种激励方式鼓励引导社会各界对于公共数据的应用, 促进公共数据实现产业化, 为数字经济打好基础。三是根据本地区实际情况, 做好公共数据的发展规划, 分阶段制定相应目标, 加强落实。四是关注数据要素市场化、资产化过程中出现的问题, 积极探索建立数据要素流通规则[37] 、确权和定价制度。通过数据立法, 明确数据权属的主体资格, 明确规定数据的收集、使用、管理权限, 明确各类经营者收集数据的合法途径, 平衡数据利用与数据保护[38] 。五是在数据管理上, 既要重视数据前期的开放使用, 也要重视数据后期的归档处理, 建立健全封存销毁制度, 把好最后一道关卡。在数据质量上, 建立健全数据全流程质量管控体系, 加强数据质量事前、事中和事后的监督检查。六是在受众范围上, 首先加强与高等院所的合作交流, 积极引进人才, 在数据安全保密技术、数据应用场景等方面, 充分发挥其作用进行创新创造。目前, 政策较多涉及公共数据的利益相关者, 如政府、企业、社会团体等, 随着数据市场化的深入, 受众范围应涵盖数据资产化利用进入市场前后产生关系的相关方, 如数据加工方、产品设计方、其他的数据供应商、服务商、平台方、消费者等[39] 。

本文后续研究需要完善的地方: 一是在二级变量的设置上可以更加细致, 例如在内容领域上, 可以增加数据利用方式、利用协议等, 涵盖范围尽量全面。二是扩大政策文本的收集范围, 结合各省市颁布的数据类政策法规文件, 更宏观地分析和呈现公共数据政策的发展与应用状况。

猜你喜欢
公共数据变量政策
公共数据使用的路径探寻
——访工信部信息通信经济专家委员会委员、中国科协决策咨询首席专家王春晖
人民周刊(2023年15期)2023-09-27 07:39:40
制定中国公共数据开发利用法规的建议
政策
房地产导刊(2022年8期)2022-10-09 06:19:34
政策
房地产导刊(2022年6期)2022-06-16 01:28:40
论公共数据管控权的规范建构
抓住不变量解题
也谈分离变量
助企政策
公共数据开放许可的规范建构
政策
华人时刊(2019年21期)2019-11-17 08:25:07