李琰
[提要] 本研究依据政府开放数据评价指标体系,通过采集甘肃地方政府开放共享平台的各类观测数据展现目前甘肃省开放数据工作进程与态势;从影响政府开放数据共享的多个层面给出对策和建议,从而助力政策研究、技术投入、标准建设与服务应用。
关键词:政府数据;评估指标;开放共享
本文系中共甘肃省委党校创新工程2018年科研支撑项目阶段性成果
中图分类号:D63 文献标识码:A
收录日期:2019年12月30日
政府数据是国家所拥有的关键战略资源,是建设信息社会、发展数字经济的核心基础。政府数据是社会的公共资源,在支撑履行政府职能、保障公共安全、实施社会治理、支持重大决策和改进公共服务等方面发挥出越来越重要的作用。政府数据开放共享成为近年来国内外政府、社会组织、企业和学者高度关注的热点问题之一。
一、甘肃地方政府数据开放现状
本文通过参照国内外各类政府开放数据评估指标体系,然后将其分为数据层、平台层和准备层三个基本指标,依此建立基础评估框架。然后通过搜索甘肃地方政府相关法律法规、政策文件、新闻报道、开放数据集、数据标准、数据规范等各类信息来完成研究数据收集。最后将所采集并整理后的数据纳入相关指标体系。在此基础上对评估结果进行分析并给出对策建议。
本文的研究对象来源于甘肃省各级地方政府数据开放共享平台,通过收集和分析其原始数据能来获取所在地区的政府数据开放共享工作的现状。按照关键词“城市名称+数据”、“城市名称+政府数据”、“城市名称+开放数据”、“城市名称+大数据”、“城市名称+信息共享”、“城市名称+数据资源”在百度搜索引擎中进行搜索,筛选出甘肃省内各地方政府数据开放网站。其中地方政府行政级别为地级市,网站域名应归属于gov.cn,因其权威性足以作为地方政府数据开放平台的认定依据。各个地级市下属部门建设开放数据平台不在本研究的调查范围内。严格意义上的政府开放数据共享应该主要是以结构化数据为载体。考虑到甘肃省的具体情况,此次研究也把平台中“信息公开”“数据发布”等栏目的非结构化数据纳入研究范围。指标体系如表1所述。数据均以人工观察法来采集汇总,对采集到的数据使用描述性统计分析、文本分析等方法进行研究。(表1)
数据层的评估结果显示:(1)43%的政府数据开放共享平台提供的数据类型是纯粹的办公文档、XML、HTML、各类报表、图片和音频、视频信息;57%的平台提供了结构化数据,但是数据较少,主题集中于部门决算、水质报告等非常有限的几个主题。结构化数据质量高,再利用难度低,有利于大数据多源数据融合,是数字经济时代最重要的燃料。非结构化数据是政府部门各类数据的主要存在形式,易于生成,但难以再利用,难以整合到其他数据资源形成大数据资产。(2)数据平台建设需要关注数据的质量,其标准化的程度直接影响其复用和互通性。元数据标准规范了元数据描述方式,增强对数据的理解和发现,促进数据共享和互操作。研究发现仅36%的平台具有元数据标准,而相关数据的元数据内容较为单一,难以体现数据集的内在特征。尽管某些地方制定了数据编目,但是所有平台都没有公布所遵循的数据编目规范内容。(3)将平台“信息公开”栏目中所包含的有分类栏目的关键词和描述信息汇总,导入词云文本分析工具,结果如图1所示。词云分析对出现频率较高的关键词予以视觉上的突出。由图可见,“预算”、“安全”、“职能”、“采购”、“资源”和“法规”出现的频次最高,其后“药品”、“环境”、“就业”、“食品”等词也有较高的出现频次,反映了各地开放的数据集的内容及其主题分布。本研究还发现定西市在共享平台上提供了定西中药材价格行情结构化数据集,助力打造“中医药都”的目标。临夏州提供了蔬菜价格行情结构化数据集,致力改善民生。(图1)
平台层评估结果显示:(1)各平台最基本的分类导航和搜索功能均已实现,但更高效的排序功能只有4个平台提供;提升数据影响力的链接分享功能只有3个平台提供;主要数据汇集在一处以供访问的“数据发布”栏目也仅有4个平台实现;没有一个平台能够提供数据发布者联系方式。这反映了平台建设未能把数据增值再利用作为主要设计目标。(2)各平台最基本的分类导航和搜索功能均已实现,但更高效的排序功能只有4个平台提供;提升数据影响力的链接分享功能只有3个平台提供;主要数据汇集在一处以供访问的“数据发布”栏目也仅有4个平台实现;没有一个平台能够提供数据发布者联系方式。这反映了平台建设未能把数据增值再利用作为主要设计目标。(3)只有4个平台提供了初级的数据可视化工具,以方便用户在对数据集有基本的了解,帮助非专业的数据利用者直接获取所需。这同样反映了平台建设中仍然没有把数据增值再利用作为主要设计目标。(4)所有平台都提供了数据在线申请和申请结果查询功能,反映平台把用户数据需求放在重要位置予以支持。但是,只有1个平台提供了在线申请的统计情况,这很不利于用户和社会公众的主动数据获取行为以及数据开放共享的社会监督工作。
准备层评估结果显示:(1)在14个平台中仅有6个对于政府数据开放作出规范性要求的法律法规和政策文件;仅有8个市州出台了与开放数据相关的产业政策;很多与数据开放共享相关的政策归属于以“政务公开”为标题的公文之中。(2)仅有4地设立了大数据管理局,其他地方数据开放共享工作基本上是多头管理。共享标准的制定、数据资源的管理、运行与维护以及协调推进信息资源整合及共享,都需要专门机构长期稳定地提供服务。这方面显然存在不足。
研究发现甘肃政府数据共享工作在较短时间内取得了长足进步,基本形成了全省统一、共建共享的政府数据基础设施平台,形成以大数据为支撑的智慧政府体系,基本建立政府数据共享交换体系和共享机制。省级政府部门和市州政府开放数据全部接入甘肃政务服务网。各级行政机关和公共事业单位按照规定逐渐通过政务信息资源共享平台提供、获取、使用政府信息。政务信息化建设日趋完善,信息惠民切实推进,地方政府治理体系和治理能力逐渐现代化。软硬件基础设施建设加速进行,信息通信网络基础设施、云计算数据中心、政务数据和公共服务数据应用系统平台以及政府数据统一共享交换平台都在陆续投入使用。多个地方政府数据平台走出了自己的特色之路:(1)兰州市在开放共享政策法规制定、数据资源编目以及组织机构保障上做出了表率,兰州市大数据管理局入选2017年中国十大数据管理局,2019年荣获了“2019中国政府信息化管理创新奖”。(2)定西市在共享平台上提供了定西中药材价格行情结构化数据集,助力打造“中医药都”的目标。临夏州提供了蔬菜價格行情结构化数据集,致力改善民生。(3)天水市、张掖市和定西市在平台上提供了数据可视化工具,表明政府开始自发地从社会和应用价值看待数据。
二、甘肃地方政府数据开放存在的主要问题
数据层的评估结果显示开放共享情势与《国务院关于印发促进大数据发展行动纲要的通知》、《甘肃省促进大数据发展三年行动计划(2017-2019年)》中“推进公共机构数据资源统一汇聚和集中向社会开放,制定政府数据共享开放目录。通过政务数据公开共享,引导企业、行业协会、科研机构、社会组织等主动采集并开放数据”的目标存在着明显差距。这既与数据开放共享建设的发展阶段和实施顺序有关,也与各地政府尚未真正把握开放数据的内涵有关,反映到工作实际就是将政务信息公开与数据共享混为一谈。在14个平台中有6个平台没有提供任何形式的結构化数据;因缺乏统一的标准,数据虽然量大但质量不高,可利用价值低;有9个平台没有任何元数据信息,剩下的5个平台元数据标准非常粗糙,难以反映数据集内在特性;开放数据都保存于“信息公开”栏目下以信息文本形式存在。少部分数据以结构化形式存在,但经常局限于部门决算表等有限主题领域;虽然有数据共享管理的政策法规,但在推进开放政务数据方面流于形式。
从准备层的评估结果来看,省内各地差异较大,总体水平不高,在政策法规和组织保障方面较为薄弱。仅有6个市州有规范性要求的法律法规和政策文件。仅8个市州出台了与开放数据相关的产业政策;很多与数据开放共享相关的政策归属于以“政务公开”为标题的公文之中。政策法规是决定政府数据开放成败的重要因素。配套的大数据产业政策在数据中心建设、产业培育、数据资源的增值再利用上,都是推进数据开放工作的关键要素。只有4地设立了大数据管理局,其他地方数据开放共享工作基本上是多头管理。无论开放共享标准的制定、数据资源的管理、运行与维护以及协调推进信息资源整合及共享,都需要专门机构长期稳定地提供服务。
从平台层的评估结果来看,平台最基本的分类导航和搜索功能均已实现,但是对于更高效发现数据的排序功能只有4个平台提供;更高效推广数据的链接分享功能只有3个平台提供;主要数据汇集在一处以供访问的“数据发布”栏目也仅有4个平台实现;没有一个平台能够提供数据发布者联系方式;只有4个平台提供了数据可视化工具,以方便用户在对数据集有基本的了解,帮助非专业的初级数据利用者直接获取所需;仅有1个平台提供了在线申请的统计情况,这不利于用户和社会公众的主动数据获取行为以及数据开放共享的社会监督工作。
三、对策建议
(一)加快推进公共数据资源开放。制定公共机构数据开放计划和时间表,落实数据开放和维护责任,鼓励社会监督,稳步推动公共机构数据资源统一汇聚和集中向社会开放。厘清政府部门、事业单位等公共机构数据资源清单,制定实施政府数据开放共享标准,依托现有政务平台,优先从密切涉及民生的领域、经济社会效益潜力较大的领域着力,优先推进重点领域和重点地区公共信息资源开放,逐步拓展广度和深度。
(二)健全组织保障。建立数据开放共享主管部门,彻底落实中央和省市信息化建设重大决策部署;研究拟定并组织实施信息化社会服务、智慧城市建设等大数据发展规划和政策措施,会同有关部门研究组织实施信息产业政策规划;负责组织制定相关标准规范;负责协调推进全市信息资源整合及共享;负责大数据产业、信息产业促进等工作的指导、监督和考核。这是政府数据开放重要的组织基础。
(三)加快制定法规政策。对政府数据开放各环节制定规范性要求的法律法规和政策文件,提高数据开放共享法规政策的效力等级和专门性,积极制定大数据产业政策,充分运用国家标准、行业标准,编制公共数据清单和数据目录管理规范,制定公共数据采集、归集、整合、共享、开放、应用和数据质量管理的相关标准规范,实现公共数据全生命周期的规范化管理。
(四)积极推动数据再利用。加强宣传和政策支持引导,积极营造全社会广泛参与和开发利用公共信息资源的良好氛围。以政府专项资金扶持、数据应用竞赛等多种方式,吸引企业和个人利用开放数据开展创业创新,促进大数据产业发展。培养一批有实力的机构和个人利用开放数据开展应用示范来带动各类社会力量开展数据增值开发。
主要参考文献:
[1]刘新萍,肖鑫,黄奕奕.中国地方政府环境数据开放的现状、问题与对策:基于国内部分省市开放数据平台的分析[J].电子政务,2017(9).
[2]郑磊,韩笑,朱晓婷.地方政府数据开放平台研究:功能与体验[J].电子政务,2019(9).
[3]张勇进.我国地方政府数据开放现状研究[J].中国行政管理,2016(11).
[4]周文泓.我国省级政府开放数据的进展、问题与对策[J].图书情报知识,2017(1).
[5]谭必勇,陈艳.我国开放政府数据平台数据质量研究——以十省、市为研究对象[J].情报杂志,2017(11).