邓桂苗 廖国智
[提要] 地方政府数据开放平台是地方政府数据开放的主要载体,对地方政府数据开放具有重要意义。目前,我国的地方政府数据开放平台还存在数据体量小、数据更新慢、数据检索功能简单、数据下载程序繁杂、用户反馈不足等问题。完善地方政府数据开放平台应坚持以用户为导向,加大数据开放力度、加快数据更新速度、健全数据分类体系、完善数据检索功能、简化数据下载程序、畅通数据沟通渠道。
关键词:地方政府;数据开放;平台建设
中图分类号:D63 文献标识码:A
收录日期:2019年5月9日
地方政府数据开放平台是由各地政府办公厅、经济和信息化委员会或大数据发展管理局等牵头、各政务部门共同参与建设的、集合了经济、教育、交通、医疗等领域数据集的、能为公众提供数据检索、查看、下载、反馈等功能的公开性平台。政府数据开放平台是政府采集数据、开放数据的窗口,也是公众生产数据、获取数据的渠道,是实现政府与公众双向互动的重要载体,是政府数据开放中不可或缺的一部分,因此加快政府数据开放平台建设深受各国政府的重视。
《2018中国地方政府数据开放报告》显示,截至2018年3月,我国已建成46个地方政府数据平台,其中包括北京市、上海市、宁夏回族自治区等建立的8个省级平台,广州市、济南市、武汉市等建立的7个副省级平台及东莞市、中山市、贵阳市等建立的31个地市级平台。笔者鉴于时间、精力及研究条件有限,故综合考量了各地方政府数据平台所在的地理区位、成立时间及行政级别等,分别选取了北京、上海、广东三个省级平台,武汉、青岛、哈尔滨三个副省级平台和贵阳、佛山、苏州三个市级平台为样本,对各平台数据开放的数据集、数据更新情况、数据分类、数据格式等进行调查统计(统计时间为2019年3月26日),从数据用户的角度,分析了九个地方政府数据开放平台中数据数量与更新、数据分类与检索、数据获取与利用及平台与用户的交流互动等四个方面的情况,以探究目前我国地方政府数据开放平台的建设现状。
(一)数据的数量与更新。在数据数量方面,主要的衡量指标是数据集的数量,数据集是由数据组成的集合,有效数据集越多说明开放的数据量越大。在本文选取的九个地方政府数据开放平台中,各平台发布的数据集呈现出较为明显的层次性。广东、贵阳和青岛的数据集超过2,500个,位于第一梯度;武汉和上海的数据集超过2,000个,位于第二梯度;北京、佛山和哈尔滨的数据集超过1,000个,位于第三梯度;苏州的数据集仅有184个,位于第四梯度。其中位于第一梯度的广东的数据集总量达到了位于第四梯度的苏州的数据集总量的17.52倍,二者的数据集差高达3,039个;此外,调查发现,数据集的差异不仅存在于各平台之间,也存在于平台内部之间。以上海市政府数据服务网为例,在该平台中,数据资源开放领域中数据集最多的是经济建设(473个),最少的是信用服务(26个);数据开放部门中数据集数量最靠前的三个部门是市质监局(183个)、市生态环境局(182个)和市交通委(169个),数据集最靠后的三个部门是市公务员局(1个)、市妇联(2个)和市合作交流办(2个)。在数据更新方面,各个平台、各个领域的数据更新频率各不相同,主要的更新频率有月度、季度、半年度、年度、不定期等,最近更新时间各不相同,其中武汉、佛山、苏州的最近更新时间还停留在2018年。
(二)数据的分类与检索。目前,我国的地方政府数据开放平台都对数据进行了分类并设置了检索功能,但不同的平台数据分类的标准不同,检索功能也存在差异。以上述九个平台为例,在数据分类方面,佛山是按照主题这一单一标准对数据进行分类的,其他平台则对数据进行了多种方式的分类;在数据检索方面,各平台都提供了分类导航和关键词检索功能,上海、武汉、青岛、哈尔滨、贵阳、佛山、苏州等地的数据平台还提供了条件筛选功能,用户可根据数据综合得分、数据类型、数据格式等进行二次检索;在检索数据排序方面,苏州的数据平台是自动按更新时间对数据进行排序,其他平台则提供了多种排序方式。
(三)数据的获取与利用。政府数据的获取可分为直接获取和间接获取,直接获取是指用户可在本平台上下载数据,间接获取是指用户需跳转到其他页面下载数据。目前,上述九个地方政府数据开放平台都实现了数据的直接获取。但是,直接获取并不代表用戶可以直接下载数据。调查结果显示,九个平台中只有上海和广东的数据平台无需用户注册登录就能直接下载数据,北京、武汉、青岛等其他七个地方的数据平台仍然要求用户注册登录后方可下载数据。而在数据下载格式方面,各平台提供了包括XLS、XLSX、XML、JSON、CSV、PNG、PDF等在内的主要下载格式,基本满足了数据的可机读要求。其中,北京、上海、广东、青岛、哈尔滨、佛山、苏州等平台提供的数据文件格式包括XLS、XLSX、XML、JSON、CSV等;武汉提供了XLS、XLSX、CSV、PNG、PDF等数据下载格式,贵阳的数据平台除了有XLS、CSV、JSON、XML等格式的数据外,还存在PDF格式的数据。
(四)用户与平台的交流互动。用户与平台之间的交流互动可通过平台设置的互动交流模块和电子邮箱、联系电话、智能机器人等方式来实现。目前,我国各地方政府数据开放平台几乎都设置了交流互动模块,该模块的主要内容包括问卷调查、历届活动、咨询建议、建议增加的数据类型、用户指南、已有意见反馈、纠错结果公开等,主要作用在于实现用户与平台之间的双向沟通。在上述的九个地方政府数据开放平台中,除苏州的政府数据开放平台外,其余八个平台都设置了交流互动模块。互动模块内容多为平台发布的用户指南和常见问题,其他内容较少。此外,所有的平台都留下了电话、电子邮箱、传真、智能机器人中的一种或两种联系方式,其中电话和电子邮箱是最为常见的平台联系方式。
(一)数据体量较小、且更新不及时。调查发现,目前我国部分地方政府数据开放平台开放的数据集体量较小,主要集中在第三梯度,即数据集刚超过1,000个的大量存在,最少的甚至不足200个,有些平台虽然发布的数据集总量较多,但其中存在许多空数据集,即数据集里不存在任何数据条目。同时,平台内部各部门提供的数据集数量相差甚远,多则几百,少则屈指可数。此外,许多平台存在数据更新不及时的现象,这种不及时现象主要体现在两个方面:一是数据非实时更新、更新速度缓慢,如苏州市政府数据开放平台的最近更新还停留在2018年11月30日,哈尔滨市政府数据开放平台的最近更新是2018年12月19日;二是不按公布的更新频率更新,如上海市政府数据服务网的公布的“基层法律服务所”的更新頻率是每月更新,但其最后更新还停留在2017年5月15日。可以看出,不管是省级平台、副省级平台还是市级平台,都存在数据更新不及时的问题。
(二)数据分类方式及检索功能不够完善。目前,我国的地方政府数据开放平台多按主题和部门对数据进行分类,分类方式不够全面。在上述九个数据平台中,只有贵阳市政府数据开放平台按照主题、行业、领域、服务、部门/区县等五种方式对数据进行了分类;在数据检索方面,我国的地方政府数据开放平台主要存在两个问题:一是不能进行精确检索,虽然各平台都设置了分类导航和关键词检索功能,但多数平台的筛选功能设置简单,不仅缺少高级检索功能,而且二次筛选的限定条件较少且不支持多条件同时限定筛选,有些平台甚至不能通过限定条件进行二次筛选;二是检索数据排序简单,虽然大部分平台都提供了多种排序方法,但仍然不够全面,且有少部分平台排序方法单一。随着平台数据类型的不断丰富和数据量的不断增长,简单的分类方式和检索功能将给用户查找数据带来越来越多的困难。
(三)数据获取和利用不够便捷。调查发现,目前我国绝大部分地方政府数据开放平台都要求用户注册登录后才能下载数据,只有极少数的平台提供直接下载服务。在注册过程中,用户需填写的信息较多,比如在北京市政务数据资源网和武汉市政务公开数据服务网进行注册时,需要填写十项信息,其中包括用户姓名、性别、身份证号码、居住地等多种信息。注册信息虽然有利于政府了解数据用户的基本情况,但也在一定程度上增加了用户隐私泄露的风险和获取数据的成本,降低了用户的体验感和信任感。在数据利用方面,大部分地方政府数据开放平台都提供XLS、CSV、JSON、XML等可机读格式的数据集,但仍有部分平台提供不可机读格式(如JPG、PDF、DOC等)的数据集,由于这些格式不能被计算机直接读取和处理,因此大大降低了用户获取和利用数据的便捷性。
(四)沟通渠道有限,互动交流不足。在沟通渠道方面,目前大部分地方政府数据开放平台都只留有电话和电子邮箱两种联系方式,有的平台甚至只留有电话或电子邮箱,这也直接导致公众与平台之间的沟通渠道有限、线下联系脱节等问题。而在交流互动方面,虽然几乎所有的平台都设有互动交流模块,但实际上与公众互动的交流极少,绝大部分内容都是平台发布的用户指南和常见问题,用户的建议反馈、留言咨询等寥寥无几,甚至一片空白。此外,部分平台还存在回复时效性差的问题,如某平台用户2018年11月提交的数据申请至今仍然处于待审核状态。平台中存在的线上回复缓慢、线下联系困难等问题极大地增加了公众咨询建议的难度,削弱了公众参与的积极性。
(一)加大数据开放力度,加快数据更新速度。数据连续、完整、齐全是政府数据开放的基本要求,因此,在推进数据开放平台建设中,各地方政府应加大数据开放力度,加快数据更新速度,丰富数据种类,增加数据量,为公众提供一个数据完备的资源获取平台,做到“有数可查”。第一,政府应想群众之所想,鼓励多主体参与,提高数据开放领域覆盖率和部门覆盖率,争取做到领域和部门的全覆盖,拓展数据宽度;第二,政府应急群众之所急,及时更新数据,增强数据的科学性和实效性。此外,应当特别注意的是数据数量是面子,数据质量是里子,政府数据开放既要重视面子,更要重视里子,在保证数据数量的同时加强数据质量的监督管理,尽量减少甚至避免无效数据,保证数据的价值性。
(二)健全数据分类体系,完善数据检索功能。健全的数据分类体系和完善的数据检索功能有利于提高用户查找数据的速度,增强数据查找的便捷性。在数据分类方面,政府可采用多元的数据分类方式,如主题、领域、格式、机构、区县等,为用户提供多种选择,而不是仅仅局限于主题或部门。同时,可借助自然景观、图形图标、动漫形象等标识数据类目,使分类导航更加清晰明了、生动有趣。在数据检索方面,政府应优化功能设置,一方面应增加高级搜索功能,使用户既能进行模糊检索,也能进行准确检索;另一方面应充分开发二次检索功能,丰富二次检索的限定条件,如部门、时间、数据量、数据格式、综合得分、接入方式等,完善多条件同时限定功能,以便用户快速缩小筛选范围,准确定位所需数据。在检索数据排序方面,应丰富数据排序方式,除了下载量、浏览量、更新时间、综合评分等常规排序方式外,还应增设相关度、更新频率等非常规排序方式,以满足用户的检索需求。
(三)简化数据下载程序,规范数据下载格式。数据下载程序和格式直接决定用户获取数据和利用数据的便捷程度,因此政府应着力简化数据下载程序,规范数据下载格式,使用户在下载数据时能够“一点即下”,在数据利用时能够“直接处理”,提升用户获取和利用数据的体验感和获得感。在数据下载程序方面,政府首先应对数据进行分级分类,逐步推进数据直接下载服务,而不是采用“一刀切”的方式要求用户注册登录;在确实需要用户注册登录时,应尽量简化注册程序,删减不必要的注册信息;在下载格式方面,应以可机读的格式开放数据,以便用户可直接利用计算机读取和处理数据。其次,应丰富数据下载格式,提供多种格式的数据,以打破数据格式和操作平台的限制,使用户更好地对数据进行二次开发与利用。
(四)畅通沟通渠道,重视用户反馈。用户反馈是完善政府数据开放平台建设的重要因素,政府数据开放平台应以用户为导向,重视用户的数据需求、数据体验及疑难问题,让用户不仅有数可用,而且用得舒心、用得满意。一方面平台应为用户提供多种联系方式,如电话、电子邮件、传真、在线留言、人工咨询、智能机器人等,通过多渠道的优势互补,畅通用户沟通渠道,让用户“咨询有路、建议有门”,提高用户反馈的便捷性和积极性,最大限度收集公众的感受、评价、意见、建议等,了解用户所需所想,了解平台的缺陷与不足以便及时改进;另一方面平台应重视用户反馈,及时回复用户咨询,审核用户申请,纠正平台偏差,提高平台反馈的实效性和科学性。此外,平台可将不涉及用户隐私的咨询信息和反馈意见公开,供其他有相同或类似疑问或想法的用户参考,以减少管理人员的重复性工作,同时提高平台的科学性和透明性。
[1]张晓娟,谭婧.我国省级政府数据开放平台元数据质量评估研究[J].电子政务,2019(3).
[2]王翔,郑磊.面向数据开放的地方政府数据治理:问题与路径[J].电子政务,2019(2).
[3]唐长乐,张晓娟.政府开放数据更新评估研究:类型、性能与测度[J].情报资料工作,2019.40(1).
[4]郑磊,吕文增.地方政府开放数据的评估框架与发现[J].图书情报工作,2018.62(22).
[5]朱红灿,胡新,李顺利.基于Kano模型的政府数据开放平台用户体验要素分类研究[J].现代情报,2018.38(12).
[6]刘新萍,肖鑫,黄奕奕.中国地方政府环境数据开放的现状、问题与对策——基于国内部分省市开放数据平台的分析[J].电子政务,2017(9).