莫富传
(华中师范大学信息管理学院 武汉 430079)
随着人类社会从信息时代进入大数据时代,政府数据开放的意义更加突出。政府数据作为民主政权国家的重要资产,是政府进行公共政策制定、服务传递的依据和条件,也是公民、组织和企业公共参与、决策和创造创新性产品和服务极其珍贵的资源[1]。2015年国务院发布《促进大数据发展行动纲要》,提出要在2018年底前建成跨部门的国家政府数据统一共享交换和开放平台[2]。2017年5月3日国务院办公厅印发的《政务信息系统整合共享实施方案》提出要建设“大平台、大数据、大系统”,形成覆盖全国、统筹利用、统一接入的数据共享大平台[3]。然而一直以来,政府数据共享开放普遍存在着数据分布分散、来源各异、多种格式并存、权利关系不清、无法规可遵循、数据封锁、信息孤岛等问题,严重阻碍了政府数据资源的开放共享。贵阳市作为国家大数据(贵州)综合试验区的核心区,在落实国家大数据战略的基础上,以政府数据资源目录体系建设为主线,构建了一体化的政府数据共享开放体系,形成了包括政策法规与标准的顶层设计、一网六平台一企一基地载体支撑、数据资源体系基础和创新型数据服务模式较为完整的、一体化政府数据共享开放贵阳总体解决方案,初步解决了传统共享开放面临的数据采集难、汇聚难、融合难、职责不清等问题,实现了突破信息孤岛、打破条块分割、实现块上数据聚集等目标。
本文从顶层设计、载体支撑、资源体系和服务模式四个方面分析和总结贵阳市的政府数据共享开放方案,并结合我国政府环境数据开放的现状与问题,提出优化对策。
政策法规与标准是顶层设计的最佳形态,为某项工作的开展提供目标与指南。政府数据开放共享涉及多种较为复杂的问题,随着数据开放共享的深度发展,需要通过不断完善的政策法规与标准提供指导。政策的颁布为政府数据开放及其平台建设提供了发展方向和指南,而相关法律规范与标准的制定和实施,则可以凭借其特有的强制力推进政府数据开放共享工作,为政府数据开放共享提供坚实的保障。
《贵阳市加快推进政府数据共享开放的实施意见》是贵阳市第一个加快推进政府数据共享开放的政策法规[4],提出了加快推进政府数据共享开放的主要目标,为加快推进政府数据共享开放提供了政策法规保证。《贵阳市政府数据共享开放条例》是全国第一个关于政府数据如何利用的一个地方性法规,也是大数据综合试验区积极推动的一个很重要的顶层设计和制度设计[5]。这两部法规的颁布解决了政府数据共享开放存在的问题,有助于明晰标准规范,打破利益格局,实现政府部门间数据共享、面向社会数据开放,进一步扩大数据开放的广度、深度,进一步提高开放共享价值的密度。
2017年8月25日,《贵阳市政府数据共享开放实施办法(征求意见稿)》和《贵阳市政府数据资源管理办法(征求意见稿)》对外发布[6]。《贵阳市政府数据共享开放实施办法》致力于实现政府数据公平有序地共享开放,提高行政效率和服务水平,推动政府数据创新应用,全面实施大数据战略行动。《贵阳市政府数据资源管理办法》则旨在加强和规范政府数据资源管理,推进政府数据共享开放和开发应用,提高行政效率和服务水平。两部法规旨在进一步对各级行政机关政府数据共享开放的职责、载体、边界范围、分类、程序、方式及其他相关要求、监督管理等进行补充、细化,使《贵阳市政府数据共享开放条例》更具有针对性、可操作性和实效性。
贵州省质量技术监督局于2016年9月28日发布了《政府数据 数据分类分级指南》、《政府数据资源目录第1部分:元数据描述规范》、《政府数据资源目录第2部分:编制工作指南》、《政府数据 数据脱敏工作指南》4个工作规范文件[7],对政府数据分类分级、政府数据资源目录元数据描述规范、政府数据资源目录编制工作和政府数据脱敏等方面的工作进行规范。贵州省质量技术监督局发布上述4个工作规范文件的同时,也要求各有关部门抓紧开展数据目录编制及分类分级有关工作,可见数据目录编制及分类分级的标准化十分重要。
这四项标准的制定发布和有关部门的通知要求,有利于对政府数据实施有效管理、稳步推进政府数据开放和共享,有助于按类别正确开发利用政府数据,实现政府数据价值的最大化挖掘和利用,为大数据发展奠定数据基础、提供数据支撑。
贵阳市政府数据共享的总体思路是:以建设块数据城市为目标,以政府数据资源目录体系建设和项目驱动为抓手,优势在于统筹协调,载体是“一网六平台一企一基地”,整合本地数据、国家数据和互联网数据,建设块数据资源池,提高政府数据资源开发利用价值,提升行政效率和政府治理水平,促进大数据产业发展[8]。由此可看出,“一网六平台一企一基地”作为贵阳市政府数据共享体系中的载体支撑,发挥着渠道和桥梁的重要作用。
“一网”即电子政务外网,承载的是非涉密信息,而非保密局或国家保密法所指的涉密信息。各部门自行制定的没有国家保密部门认定的都不属于涉密信息,因此大量的信息、数据和系统可以放在电子外网。通过建设统一的电子政务外网,实现横到边、纵到底,全市各部门、各区(市县)、各乡镇(社区)的全覆盖和应用系统的互联互通,构建政府数据自由流通的高速公路。
“六平台”即云上贵州·贵阳平台、政府数据共享交换平台、政府数据开放平台、数据采集平台、数据增值服务平台和数据安全监管平台。
(1)云上贵州·贵阳平台。依托云上贵州·贵阳平台,贵阳市统一建设了政府数据共享和开放平台,用于汇聚、存储、开放和共享全市政府数据,实现政府块数据平台和公安块数据平台的互联互通、同城灾备和信息共享。
(2)政府数据共享交换平台。政府数据共享交换平台是贵阳市块数据平台及大数据产业重要的组成部分,采用多源异构数据“索引管道式”共享交换模式来提供数据服务,形成政府数据的块上聚集,有效整合本地数据、国家数据和互联网数据建设块数据资源池,有序推进数据共享开放,实现按需响应、按需服务。
(3)政府数据开放平台。政府数据开放平台围绕数据中心、用户中心、支撑中心、价值中心“四个中心”,基于云计算、大数据、人工智能技术,提出平台、业务、数据、管理、安全“五位一体”的架构设计,采取“主动开放+依申请开放+契约式开放+孵化式开放”的数据开放模式,建成国内首个理念超前、技术先进、架构完善、模式多元的地级市一体化政府数据开放平台,在国内率先提供网页智能引导机器人、RDF格式、全量目录下载、自定义场景等功能。
(4)数据采集平台。数据采集平台是依托全市统一的政务外网,利用DaaS平台API生成技术,构建政府部门多源异构数据的“活化”采集通道和数据目录,通过统一部署数据采集网关,数据采集前置机等方式,实现政府数据的自流流通与自动化更新。
(5)政务数据开放与增值服务平台。政务数据开放与增值服务平台的主要功能包括数据采集与接入、数据目录服务、元数据服务、数据汇集、分布式异构数据存储、数据清洗与加工处理、数据标记、数据开放、用户与权限管理、平台运维管理。
(6)数据安全监管平台。数据安全监管平台的建设旨在探索建立数据资源审计和安全监督制度,对数据采集、共享、开放、身份验证、授权管理和安全保障探索利用区块技术跟踪和追溯,为数据共享开放提供安全保障。
“一企一基地”即贵阳市块数据城市建设公司和大数据加工清洗基地,是贵阳市大数据生态体系具体路径的体现。由于路径问题、机制问题、方法问题、模式问题等问题的困扰,单一的政府机构无法将平台资源与市场需求结合起来,无法高效促进产业发展和释放数据价值。鉴于此,贵阳市将政府基础设施建设及数据资源运营交给块数据公司,并通过大数据加工清洗基地实现政府数据价值链的闭环,最终促进政府开放数据的政用、商用和民用。
政府开放数据资源的建设是开放共享的基础。贵阳市通过摸家底、供给需求双刃驱动、强调高质量高价值两个取向、扩大开放范围、丰富数据种类、数据资源的五级分类和关联组织,建立了政府数据资源体系,为政府数据开放共享奠定基础。
摸清政府部门掌握数据量、数据类型、数据更新频率、数据质量高低等,是政府部门首先需要解决的问题,更是政府数据开放的基础。贵阳市深度梳理了各个部门现有业务类型、部门应有的数据类型和部门IT系统中现存的数据类型,建成了贵阳市全量数据资源目录管理系统。按照“一数一源、多元校对”的理念,通过一数一源构建数据描述体系,推动贵阳市数据基础建设;通过数据多元校对提供一个基础性的参考,确保数据后期的持续性、准确性和完整性。
贵阳市政府数据开放共享特别强调数据标准化,在数据采集上采取倒推机制,通过供给需求双刃驱动,各部门按照标准来开放数据,确保数据的完整、有效、及时、准确。一方面,贵阳市有统筹机制,深度广度都能支撑数据,从供给侧角度保证数据的完整性、持续性、权威性、可机读性、及时性和有效性;另一方面,通过开放申请和开放指数两个功能模块,分析用户需求、反馈,以及数据获取轨迹与特征,从需求侧按需开放,确保用户最迫切的政府数据需求得到及时、有效地满足。贵阳市政府数据的开放共享还强调政府数据开放要有高质量和高价值两个取向,政府数据的内容完整性、获取便利性构成了它的质量,而高质量的政府数据及其整合也增加了它的价值。贵阳市政府数据开放平台数据定义清楚、来源明确、类型丰富、覆盖面广、分类清晰,可机读性强、更新及时、数据组织管理和服务功能齐全,其内容构成在平台上有完整的显示,可深度挖掘和可重复利用,其质量较高,蕴含的价值十分丰富。此外,“一网六平台一企一基地”的共享载体,整合了本地数据、国家数据和互联网数据,也提高了政府数据资源的开发利用价值。
贵阳市政府数据开放平台首批面向社会免费开放634个数据集以及101个API 资源,基本涵盖贵阳市级所有对社会提供公共服务的政府部门及相关直属事业单位。随着开放范围不断扩大,截止2018年4月20日,已开放6 119 853条数据、2 685个数据集、303个API、52个市级部门和13区县。开放数据覆盖综合政务、经济管理、科技、教育等20个主题,生态文明、信用服务、经济建设等14个领域,以及采矿、信息传输、软件和信息技术、房地产等20个行业类别。开放数据涉及了融合表格、文本、图片、地图等多载体类型的实时与非实时的政府可公开数据,并提供XLS、CSV、JSON、XML等多种机器可读的开放格式和PDF非开放性格式。平台所提供数据全部可供下载或调用,通过平台成功注册的用户享有免费访问、获取、使用、传播分享和利用及再利用数据资源的权利。
贵阳市政府数据开放平台既根据主题、行业、领域、部门/区县等传统标准进行数据的分类,还在国内率先提出“领域、行业、部门、主题、服务”5种数据分类,将政府开放数根据领域、行业、部门、主题、服务进行分类组织,极大提升了数据检索、定位、发现的便捷性与精准性,方便公众检索、定位、发现所需要的政府数据。
贵阳市政府数据开放平台提供了可视化数据图谱,实现对政府数据的深度关联组织和关联开放。专题图谱以星型结构的数据图谱实现了平台上同一专题领域的政府数据的关联组织和数据关联关系的可视化描述,而全局数据图谱将平台上的所有数据都进行了关联组织并以数据图谱的形式可视化描述,并通过连接线条数目和节点详情浮动页面可以详细了解节点信息和关联情况,便于从全局上把握数据的关联信息和组织结构。数据图谱实现了平台上所有的、多源异构的政府数据关联组织和数据图谱可视化描述,不会使得数据资源间的关联关系被人为地割裂,与单纯将数据按其领域进行汇集、提供等级结构式或菜单式导航浏览方式相比有诸多的优势。
图1 贵阳市政府数据开放平台“领域”全局图谱
在大数据环境和政府数据开放背景下,为了能够更好地促进政府数据的开放、方便社会公众对政府数据的进行获取利用,建立专门的政府数据开放平台成为政府数据开放共享的重要选择。贵阳市政府数据开放平台为了取得更好的数据开放共享效果,坚持以用户需求为导向,创新数据服务模式,实现政府数据的结构化关联和知识发现,增强数据的展示性,以促进政府数据的创新性开发和应用,不断满足用户多样化的政府数据需求。
在大数据时代,政府数据的开放、整合和共享,能发现新的知识、创造新的价值。随着关联数据技术和数据图谱可视化描述方式的应用,政府开放数据所蕴藏的知识和价值,已经被越来越多地挖掘和变现。数据图谱实现了政府数据的关联链接与组织,以及数据图谱的可视化描述,使得单个数据集的元数据构成、多个数据集间的关联关系、平台上所有政府数据资源的体系结构,都非常直观和清晰地展现在我们面前。政府数据彼此间的关联越多和越紧密,揭示得越直观,数据的知识性就更加明显,数据也就越有价值。贵阳市政府数据开放平台提供了可视化数据图谱,通过传播媒介展示出各种赋予表现力的形式,更加形象直观的了解平台上的数据情况。数据图谱可以从多种角度对平台上政府数据进行的结构化关联和可视化描述,揭示政府数据资源的知识单元和知识关联。在此基础上开发的各种应用,使政府数据资源的知识构成、知识关联和价值得到了清晰的揭示,进而发现多源异构的政府数据间隐含的固有联系。有助于实现政府数据的关联组织与用户的关联查询,实现在更大范围内、更多应用场景下准确、高效地查找、调用、分享和利用相互关联的政府数据资源;有助于用户对数据资源所蕴藏知识的挖掘、发现和利用,实现政府数据的创新性开放利用。
图2 贵阳市政府数据开放平台“教育场景”数据关联图谱
对政府数据开放共享和获取利用情况进行监测,有助于平台管理人员和用户分析政府数据开放共享和获取利用情况,为进一步优化政府数据的开放和利用提供依据,最终改进服务方式,提升政府数据开放共享质量。贵阳市政府数据开放平台提供了强大的数据监测工具——开放指数,提供包括平台访问来源追溯、访问次数、关注热度词云、用户注册类型分析、平台访问历史、数据评分统计、数据开放统计、需求分类比例、数据更新统计、资源格式比例、部门数据TOP10、数据下载TOP10和API调用TOP10等项功能板块,对政府数据开放和利用情况进行全方位分析,方便平台管理人员和用户分析政府数据开放共享和获取利用情况,为进一步优化政府数据的开放利用提供依据。
图3 贵阳市政府数据开放平台“开放指数”服务
政府数据开放的最终目的是通过数据资源的开放共享与创新性利用,最大化发挥政府数据的价值,使政府部门更高效透明地开展工作,促进经济发展和社会创新。贵阳市政府非常重视政府数据的开放共享与再应用,通过在政府数据开放平台上为用户提供应用开发及其孵化平台服务,为用户获取政府数据并在此基础上进行创新性利用提供便利。贵阳市政府数据开放平台开发应用服务框架如图4所示。
图4 贵阳市政府数据开放平台开发应用服务框架
(1)APP服务。随着移动互联网和APP软件开放技术的发展,移动APP成为了公共部门发布最新数据信息和用户即时获取利用的重要方式。国外政府数据开放平台上提供了政府开放数据获取APP简介和下载链接的功能。这些APP软件按照其连接数据所属领域或主题进行分类,功能强大、使用方便。用户通过政府数据开放APP,便利而有效地利用了政府数据。移动APP等应用软件的开发与发布,既有助于用户便利而有效地获取和利用政府数据,促进政府数据的重复性使用和创新性开发,也很好地鼓励社会公众积极开展创新和创造。
(2)项目孵化平台服务。麦肯锡全球研究院发布关于开放数据的研究报告对开放数据的经济价值进行了量化,估算其能够带来3~5万亿美元的经济价值[9]。基于政府开放数据的创新性开发项目具有巨大的潜在经济利益,但这些项目要在复杂的商业与市场环境下顺利成长,还需要良好的孵化环境[10]。贵阳交通大数据孵化平台积极探索契约式开放模式,为用户提供安全稳定云服务资源和数十类开放免费的交通数据资源,提供自动化工具和一站式申请、审批、开通、计量、保障及支付等服务,以及贵阳大数据交易所的支持,为孵化器成员带来全新商业模式,支持创业者开展亿万级别数据的开放挖掘,促进行业高价值数据的深度开放,最大化实现数据价值。筑民生数据开放广场是一个基于大数据开放应用的“互联网+民生服务”的民生服务综合平台,通过积极探索孵化式开放模式,提供广泛的政府开放数据、企业数据和市场数据,旨在加快数据应用孵化,以真正实现大数据民生的健康、生态、自循环服务常态,实现大数据民生服务产业化。
(3)开发向导服务。贵阳市政府数据开放平台设置了开发向导板块,提供开放的API、分析工具、开发流程、开发工具和应用提交与推广服务。API是目前网站普遍运用的用来提供给用户调用数据的方式,通过对外提供政府数据的浏览检索和下载利用服务接口,帮助用户便利地根据自己的选择标准或实际需求获取数据。分析工具是一个个性化的服务模块,帮助用户导入MYSQL、SQLSERVER、ORACLE等数据源,创建SQL、Excle等组合数据集,进而制作仪表盘、门户等多样式的报告材料,可视化分析开放数据的应用场景及其价值。创建应用、订阅服务、开发应用、提交发布和管理应用的开发全流程服务,javaSDK开发工具包的下载和使用服务,以及应用提交与推广服务,则有助于用户充分有效地使用大量的政府数据开放资源成为一名软件开发者,在自己感兴趣的数据应用领域设计和开发应用软件,提交给数据平台进行审核,最后提供给用户下载用。
(4)成果提交。贵阳市政府数据开放平台开设了成果提交板块,用户可以根据自己掌握的数据资源,以及在平台所提供的项目孵化平台、开放向导服务的支持下,开发应用软件,或者形成研究报告,在平台填写应用的相关信息并上传应用,帮助平台丰富应用模块的内容。
贵阳市政府数据的开放共享不仅仅是单纯提供政府数据,还注重对政府数据进行多形式的展示和多视角的解读。贵阳政府数据开放平台和“贵阳政府数据开放”官方微信公众号不定期更新和推送“数据无限”、“数说贵阳”、“行业解读”三个内容板块,为用户提供多样化和多视角的数据内容。“数据无限”、“数说贵阳”基于媒体视角,通过挖掘开放数据核心内容和传播价值,经过采编、分析、制图形成通俗易懂、活泼生动、利于传播的数据融媒产品,以图文方式形象生动地解读文化、科技、经济等领域政府数据的内涵,帮助用户进行拓展性的了解。而“行业解读”则以较为严谨学术态度、从行业专业的角度,对大数据背景下大数据产业、政府数据开放共享等问题进行解读。多样化内容板块,多视角解读数据内涵,更好地满足了普通用户、数据研究者、数据投资者、数据开发者等各类群体对数据浏览、查询、调用、研究和开发的需求。
贵阳市政府数据开放平台引入了媒体合作,非常注重建立用户的参与机制,既为用户提供多种具有本地特色和用户个性化的服务,也强调支持和鼓励用户通过多种途径参与平台的建设和优化。在平台上提供了数据分享、数据定制、信息交流和用户个性化服务等功能,给予用户合作者的角色,提高数据开放平台的用户参与度,鼓励用户参与数据开放平台的建设和优化,在提升用户体验和满意度的同时,也共同促进政府数据的开放和共享。
表1 贵阳市政府数据开放平台的特色服务和用户参与功能
贵阳市抓住全国首个国家级大数据综合试验区和国家大数据战略的政策优势和发展机遇,形成了较为完整的、一体化的政府数据共享开放总体方案,为其他省市区乃至全国的政府数据开放共享探索出一套行之有效的办法。
笔者对已建成或试运行的政府数据数据平台进行调查,并对学界关于我国政府数据开放状况调查评价的文献进行总结。总体而言,我国地方政府数据开放共享的总体水平还不高,仍处于初级阶段。从机制上看,我国政府数据开放共享机制的建立存在理念障碍、体制障碍和技术障碍[11];从政策法规层面看,虽然一些地方已经发布相关的政策法律,但不够系统和全面,且缺乏全国性政策或法律条款来规范政府数据开放权责利益、隐私保护和安全数据方面的问题[12];从资源建设上看,总体数量少、地域差异大,数据开放的广度和深度都不够,数据资源没有得到有效的管理整合,缺乏数据规范和全面、完整的元数据体系,数据格式和质量参差不齐、没有统一的标准,导致数据质量参差不齐、数据分类模糊、更新频率低、数据格式混杂[12-15];从平台功能上来看,当前的大多数开放数据平台功能相对简单,且建设中缺乏统一标准[12-13];从服务模式上看,数据授权协议条款含糊,缺乏便捷的数据获取渠道和高质量的数据应用,缺乏便捷、及时、有效、公开的互信息交互功能、数据互操作功能和个性化服务、可视化服务等[14-15]。借鉴贵阳市一体化的政府数据共享开放体系,本文认为各级政府部门加快政府数据开放共享进程需要在以下几方面发力:
第一,建立健全相关法律法规,建立数据开放共享的保障制度。要结合时代变化和现实需要,制定大数据环境下政府数据开放及其平台建设的相关法律和规范,明确各主体的权利和义务,厘清政府数据开放和平台建设的具体范围和主体责任,加快政府数据开放平台建设,促进政府数据在风险可控原则下最大程度的开放;要结合国情抓紧制定开放许可模式、安全保障和隐私保护、数据资源清单、数据开放目录、开放时间表、公众利用方式以及参与机制等方面的相关制度,建立健全政府数据开放平台建设的监督机制,加强对政府开放数据资源体系建设、整合共享、数据资源质量和平台的安全运行和维护等方面的审计监督。
第二,建立政府数据开放标准体系,实现标准化开放。发挥政府数据开放平台的作用,实现政府数据开放共享和获取利用的社会效益和经济价值,需要以政府数据开放标准体系的建设和运用为基础。要从我国国情和政府数据开放的具体实际出发,抓紧制定我国政府数据开放格式、元数据管理、数据采集和管理、整合共享及交换接口、获取利用、平台运行、质量保障和安全管理等方面的具体标准,促进政府数据的标准化开放,实现社会有序共享和充分利用政府数据。
第三,创新服务模式,建立公众参与和反馈机制。实践表明,国内外数据开放共享工作成效突出的政府部门非常重视建立公众的参与和反馈机制。政府数据开发平台应提供数据互操作可视化、数据定制与分享、信息交流和用户个性化等服务,同时努力简化公众网上咨询和参与的流程,加强对公众的咨询。通过这些措施,建立高效的公众参与和反馈机制,形成多主体良性互动的循环和数据资源融合开放的格局,保证公众的数据请求和咨询问答能够得到最快的响应,优先公开社会公众最迫切需要的数据资源,提高平台服务效率和用户满意度。
第四,加快建成政府数据统一开放平台,实现一站式开放。各级政府要以《促进大数据发展行动纲要》的出台为契机,以政府掌握的数据资源为基础,以用户需求为导向,借鉴国内外成功经验,加快建成集政府数据交换共享、采集管理、开放获取和安全监管为一体的国家级政府数据统一开放平台,实现政府数据的一站式开放,促进政府数据的开放共享和获取利用,最大化地挖掘和利用政府数据的巨大价值,以促进国民经济增长和社会可持续发展,不断提高人民生活水平。