陕西数据开放生态系统建设主要分为开放准备度子系统建设、平台层子系统建设和应用层子系统建设。从协同治理的视域看,准备度子系统建设主要做了立法、宣传、成立机构等工作;平台层子系统建设主要涉及网站建设数据开放、分类和APP开发等;数据应用层子系统举办了数据开放的论坛、活动组织数据的开发和应用等。在建设数据开放生态系统过程中陕西面临法规制度不完善、新闻宣传报道力度不足、组织机构不健全、数据开放平台技术有待提升,数据更新频率缓慢,数据鸿沟与社会资本缺失等问题,需要以协同治理为手段,完善法规考核和容错机制,加强新闻宣传报道打造数据开放论坛品牌,统筹政府机构设置和激发社会组织活力,优化迭代数据开放平台技术,提高数据更新频率,消除数据鸿沟,构建活动所需社会资本。
数据开放生态系统建设旨在促进陕西产业结构优化、转变经济发展方式和提升治理能力现代化水平。协同治理旨在治理社会问题时充分协调政府、社会和市场中各个利益相关者组成的子系统,通过协同互动形成有机系统对社会问题进行有效治理。
在协同治理理论视域下,首先,数据开放生态系统是由多个子系统构成的,主要是由数据开放前期准备工作构成的准备度。[1]其次,数据开放平台网站建设的子系统,主要涉及数据更新频率、数据质量、地图和APP应用和平台反馈机制等数据层子系统建设。最后,数据在应用方面的子系统建设,例如活动开展的组织宣传、弥补不同人员间的数据鸿沟和社会资本的构建等构成的应用层子系统,三个子系统间的协同促进数据开放生态系统有序运转。
数据开放生态系统相关概念界定
“数据开放生态系统”是一个复合概念,其概念界定需先对其基础性概念进行梳理。了解数据与大数据、数据开放以及数据开放生态系统等相关概念,才能对数据开放生态系统建设有系统深入的认知。
(一)大数据与政府数据
数据一直伴随着人类的发展变迁,在古代数据呈现出规则化汇聚的特征。在计算机发明以后,数据与计算机编码产生了重要的联系。在计算机发明初期,数据特指结构化数据,近十几年来,随着计算机技术的发展,网页、声音、图像等半结构化数据成为数据的重要组成部分。
而大数据并非一个确切的概念。最初,这个概念是指需要处理的信息量过大,已经超出了一般电脑在处理数据时所能使用的内存量,因此工程师们必须改进处理数据的工具。[2]现在较为流行的观点是大数据是人们在大规模数据的基础上可以做到的事情,而这些事情在小规模数据的基础上是无法完成的。大数据是人们获得新的认知、创造新的价值的源泉;大数据还是改变市场、组织机构,以及政府与公民关系的方法。[2]
政府数据是指政府在开展各项工作和履行各项职责的过程中所获取的各项数据。政府获取数据的种类和格式也繁多,也属于大数据的范畴,并且政府作为数据的主要持有者,约占数据总量的80%以上。政府所掌握的数据具有较高的相关性、一致性、完整性和时效性,是较为完整的数据体系,具有巨大的经济价值和社会价值。
(二)数据开放与政府数据开放
数据开放是指数据开放主体(个人、企业、社会组织和政府等)在既定法律法规协议框架下,通过授权同意将自身所拥有的数据通过技术手段脱敏、分类汇总到网站上,让社会无差别获取和利用的一种数据共享模式。
政府数据开放是在政府信息公开和电子政务建设基础上的深化和拓展,所开放的数据既包括结构化数据,也涵盖半结构化数据,而各种类型的数据构成了大数据,所以政府开放的各类型数据统称为大数据。2009年第一个数据开放网站data.gov建成后,拉开了政府数据开放的序幕。数据开放平台通过对数据脱敏后将未加工过的原始数据上传至网上,社会面无歧视、无差别获取数据,然后通过技术手段实现对数据的开发和利用。
(三)数据开放生态系统的内涵
对于数据开放生态系统概念的界定,学界从不同角度进行了阐释,有的学者从技术角度对数据开发的产业链进行分析;有的从参与主体功能划分和协同互动方面对数据开放生态系统的概念进行界定;有的是以社会-技术理论从利益相关者角度和技术协作角度对数据开放生态系统进行界定;有的是在社会-技术理论角度上加上了环境因素,形成了以TOE理论416941af7ed06f3ee700b18a1ab540f021aadec06c9ea099810d184b8f94b106为基础的数据开放生态系统理论;有的则是从主导者进行区分,开放数据生态系统可以分成如下三种类型,即:政府主导型、法规主导型、政府-企业主导型。[3]
综上所述,数据开放生态系统的概念阐述离不开数据本体、数据流动、技术开发、利益相关者、环境和主导者等要素。所以,数据开放生态系统是在法律法规和其他相关社会技术环境背景下,由政府、法规或政府-企业主导的,社会其他利益相关者(如企业、社会组织和技术人员等)协作参与,运用数据开发相关技术手段,对数据开放平台所开放的原始数据,进行系统性的开发,形成较为完整的数据开发产业链条,促进开放数据有效运用于经济发展和社会治理等方面,形成各个要素、子系统相互作用的、良性互动的系统。
陕西数据开放生态系统建设现状
陕西数据开放生态系统建设在准备度(法律法规、宣传工作和领导力)、数据开放平台和数据开发和应用方面都做了大量的工作,制定了相应的法律法规、完善了机构设置、组织了新闻宣传,建设了平台政府网站和开展了大数据论坛,但是数据开放生态系统建设水平仍有待提升。
(一)陕西数据开放准备度子系统建设现状
准备度子系统主要涉及数据开放前期的一系列准备工作,主要涉及法律法规、组织保障和新闻宣传报道等方面。陕西已经制定了数据开放相关的法规,省会西安立法先行,2022年5月颁布了《西安市2022年政务信息系统打通与数据共享工作实施方案》;2022年9月制定出台了省级法规《陕西省大数据条例》;2022年底发布了《西安市政务数据开放管理办法(试行)》。《西安市2022年政务信息系统打通与数据共享工作实施方案》着手从内部打破西安市信息孤岛和信息烟囱林立的局面,以促进数据共享。《陕西省大数据条例》对基础设施、数据资源、开发应用、产业发展、安全保障和法律责任等进行了具体明确。《西安市政务数据开放管理办法(试行)》对西安市政务数据开放机制、安全管理机制和促进使用措施等方面作出了相关规定。这三个文件为陕西和西安数据开放平台建设提供法规依据,有效地提高了陕西数据开放的准备度。
在组织保障方面,陕西成立了政务大数据服务中心,为省政府直属正厅级公益一类事业单位,专门从事政府数据运营管理工作,弥补了在大数据管理组织方面的不足。
在新闻宣传和领导力方面,《陕西日报》公开发表了大量关于数据开放、数字经济和数字政府的文章,对于数据开放和数据要素的重要性进行解读和宣传。多位省级领导在多个会议上强调发展数字经济和建设数字政府的重要性。这些文章和领导表态在一定程度上对于数据开放、数字经济发展和数字政府建设起到了宣传和推动作用。
(二)陕西数据开放平台子系统建设现状
数据层子系统主要涉及数据开放平台网站的建设和更新、开放数据分类和数据更新等。陕西于2018年1月建成了省级数据开放平台,涉及数据目录、地图服务、APP应用、开放指数和互动交流等几个板块。
第一,数据开放平台所开放的数据涉及的主题有公共服务、安全保障、社会保障、安全生产等12项,其格式有excel、doc、docx、url、DB数据库等。12大项分类所涉及的数据存在重合的部分,在doc、docx格式数据中存在少部分无效数据,url类型的数据只有少部分政府网页链接,并无实体数据,整个网站并无设立API接口。
第二,地图服务方面,地图框架已经基本建成,但并未对地图上的数据进行分类,所以在数据查询方面未能发挥应有的效应。APP应用方面已经开发了9个应用,主要涉及农业、医药、银行和环境等方面,APP开发覆盖面、针对性和更新速度还有待提升。
第三,从开放指数方面来看,陕西数据开放平台所开放的数据主要集中在省直机构,地市未能有效地开放数据。在互动交流方面,部分数据使用者对数据进行了评价,平台也进行了回应,但互动总体偏少。
(三)陕西数据应用层子系统建设现状
应用层子系统主要涉及数据开放和开发的论坛设立、活动组织数据的开发和应用等。陕西数据应用层子系统主要包括组织大数据论坛、数据社会应用等方面。2020年,在宝鸡举办了数字陕西建设高峰论坛,主题是“数字赋能陕西高质量发展,勇立潮头争当时代弄潮儿”。2021年,“数字陕西建设高峰论坛”开幕式暨主论坛在铜川举行。此次论坛以“开启数字化建设新征程,谱写高质量发展新篇章”为主题,盘点陕西数字发展经验,探讨数字陕西发展新方向。通过论坛研讨可以有效吸引高校、科研院所和科技公司提高对数据开发的关注度和投入。由于准备度子系统和数据层子系统未能有效建设,陕西高校、科研院所和科技公司开发和应用数据程度较低,参与感较弱,社会资本缺乏,社会组织活力较低。在数据开放活动方面,陕西并未开展开放性的数据开发活动,社会面未能有效地利用数据。
陕西数据开放生态系统建设存在的阻碍因素
陕西关于数据开放生态系统的准备度的立法不健全、新闻宣传不到位、组织机构不完善,导致数据孤岛和数据烟囱现象仍然存在,数据更新频率较低,数据开放平台技术水平有待提升,数据更新频率缓慢,数据鸿沟和社会资本的缺失影响着各个子系统和整个数据开放生态系统建设。
(一)法规制度不够完善
从法规制度建设方面来看,陕西颁布了《西安市2022年政务信息系统打通与数据共享工作实施方案》《陕西省大数据条例》和《西安市政务数据开放管理办法(试行)》三部法规、文件。这三份文件中,只有《陕西省大数据条例》是陕西省人民代表大会常务委员会制定的地方性法规,具有统筹性、全局性和相应的法律效力,而其他两份文件则属于相关部门颁发的规范性文件,仅具有政策指导性。《陕西省大数据条例》虽然对基础设施、数据资源、开发应用、产业发展等方面作出了相关规定,但是并未将数据开放纳入政府部门考核体系,仅对数据泄密方面的惩罚做了相关规定,而对数据开放并无相应考核、奖励措施,并不能有效激发政府数据开发的积极性。这影响着准备度子系统建设,同时对于整个数据开放生态系统来说,由于一些环节缺乏法理性的支撑,所以在进行数据开放和开发活动时政府内部存在一定的阻力,社会各界参与的积极性不高。
(二)组织机构设置仍需调整
在部门设置方面,每个厅局都设有电子政务中心,省、市、区(县)都设有相应的数据管理机构,数据资源形成条块分割的状况,“数据孤岛”和“数据烟囱”现象不容忽视。经过多年的电子政务建设,政府部门间的数据实现了一定程度的交互共享,但是仅局限于业务往来,并未完全实现互联互通。这就导致准备度子系统建设缺乏协调,无法形成合力。2021年,成立了陕西政务大数据管理局,负责收集、汇总各个部门的数据,推进“数字政府”建设相关工作,在数据开放机构设置方面取得了突破性进展,但是数据开放工作开展进度仍显缓慢,导致数据层子系统还未形成有效的数据开放路径。陕西政务大数据服务中心成立后并未公布数据开放相关的工作计划,也没有组织数据开放相关活动。这就导致数据开放一直处于规划阶段,并未形成以某个组织为抓手进行协调展开的数据开放活动,导致应用层子系统中活动的开展未能有效进行。
(三)数据开放平台技术有待提升,数据更新频率缓慢
自2018年数据开放平台网站建成以后,除了网站数据不定期更新以外,数据开放平台网站的界面设计和技术基本处于停滞状态,未对网站界面进行整合,也未对数据开放平台技术进行迭代,导致准备度子系统建设呈现滞后状态,影响政府数据的上传和整合工作,对数据层子系统建设造成了一定的影响。2018年开放了大量的数据集,但是随后数据更新数量呈现断崖式下跌,数据更新频率逐步放缓,在一段时间内甚至呈现出停滞状态。从数据开放的质量来看,2018年开放了许多高质量数据,但是其中存在一些低质量数据和无效数据,有些数据集过于陈旧,有些数据集是不可机读的格式(例如doc格式),数据开放平台并未设立API接口,这就导致数据不能被高效地读取和下载,影响开发层子系统建设。在平台互动方面,用户和政府间的互动较少,也未设立APP提交系统,导致APP数量少并且没有解决针对性问题的功能。
(四)数据鸿沟的阻碍和社会资本的缺失
数字鸿沟又称为“信息鸿沟”,是20世纪中后期开始引起人们重视的一个问题,指由于信息通信技术的发展,不同人群或不同地区出现的在获取数字资源上的差别。[4]在数据开放生态系统中政府是数据的主要拥有者,政府工作人员是数据的主要收集者和接触者,但是对数据的开发能力却有限。数据技术开发人员是数据的主要开发者,掌握着数据资源开发的技术,在公开渠道上有获取数据的技术手段,但是对于政府数据开放的意图等并未能完全掌握。社区公民是数据开发产品的主要需求者,但是接触和获取数据的技术手段有限。这三者之间产生的数据鸿沟导致数据开放生态系统在应用子系统建设中存在一定的阻碍。
陕西数据开放生态系统应用层方面“软实力”的缺失主要体现在社会资本的缺乏。社会资本是指社会成员在相互联系中所产生的信任和规范,它们能够提高社会效率,提高投资于物质资本和人力资本间的效力。[5]目前陕西并未补全数据开放生态系统开发层层面的数据鸿沟和组织架构方面的短板,导致数据开放生态系统应用层面社会资本的缺失。加之受传统思想观念的影响,人员间的合作和信任受地域和熟人关系等因素的限制,大型、公益化性质的活动开展起来有一定的困难。
(五)新闻宣传报道力度不足
在新闻宣传方面,对于数据开放进行过相关报道,但是,主要局限于传统媒体,受众范围有限。部分社会成员不知道数据开放的目的和意义是什么,更不知道数据开放以后通过开发对经济社会的作用,影响其参与层子系统建设。新媒体对数据开放并未进行频繁的报道和针对性的宣传。相关领导对于数据开放的公开讲话也相对较少。在活动举办方面,陕西举办过几次数据开放的论坛,仅局限于理论探讨,实质性的数据开放活动(类似于上海SODA大赛)基本没有,导致陕西数据开放生态系统建设迟滞不前。
协同治理视域下的陕西数据
开放生态系统建设路径
针对陕西数据开放生态系统建设存在的阻碍性因素,建议完善法规考核、容错机制,加强新闻宣传报道,打造数据开放论坛品牌,完善政府机构设置和激发社会组织活力,优化迭代数据开放平台技术,提高数据更新频率,消除数据鸿沟,构建数据开放所需社会资本,强化各个子系统间的联系,推进整个数据开放生态系统良性运转。
(一)加强法规建设,完善考核、容错机制
针对陕西数据开放系统建设存在的问题,做到制度先行,对相关条例、制度进行查漏补缺。将数据开放纳入公职人员考核体系,明确数据开放的任务目标、规划和要求,加强数据开放任务完成情况的督导,对于任务完成情况好的予以适当奖励,对于未按进度完成的组织诫勉谈话,以完善准备度子系统。同时,出台相应免责制度,构建容错机制,鼓励参与各方大胆探索,在实践中总结经验,推动数据开放系统在探索创新中建设。
(二)加强新闻宣传报道,打造数据开放论坛品牌
重视新闻报道工作,加强策划,严密组织,把握好“时度效”,多措并举做好数据开放宣传工作,通过持续报道,使之入眼、入脑、入心,务求实际效果。扩大数据开放论坛影响力,打造数据开放论坛品牌,夯实数据开放社会基础。建议在举办原有大数据论坛的基础上,继续开展相关数据开放论坛活动,吸引更多的高校科研团队、研究所科研人员、政府工作人员和社会公众参与,让社会公众意识到大数据和数据开放对于经济发展和社会治理方面的重要作用。
(三)统筹政府机构设置和激发社会组织活力
统筹各省、市、区(县)电子政务相关部门,形成条状相联块状相交互联互通的网状结构,设置数据传输“绿色通道”,减少“数据烟囱”和“数据孤岛”带来的数据传输障碍。建立健全各电子政务中心数据汇总机制,通过条状链接形成数据专业类型汇聚,通过块状链接形成数据地域性汇聚,在此基础上形成定期大数据汇总机制,通过各项机制链接形成系统有效、运行流畅的数据开放机构体系,在此基础上完善准备度子系统。
在进行数据开发活动的初期,可以先建立政府主导的模式,在此基础上协调企事业单位、社会组织积极参与数据开发活动。在数据开放活动相对成型的基础上,逐步放手让社会组织等主体参与数据活动,社会组织发挥纽带作用,及时收集并向政府反馈群众对于大数据的诉求,从而促进政府数据开放。通过多方沟通努力,使得数据开发应用乃至数据治理逐步实现扁平化的格局,弥补开发层子系统组织层不足的短板。
(四)创新迭代数据开放平台技术,提高数据更新频率
结合实际需求开发、迭代升级数据开放平台技术,建设开源模式数据开放平台。开源模式(Open-source Model)是指不依赖少数机构的封闭技术体系,是围绕某一开源系统作为基础建设开放社区生态,强调所有系统工具面向全社会免费开放共享、社会各界协同创新的分布式建设和治理模式。[6]采取开源模式可以从平台建设层面就允许社会力量参与,数据开放平台不仅是开放数据源而且还是数字产业建设的生态源。
建立定期更新数据机制,逐步加快数据更新频率。建议在已有的技术条件下建立定期更新数据机制,对于按时更新数据的部门在考核中予以奖励,对于未按时更新数据的部门进行通报并责令改正。在形成稳定的数据更新机制后,可建立数据开放竞争机制,不同部门之间可以通过良性竞争来逐步加快数据更新频率。在此基础上,对于表现较好的部门予以奖励,激发相关部门开放数据的动力,进而提高数据更新频率。完善数据更新反馈机制,稳步提高数据开放质量。在提高数据更新频率的基础上,完善数据更新反馈机制,设立用户反馈最迟回复时限,在截止日期前必须对于用户所提出的疑问进行答疑解惑,若未能按时回复应说明原因。建立用户投诉机制,对于反复出现的问题未能有效解决或者在互动过程中出现的懒政、怠政的问题,接受用户的投诉,及时调查处理,以提升工作人员服务水平,提高开放数据质量。
(五)消除数据鸿沟,构建所需社会资本
应用层子系统建设的关键就是要打破不同身份人员间的数据鸿沟。加强政府和企业、社会组织、公民间的交流,消除数据持有者和开发者、使用者之间的数据鸿沟,使数据开放发挥应有的效能。在学校普及大数据知识,引导学生培养大数据意识,从源头处弥补鸿沟,让三个子系统间在技术方面高效衔接。
数据开放生态系统应用层方面子系统的构建需要靠社会资本来凝结促进。在举办数据开发活动时,应吸引各界各层级人员共同参与,平等协商对话,公职人员可以将数据开发的意图向参与活动的技术人员、社会组织成员和社区群众进行交流,让社会层面认识到数据开放和开发的意图。技术人员可以将数据开发的技术实现路径以及产生的效果向参与人员进行阐述。社区群众可以将自身的实际需求向公职人员和技术人员表达。在各方协商交流过程中构建社会资本,增强应用层子系统的软实力。
(六)三个子系统间协同发力,促进数据开放生态系统良性运转
通过准备度子系统中法律法规的完善、加强新闻宣传和统筹在政府内部形成数据开放的向心力,由政府主导开展数据开发活动,让社会组织和企业有效参与进来,形成数据开放生态系统总体的组织架构。在此基础上,以社会需求为导向,以数据层子系统为载体,组织公职人员、社会组织成员、企业人员、技术开发人员和普通社区居民,共同参与数据开发活动,以解决现实问题为着眼点,综合政策、技术和民意,开展数据开发活动,优化开发层子系统,在此过程中将问题进行反馈,然后完善政策法规、组织架构和活动模式,进一步激发社会组织活力和构建社会资本,促进数据开放生态系统良性运转。
结 语
在大数据时代,数据既是经济发展的重要要素,也是推动社会运行发展的“燃料”。 陕西要通过协同治理的方式,将数据开放生态系统建设作为开启追赶超越新篇章、争做西部示范排头兵的关键一招,通过用数据开发为陕西经济社会发展赋能,为社会治理提供新方案。陕西数据开放生态系统建设仍有很大的提升空间,完善数据开放生态系统任重而道远。
参考文献
[1]援引复旦大学数字与移动治理实验室《中国开放数林指数报告》中的概念为准备度即准备度子系统。
[2][英]维克托·迈尔-舍恩伯格、肯尼思·库克耶;盛杨燕、周涛译:《大数据时代:生活、工作与思维的大变革》,浙江:浙江人民出版社,2012:20页。
[3]马海群、王本刚:《开放数据生态系统——一个系统性的文献综述》,载《图书馆杂志》,2022,41(11):12页。
[4]薛伟贤、刘骇:《数字鸿沟主要影响因素的关系结构分析》,载《系统工程理论与实践》,2008(05):85-91页。
[5]杨光斌:《政治学导论(第四版)》,北京:中国人民大学出版社,2011:72页。
[6]Levine, Sheen S, Michael J Prietula. Open collaboration for innovation: principles and performance. Organization Science, 2013, 25(05):1414-1433。
作者简介
田王超 陕西省社会科学院政治与法律研究所研究实习员,研究方向为电子政务、社会治理
李佳伦 陕西省音乐文学学会秘书长,研究方向为音乐文学