朱晓峰 姜玉洁 蒙晓莹
DOI:10.3969/j.issn.1008-0821.2021.10.002
[中图分类号]D63-39 [文献标识码]A [文章编号]1008—0821(2021)10—0012—09
信息技术的快速更迭,为政府数据的开放共享提供了良好的技术环境。各国纷纷建立政府数据开放共享标准与相关战略,并在国内和国际之间发布开放宣言。政府数据开放已经成为现代政府的重要工作内容,也是顺应时代要求的体现。
如何實现政府数据开放一直是理论界关注的焦点,早期主要聚焦于政府数据开放的内外部环境,强调系统地开放数据制度与组织架构、协同式地开放数据共享与应用机制;关注用户的隐私保护,建议综合考虑使用主体、用途和可能的效益;评价网站服务质量,探索提高开放数据网站服务质量建设的可行措施。随着研究的深入,学者们日益关注政府数据开放的具体落地与实现,如探寻政府数据开放的影响因素及其彼此关联、解析立法条例以期探寻政府数据开放的立法路径、通过强化领导驱动和完善职责体系实现数据开放平台建设的纵深突破等。
令人遗憾的是,由于政府数据开放是一个系统工程,是一个不断发展、完善的过程,导致单一维度的探索难以适应不同层级、不同阶段政府数据开放的需求。政府数据开放的实现具有高度不确定性,一般性的对策建议缺乏适应性,难以有效推进政府数据开放进程。换言之,政府数据开放的实现,本质上是一个不断进行路径选择的过程。
政府数据开放路径选择,就是政府在对其数据资源优化重组的过程中,选择最适合其长期发展的道路,这实质上描述了政府以新的逻辑创造和资源利用创造新的价值的过程。在这个过程中,需要明确政府数据开放的关键因素和彼此关系关联。NK模型的主要作用,正是用来通过分析系统内部元素间的相互作用来研究系统的演化规律。例如,刘凯宁等通过分析商业模式系统内部要素的相互作用研究商业模式创新路径选择;Celo S等利用NK模型分析跨国公司组织结构与绩效之间的关系;汤洪霞等利用NK模型聚焦BIM情境下综合设施管理组织合作关系内部要素的相互作用。这些研究表明,NK模型可以很好地模拟组织、管理中的复杂系统和复杂关系,同样也适合模拟政府数据开放各个要素之间相互关系。
综上,本文将政府数据开放视为复杂系统,考虑政府数据开放构成要素之间的相互影响和相互作用,并借鉴Gould S J提出的NK模型理论,通过采用计算机仿真方法给出一种政府数据开放路径选择的决策方法。
1政府数据开放的路径选择框架与影响因素筛选
1.1基于NK模型的政府数据开放路径选择框架
基于NK模型的政府数据开放路径选择框架,本质上是在识别政府数据开放诸多影响因素的基础上,探索一种政府数据开放路径选择的规范方法。主要目的是解析政府数据开放的关键因素以及彼此关系,进而探索这些要素和彼此关系对于政府数据开放产生的影响程度和变化方向。
如图1所示,基于NK模型的政府数据开放路径选择框架,首先通过理论分析与文献梳理,分析已有文献中关于政府数据开放的所有影响因素,再通过问卷调查法筛选出主要的影响因素;其次,探究影响因素之间的关联强度,据此识别政府数据开放的关键因素数量(即参数N),以及因素间的相互作用情况(即参数K);再次,利用随机分布函数为影响政府数据开放的关键因素选择组合结果,随机分配适应度值并绘制适应度景观图;最后,根据相应算法,利用计算机仿真工具对政府数据开放路径进行优选,并给出具体选择结果。
1.2政府数据开放影响因素筛选
政府数据开放的影响因素,已经有诸多专家学者分析研究并给出了众多结果。但是,这些影响因素中哪些是最重要的、最需要解决的,以及改善这些影响因素的先后顺序,鲜有人提及。所以,需要首先筛选和确定政府数据开放受到哪些影响因素的制约,进而确定哪些是最重要的影响因素。
通过在CNKI、Elsevier等数据库中进行文献高级搜索,主题为“政府数据开放”,篇名或者摘要或者关键词为“影响因素”,共检索出期刊论文65篇。分析这些文献,不难发现,早在2012年,ZuideiwijkA等已经提出了影响政府数据开放的因素包括:社会性质、技术性质等;同一时期,Solar M等认为数据层面的原始性与完整性、组织成熟度等对政府数据开放有重要影响;Chan C指出影响因素为政府内部层面的创新战略、平台开放性、组织合作、平台创新等;Conradie P等也指出机构、数据使用、数据存储、公共服务等是政府数据开放的重要影响因素。在国内,汤志伟等认为政治要素中的政策数量、经济要素中的地方经济发展水平、社会要素中的信息产业发展水平共同影响着政府数据开放平台的发展水平;陈朝兵从“质”和“量”两个维度,将政府数据开放质量的影响因素分为:价值取向、公共政策、目标原则、开放平台、政府数据、体制机制、公众能力、公众自身特征、公众间沟通与交流和政府后续行为等。
近年来,政府数据开放的影响因素的研究,已不再是简单的罗列,而是通过这些影响因素分析对于政府数据开放的具体影响。孟显印等研究发现,问责制、话语权和法制监管环境对政府数据开放发展水平有显著正向影响。门理想等从数据开放者、消费者等4个维度出发进行回归分析,发现4个变量——“国内生产总值”“数据开发者开发能力”“开放政府数据的省域统筹程度”和“是否位于国家大数据综合试验区”,显著正向影响政府数据开放建设的成效。李梅等提出,对于政府数据开放而言.最为直接的影响因素是数据开放统一平台和政府数据管理机构;间接的影响因素包括开放评价机制、政府数据开放理念、战略规划与政策支持等。
在诸多文献中,只挑选属于SSCI、SCI、CSS-CI、北大核心期刊中的46篇论文作为具有代表性文献进行进一步分析研究。为了找出最能准确描述和概括政府数据开放的影响因素(多次在论文中被提到的关键词语),采用共现矩阵的方法对每篇文章的关键词进行梳理分析。具体而言,通过Py-thon生成共现矩阵,使用NetDraw网络分析软件绘制出政府数据开放影响因素的相关文献的网络关系图,如图2所示。在图2中,圆圈表示文献中提到的政府开放数据的影响因素。其中较大的圆点诸如“数据质量”“制度规范”等,表示这些影响因素在46篇代表性文献中多次被提到,可作为政府数据开放影响因素筛选的重要依据(初步筛选得到58个影响因素)。
在NetDraw网络分析软件初步筛选的基础上,进一步运用德尔菲法对这58个影响因素进行专家意见征询,从而对政府数据开放影响因素进行修正和补充,得到政府数据开放的主要影响因素。具体而言,选定来自高校和政府部门的20位研究政府开放数据的专家,通过发送匿名电子邮件的方式进行问卷调查。专家们依据李克特量表,按照“非常重要、重要、一般、不重要、非常不重要”5个等级对初步筛选的58个政府开放数据影响因素进行评价,5个等级分别赋值为5、4、3、2、1。专家调查中,采用α信度系数法对问卷量表进行信度检验,Cronbachsα系數为0.902,大于0.7表示信度较好。采用KMO进行效度检验,KMO统计量值为0.884,大于0.8,表明量表具有良好的结构效度。
综上,筛选出政府数据开放的主要影响因素包含11个指标,分别是数据可用性、数据及时性、数据内容质量、公众参与公众能力、价值取向、行政生态、管理机制、组织能力、平台功能、平台安全和平台隐私保护,如表1所示。
2政府数据开放路径选择的NK模型构建
本文构建的NK模型,是指通过计算政府数据开放主要影响因素的中心度和中心度阈值,识别关键因素(即参数N),计算关键因素之间的关联度确定参数K,进而得出关键因素等位基因组合的适应度值,最后选择政府数据开放的最优攀爬路径。
2.1基于中心度和中心阈值确定关键因素
政府数据开放路径选择的NK模型,包括如下的基本参数,如表2所示。
最终,将政府数据开放关键因素等位基因组合的适应度数值映射到三维空间,得到政府数据开放的适应度景观图,此图本质上体现了政府数据开放关键因素之间的所有互动关系和相互影响。
2.4政府数据开放最优路径选择
政府数据开放最优路径选择,是指对影响政府数据开放关键因素的选择过程。当政府数据开放的某个或者某些关键因素发生变化时,政府数据开放的整体适应度值将发生改变,需要辨别适应度值增加的路线,将其显示在适应度景观图中。在不断识别的过程中,就可以直观展现政府数据开放的最优路径。
换言之,政府数据开放路径选择过程,是一个不断辨别各关键因素对应状态之间影响和变化的过程。如图3所示,若将α作为起点,通过对附近关键要素的适合度值进行计算,找出最优路径,分别经过b、c、d,到达图中的最高点e。
3政府数据开放路径选择的仿真研究
为了验证前述方法的可用性,本文选取尚未上线政府数据开放平台的Y市为例,邀请10位对于政府数据开放有深刻理解的专家和Y市10名从事政府数据开放工作的实践者,进行了问卷调查。采用李克特五级量表形式.被调查者针对表1中11个主要影响因素之间的关联程度进行打分,分值范围从1~5变化,分别对应“非常不重要”到“非常重要”。
根据式(1),将专家评价的各要素之间的关联程度矩阵进行集结,得到政府数据开放影响因素直接关联群体评价矩阵T,即各个专家打分的均值,如表3所示;依据式(2)得到规范化之后的政府数据开放影响因素直接关联评价矩阵,即将矩阵归一化处理,如表4所示;规范直接影响矩阵自乘,表示的是要素之间增加的间接影响,当把所有的间接影响都相加便得到间接关联评价矩阵。依据式(3)计算得到影响因素的间接关联评价矩阵,如表5所示;依据式(4)~(6)计算得到影响因素的中心度,中心度值越大,表明该因素在评价指标体系中越重要或所起的作用越大,中心度值大于阈值的影响因素即为关键要素,如表6所示。
依据式(6)和表6,结合设定的最大中心度比率X=0.93,得出政府数据开放关键因素的中心度提取阈值ξ=18.62,将中心度高于提取阈值的W2(数据及时性)、W5(价值取向)、W7(管理机制)、W9(平台功能)作为政府数据开放提升的关键因素B1、B2、B3、B4,得到参数N=4。并依据式(7),得出关键因素的邻接矩阵4为:
进一步集结矩阵4中的行元素,得到政府数据开放关键因素关联度,忽略各因素对其自身的影响,结合式(10),将政府数据开放关键因素关联度的平均值作为参数K=3.0。
将影响政府数据开放的4个关键因素抽象为4个主体,进行主体建模,同时更深一步挖掘各因素间的彼此交互关系和对政府数据开放的影响。基于NK模型的政府数据开放路径选择,就是政府数据开放的关键因素形态不断改变的过程,也就是根据该因素与其他关联因素之间的关联关系,随机抽取(0,1)区间的数作为适合度值的过程。所以,依据NK模型各要素状态编码及适合度计算公式,运用计算机仿真为每一个决策选择结果随机分配适合度值,整理得到政府数据开放所有关键因素的组合状态集合,以及相应关键因素其组合状态下的景观适合度值,绘制政府数据开放系统适应度三维景观攀爬图。
如图4所示,①、②、③、④体现了适合度景观图的攀爬过程。也就是说,Y市开展政府数据开放工作,首先需要考虑关键因素B4(即平台功能),在适应度景观上表现为从位置00(平面坐标0000)向位置①(平面坐标0001)攀爬的过程;其次,应通过改进关键因素B1来提升政府数据开放适合度,在适合度景观示意图上表现为从位置①(平面坐标0001)向位置②(平面坐标1001)攀爬。以此类推,要提升政府数据开放系统适合度应按照平台功能、数据及时性、管理机制和价值取向的顺序依次提升,即政府数据开放系统适合度的路径为B4→B1→B3→B2。
具体而言,首先,考虑增强平台功能中数据采集、处理、存储、整合、分析、共享和安全等功能,将其作为承载政府数据开放最坚实的数据载体和技术基台;其次,考虑提升数据的及时性,其体现了数据的时效性,与数据可用性及数据质量均息息相关;再次,考虑改革政府的管理机制,即建立统一的数据管理机构并优先建立数据管理协同机制及合作机制,提高政府数据开放的效力,为其注入新的动力;最后,当上述关键因素得到提升优化之后,坚定政府数据的开放价值取向,即明确政府在开发利用数据方面的独特优势,将政府数据开放投入到最有价值的建设中。
4结论
NK模型在经济与管理领域已具有广泛应用,它适合解决复杂系统中各要素的相互影响问题。本文基于NK模型针对政府数据开放的路径选择问题进行研究,并通过计算机仿真辅助找出最优路径。本文的研究,实质上是提供了一套决策分析方法,帮助政府数据开放的实现提供具体的措施和步骤。该方法从系统的角度出发,考虑到各影响因素之间的相互作用、相互关联性,克服了一些无法用实证数据测量的局限性,对于推进政府数据开放具有理论指导意义和实际应用价值。
需要强调的是,在政府数据开放实践中,无论是尚未上线的还是已经上线的各级政府数据开放平台,所处阶段和水平各不相同。针对不同条件和状态的政府数据开放平台,其关键因素必然也各不相同,需要重新识别和辨析,从而得出适合自身情况的最优路径。
(责任编辑:孙国雷)