省级政府数据开放平台建设水平的影响因素及组态分析

2023-10-14 08:29王昭君杜玉萍
科技和产业 2023年18期
关键词:开放平台组态变量

王昭君, 杜玉萍

(1.武汉大学 政治与公共管理学院, 武汉 430072; 2.江汉大学 图书馆, 武汉 430056)

随着大数据以及信息化时代的到来,数据资源越来越演变成为核心资源,政府作为海量数据的拥有者,政府数据开放为公众获取数据资源提供了重要窗口。截至目前,全世界已经有一百多个国家和地区建立了数据开放平台。我国的政府数据开放平台建设起步较晚,其最早可以追溯到2012年上海市率先推出的我国第一个政府数据开放平台,2015年开始我国政府开始关注并重视政府数据开放并将其上升到国家战略层面;2015—2018年政府出台大量相关政策推动数据开放的发展,政府数据开放平台数量呈现逐年递增的趋势。

在影响政府数据开放成效的因素中,数据开放平台建设水平是一个重要因素,然而学界对政府数据开放平台建设影响因素的研究并不多,当前学界多聚焦于对政府数据开放成效的整体性评价,平台建设的影响因素及其组态的分析亟待丰富与完善。探究省级政府数据开放平台影响因素及其组合样态具有理论价值和现实意义。

1 文献综述

现有文献关于政府数据开放的影响因素研究较为丰富,朱玲玲等[1]以省级地方政府为例对政府数据开放准备度的关键影响因素加以识别,认为安全保障等因素是影响政府数据开放准备度的关键因素;上官莉娜和潘晨[2]从制度逻辑视角下对政府数据开放绩效的相关影响因素进行分析,认为顶层设计等因素是影响其绩效高低的关键因素;程风和邵春霞[3]针对省级政府数据开放的影响机制展开研究,认为存在先发优势型、政策驱动型等四种驱动机制;上官莉娜和夏本倩[4]选取山东省地方政府作为案例分析地方政府数据开放的相关影响因素,认为其受到数据资源等多因素的共同影响;冉连和张曦[5]针对政府数据开放中的具体数据管理方面的影响因素进行分析,认为数据安全管控和技术保障是必要性条件。

关于政府开放数据平台的相关研究主要从以下几个方面展开:一是构建评价指标体系对政府开放数据平台建设进行评估,朱晓峰等[6]基于服务接触视角建构政府数据开放平台评估框架,发现平台建设好坏与经济发展水平不存在显性关系,各个政府开放数据平台的前台服务存在显著差异,使用开放数据平台的人员之间的接触方式也存在显著差异,政府数据开放平台的接触维度均较为薄弱;纪江明和刘冬[7]运用“结构-过程”模型对长三角区域的政府数据开放平台的建设进行分析,发现存在地区差距大、数据质量差以及数据可视化能力欠缺等问题,并提出针对该区域政府数据开放平台建设的具体建议;曹海军和李明[8]借鉴SERVQUAL模型构建政府数据开放平台服务质量的评价体系,发现我国政府数据开放平台服务质量存在明显的差异与不平衡,据此提出加强对平台建设的支持力度等措施。二是针对政府开放数据平台的现状及问题进行研究。胡亚飞和刘梦露[9]基于创新激励目标对政府数据开放平台中用户与平台的契约关系进行研究,发现目前各地开放数据平台契约关系存在权责关系不完整,双方风险配置不恰当和数据资源质量不高等问题;杜荷花[10]针对政府数据开放平台的隐私保护进行研究,对美国等国的相关政策进行分析,认为制定相关政策、构建相关制度是促进我国政府数据开放平台隐私保护的重要手段;刘瑾[11]以新冠肺炎疫情为背景,收集政府数据开放平台的相关数据,以数据层和平台层为评估分析框架提出政府数据开发建议;孟显印和杨超[12]分析了国内的开放政府数据平台应用开发现状,发现存在应用质量不高、更新不及时等问题。

对政府数据开放平台建设影响因素的研究成果包括以下几个方面:一是人才因素。张爱舒[13]发现专业技术人员可以保障政府数据开放平台的运营、维护等诸多功能的实现;邓崧和葛百潞[14]认为建立专门的技术人才保障机制是保障政府数据开放平台建设的重要环节。二是数据质量因素。李志[15]研究发现从平台用户使用角度看,用户利用数据的效果直接受到数据质量的影响,数据质量进一步影响到用户对平台的体验;王今[16]研究发现政府数据开放平台建设是否取得实质突破取决于数据质量是否实现升级。三是技术因素。李白杨[17]发现当政府数据开放平台拥有更多的内部支持功能时,可以满足用户的更多需求,较高的技术水平可以支持平台拥有更多内部功能,因而技术水平更高,政府数据开放平台建设也就相应的越好;相丽玲等[18]认为政府数据开放平台的运行与维护离不开技术层面的支持。四是公众需求因素。李荣峰[19]研究指出对政府数据开放平台建设起到催化和推动的一个重要因素是公众需求;朱红灿等[20]研究指出公众手中掌握着评判平台建设好坏的权力,而公众评价政府数据开放平台建设成效的依据是自身需求的满足程度;王一凡[21]指出公众需求会对政府数据开放平台建设产生影响。五是资金投入因素。现有研究关于资金对政府开放数据平台建设的影响不仅囊括了是否存在影响,也讨论了资金在影响因素中的地位。王今[16]研究发现资金投入越多,政府数据开放平台建设效果越好。

综上,现有研究认为政府数据开放平台建设的影响因素包括人才因素、数据质量因素、技术因素、公众需求因素以及资金投入因素,但是现有研究缺乏对政府数据开放平台影响因素的系统归纳,也缺乏对各个影响因素的组态分析,分析政府数据开放平台建设的影响因素及其组态能够促进其更好地建设与发展,因此具有必要性;与此同时,采用fsQCA的方法对政府数据开放平台影响因素分析,现有研究较少采用这一方法对政府数据开放平台进行研究,本文在研究方法及内容上具有创新性。

2 理论基础及分析框架

2.1 政府数据开放生态系统

政府数据开放生态系统是基于自然生态系统、信息生态系统、政务信息生态系统以及数据生态系统等理论基础上形成的。目前学界将政府数据开放生态系统界定为由数据主体参与,并受到外部环境条件制约的相互作用的生态系统,在这个生态系统中,数据资源、数据主体以及外部环境是其核心要素,在这个生态系统中,三大要素之间会受到彼此的影响并给予反馈。

2.2 分析框架

在政府数据开放生态系统理论基础上结合本文的研究问题构建如下分析框架。

数据资源:采用数据质量这一解释变量,数据质量是关系到政府数据开放平台建设的一个重要影响因素,数据是政府开放数据的核心资源,这其中包括了数据数量、开放范围、关键数据集质量等,数据数量越多,意味着平台提供的资源越多;开放范围越广,能够获取到相应的数据资源的用户范围也就越大,平台用户也就越广,关键数据集质量更是直接决定了用户所能获取的数据资源质量的高低,借鉴《中国地方政府数据开放报告:省域指数(2022)》[22],设立数据层指标以评估数据质量,数据层指数涵盖了数据质量、开放范围、关键数据集质量、关键数据集规范以及关键数据集安全保护等5个测量指标,能够集中全面地反映各个省级政府数据开放平台中的数据质量。

环境因素:采用资金支持、公众需求以及技术人才保障3个解释变量,资金的投入会促进政府数据开放平台建设,采用省级政府2022年一般公共预算支出作为衡量政府资金支持的数据来源,政府的一般公共预算支出较少时,支出将主要用于满足最基本的公共服务,对政府开放数据平台建设的资金投入会减少。因而,省级政府一般公共预算支出可反应政府开放数据平台建设的资金支持。李荣峰等[19]指出公众需求对政府数据开放平台的建设具有推动作用,平台建设的好坏最终也取决于公众的评判,因此政府在建设数据开放平台的过程中,公众需求是一个重要的影响因素,政府信息公开申请人次在一定程度上能够代表公众对公开信息以及数据的需求,相应的也体现了公众对数据平台的需求,借鉴各省政府信息公开申请人次作为衡量公众对数据平台建设需求的数据来源。技术人才保障是政府数据开放平台建设的重要影响因素,各省份信息技术等服务业从业人员数量能够代表该省份的技术人才实力,技术人才实力越强,政府数据开放平台建设的人才保障也就越充分,因此借鉴《中国统计年鉴2022》中的信息传输、软件和信息技术服务业从业人员数作为衡量各省技术人才保障的数据来源。

数据主体:开放数据的提供者主要是政府,采取政策支持度作为解释变量,政策支持能够显著提升政府数据开放平台建设水平,《中国地方政府数据开放报告:省域指数(2022)》[22]设立了准备度指标以评估相关政策支持度,借鉴这个指标作为数据提供者政策支持度的数据来源。数据主体还包括了利用者,数据利用者主要包括从事政府数据二次开发利用的个体或群体,通过参加数据开放创新大赛等推动政府数据开放平台建设,数据利用者多样性越丰富、产出的成果数量越多、成果质量越高、成果价值越高越能提升政府开放数据平台的建设水平,《中国地方政府数据开放报告:省域指数(2022)》[22]专门设立了利用层指标以评估数据利用度,以该指标作为数据利用度的数据来源。

综上,选择数据质量、资金支持、公众需求、技术人才保障、政策支持度及数据利用度作为解释变量,构建研究模型以分析政府数据开放平台建设的影响因素及组态。

3 研究设计

3.1 研究方法

采用模糊集定性比较分析方法(fsQCA) 的原因在于:首先,从样本量的角度考量,拟采用的样本为15个省份,QCA对于样本量的要求为10~60个中小样本,适用于样本量小的数据处理。其次,从变量角度考量,影响政府数据开放平台建设的多种因素之间具有联动作用,影响因素与政府数据开放平台建设之间也并非简单的单一线性关系,传统定量方法只能验证自变量与因变量之间的单一关系,无法进行多因素组态分析,QCA研究方法可以验证单变量与因变量之间的复杂线性关系,也能识别单变量之间的组态关系,与研究的适配度较高。最后,所采取的解释变量如公众需求、政策支持度等较为复杂,无法进行量化,也不能用简单的“属于”和“不属于”进行归类,因此,采取模糊集定性比较分析方法(fsQCA)进行数据处理。

3.2 样本选择及变量确定

3.2.1 样本选取

依据《中国地方政府数据开放报告:省域指数(2022)》[22]平台层指数排名,选取贵州、山东、浙江、四川、广西、辽宁、广东、江苏、海南、福建、江西、陕西、安徽、河北、宁夏15省份作为样本。选取这些省份作为分析样本原因在于:省级政府数据开放平台具有代表性,能够代表相应省份的数据开放平台建设的水平;平台层指数越靠前证明其平台建设水平越高,越具有代表性,对研究平台建设的影响因素及其组态具有典型意义。

3.2.2 结果变量的确定

将贵州等15个省级政府开放数据平台建设水平作为结果变量,数据来源于复旦大学和国家信息中心数据中国研究院2022年下半年发布的《中国地方政府数据开放报告:省域指数(2022)》[22]平台层指数,这些数据均客观准确反映各省级政府开放数据平台的建设水平。

3.2.3 条件变量的确定

根据分析框架确定了数据质量、政府资金支持、公众需求、技术人才保障、政策支持度以及数据利用度5个条件变量,变量类型、变量名称、测量指标及数据来源如表1所示。

表1 变量测量及数据来源

3.2.4 数据校准

数据校准,即通过将原始数据校准为集合隶属分数,从而分析数据的相关性与必要性,使用直接校准法,设定3个定性锚点,基于原始样本数据,将完全隶属点选定为样本数据的95%分位点,交叉隶属点选定为50%分位点,完全不隶属点选定为5%分位点。采用fsQCA3.0软件进行校准实现,通过校准函数calibrate 将原始数据校准为0~1的集合隶属分数,校准后的结果如表2所示。

表2 变量校准

4 实证结果分析

4.1 必要条件分析

必要条件分析是指对一个结果变量的影响需要满足一定的必要条件。确定必要条件可以提高分析模型的精确性和准确度,基于QCA分析原理,条件变量一致性参数高于0.9的视为影响结果变量的必要条件,对6个条件变量进行必要性分析,得到各个条件变量对应的一致性指数和覆盖度数值,结果如表3所示。所有条件变量的一致性值均低于0.9,无法作为结果变量的必要条件,说明没有直接决定结果变量的条件变量,其中政策支持度的一致性虽然没有达到0.9,但高于 0.8,因此该变量可以作为结果变量的充分非必要条件。综上分析,影响结果变量的必要条件是不存在的,政府数据开放平台建设水平是由诸多条件因素协同影响决定的,为了进一步探究影响方式,需要进行组态分析。

表3 必要条件分析

4.2 条件组态分析

组态分析是指研究不同因素之间交互作用以及这些因素对于结果的影响,利用布尔代数以及逻辑运算原理分析条件变量的组合机制是如何影响结果变量的。首先设定案例频数阈值,采用15个不同省份数据样本,故设置频数阈值为1;用一致性指标来衡量不同组态的充分性,根据数据断层出现在0.7~0.9,设置阈值为0.80,同时将设置PRI临设为0.65。分析得到复杂解、中间解和简单解3 种解,其中中间解相比简单解覆盖面广,相比复杂解组态路径更具有代表性,可解释性更强。中间解组态路径如表4所示,得到了3种不同的条件组态路径,根据表中数据,显示解的覆盖度为0.745,说明这3种条件组合可以解释74.5%的具有高水平政府数据开放平台的建设案例。整体解的一致性为0.8,说明在符合这3种组态的地方政府数据开放案例中,有80%的政府开放数据平台建设水平较高;可进一步将这3种驱动政府数据高水平开放的条件组态归纳为政策数据联动型、数据环境联动型和全要素驱动型3种具体类型。

表4 政府数据开放平台建设水平的影响因素组合

1)政策-数据联动型,对应表中的组合1。在该组态中,政策支持度以及数据质量起到关键作用。该组态表明,省级政府政策环境较好,政府出台大量支持平台建设的政策,当政府开放数据平台拥有更庞大、更高质量的数据资源的时候,可以显著提升政府开放数据平台的建设水平,0.913是组合1的一致性数据,说明组合1可以解释35.1%的相关案例,代表的省份是广西和贵州,其中2020年颁布实施的《贵州省政府数据共享条例》对贵州省政府数据开放存在的数据不准确、数据不规范、数据的实效性不足等问题靶向施策,促进贵州省政府数据开放建设水平。贵州多措并举盘活数据资源,打造“云上贵州”,打破部门之间的数据壁垒,促进所有政务部门数据资源共享。广西于2020年出台了《广西公共数据开放管理办法》,从省级层面规范公共数据资源的管理,对数据资源的更新频率等做了具体规定,从政策层面提升了省级政府数据开放效率。

2)数据-环境联动型,对应表中的组合2。该类型表明,起到关键影响因素的是公众需求以及技术人才保障,而数据质量、数据利用度以及资金支持等要素起到辅助作用,而政策支持度则不是必备因素。组合2的一致性是0.607,该组合能够解释27.3%的政府数据开放案例,代表省份是安徽,安徽2022年政府信息公开申请数量高达13 293次,体现了公众对该省政府数据开放及信息公开的较高要求,其2022年的信息技术等服务业从业人员数量高达55 161人,专业技术人才支撑显著提升了安徽省政府数据平台的建设水平。从安徽的案例中可以知晓,公众需求以及技术人才保障是促进政府开放数据平台建设的关键要素,同时也是驱动政府数据开放平台高水平建设的可行路径。

3)全要素驱动型,对应表中的组合3。当政府数据开放平台有较高的政策支持度、较高公众需求和技术人才保障时,辅之以较高数据质量、数据利用度及资金支持时,则可以实现较高的政府数据开放平台建设水平,在该类型中政策支持度、公众需求及技术人才保障起到关键的主导作用。组合3的一致性是0.948,该组合能够解释51.1%的政府数据开放案例,代表省份是山东。山东是政府数据开放平台建设方面表现较为典型的案例,2022年《山东省公共数据开放办法》的施行对省内公共数据安全及适用范围做出相关规定,该办法支持和促进社会各界包括公众、社会组织、企业等对相关数据的开发利用。2022年山东省政府数据开放申请公开数量高达39 620次,公众需求较高,山东2022年从事信息技术等服务业的人数达到了130 314人,对政府数据开放平台形成技术支撑,促进其更好的开发建设,山东2022年省级政府的一般公共预算支出高达11 713.16亿元,省政府财力充沛、能对平台建设投入更多资金支持。山东在政府相关政策的支持下,积极推进政府数据开放平台建设,加之公众对政府数据开放提出更高要求,促使政府提高开放数据质量,在多个因素的共同影响下促进了政府数据开放平台的高质量建设。

4.3 稳健性检验

稳健性检验,通过一致性阈值、校准锚点等参数的微调,观察组态路径的变化情况,检验分析结果是否具有较高的可靠性和鲁棒性。通过对一致性阈值的调整对结果进行稳健性检验,将原本的阈值用更高的值0.85和更低的值0.5分别进行替换,不改变其他分析要素的情况下,检验结果没有发生变化。其次调整PRI阈值,将其从0.65调高至0.8,案例频数和一致性阈值2个参数保持不变,输出得到的中间解组态路径数量减少为2个,观察可知这2条路径在原结果中也存在,说明两次的组态路径结果之间存在包含关系,新得到的组态包含在原结果的解释范围内。最后调整校准锚点,将所有变量的交叉隶属度设置为变量数据的55%分位数,其他参数保持原值。结果显示,组态的数量保持3个不变, 一致性指数和覆盖度数值变化幅度在合理范围内,核心条件没有发生变化。通过上述检验过程可以判断本文的研究结果是具有稳健性的。

5 结论与建议

基于政府数据开放生态系统理论,采用模糊集定性比较分析方法对贵州、山东等15个省级政府数据开放平台建设水平差异的影响因素及其组态进行分析。研究认为,单个因素不能决定政府数据开放平台建设水平的高低,其差异受到多个因素的共同影响,从影响因素的组合机制来看,我国政府数据开放平台建设水平的影响机制可以分为政策与数据联动型、数据与环境联动型及全要素驱动型,三种影响机制基于数据、数据主体及外部环境相互作用形成。

本文的研究结论为我国省级政府如何提升政府数据开放平台建设水平提供了启示与建议。从影响因素角度看,首先,需要提升政府高位政策支持度。从本文研究来看,政府对开放数据给予高位支持并出台较多配套政策的省份平台建设水平较高,而政府重视力度不够或者相关政策未严格落实则导致该省数据平台建设水平较低,因而加大政府政策支持度,并对公共数据资源加以规范,提升数据资源质量是促进平台建设水平提高的有效路径。其次,加大对技术人才的支持引进力度。研究显示信息技术服务业从业人员较多,表明该省份技术实力较强,相应的能够为政府数据开放平台建设提供较强技术保障和人才支撑,其建设水平显著提高,因而促进技术人才引进,支持其促进本省技术行业发展可以显著促进政府数据开放平台建设水平。最后,加大宣传力度,提高公众对政府数据公开的认知度。公众对政府数据公开的需求往往构成较大的外在压力,从外部驱动政府数据开放平台的建设,公众需求较大的省份往往数据开放平台建设水平较高,因而提升公众对公共数据需求度是促进政府数据开放平台建设的有效外部路径。

从驱动因素组合角度看,对于经济水平较高、政策环境较好、公民需求高以及技术人才资源丰富的省份来说,可以采取全要素驱动这一路径加强政府数据开放平台建设,在建设过程中要注重相关配套政策更迭升级,注重技术人才的引进扶持以及财政投入,积极开展开放数据竞赛等活动促进数据资源利用;对于政策环境较好,数据资源质量较高,但是经济环境、技术人才数量及公民需求相对较低的省份而言,可以采取政策数据联动这一路径,发挥政策优势以及数据资源优势,与此同时补短板强弱项,加强公民对政府数据开放的了解,提升公民外部诉求,加大技术人才的引进,为平台建设提供人才储备与技术支撑,政府加大对平台建设的投入力度,积极开展数据知识竞赛,从而有效提升平台建设水平。对于经济环境、技术人才等方面较好但是政策环境尚不完善的省份,可以采取数据环境联动路径,采取公民需求、技术人才及经济支持等内外部合力助推平台建设。

本研究局限性在于,首先,选取了15个省份作为样本数据,存在样本量较小的问题;其次,根据数据生态系统理论以及学界已有研究选取了相应的条件变量,但是影响结果变量的因素可能不仅仅局限于此;最后,基于数据的权威性和可得性选取了相关解释变量,仍待在未来的研究中补充和优化。可进一步优化样本量、条件变量以及解释变量,使研究结论更具说服力。

猜你喜欢
开放平台组态变量
抓住不变量解题
基于在线开放平台的混合式课堂教学模式构建与实践
基于PLC及组态技术的恒温控制系统开发探讨
也谈分离变量
基于AliGenie语音开放平台的传统家居智联网解决方案
基于PLC和组态的智能电动拧紧系统
搭建开放平台 收获真情实感——谈《品德与生活》教学中开放式教学的实施
PLC组态控制在水箱控制系统的应用
铸造行业三维组态软件的应用
SL(3,3n)和SU(3,3n)的第一Cartan不变量