卢新元 陈泽茵 卢泉 王雪霖
作者简介:卢新元,教授,博士生导师;陈泽茵,博士研究生;卢泉,博士研究生;王雪霖,博士研究生,通信作者,E-mail: xlinwang@foxmail.com。
收稿日期:2023-02-20 发表日期:2023-10-19 本文责任编辑:刘远颖
摘要:[目的/意义]从构型的视角出发,获取高水平政府数据开放水平构型,探究深入影响政府数据开放水平的因素,提出优化平台数据开放水平的不同路径,归纳优化策略。[方法/过程]采用基于模糊集的定性比较分析方法,以開放的省级政府数据开放平台作为研究案例,利用扎根理论方法总结出数据数量、数据质量、数据规范、数据获取和开放范围5个前因变量,探究多个变量的共同作用对政府数据开放水平的影响。[方法/过程]研究结果共有3种构型:①平台数据规范程度高、数据质量好的高规范数据型。此类型平台可以通过两种路径维持平台的高数据开放水平,一是适当增加数据集数量,二是增加API接口数量。②平台规范性数据量大的大数量数据型。此类型平台的高数据开放水平仅通过加大规范数据量的开放就可以保持。③平台数据质量高的高质量数据型。对于数据质量很好的平台,通过加大开放数据集数量,增加开放范围,增加数据获取API接口可使平台数据开放处于较高水平。
关键词:政府数据开放;扎根理论;定性比较分析;fsQCA;NCA
分类号:G251
引用格式:卢新元, 陈泽茵, 卢泉, 等. 省级政府数据开放平台的数据开放水平构型研究[J/OL]. 知识管理论坛, 2023, 8(5): 382-398[引用日期]. http://www.kmf.ac.cn/p/359/.
开放政府数据(open government data)是公民可自由获取、访问、使用、再利用、再发布的由政府生成的结构化数据。它不仅可以通过透明监督提高自身效率和服务能力,增加政府影响力,实现治理现代化,还可以使公民和机构通过对大数据的挖掘、整合和再利用为国家带来科技、文化创新和经济增长,促进价值创造[1]。因此,开放政府数据有其重要的现实意义,也逐渐融入我国的政策实践中[2]。2015年国务院发布《国务院关于印发促进大数据发展行动纲要的通知》[3],明确要求开展公共数据开放行动,随后又相继出台《促进大数据发展行动纲要》[4]等文件对推进公共数据资源开放做了稳步部署,旨在通过政府数据开放平台为个人和企业使用政务信息资源提供数据支持服务[5]。
然而,在政府数据开放促进跨部门资源共享共用、稳步推进公共数据利用的同时,研究发现开放政府数据为现实经济社会带来的好处不够显著[6]。有研究指出其原因在于政府数据开放水平未得到充分提高[6]。因此,如何有效提高政府数据开放平台的数据开放水平,并使之释放数据利用潜力,成为一个亟待解决的问题。目前已有学者对该问题开展研究,但是仍存在一些问题:①政府开放数据平台的评价指标的选取多是基于单一平台,评价结果存在不一致性,影响了研究的可比性和可信度;②研究多是基于数据质量和可用性等方面,未从整体角度考虑多个评价指标的共同效应。
由此,为了推动规范数据流动与利用,充分挖掘政府数据的应用价值,笔者采用扎根的方法获得政府数据开放平台的数据开放水平的影响因素,并从整体的视角出发,根据基于模糊集的定性比较分析方法探究数据开放水平的构型,以期提高政府数据开放平台开放水平,激发社会利用政府数据的创新活力,推动数据驱动型经济发展。
1 文献综述
当前,国内外学者对于政府数据开放展开了细致研究。国外对开放政府数据的研究起步较早,最初是政府部门为了解决效率低下的问题,有序推行新公共管理运动,形成公共价值理论[7]而开展的研究。在此基础上,政府部门积极开展政府数据开放各项工作,以期能够提高政府部门的工作效率,促进经济增长,进一步提高政府透明度。
国外政府数据开放平台的发展历程可以分为以下两个阶段:
(1)政府数据公开。这个阶段主要是政府通过官方网站等渠道公开数据,但是不同政府数据开放平台所提供数据的质量和格式不尽相同,不便于公众使用。这个阶段的研究者多侧重于对政府开放数据质量的研究。R. Meijer等[8]在研究报告中对政府数据公开做出了细致研究,提出预先承诺的概念,有效避免开放数据与公共价值之间的冲突。其中,预先承诺包含3个不同的阶段:①界定需求数据的类型与内容;②关注法律法规,准备需要传递的数据,并将敏感数据删除;③将数据向所有人开放。研究人员认为政府数据公开有利于促进公共价值的提升,但存在不信任、不安全等隐患。K. Jung等[9]在研究中认为公共政策中关键问题与维度之间存在一致性。在数据共享工作中,应该重视新产品的应用,将其创造性融入到现有生态系统中,有利于提升政府工作透明度,并且对开放公共数据进行标准化处理,能够增加就业机会,创造新的商业模式。R. P. Nugroho等[10]对不同国家开放数据政策进行对比分析,认为政府数据公开过程中,需要健全的法律框架、合适的运作政策、能够为用户提供高质量的数据服务。在国家政策推行中,重视开放政策的制定与评估,适应当前政府工作的需求,能够为政府工作带来更大的益处。
(2)政府数据开放。这个阶段主要是政府向公众开放数据,公众可以通过政府数据开放平台获取数据。2009年美国推出第一个国家级开放政府数据平台Data.gov,开始注意到统一规范的数据开放平台对推动数据开放的重要性。A. S. Martin等[11]比较不同的政府平台质量,从功能、语义、内容3个不同层面,对政府数据质量进行有效评价,认为政府数据开放质量缺乏同质性,容易受到国家网络与经济能力的影响。A. Brown[12]基于生态系统理论重新定义了政府数据开放平台构成要素。L. Danneels等[13]通过认识论定义了3种不同类型的数据开放平台,该研究表明目前政府数据开放平台仍未达到期待水平。
政府数据开放平台是政府部门为提高政务公开度和透明度、促进政务信息共享与利用、加强政府与社会互动交流所建设的一种信息化平台。相较于国外,我国政府数据开放数据研究起步较晚,仍处于探索阶段,近年来,在国内政府数据开放平台的研究逐渐成为学术界和政策制定者关注的焦点,主要从以下几个方面开展:
(1)政府数据开放平台的数据质量与安全研究。研究者关注如何提高政府数据的准确性、完整性、时效性和可用性,以及如何确保数据安全与隐私保护,从而提高政府数据开放平台的可靠性和可信度。张聪丛等[14]从生命周期的视角对开放数据共享与使用中的隐私保护问题进行了探讨,强调规制性措施在数据利用过程中的必要性。杨瑞仙等[15]探讨了国内数据开放平台存在数据量少、数据的适用性与规范性不足等6个方面的问题。王琳等[16]基于公众感知视角对开放平台的信息服务质量进行评价,归纳可以用于评价政府数据开放平台的信息服务质量的7个维度指标,发现用户对平台的数据质量、易用性、安全性方面的感知决定其对政府开放数据平台环境的评价。
(2)政府数据开放平台的政策与法规研究。政府数据开放平台的建设与运行需要相应的政策与法规支持。研究者关注政府数据开放的政策制定、法规完善、政策执行等方面,以期为政府部门提供有力的政策支持。黄如花等[17]采用文本分析的方法对国家政策文本进行梳理归纳,总结出我国政府数据开放共享的政策框架。房海旭与付熙雯[18]对我国地方政府数据开放政策进行了梳理,并提出基于政策工具、政策外部结构、政策主题3个维度的开放政策分析框架。洪伟达等[19]通过对2012—2020年的相关政策进行分析,提出了政策强度、政策目标和政策工具3个维度的政策量化标准。马海群等[20]在研究中重視对美国数据安全政策的演变路径分析,提出当前政府数据开放应该推动国际合作,寻找有力的政策工具,健全数据安全相关法律法规,从而保障数据安全。征正等[21]强调加强政策制度的保障功能,为政府开放数据平台的建设提供支持。他们的研究结果基本相同,都强调政府数据开放相关政策的制定要有更加明确的目标和便利的技术工具。
(3)政府数据开放平台的应用与价值挖掘研究。政府数据开放平台的价值体现在针对不同用户类型的数据应用与利用。研究者关注如何通过区分不同数据使用者类型,加以不同的数据挖掘、可视化等技术手段,将政府数据转化为有价值的信息,为政府决策和社会公众提供更好的服务。在开放数据的用户类型研究方面,郑磊[22]指出,数据使用者按次序可分为一手和二手用户;按方式可分为专业使用者与普通民众;按背景可分为开发者、学者、记者和普通民众。汤志伟等[23]指出目前政府开放数据的5种主要用户包括:企业、普通民众、政府、非营利组织、科研群体与媒体。由于用户在专业程度、技术背景、教育水平等方面存在差异,对于开放数据的获取和使用存在着“数字鸿沟”现象。在开放数据生态系统的过程中,需要识别用户群体,为弱势群体提供帮助,使得开放数据的便利与价值惠及各类群体[24]。钟葳等[25]以深圳市政府数据开放平台为例,从用户视角出发,研究政府开放数据的有用性和易用性。徐慧娜[26]基于纽约市和上海市的政府数据开放平台,分别比较了两平台数据的有用性和利用效果。汤志伟[23]从用户类型、利用环境、利用方式和利用效果4个方面,通过系统性文献综述方法研究了我国政府开放数据的利用情况,以期提高政府数据利用价值和效用。
(4)政府数据开放平台的社会评估研究。政府数据开放平台的建设与运行对社会产生了广泛的影响。研究者关注影响政府数据开放平台开放效果的影响因素,以期在提高政务透明度、促进社会创新、推动产业发展等方面发挥作用。目前受到研究者关注较多的主题是政府数据开放平台的评估研究。黄如花等[5]从资源建设、组织与检索、服务等方面对国内13个地方性政府数据开放平台进行了评估。毛太田[27]基于湖南省政府数据开放平台,利用SERVQUAL评价量表从6个维度探究公众需求背景下提升政府数据开放平台服务质量的方法。黄明峰等[28]以贵阳政府数据开放平台为例,讨论建设该平台应从基础设施、数据资源、平台和应用4个层面入手。孙嘉睿等[29]采用专家评审法和模糊综合评价方法对北京市数据开放平台的数据质量进行了评估。
综上所述,国内现有研究主要集中于开放数据的用户类型研究、政府开放数据的环境和政策因素、开放数据的利用方式以及政府数据开放效果评估等方面,正如赵玉攀[30]的综述所总结的,目前国内对于政府开放数据平台的评估研究多集中于对某一平台、某一视角的单一研究,研究结论缺乏普适性。
因此,为了进一步提高研究的普适性与整体性,解决平台数据开放水平参差的问题,笔者从整体的角度出发,基于组态视角,将政府数据开放平台作为研究对象,综合分析政府数据开放评估策略,并根据当前政府数据开放建设现状,深入分析影响政府数据开放高水平的因素,加快推动政府数据开发体系建设与发展,加快高水平政府数据开放平台建设,让数据更好地服务社会。
2 数据开放水平的评价研究
2.1 政府数据开放平台数据开放水平的相关因素提取
由于现今尚无一个成熟的理论框架能揭示有关政府数据开放平台开放水平的影响因素,所以笔者采用扎根理论的方法提炼出影响政府数据开放平台数据开放水平的相关因素。扎根理论是由B. Glaser和A. Strauss[31]在1967年提出的一种定性研究方式,其主旨是从经验资料的基础上建立理论。扎根理论研究的理论构建工作主要通过理论性编码来完成,即通过编码中形成的概念或范畴组织起来以构建理论[32]。目前,有关政府数据开放平台开放水平影响因素的研究尚处于发展阶段,研究学者仍在不断探索数据开放水平的发展框架。笔者共收集25位政府数据开放网站使用者的访谈资料(见表1),通过随机抽样的方法对其中21位的访谈资料进行编码分析,其余4位的访谈资料用于饱和性检验。受访者的学历以硕士为主,其职业多为从事政府工作相关研究的研究员或供职于政府的职员,在生活中使用政府数据开放平台的程度较高。编码过程由两名研究小组成员分别进行编码分析,保留参考点数量大于2的概念,最终结果相似度高于90%,确保结果严谨有效。
2.1.1 开放式编码
开放式编码是扎根理论编码分析的第一步,也是最核心的一步,主要是将访谈收集的资料进行打散、分解、概念化整理,以从资料中发现概念。两名研究组员通过不断整理、归纳、列出条目,共获得了24个概念,每个概念都有代表性的原始语句来定义现象,具体信息如表2所示:
2.1.2 主轴编码
主轴编码是扎根理论编码分析的第二个阶段,用以发现和建立类属间的各种深层联系,以确定核心范畴。在开放式编码的基础上,笔者围绕概念轴心,通过合并、归类的方式,将初始概念进一步抽象归纳,寻找概念类属间的有机联系,最终归纳出18个核心范畴,如表3所示:
2.1.3 选择性编码
选择性编码是扎根理论的三级编码阶段,在开放式编码和主轴编码的基础上,通过核心范畴的梳理,进一步明确主范畴和核心范畴的关系,最终确定核心范畴的影响因素和作用路径,从而形成一个系统的理论架构。通过反复归类、调整,笔者归纳出影响政府数据开放平台数据开放水平的5个核心范畴,分别为数据数量、数据质量、数据规范、开放范围和数据获取,具体如表4和表5所示:
2.1.4 理论饱和度检验
笔者采用理论饱和度检验来验证编码分析过程和编码分析结果的准确性和可靠性。研究小组成员对事先预留的4份随机抽取的访谈记录进行同一流程的扎根编码理论分析并进行饱和度检验,没有再发现新的范畴和关联关系,结果显示理论模型是饱和、完整的。
2.2 数据开放水平影响因素的合理性验证
通過扎根理论所得出的5个政府数据开放平台开放水平影响因素为:数据数量、数据质量、数据规范、数据获取和开放范围。本研究选取上述因素作为研究的条件变量。
(1)数据数量。政府数据开放平台数据集总量统计的是平台上可通过下载或API接口获取的有效数据集总数[33],代表了不同种类的数据总数量。把数据集的数量作为测量数据数量的指标可以反映平台数据数量的整体水平。
(2)数据质量。高数据质量反映在政府数据开放平台优质数量集多,数据质量问题较少,数据发布连续性强[23]。I. Safarov等[34]认为数据利用的核心前提是数据质量,连续性强的优质数据集的应用性更高,应用的数量更多,范围更广。王卫等[35]通过研究发现,阻碍政府数据利用的最关键因素是数据质量低。通过对前人的研究总结得出,政府数据应用数量可以直观地反映数据质量。
(3)数据规范。数据规范要求政府数据开放平台在开放数据的时候要做到分级分类,同时符合可机读格式标准[33]。本研究收集的14个省级政府数据开放平台符合上述条件的规范数据,把衡量这些规范性数据的准则作为测量14个平台数据是否规范的标准。
(4)开放范围。开放范围指平台开放数据所涵盖的开放部门和开放主题[35]。本研究采用开放部门与主题的总数来衡量各平台开放范围。
(5)数据获取。数据开放的前提是数据获取,更便捷的数据获取方式有利于公众更有效率地对数据进行挖掘和利用,提高政府数据开放水平。《中国政府开放数据利用研究报告(2020年)》[36](以下简称《利用报告》)中明确提出数据获取作为数据开放的前提尤为重要。政府数据开放平台不仅仅是一个“数据超市”,要实现真正的数据开放,必须让数据活起来,让公民真正地参与进来。《利用报告》指出,API接口指各平台向公众开放数据的API(应用程序接口)的情况。与通过下载数据方式获取数据集相比,API接口的数据使用者可通过参数有选择性地获取所需的数据用于特定的使用目的,以实时高效地满足不同场景下的数据需要。平台API接口数能够很好地反映数据是否可以被更便捷、更有效地获取。因此本研究将API接口数作为数据获取的衡量指标。
在进行理论饱和度检验的同时,选取3篇知网下载量高的文章进行影响因素对比(见表6),对比结果表明笔者提出的影响因素在其他文献中也有涉猎,进一步验证了结果的科学性。
3 数据开放平台开放水平的构型研究
3.1 变量选择
研究模型的条件变量选取基于扎根方法所得的影响因素:数据数量、数据质量、数据规范、开放范围和数据获取,结果变量选取基于省级政府数据开放指数,如表7所示:
3.2 数据收集过程
本研究中所进行的样本选择和数据收集过程均由两名研究小组成员独立完成,结果总体一致性高达98.7%,有差异的部分经过小组研究和专家复核已经达成一致。本研究的样本选择以“data.gov.cn”“数据开放平台+政府”为检索式在互联网上进行检索,检索时间为2021年7月,得出142个政府数据开放平台。因为本研究主要分析省级政府数据开放平台,所以剔除副省级和地级平台。剩余的省级平台主要可分为两种:①省级政府有单独的数据开放平台;②省级政府无独立数据开放平台,数据发布皆被嵌于政府政务官网的信息公开和数据统计分级下。经分析,该类嵌入式数据发布平台不可作为研究样本,原因如下:第一,开放政府数据与政府信息公开有本质区别,表现在:①“信息”是经过提炼加工的“数据”,二者虽有联系但区别更大。②政府信息公开的目的在于让公民“知”,政府开放数据的目的在于让公民“用”,二者发布的目的不同[38]。第二,政府开放数据应符合M. Carl[39]提出的八项原则,由此经过数理统计后的数据已经不再具备原始性,不属于政府开放数据范畴。所以该类样本不符合研究标准,应该剔除。经筛选,最终决定仅以14个省级政府数据开放平台作为研究样本,分别为浙江省、山东省、广东省、北京市、上海市、四川省、天津市、福建省、陕西省、广西壮族自治区、河南省、贵州省、江西省和海南省,属于小样本研究范围,适用于QCA方法。
3.3 数据分析
笔者基于组态的视角,运用定性比较分析的方法对影响政府数据开放平台数据开放水平的构型因素进行分析。定性比较分析方法(qualitative comparative analysis,QCA)最早由C. C. Ragin在1987年提出,该方法旨在基于整体论,通过案例间的比较,找出条件组态与结果间的复杂因果关系[40]。C. C. Ragin认为QCA既“为分析因果复杂性提供了强大的工具”,又“是中小样本究设计的理想选择”。QCA与其他统计方法的区别主要在于它支持均等性,这意味着特定的结果可能由不同的元素组合引起。QCA遵循这样的范式,因为它旨在将每个模式的元素减少到基本的必要和充分条件。此外,fsQCA进一步支持因果不对称的发生。A. Leischnig等[41]指出,因果条件的存在与否取决于该因果条件如何与一个或多个其他因果条件相结合。QCA方法在早期主要应用于社会学、政治学等社会学科开展小样本的跨案例定性比较分析,经过发展成为在处理大样本案例和分析复杂组态间的功能等方面同样具有较强的应用性的分析方法,受到管理学领域学者的关注[40]。QCA方法同时具备了定性与定量研究方法的优点,既可研究10个以下的小样本案例,也可研究10—50个之间的中等规模样本案例,同时对100个以上的大样本案例也适用。
综上所述可以发现,QCA方法作为解决因果关系复杂性的重要工具在国内外的研究中得到广泛应用。笔者采取定性比较分析方法对理论进行验证的原因主要包括:①该方法对研究样本的数量不做限制,适合本研究的小样本使用;②在数据层面上,影响政府数据开放水平的原因是多重并发的,运用组态视角可以更好地解决条件变量与因果变量之间的复杂关系,精准识别高数据开放水平的省级政府数据开放平台的构型要素,对非高水平开放度政府提供指导实践。
运用定性比较分析的方法进行数据分析要遵循如下4个步骤:①数据校准;②必要条件分析;③必要性分析;④构型分析。
3.3.1 校准
研究数据通过14个省级政府数据开放平台收集而来,并基于fsQCA分析工具对数据进行分析。第一步,进行数据校准,设定“完全隶属”“交叉点”“完全不隶属”这3个阈值,运用fsQCA将这些值转换为0—1的模糊得分。本研究相关构念集合运用的“Calibrate”程序赋值校准标准如表8所示:
3.3.2 必要条件分析
笔者采用NCA(necessary condition analysis)的方法对前因变量进行必要性检验,生成上限回归(ceiling regression,CR)和上限包络(ceiling envelopment,CE)来检测效应量。因为如果条件变量和结果变量都是连续的或离散的,则使用上限回归(CR)生成上限函数,所以本研究采用CR值。基于J. Dul[42]给出的衡量标准,必要条件的效应量需要0.1≤d<0.3且p<0.01,所以可以由表9得出开放范围、数据质量和数据规范为必要条件。
如表10所示,要达到60%的平台数据开放水平,需要13.5%的数据质量、14%的数据规范和19.3%的开放范围。
3.3.3 必要性分析
对校准后的数据进行单项前因变量的必要性和充分性分析。通常认为,必要条件的一致性分数最低为0.9,这意味着,如果没有该条件,该结果就无法产生[43]。从表11中充分性一致率(consistency)一项可以看出本项研究没有必要性条件。
3.3.4 构型分析
将数据导入fsQCA软件,分析5个条件变量构成的条件组合在数据层面上对政府开放数据平台开放水平的影响。
高水平平台数据开放构型如表12所示,总体一致性约为0.9913,这说明得到的前因变量组合对结果有较强的解释力度,较符合结果预期。结果显示有4条不同的路径可以获得高水平知识贡献,即Ha1、Ha2、Hb、Hc,可归纳为3种构型:①强调数据质量和数据规范的Ha1、Ha2;②仅强调数据规范的Hb;③仅强调数据质量的Hc。
Ha构型以数据规范和数据质量为核心因果性条件,因辅助条件不同而出现两条路径,Ha1构型以数据数量与非数据获取作为辅助因果性条件,说明在数据质量高和数据规范水平高的情况下,数据集的数量越多,数据平台开放水平越高。值得惊讶的是,开放的API接口更多,并不会使数据开放平台数据开放水平更高。在Ha2构型中,在以数据规范和数据质量为核心因果性条件的情况下,数据获取成为辅助因果条件。而数据数量和数据范围并不会带来更高水平的数据开放。从仅以数据规范为核心因果性条件的Hb构型中可以看出,如果规范的数据量足够大,就可以实现高数据开放水平。从仅以数据质量为核心因果性条件的Hc构型中可以看出,在数据质量足够好的前提下,还要辅以更多的数据数量、更好的开放范围和更便捷的数据获取途径才可以实现高数据开放水平。
4 结果与讨论
4.1 研究结论
由fsQCA分析结果可得出3个数据开放高水平平台构型:①高规范数据型:平台数据规范程度高、数据质量好。此类型表明平台可以通过两种路径维持平台的高数据开放水平,第一种路径为适当增加数据集的数量来提高开放水平,第二种路径为增加API接口数量提高数据开放水平。②大数量数据型:平台规范性数据量大。此类型平台表明平台高数据开放水平仅通过加大规范数据量的开放就可以保持。 ③高质量数据型:平台数据质量高。对于数据质量很好的平台,通过加大开放数据集数量,增加开放范围,增加数据获取API接口可使平台数据开放處于较高水平。
笔者在前人研究的基础上,基于组态视角,采用fsQCA分析方法分析影响政府数据开放平台数据开放水平的因素构型,在将多个因素综合考虑的同时确定影响政府数据开放平台数据开放水平的必要因素。通过对政府数据开放平台的数据开放水平进行比较分析,找到与数据开放水平相关的重要因素组合,包括数据开放的数量、质量等方面,为政府数据开放平台的改进提供科学的决策支持,确定优化方案,提高数据开放水平。
4.2 应对策略
根据研究结果,可得出以下加强平台数据开放水平的途径:
(1)政府应该加强对数据资源的管理和整合,建立完整的数据资源库和数据管理体系,整合政府各部门和机构的数据资源,提高数据资源的共享和利用效率。政府还应该加强对数据资源的分类、标准化和归档等工作,保证数据资源的准确性和完整性。政府应提高平台高数据质量和高数据规范,增加数据集数量,或增加数据获取API接口,鼓励民众进行数据挖掘和利用。陈玲和段尧清[44]提到高任务需求可增加公众对政府开放数据的初始接受行为和持续使用行为。政府应该推动各部门和机构的数据开放,鼓励政府各部门和机构向政府数据开放平台开放更多的数据资源。政府还应该加强与各部门和机构的沟通和协作,协调各部门和机构的数据开放事宜,推动政府数据资源的全面开放和共享,以监督政府提供更多无错误、连续性强的高质量数据集,促进政府数据开放。目前还未开放数据共享平台的省份可以基于Ha构型,在开放数据平台的时候优先建设数据质量和数据规范,先解决好“主要矛盾”,再循序渐进地提高数据开放水平。
(2)增加规范数据量。Hb构型表明如果平台开放的规范数据量足够多,则无需其他因素共同作用,平台亦可达到数据开放的高水平。政府数据开放平台的数据规范性问题主要表现在以下几个方面:①数据来源的不确定性。政府数据来源广泛,包括各级政府、政府机构、公共机构、科研机构等,数据的质量和精度也不同,这就导致政府数据开放平台数据来源的不确定性和数据的可信性难以保证。②数据格式的不一致性。政府数据来源的不同,也导致政府数据开放平台的数据格式不一致,数据的重复使用和整合难度大,降低了数据使用的效率,影响了数据的应用价值。③数据标准的缺乏。政府数据开放平台的数据标准没有明确的规范,数据的分类、标准化和归档等工作没有得到有效的统一控制,导致政府数据开放平台的数据规范性无法保证。④数据保护的不足。政府数据开放平台开放的数据涉及到个人隐私和商业机密等敏感信息,政府数据开放平台的数据保护机制不够完善,容易导致数据泄露和滥用,影响政府和公众的利益。
针对上述规范性问题,政府数据开放平台应该采取所如下措施:①建立标准化的数据开放规范。政府应该制定统一的数据开放规范,规定政府数据开放平台开放的数据格式、标准、共享方式、使用范围和使用限制等,保证政府数据开放平台开放的数据规范化和标准化。 ②完善数据开放流程和标准。政府应该建立完善的数据开放流程和标准,规范政府各部门和机构的数据开放流程和标准,加强对数据开放的监管和评估,保证数据开放的顺畅和规范。③加强数据质量监管。政府应该加强对政府数据开放平台的数据质量监管,完善数据质量评估机制,提高数据质量的准确性和可信度,保证政府数据开放平台开放的数据质量。④提供数据使用指南和数据清洗工具。政府应该向公众提供数据使用指南和数据清洗工具,帮助公众更好地使用政府数据开放平台的数据,提高数据的使用效率和价值。⑤鼓励数据共享和数据交换。政府应该鼓励政府各部门和机构之间的数据共享和数据交换,促进政府数据资源的共享和利用,提高政府数据开放平台开放的数据数量和规范性。加强对数据开放的监管和评估。政府应该加强对政府数据开放平台的监管和评估,建立完善的数据开放监管和评估机制,对政府数据开放平台开放的数据进行质量和数量的评估,及时发现和解决问题,保证政府数据开放平台开放的数据规范化和标准化。对于目前还未建立数据开放平台的省级政府来说,在条件有限的情况下,可遵循上述研究中的Hb构型,优先建设平台开放的规范数据量,把增加规范数据量作为第一要務摆在首要位置。
(3)坚持以加强平台开放数据质量为核心,提高数据数量、开放范围和数据获取三管齐下的发展策略。为了确保数据质量,政府数据开放平台应该建立数据质量管理体系,对数据进行全面的管理和监控。这个体系应该包括数据质量管理制度、数据质量评估机制、数据质量监控和追溯机制等,确保数据质量的可控性和可追溯性。政府数据开放平台应该加强数据共享和协作,借助云计算、大数据、人工智能等新技术,实现数据的共享和协作,提高数据的价值和效率。政府数据开放平台还应该鼓励公众、企业和学术界等各方参与数据共享和协作,提高数据的质量和应用价值。对于现在还处于平台“空白”阶段的省份来说,未来在建设自己的省级政府数据开放平台时,可按照Hc构型,首要发展数据质量,辅以数据集数量、开放范围和数据获取途径的建设,可早日建成高开放水平的数据开放平台。
综上所述,政府数据开放平台是政府向公众开放数据资源的载体,对于推动政府数据资源的共享和利用,促进数据创新、数据应用和数据服务等方面具有重要作用。政府在建设数据开放平台时,应该建立标准化的数据开放规范,完善数据开放流程和标准,加强数据质量监管,提供数据使用指南和数据清洗工具,鼓励数据共享和数据交换,加强对数据开放的监管和评估等措施,保证政府数据开放平台开放的数据规范化和标准化,提高数据的使用效率和价值,为公众提供更好的数据服务。
5 结语
政府数据开放平台是政府向公众开放数据资源的载体,对于推动政府数据资源的共享和利用,促进数据创新、数据应用和数据服务等方面具有重要作用。笔者基于组态视角,采用模糊集定性比较分析的方法,以14个省级政府数据开放平台为研究对象进行分析,最终获得3组平台高数据开放水平构型,分别为:高规范数据型、大数量数据型、高质量数据型。研究表明,在数据层面上,政府数据开放平台数据开放水平的组态构成因素有助于帮助政府人员通过不同构型找到适合自己平台提高数据开放水平的途径。数据开放平台的建设应着眼于数据主体。开放的“本源”是数据,应将为公民提供更多规范的开放数据放在平台建设的首要位置。本研究有助于政府数据开放平台立足于开放数据本身,对于不同平台实施适合自身的数据开放建设径路具有引导意义。
本研究的贡献主要体现在3个方面:①基于组态视角研究政府数据开放平台高开放水平的多重影响因素,在已有框架上丰富了现有研究理论;②现有关于政府数据开放的研究对定性比较分析(QCA)的方法使用较少,本研究采用fsQCA软件严格遵守规范操作,为未来该领域研究学者在选择研究方法上提供了新可能;③得到政府数据开放平台数据开放高水平影响因素的4种构型,研究结果可以为平台提高数据开放水平提供一定的帮助,也可以为还未建立开放数据平台的省级政府提供建设思路。
本研究存在以下不足之處:由于现有省级政府数据开放平台较少,所以样本案例不能覆盖全国各省,研究结果的普适性受到一定限制。未来研究可扩充副省级和地级开放平台进行研究分析。
参考文献:
[1] 陈朝兵, 张田. 2011-2020年国内外政府数据开放平台建设研究述评[J]. 图书情报知识, 2022, 39(1): 130-140. (CHEN C B, ZHANG T. Literature review of domestic and oversea research on open government data platform construction from 2011 to 2020[J]. Documentation, information & knowledge, 2022, 39(1): 130-140.)
[2] 罗博, 朱丘毅, 张晋朝. 社会公平视阈下中美开放政府数据政策的批判性话语分析[J]. 图书情报知识, 2023, 40(1): 98-111, 123. (LUO B, ZHU Q Y, ZHANG J C. A critical discourse analysis on open government data policies of China and the United States from the perspective of social justice[J]. Documentation, information & knowledge, 2023, 40(1): 98-111, 123.)
[3] 陈伟. 《促进大数据发展行动纲要》解读[J]. 中国信息化, 2015(10): 11-14. (CHEN W. Interpretation of the outline of action for the development of big data[J]. China informatization, 2015(10): 11-14.)
[4] 中华人民共和国中央人民政府. 国务院关于印发促进大数据发展行动纲要的通知[EB/OL]. [2022-07-02]. http://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm. (The State Council of the Peoples Republic of China. Circular of the State Council on the issuance of the action program for promoting the development of big data[EB/OL]. [2022-07-02]. http://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm.)
[5] 黄如花, 王春迎. 我国政府数据开放平台现状调查与分析[J]. 情报理论与实践, 2016, 39(7): 50-55. (HUANG R H, WANG C Y. Survey and analysis of the current situation of Chinas government data open platform[J]. Information studies: theory & application, 2016, 39(7): 50-55.)
[6] 马海群, 王本刚. 开放数据生态系统:一个系统性文献综述[J]. 图书馆杂志, 2022, 41(11): 8-18, 39. (MA H Q, WANG B G. Open data ecosystem: a systemic literature review[J]. Library journal, 2022, 41(11): 8-18, 39.)
[7] 郑磊. 开放政府数据的价值创造机理: 生态系统的视角[J]. 电子政务, 2015(7): 2-7. (ZHENG L. Value creation mechanisms of open government data: an ecosystem perspective[J]. E-government, 2015(7): 2-7.)
[8] Meijer R, Conradie P, Choenni S. Reconciling contradictions of open data regarding transparency, privacy, security and trust[J]. Journal of theoretical and applied electronic commerce research, 2014, 9(3): 32-44.
[9] Jung K, Park H W. A semantic (TRIZ) network analysis of South Koreas “Open Public Data” policy[J]. Government information quarterly, 2015, 32(3): 353-358.
[10] Nugroho R, Zuiderwijk A, Janssen M, et al. A comparison of national open data policies: lessons learned[J]. Transforming government: people, process and policy, 2015, 9(3): 286-308.
[11] Martín A S, Rosario A H D, Pérez M D C C. An international analysis of the quality of open government data portals[J]. Social science computer review, 2016, 34(3): 298-311.
[12] Brown A, Fishenden J, Thompson M, et al. Appraising the impact and role of platform models and Government as a Platform (GaaP) in UK Government public service reform: towards a Platform Assessment Framework (PAF)[J]. Government information quarterly, 2017, 34(2): 167-182.
[13] Danneels L, Viaene S, Joachim V D B. Open data platforms: discussing alternative knowledge epistemologies[J]. Government information quarterly, 2017, 34(3): 365-378.
[14] 张聪丛, 郜颍颍, 赵畅, 等. 开放政府数据共享与使用中的隐私保护问题研究——基于开放政府数据生命周期理论[J]. 电子政务, 2018(9): 24-36. (ZHANG C C, GAO Y Y, ZHANG C, et al. A study of privacy protection issues in open government data sharing and use—— Based on the life cycle theory of open government data. [J]. E-government, 2018(9): 24-36.)
[15] 杨瑞仙, 毛春蕾, 左泽. 我国政府数据开放平台建设现状与发展对策研究[J]. 情报理论与实践, 2016, 39(6): 27-31. (YANG R X, MAO C L, ZUO Z. Study on the status quo of the construction of Chinas open government data platform and development countermeasures[J]. Information studies: theory & application, 2016, 39(6): 27-31.)
[16] 王琳, 杨莹, 邱均平. 基于公众感知的政府数据开放平台信息服务质量评价体系研究[J]. 情报科学, 2022, 40(11): 12-19. (WANG L, YANG Y, QIU J P. Innovation of methods for evaluation science from the perspective of deep learning[J]. Information science, 2022, 40(11): 12-19.)
[17] 黄如花, 温芳芳. 我国政府数据开放共享的政策框架与内容:国家层面政策文本的内容分析[J]. 图书情报工作, 2017, 61(20): 12-25. (HUANG R H, WEN F F. Policy framework and content of opening and sharing government data in China: a content analysis of policy documents at the national level[J]. Library and information service, 2017, 61(20): 12-25.)
[18] 房海旭, 付熙雯. 地方政府数据开放利用的政策现状与优化策略研究——基于三维政策分析框架[J]. 情报探索, 2023(2): 75-83. (FANG H X, FU X W. Research on the Status Quo and optimization strategy of data open anf utilization policy in local governments: based on three-dimensional policy analysis frame work [J]. Information research, 2023(2): 75-83.)
[19] 洪偉达, 马海群. 我国开放政府数据政策的演变和协同研究——基于2012-2020年政策文本的分析[J]. 情报杂志, 2021, 40(10): 139-147, 138. (HONG W D, MA H Q. Research on the evolution and coordination of open government data policy in China —analysis of policy texts based on 2012-2020[J]. Journal of intelligence, 2021, 40(10): 139-147, 138.)
[20] TANG R, JIANG J. Characteristics of Open Government Data (OGD) around the world: a country-based comparative meta-analysis[J/OL]. Data and information management, 2021, 5(1): 11-26. https://doi.org/10.2478/dim-2020-0026.
[21] 征正, 庄国波, 陆晓燕. 我国数据统一开放平台建设的障碍及对策研究[J]. 科技与经济, 2016, 29(6): 11-15. (ZHENG Z, ZHUANG G B, LU X Y. Research on obstacles and countermeasures to the construction of Chinese governmental unified and open data platform[J]. Science & technology and economy, 2016, 29(6): 11-15.)
[22] 郑磊. 开放政府数据研究:概念辨析、关键因素及其互动关系[J]. 中国行政管理, 2015(11): 13-18. (ZHENG L. Study on open government data: definitions, factors and interactions [J]. Chinese public administration, 2015(11): 13-18.)
[23] 汤志伟, 郭雨晖. 我国开放政府数据的利用:基于CNKI的系统性文献综述[J]. 情报杂志, 2018, 37(7): 176-181, 65. (TANG Z W, GUO Y H. Utilization of open government data in China: a systematic literature review based on CNKI[J]. Journal of intelligence, 2018, 37(7): 176-181, 65.)
[24] ZUIDERWIJK A, JANSSEN M, CHOENNI S, et al. Socio technical impediments of open data[J]. Electronic journal of electronic government, 2012, 10(2):156-172.
[25] 钟葳, 梁丽芝, 張运. 基于用户技术接受模型的政府数据开放平台研究——以深圳政府数据开放平台为例[J]. 湖南工业大学学报(社会科学版), 2022, 27(6): 47-54. (ZHONG W, LIANG L Z, ZHANG Y. Research on government open data platform based on user technology acceptance model: a case study on Shenzhen city[J]. Journal of Hunan University of Technology (social science edition), 2022, 27(6): 47-54.)
[26] 徐慧娜, 郑磊. 面向用户利用的开放政府数据平台:纽约与上海比较研究[J]. 电子政务, 2015(7): 37-45. (XU H N, ZHENG L. Open government data platform for user utilization: a comparative study of New York and Shanghai[J]. E-government, 2015(7): 37-45.)
[27] 毛太田, 许馨仪. 基于公众需求的湖南省政府数据开放平台服务质量提升研究[J]. 江苏科技信息, 2023, 40(2): 22-27. (MAO T T, XU X Y. Research on service quality improvement of hunan government data open platform based on public demand [J]. Jiangsu science and technology information, 2023, 40(2): 22-27.)
[28] 黄明峰, 刘军, 靖剑波. 贵阳市政府数据开放平台设计与实现[J]. 电信科学, 2017, 33(9): 136-147. (HUANG M F, LIU J, JING J B. Design and practice of Guiyang open government data platform[J]. Telecommunications science, 2017, 33(9): 136-147.)
[29] 孙嘉睿, 安小米. 开放政府数据质量评估指标体系研究[J]. 情报理论与实践, 2023, 46(6): 94-100, 78. (SUN J R, AN X M. Research on open government data quality evaluation index system[J]. Information studies: theory & application, 2023, 46(6): 94-100, 78.)
[30] 赵玉攀. 国内开放政府数据研究的系统评述[J]. 现代情报, 2018, 38(2): 164-170. (ZHAO Y P. A Systematic review of domestic open government data research[J]. Journal of modern information, 2018, 38(2): 164-170.)
[31] Glaser B, Strauss A. Discovery of grounded theory: strategies for qualitative research[M]. New York: Routledge, 2017.
[32] 贾旭东, 谭新辉. 经典扎根理论及其精神对中国管理研究的现实价值[J]. 管理学报, 2010, 7(5): 656-665. (JIA X D, TAN X H. The actual value of the classical grounded theory and its spirit to China management research[J]. Chinese journal of management, 2010, 7(5): 656-665.)
[33] 复旦大学数字与移动治理实验室. 2020中国地方政府数据开放报告[R]. 上海:复旦大学, 2021. (Digital and Mobile Governance Lab, Fudan University. 2020 China Local Government Data Openness Report [R]. Shanghai: Fudan University, 2021.)
[34] Safarov I, Meijer A, Grimmelikhuijsen S. Utilization of open government data: a systematic literature review of types, conditions, effects and users[J]. Information polity, 2017, 22(1): 1-24.
[35] 王卫, 王晶. 开放政府数据用户参与研究[J]. 情报理论与实践, 2020, 43(12): 68-74. (WANG W, WANG J. Research on open government data user participation[J]. Information studies: theory & application, 2020, 43(12): 68-74.)
[36] 国家社会科学基金重点项目(17ATQ006)课题组,华中师范大学信息管理学院,湖北省数据治理与智能决策研究中心. 中国政府开放数据利用研究报告[R]. [2022-07-30]. http://sim.ccnu.edu.cn/info/1046/12620.htm. (China Social Science Foundation Key Project (17ATQ006) Research Group, School of Information Management, Central China Normal University, Hubei Research Center for Data Governance and Intelligent Decision Making. Research report on the utilization of Chinese government open data [R/OL]. [2022-07-30]. http://sim.ccnu.edu.cn/info/1046/12620.htm.)
[37] 曹雨佳. 政府开放数据生存状态:来自我国19个地方政府的调查报告[J]. 圖书情报工作, 2016, 60(14): 94-101. (CAO Y J. The state of survival of government open data: a survey report from 19 local governments in China[J]. Library and information service, 2016, 60(14): 94-101.)
[38] 杨孟辉. 开放政府数据概念实践和评价[M]. 北京:清华大学出版社, 2017. (YANG M H. Open government data conceptual practice and evaluation[M]. Beijing: Tsinghua University Press, 2017.)
[39] Carl M. Open government working group[EB/OL]. [2022-07-23].https://public.resource.org/open_government_meeting.html.
[40] RAGIN C C. The comparative method: moving beyond qualitative and quantitative strategies[M]. Berkeley: University of California Press, 1987.
[41] Leischnig A, Kasper-Brauer K. Employee adaptive behavior in service enactments[J]. Journal of business research, 2015, 68(2): 273-280.
[42] Dul J. Necessary condition analysis (NCA) logic and methodology of “necessary but not sufficient” causality[J]. Organizational research methods, 2016, 19(1): 10-52.
[43] 张明, 杜运周. 组织与管理研究中QCA方法的应用:定位、策略和方向[J]. 管理学报, 2019, 16(9): 1312-1323. (ZHANG M, DU Y Z. Qualitative comparative analysis(QCA) in management and organization research: position, tactics, and directions[J]. Chinese journal of management, 2019, 16(9): 1312-1323.)
[44] 陳玲, 段尧清. 政府开放数据公众持续使用行为影响因素的异质性分析[J]. 情报科学, 2021, 39(6): 134-142. (CHEN L, DUAN Y Q. Heterogeneity analysis on the influencing factors of public continuous use behavior of government open data[J]. Information science, 2021, 39(6): 134-142.)
作者贡献说明:
卢新元:提出研究主题与思路;
陈泽茵:撰写与修改论文;
卢 泉:检验数据;
王雪霖:检查与修改论文。
Research on Data Openness Level Configuration for Provincial Government Data Open Platform
Lu Xinyuan1,2 Chen Zeyin1 Lu Quan1 Wang Xuelin1
1School of Information Management, Central China Normal University, Wuhan 4300792
2E-commerce Research Center of Hubei Province, Wuhan 430079
Abstract: [Purpose/Significance] Starting with the perspective of configuration, this study aims to obtain the openness configuration of high-level government data and explore the factors which have deep effect on the openness level of government data. It also proposes different paths to optimize the level of data openness of the platform and summarize the optimization strategies. [Method/Process] With the qualitative comparative analysis method based on fuzzy set, taking the provincial government data open platform as research case, this study summarized five antecedent variables: data quantity, data quality, data specification, data acquisition and open range with the grounded theory method so as to explore the impact of the joint action of multiple variables on the openness level of government data. [Result/Conclusion] The research reveals three configurations. ①High standard data type: High standardized data on the platform, and good data quality. This type of platform can maintain a high level of data openness through two ways, one is to appropriately increase the number of data sets, and the other is to increase the number of API interfaces. ②Large quantity data type: large quantities of standardized data on the platform. The high level of data openness of this type of platform can be maintained only by increasing the openness of the volume of standardized data. ③High quality data type: good data quality on the platform. For platforms with good data quality, its data openness can reach a higher level by increasing the number of open data sets, increasing the scope of opening, and increasing the API interface for data acquisition.
Keywords: government data openness grounded theory qualitative comparative analysis fsQCA NCA