胡媛 蒋天森 高薇等
关键词: 开放政府数据; 元综合; 影响因素; GTEV 模型
DOI:10.3969 / j.issn.1008-0821.2023.12.009
〔中图分类号〕G203 〔文献标识码〕A 〔文章编号〕1008-0821 (2023) 12-0100-11
当今社会的数字技术高度发展, 不断生成的数据已成为一种社会生产新要素[1] 。政府数据作为公共数据的重要组成部分, 其开放与共享已成为不可逆的趋势。开放政府数据(Open Government Da?ta, OGD)是指任何人都可以自由、免费、无需授权地访问、获取、利用和分享政府的数据, 进而促使建设参与、透明、协作的开放型政府[2] 。自2009年美国发布《透明与开放政府》并建立世界上第一个开放数据平台以来, OGD 在世界范围内迅速扩散。2012 年, 上海市拉开我国城市政府开放数据平台建设的帷幕, 到目前我国已有200 多个地方政府数据开放平台。政府数据在开放过程中, 不仅能实现提高政府透明度、加强公众问责、促进公民参与等效益, 还能推动大数据的发展, 供社会进行增值和创新应用, 进而促进经济增长[3] 。然而, 在各国(地区)高度重视并投入大量资源建设的背景下, OGD 实施仍面临组织架构不合理、数据标准不统一、法律法规不完善、价值实现不顺利等挑战,OGD 仍需不断发展。
1研究问题和研究设计
1.1研究基础与问题确定
开放政府工作组提出, 政府数据在满足完整、一手、及时、非歧视性、非私有、可获取、可机读和免于授权8 项条件时可称为“开放”[4] 。与传统的政府信息公开不同, OGD 更注重数据被开发利用后产生的价值[2] 。
当前, 国内外学者多从数据开放方探究OGD 的影响因素。如Conradie P 等[5] 提出有关开放数据的法律政策、组织、技术、经济和文化五大影响因素;赵润娣[6] 构建“政治—经济—公众” 三要素的影响因素分析框架。现有研究多将OGD 归为创新扩散的领域, 认为其主要受到技术、组织、环境3 个层面的共同影响[7-8] 。但政府数据的利用不仅由政府进行, 还包括公众、企业、社会组织等多主体对数据的利用。对于如何匹配用户需求并利用数据产生价值, 陈美等[9] 基于UTAUT 理论构建用户采纳模型,段尧清等[10] 和陈玲等[11] 分别研究了公众初次使用、持续使用政府数据的意愿的影响因素。
对于OGD 实施过程中各因素的关系, 学界基于生态系统视角从纵横两个维度建立了框架与模型。纵向维度方面, 学者们分不同的阶段来阐述OGD 的实施过程, Evangelos K 等[12] 将数据开放划分为4 个阶段: 政府数据聚合、数据整合、与非官方数据的整合、与非官方数据和社会数据的整合;郑磊[3] 建立了包括数据的生成、开放、利用、效果的动态系统。Harrison T M 等[13] 则从横向维度构建了一个包含行动者、技术设施、组织和相关资源的开放数据社会生态系统, 并阐述各要素主体之间的相互作用关系。
综上而言, 目前国内外对于OGD 方面的研究成果为本文提供了坚实的基础, 但仍存在探索空间。现有研究大多仅从数据开放方或数据利用的角度研究影响因素, 少有从数据利用方、用户参与、价值共创等多主体角度的全面分析; 随着研究的深入, 纳入研究的因素越来越多, 既有研究存在遗漏影响因素、解释力不足等问题, 亟需构建一个完整通用的理论模型框架, 进一步分析各影响因素间的复杂关系。基于此, 本文以OGD 发展过程和实施质量的影响因素为主要研究问题, 对其进行解释性元综合研究, 并分析各因素间的互作用关系, 进而构建更为全面的因素整合框架, 以期推动OGD 发展并提高实施质量。
1.2研究设计和研究方法
本文采用元综合方法对OGD 影响因素进行提取、汇总和综合。元综合是一种对于选定主题的相关文献进行检索、筛选、提取、解释、融合、重建并详细解释的方法, 该方法将定性和定量的结果一同纳入框架进行分析, 通过汇总众多文献中重要因素、重新定义含义重复的概念, 最终实现理论转化和拓展研究。与学界进行综合分析时普遍采用的Meta 和质性元分析相比, 元综合对于文献的选择更具包容性; 同时元综合对文献的综合性解释能够避免单一视角分析的弊端。
根据Christina H[14] 的研究, 元综合的具体过程如下: ①明确研究主题并制定文献检索策略; ②确立文献纳入标准并筛选检索出的文献; ③选取适合的批判性评估标准, 并根据评估结果进一步筛选文献; ④运用合理的方法对数据进行提取、归类、综合; ⑤对分析结果进行信效度分析, 判断结果的质量。
2数据处理与分析
2.1数据获取与预处理
2.1.1检索策略
文章选取CNKI 数据库作为中文数据库来源,WOS 所有数据库、Scopus 文摘数据库、Proquest 硕博士论文全文库作为外文数据来源; 检索范围为检索日期2022 年7 月22 日以前的所有文献。根据检索策略检索文献, 合并去重后共计得到外文文献2 023篇, 中文文献1 815篇。
2.1.2纳入标准
確定纳入标准是进行文献元综合分析的必要条件, 有助于保障分析文献的质量。本文文献纳入标准如下: ①研究主题涉及OGD 的影响因素, 包含探索性和验证性的实证研究, 排除主题不相关文献;②文献的研究主体为政府开放数据的实施过程, 不包括对结果的满意度等; ③文献仅限于中英文期刊论文、学位论文, 去除书评、会议论文以及同一作者相似的论文等。通过上述纳入标准筛选得到78 篇文献, 包括42 篇外文文献, 36 篇中文文献。
2.1.3文献质量评估
文献质量与最终结论的质量有关, 高质量的文献有助于提升结论的有效性与科学性。因此, 研究采用文献质量评估工具对筛选出的78 篇文献进行质量评估。本文采用图书情报领域的EBL 评判工具[15] 对纳入文献进行质量评估。具体包括4 个部分: ①总体特征: 样本的基本情况和文献纳入标准; ②研究设计: 选择的研究方法是否适用、是否详细充实以利于复制等; ③数据收集: 数据收集方法是否有效、是否带有偏见等; ④研究结果: 结果是否合理, 是否清晰反映研究主题等。每部分有5题左右, 每题有是(Y)、否(N)、不清楚(U)、不适用(NA)4 个选项。梳理文献内容并对照选项回答, 统计最终结果, 根据式(1) 得到的总分数≥75%或者根据式(2) 得到的总分数≤25%, 则该篇文献通过质量评估。
需要说明的是, 评估表中A 部分“样本数量”采用式(3) 判断, 式中N 代表总人数, n 为样本量, e 代表选择95%的置信区间[16] ; “回复率” 以在线调查回复率大于30%、当面调查回复率大于80%为判断标准[17] 。通过进行EBL 批判性评估后,最终选出56 篇文献纳入分析。
2.2数据提取和综合
在对研究内容进行数据处理时, 结合Anselm S的编码思路和“批判性解释综合” (CIS)方法对文献进行解释性编码。Anselm S 等[18] 编码可分为以下3 个步骤: ①开放式编码标记文献中与研究问题相关的陈述, 形成初始概念; ②主轴编码对初始概念进行聚类形成泛型; ③选择性编码压缩新主题形成核心泛型。CIS 本质是一种兼具“解释性” 与“综合性” 的研究模式, 通过回顾、汇总各种概念和因素并进行批判性思考, 综合重复冗杂的概念以形成新的模型。具体步骤如下: ①研究文献, 识别、获取和理解相关陈述、概念和隐藏含义; ②将获得的初始概念进行再表述, 整合相似概念; ③对照整合后的概念, 总结其中隶属关系; ④归纳综合概念, 最终整合为一个理论框架[19] 。为确保概念的普适性和有效性, 鉴于初始概念数量多且重要程度不一致, 因此选取次数3 为阈值, 将大于等于阈值的编码归入初始概念。
2.3结论检验
本文分别采取两种方式来检验结论信效度: ①文章纳入编码的文献前期均经过EBL 批判性质量评估, 且大多来自CSSCI、北大核心等期刊, 内容质量较高; ②根据Francis J J 等[20] 结论饱和度检验的研究, 本文首先将所有原始材料进行编号, 随机选取其中3 份作为测试集, 剩余53 份材料作为实验集正式编码; 然后检验测试集材料中是否有新的编码, 若没有即认为理论饱和度检验通过; 综上所述, 本文结论具有良好的信效度。
本文基于开放式编码的结果, 并通过主轴编码和选择性编码自下而上逐级提炼, 得到有关OGD实施影响因素的概念和范畴, 对结果进行梳理、归纳和综合。最终得到75 个初始概念, 28 个范畴,11 个主范畴, 归类为4 个维度, 如表1、表2 所示。主范畴分别作用于OGD 实施过程中的各要素主体, 与OGD 的实施具有指导、支撑、依据关系,如表3 所示。政府作为开放主体, 通过体制指导和能力支撑, 利用信息技术实施开放; 技术基础、数据平台技术、数据要求是数据开放行为全过程的基础支撑和实施依据; 政策政治环境能在法律和行政上指导开放行为, 组织环境作为重要支撑因素, 公众参与、社会环境作为重要依据因素, 作用于开放全过程并促进开放行为的有效实施与价值实现。
3 OGD实施影响因素互作用框架构建
本文基于編码过程对概念的逐级解释和综合,以及主范畴间的互作用关系, 并结合数据生成、开放、利用的全生命周期, 构建出由核心因素政府组织(Government Organizations)、基础因素技术保障(Technical Support)、促进因素内外环境(Internaland External Environment)、目标因素价值实现(Val?ue Realization) 组成的开放政府数据实施过程的影响因素框架(GTEV 模型), 如图1 所示。政府组织作为数据开放方和相关政策制定者、实施者, 指导数据开放生成、开放、利用的实施全过程; 技术是开放行为实施的手段, 相关技术水平直接影响OGD 实施质量和效果; 实施过程中, 内外环境是深刻反映政府开放行为的内在关系和影响过程的促进变量, 同时影响技术的发展变迁; 开放数据的目标是通过促进各方的积极参与, 实现经济、社会、政治方面的长远效益。
3.1政府组织维度
政府组织作为数据开放核心与主体, 其内部体制和政府自身能力直接影响数据开放水平, 不同政府因组织结构、信息架构等不同, 对技术的接纳和应用水平存在巨大差距[8] 。完善的政府体制、高效的政府能力才能使政府在组织层面充分实施开放数据, 如图2 所示。
政府体制是组织运行的基础, 指导OGD 的实施, 而政府管理体制则是政府体制的基石。处于庞大横向组织网络关系中的地方政府, 在实施OGD 时必然会受到组织网络制度的影响[21] 。而我国尚未形成有效的管理组织架构[22] , 大量数据资源长期处于闲置、封闭状态, 直接影响生成政府数据阶段的效果。同时, 话语权和问责制的建立也对具体实施过程存在一定影响, OGD 的成功需要政府、公民、大众传媒等各界群体共同努力[23] 。在整体管理体制高效的同时也要关注对开放数据的单独管理体制, 数据共享较为先进的国家(地区)通常会设置专门的数据管理机构[24] 。健全政府数据管理体制, 有助于打破部门、系统之间的数据壁垒, 以实现数据开放共享。而在具体的OGD 实施过程中, 如何将政府体制充分融入到开放活动中则依赖政府能力。
政府能力是组织体制的具体体现, 支撑OGD的具体实施。OGD 实施需要投入大量的人力、财力,丰富的资源为组织行为提供保障[25] , 各个城市经济水平的不同一定程度上造成了城市之间OGD 水平的差异。具备良好组织能力的政府, 能够协调组织资源的投入, 力争要素的最大利用[26] 。OGD 作为一项政府创新工作, 政府制定、执行相关政策的能力是实施行为的最初动力, 直接决定OGD 实施的绩效[27] , 同时保证了政策执行和公众需求的迅速响应。在此过程中, 政府创新能力越强, 越能够利用数据产生更大的价值, 对数据的需求也就越大,从而产生良性循环推动OGD 的发展。此外, 商业创新环境[26] 、创新战略[25] 等因素也在宏观或微观层面影响政府创新活动, 间接影响OGD 的实施。
3.2技术保障维度
技术保障因素是OGD 实施的基础与前提。OGD作为一种治理模式的探索和创新, 需要一定的技术能力作为支撑。当一个政府拥有较充分的技术支持,即便没有充足的财政资源也能够拥有较高的数据开放水平[28] 。技术保障主要从技术基础、数据平台技术和数据要求3 个方面体现, 如图3 所示, 这些因素为OGD 的全流程实施奠定基础。
技术基础作为OGD 实施的重要支撑, 是指信息技术的发展水平和政府所拥有的技术能力。与传统信息技术相比, 政府通过社交媒体、网站等渠道发布信息不仅提升了信息的传播速度和效率, 还减少了数据获取的限制[29] 。OGD 离不开政府自身信息技术的支撑作用[30] , 政府信息水平的高低将直接影响数据开放的实施。
数据平台技术主要指建设政府开放数据一体化平台、管理以及保障平台安全。数据平台技术是OGD 前端服务的保障和支撑, 平台门户直接展示信息, 其清晰度、可理解、有用性等基本性质影响OGD 的可读性和有效性。作为数据的“承载” 和“传播媒介”, 政府數据开放平台应在政府体制的指导下根据用户需求提供多元化的政府数据服务。而除平台的多元化外, 信息类型、开放形式、分享机制等也对OGD 的实施绩效有一定影响[31] 。此外,平台的安全问题不容忽视, 要充分利用信息技术保障平台的数据和用户的使用安全。
数据作为政府开放的核心服务内容, 数据本身的安全、及时可用性、开放标准、数据内容质量等均对政府开放工作的绩效起决定性作用。随着数据开放数量的激增, OGD 出现了数据质量不高、数据利用方面成果少[32] 等问题。OGD 的主题覆盖面、部门覆盖率、高需求关键词覆盖率对其完备程度有直接关系, 但数据集数量并非越多越好[33] ,只有高质量且符合用户需求的数据集才能促进OGD的有效利用。一定的开放标准, 包括统一的数据开放共享格式、完善的数据发布审核流程等, 有助于提升OGD 质量与效率。数据要与技术发展相适应,数据机器可读性的提升, 能方便用户发现并利用数据[34] 。OGD 应具有免费性、非歧视性、自由利用、自由传播的基本功能, 统一的开放数据共享标准有助于数据互通, 避免“信息孤岛”。同时数据可用性和及时性对OGD 的实施效果也有重要影响[35] , 及时动态更新数据内容, 保证数据的高效利用与及时可用。此外, 在OGD 实施过程中, 从技术层面、行业层面、制度层面保障数据安全, 有助于增加公民信任度, 扩大OGD 的范围和深度。
3.3内外环境维度
内外环境代表OGD 实施过程中的内部与外部状态, 与服务全过程实施有着紧密联系。各国(地区)开放政府数据模式无论是社会需求推动型还是政府主导型, 都离不开内外环境中各因素的相互作用[36] 。其中, 内部环境因素包括政策政治环境、组织环境、公众参与, 外部环境因素指社会环境, 如图4 所示。
政策政治环境是其中最主要的影响因素, 顶层设计与宏观规划能指导OGD 实施的方向。相关政策的完善是OGD 实施的基础和指导因素, 反之,政策的缺失则会降低政府开放的主动性与积极性,影响社会对政府数据的需求[37] 。目前, 我国仍存在法律法规建设薄弱、国家统一的法律体系迟滞缺位等问题, 在数据隐私安全、数据共享、政府数据等方面的立法仍需完善[25] 。同时, 法律制度的执行还需依靠积极的监管, 以保障政府机制的长效运行[5]。
组织环境即政府数据开放理念与政治压力。政府作为最大的社会数据资源拥有者[38] , 其数据开放共享理念对OGD 的实施有重要支撑作用。开放的组织文化对OGD 工作有着积极意义, 而封闭的组织文化会使得政府人员在心理上产生排斥情绪[3] ,甚至成为开放政府数据工作的阻碍。在实施过程中, 通过培训学习树立正确的数据开放共享理念,能使政府人员主动接受数据开放。同时, 组织行为的发生往往依赖于过往的经验、价值理念等, 当创新行为违背过去的理念时, 组织会消极应对[38] 。因此, OGD 需要自上而下的推动, 上级组织的支持、部署和压力是OGD 的推动力量[8] 。
政府的具体实施很大程度依据公众的参与情况。公众参与首先体现在社会各界需求方面, 开放政府数据行为是为回应公民社会需求的行政行为[28] 。公众需求间接影响政府数据的生成和利用。为回应公众需求并增强社会稳定性、获得公众支持, 政府主体可能会积极提升政府开放水平[37] 。社会各界需求还涵盖了社区组织、企业、媒体组织[39]等各个社会组织的需求。同时, 政府绩效、监管质量等重要指标也与社会参与密切相关[40] 。OGD 的最终利用方是公众, 公众的信息素养在利用数据阶段起决定性作用。公众的信息素养包含了需求认知、及时检索、使用、评价信息等方面, 影响着公众对政府开放工作的认知度与对政府数据的利用能力。一方面, 公众对数据开放有最直接的需求和使用体验, 提升公众认知度能为数据开放共享奠定基础; 另一方面, 随着技术的不断发展, 公众能通过自身能力利用数据创造价值并给予正反馈, 从而促进供给的上升。
社会环境是OGD 的外部因素, 主要指外界压力对数据开放的推动。政府受到的信息共享压力越大, 数据开放共享程度越高, 但仅依靠上方高层压力和下方社会需求强制推动政府采纳新技术, 只会使得政府机构更加分割, 导致OGD 呈现碎片化的状态[41] 。而在横向政治竞争压力巨大与合作需求丰富的体制中, 推动开放式治理创新的动力才能经久不衰。从全球来看, 数据开放运动已是大势所趋, 在时代背景的倒逼下, 会加快推进OGD 工作。
3.4价值实现维度
价值实现意图利用开放数据以实现在经济、社会、政治方面收获长远效益, 这也是OGD 的最终目的。在OGD 中引入价值实现, 促进不同利益的群体参与, 是解决开放数据利用问题的重要方法[42] 。在数据开放和价值实现过程中, 主要考虑两个方面,即收益和风险, 如图5 所示。
OGD 本身不能直接带来价值, 只有当公众、机构等组织利用其创造公共价值时, 开放政府数据才真正具有价值[3] 。OGD 能够实现价值的提升, 进而促进政府开放的意愿和行为, 提高其他主体的利用率[43] 。同时在公民利用数据的过程中, “数据—信息—知识” 的转变使公民能借助其做出决策。通过积极促进公众应用数据, 将被动的沟通转变为积极的公众参与[44] 。而随着公民更多地参与到政府决策中, OGD 的政治价值也开始展现[2] 。其政治价值还涵盖个人或组织在政治中的角色及对政党事务的影响等方面。价值实现对其他维度亦有着重要影响, 当前OGD 进入了发展窘境, 只有深入了解价值实现, 才能为OGD 的实施注入新的动力[38] 。而價值链揭示了OGD 价值实现的流程[45] , 价值实现的内在逻辑则与价值生成机制密切相关。因此,虽然OGD 的价值实现在组织和制度层面的阻碍已基本扫清, 但公众利用方面意识不足、素养不够、动力不足已成为OGD 价值实现过程中必须解决的问题, 未来应聚焦如何从用户角度吸引公众积极利用开放数据、参与开放数据的过程[38] 。
伴随着巨大的价值, OGD 也存在较大风险。目前, 我国OGD 工作在开放内容、开放标准、使用权限、使用门槛等方面缺乏标准, 导致实施过程中存在相应的风险, 甚至危害国家安全[46] 。隐私泄露会影响政府公信力和工作成效, 阻碍政府开放数据的意愿[3] 。而低质、错误的数据也会导致决策失误从而引发更为严重的结果。OGD 的风险还包括感知风险[47] 、公务员风险规避态度[48] 、数据安全风险等。未来应开展完善的开放数据流程梳理和风险评估工作, 以确保数据开放工作的安全、高效、快速的实施和深化。
4结论
本文采用元综合分析方法, 通过制定检索标准和EBL 质量评估, 从国内外大量相关研究中选取有效文献, 梳理大量前人研究并对文献进行细粒度分析和解释性编码。文章揭示了开放政府数据实施过程中的众多影响因素, 厘清了影响因素之间的互作用关系, 最终构建了OGD 实施影响因素模型(GTEV 模型)。该模型包含政府组织、技术保障、内外环境和价值实现4 个维度与11 个主范畴。研究发现: 第一, OGD 作为一个复杂的研究对象,其实施过程受到政府体制与政府能力等内部核心因素的影响, 同时受到技术保障、内外环境和价值实现等外部各影响因素的共同作用; 第二, OGD 实施作为一个多因素相互作用的系统, 在纵向维度中可分为数据生成、开放、利用和反馈4 个阶段, 从而实现开放政府数据完整的生命周期动态循环; 第三, 政府作为OGD 实施的主体, 其开放能力与体制直接影响OGD 的实施效果。因此, 政府应当在OGD 实施的各个阶段, 协调统筹内外各影响因素,不断提升OGD 实施能力, 以此实现OGD 的最大价值。
本文采用元综合研究方法探索OGD 的实施,系统、全面挖掘OGD 实施的影响因素并探析其中互作用机制, 为OGD 实施提供了完整的分析视角,并在一定程度上拓展了元综合方法的应用领域和适用范围。本文构建的GTEV 模型, 综合OGD 实施过程中不同阶段的各影响因素, 阐明OGD 的实施与发展过程, 一定程度上推动了开放政府数据理论研究的发展。本文所探究的OGD 实施影响因素,更加完整阐述如何在政府组织下, 以技术为支撑,将内外部环境有效结合, 并积极地从用户的角度考虑如何促进公众的参与、开展完善全面的风险梳理, 能够为政府在后续的OGD 实施中提供理论指导, 为提升政府的数据建设及大数据时代国家综合竞争实力指明方向。
同时, 文章也存在一些不足, 本文研究对象(OGD)相关研究较为繁杂, 虽然检索时尽可能扩大范围并进行追溯检索, 但仍可能导致文献遗漏;OGD 作为一种实践行为, 本文尚未对提炼的影响因素进行实证检验。未来研究中会结合实践和理论的发展进一步探讨并完善影响因素框架, 并通过实证研究验证理论, 对框架进行修正和扩展。