赵龙文 黄锐敏 方 俊
(华南理工大学电子商务系 广州 510006)
数字化时代的到来加速了政府数字化的进程。在这一过程中,政府生产、采集并存储了大量的数据,这些数据涵盖了国家生产生活的方方面面,若能加以开放利用,将为整个社会创造巨大的价值,而政府开放数据是实现这些数据价值重要且有效的一大途径。自美国通过平台实行数据开放起,各国政府逐渐意识到政府数据中潜藏的巨大价值,纷纷加入数据开放的行列中并加大政府数据开放的建设力度,我国也不例外。继2015年《促进大数据发展行动纲要》发布之后,我国的众多战略规划文件均对政府开放数据建设方面的内容有所强调和规划,最近于2021年发布的《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》,再次对加快政府数据开放的建设提出了一定要求,明确指出资源整合以及政府数据价值实现的重要性。价值实现是政府实施开放数据这一重大战略的终极目标,也是重要的内部驱动力。在促进数据价值实现的过程中,适时对价值实现能力进行评价能够起到重要的反馈和推动作用。通过评价可以了解当前政府数据开放的整体效果、数据价值实现的可能性以及实现程度,及时发现问题并解决,把握政府开放数据工作的建设重点,从而推进政府开放数据的进一步建设和完善。因此,本文重点对政府开放数据价值实现能力进行研究,构建相应的评价指标体系,同时从中探索对价值实现能力影响较大的指标,提出具有针对性的改进建议,以期为推动政府开放数据价值实现提供参考和借鉴。
目前已有众多学者针对政府开放数据的不同要素构建了相应的评价指标体系,如平台、数据质量、政策、价值以及隐私风险等。在现有的政府开放数据评价研究中,对平台[1]和数据质量[2]这两大要素的研究居多。对于开放数据价值,现有的价值评价研究主要以价值测量为目标,基于不同视角提出价值的分析和评估框架。例如,学者赵继娣等选择从平台内容、用户参与、开发利用三个维度对数据价值进行评价[3];Yannis Charalabidis等人从用户目标实现和提供者目标实现的角度出发构建了二维评价框架,其中用户的维度主要包括数据提供能力、数据易用性和数据搜索及下载能力等指标,提供者的维度主要包括数据展示、处理、上传等能力指标[4]。测量数据的价值,对数据带来的效益进行评估和测量是较为直接的方式。郑磊等通过对开放数据价值评估的相关研究进行梳理,着重关注开放数据实施成效的相关指标,归纳总结出一个四维三级指标体系,包括政治、经济、环境、公众四维以及其下的若干二、三级指标[5]。黄如花从国内外开放政府数据的相关政策文献中提炼观点,以政治、社会、经济、技术四种价值为核心构建了我国的开放政府数据价值体系,揭示了我国开放政府数据将带来什么样的价值[6]。Anneke Zuiderwijk从实施效益出发,以诸如增加政府透明度、提高政府重用数据能力、改善行政管理流程以及增加公众授权等直观效益来评价开放数据带来的价值[7];与之类似,Peter Parycek也通过选择诸如提高员工积极性、提高公民参与、促进经济增长、提高效率等效益指标来进行评价[8]。
由此可见,对于数据开放价值的测量,以上学者们重点关注的是结果,研究多以开放数据最终能够带来的价值的测量为主,忽略了价值生成乃至实现的过程以及过程中影响价值实现的因素。开放数据价值的生成和实现是循序渐进的,有其机理和过程,受多种因素影响。对于价值的生成机理,陈兰杰基于公共价值的视角,将开放数据价值分为政治、经济、社会、文化四种类型,分析了其产生的机理,提出了价值的6种实现机制[9]。郑磊在国内外研究成果的基础上,对价值创造机理进行了研究,提出价值创造过程中涉及的利益相关者和外部环境共同构成了一个“生态系统”,并分析了主体之间的互动关系[10]。对于价值影响因素,学者王晶基于TOE理论指出影响开放政府数据价值实现的主要因素有组织、技术以及环境[11]。由于缺少数据支撑,扎根理论成为学者探索开放数据价值实现受何影响的重要研究方法。唐长乐使用扎根理论研究发现了需求、认知和动机这3个内在维度以及资源、技术和政治经济这3个外在维度会对开放数据的价值实现造成影响[12]。同样地,王法硕等[13]人也运用扎根理论,在国内外关于开放政府数据研究文献的基础上,梳理得到了影响政府开放数据价值实现的因素。
从现有研究来看,政府开放数据价值评价方面的研究主要集中在最终价值的测度上,多从用户参与层面出发或者单从效益层面进行测量,尚未发现有集合价值实现过程与结果更为全面和多维的评价方法或指标体系,评价视角或维度还较为单薄;其次,较少有研究对最终构建的评价指标体系或框架的科学性进行探讨。实际上,政府开放数据价值实现是一个循序渐进的过程,从现有对于价值实现机理及其影响因素的相关研究也可以看出,开放数据价值的实现过程和机理多样且复杂,其中涉及的环节和要素较多且分散,价值实现受这众多因素的影响,最终的实现程度存在较大的不确定性。
基于以上原因,本研究将价值评价的考察范围进一步扩展,不再局限于最终的开放效果,而是扩大到开放数据价值实现的整个过程以及开放的环境中来研究,对政府数据价值实现的能力予以评价,从而构建更为全面且多维的评价指标体系并论证其科学性。综合现有研究对价值实现过程和机理的理解[11],本文认为政府开放数据价值实现是一个以数据资源和技术资源为基本要素,利益相关者和开放环境在各个环节中相互作用的动态过程,过程的变动影响着最终价值的实现程度,故本文提出的政府开放数据价值实现能力评价实质上是对价值实现程度的评估,通过考察价值实现过程中基本要素的建设和管理情况、利益相关者的行为、数据开放环境的建设情况以及各要素的相互作用效果等,监测和把握价值实现过程的每个阶段,帮助管理者及时识别不足、采取措施、优化管理,从而推动政府开放数据价值的最大化实现和可持续发展。
数据价值实现是政府开放数据的主要目标和最终目的,政府采取的一系列措施包括相关政策的制定和出台都是为了保障开放数据的价值实现,因此,在相关研究匮乏、缺少指标体系和指标数据支撑的情况下,本文选择采用扎根理论,从中央政府出台的政府开放数据相关的政策文件入手,获取政府在开放数据中重点关注的内容,从而提炼出可用于评价政府开放数据价值实现能力的指标,构建评价指标体系。
2.1.1研究方法
政府开放数据是近年来政府尤为重视的一个领域,也是学术界热门的研究课题之一,然而目前关于开放数据的价值实现能力评价尚未形成系统完整的理论。我国政府早已意识到了数据开放共享是促进数据价值实现的重要途径和手段,近年来制定并出台了一系列政策来推动政府数据的开放。自此,政策成为了完善政府数据开放以及促进数据价值实现的基础和保障。例如,2015年发布的《促进大数据发展行动纲要》中提到“通过应用创新开发竞赛、服务外包、社会众包、助推计划、补助奖励、应用培训等方式,鼓励企业和公众发掘利用开放数据资源,激发创新创业活力”。此项内容明确指出了数据应用促进数据价值实现;再比如《国务院办公厅关于运用大数据加强对市场主体服务和监管的若干意见》中提到“各部门在履职过程中,要依法及时、准确、规范、完整地记录和采集相关信息,妥善保存并及时更新”。此项内容则强调了数据质量在数据价值实现过程中的关键性。
扎根理论将定性和定量结合,既可以克服定性研究信度差的问题,又能够克服定量研究在深度和效度上不足的问题,进而得到更科学的结果[14]。政府思想往往通过政策这一实物载体传递,通过政策中的描述性文字传达出主要的宗旨和目标,同时政策文本具有复杂性。因此在缺少数据支撑的情况下,可选择扎根理论作为主要研究方法,以政策文本为研究样本进行研究。
使用扎根理论构建理论模型的一般流程,见图1。
图1 扎根理论建模流程图
2.1.2政策来源
本文对我国政府开放数据价值实现能力评价体系进行探讨,为使最终构建的体系具有普适性,本文主要收集了中央发布的国家层面统一性的政策法规和指导方针。我国政府数据开放共享已经经历了一段时期的演化,从最初以数据共享、信息公开的形式为主,到后来重视并积极倡导数据开发应用和数据基础设施建设,再到如今的政府数据开放战略[15]。因此,在收集文献时,本文采用“信息公开”“数据开放”“数据共享”和“政府数据开放”等为检索关键词,时间区间为2014年1月1日(《促进大数据发展行动纲要》发布前一年)至2021年12月31日(检索时间:2022年1月10日),在北大法宝上进行全文检索,而后又从国务院官网、国务院组织机构官网上以相同检索方式进行补充,最后收集整理得到相应的政策文本作为研究样本。最终收集得到目前仍具有时效性的政策文本50份(部分政策文献见表1)。
表1 收集到的部分政策文献
2.1.3研究思路设计
本文对政府开放数据价值实现能力的研究思路设计如图2所示。首先使用扎根理论对相关政策文本进行梳理和编码,构建政府开放数据价值实现能力评价指标全集;然后通过指标相对权数和重要性指数进行关键指标的筛选并对其结果进行信效度检验;最后确立政府开放数据价值实现能力评价指标体系,以期为政府开放数据价值实现评价研究提供理论基础和参考借鉴。
图2 研究思路设计
2.2.1开放性编码
开放性编码的主要工作是逐一分析资料中的原始语句,用简洁的概念标签对这些语句进行标注,标注完所有语句后再将概念标签进一步归纳得到副范畴。本研究使用Nvivo 12plus作为编码工具,经开放性编码处理后,本文共得到初始概念标签359个,经筛选后得到53个有效概念标签,提取得到18个副范畴,开放性编码示例见表2。
表2 政府开放数据价值实现评价指标开放性编码示例
2.2.2主轴编码
主轴编码的主要作用或目的是分析副范畴之间的关系,梳理和归纳,将若干个副范畴合并成主范畴。在这一阶段,本文提炼出了数据指标、技术指标、制度法规指标、效益指标和参与指标5个主范畴,并将主范畴划分为直接和间接2个评价维度,见表3。
表3 主范畴和副范畴及彼此间关系
2.2.3选择性编码
选择性编码的主要作用和目的是整合主范畴,提炼核心范畴,初步形成理论模型。本文的主要研究对象是政府开放数据价值实现能力,经分析和梳理,形成了以“政府开放数据价值实现能力的评价指标”为主题的理论模型,并以这一主题为核心,进一步展开得到数据维度、技术维度、制度法规维度、效益维度和参与维度5个主范畴,将其作为政府开放数据价值实现能力评价指标的5个一级指标。其中,效益维度是政府开放数据价值实现能力的直接评价指标维度,这一维度下的指标直接衡量政府开放数据价值实现能力;数据维度、技术维度、制度法规维度和参与维度是政府开放数据价值实现能力的间接评价指标维度,这几个维度下的指标间接反映开放数据价值的实现能力,用于在开放的整个过程中对政府开放数据价值实现能力进行评估。基于以上研究,最终构建得到的指标全集如图3所示。
图3 政府开放数据价值实现能力评价指标全集
2.2.4饱和度检验
饱和度检验旨在验证按照三阶段编码步骤后构建得到的理论是否全面,以防遗漏相关范畴。若在这一步中检验通过,则理论得以建立;若检验不通过,则应再次收集资料对理论进行补充直至达到饱和,通过检验。本文预留了5份材料进行饱和度检验,在检验时,并无新的概念和范畴产生,因此,可认为检验通过。
单单运用扎根理论在现有政策文本中筛选指标构建指标全集存在一定的主观性,因此需要根据指标重要性筛选得到关键指标。根据指标重要性分析的相关研究[16],本文采用关键指标重要性分析评价指数来进行筛选。
2.3.1指标相对权数和重要性指数
第一步,计算指标相对权数。本文是在政府开放数据的政策文本中提炼指标,当某项指标内容在政策中被反复提及和强调,说明该项内容是为政府所重视的和当下需要迫切建设的重要内容,因此可用指标相对权数进行筛选,得到政策文本中的重要指标。通常,指标相对权重记为C,其取值在0~1之间,指标的重要性随相对权重数值的增加而增加。指标相对权重计算公式如下:
(1)
其中,nj表示第j个指标相关的内容在收集到的政策文本中被提及的次数,max{nj}表示指标全集中被提及的次数的最高值。
第二步,计算重要性指数。对前文建立的18个二级指标进行评分,评分规则采取5分制,即{1,2,3,4,5},分别代表{非常不重要,比较不重要,一般重要,比较重要,非常重要}。重要性分数记作I,取值范围同样是0到1之间,计算公式如下:
(2)
其中,Aj表示对第j个指标的所有专家评分的均值。
2.3.2权重计算
根据参考文献,关键指标重要性分析评价指数W,其取值在0~1之间,重要性随指数值的增加而增加。关键指标重要性分析评价指数W综合了上述两种重要性分析指数,其计算公式如下:
Wj=Cj*Ij
(3)
通常需要设定一个固定的阈值c进行关键指标筛选,当W≥c时保留指标,否则予以剔除。
根据政策文本中各指标的概念内容出现的频次计算相应的Cj,采用Likert五级量表设计问卷并向9位专家及相关领域研究人员发放,从而计算Ij。根据以上公式最终计算出重要性分析综合评价指数W,计算得到的结果,见表4。
表4 二级指标重要性分析综合评价指数
为保证评价指标体系的“全面性”与“代表性”[17],设置阈值c=0.02,保留18个二级指标进行后续研究。
2.3.3信效度检验
关键指标筛选后还需要进行信效度检验,以保证指标体系的可靠性。
对于信度,有4种检验方法,本文采用α检验,即内在一致性检验。α值越大,所构建的评价体系越可信。通常检验标准为α≥0.7[18],最好为α≥0.8。代入评分数据计算得到α=0.843>0.8,即通过信度检验,表明由这些指标构建的评价体系是可靠的。
对于效度,根据本文的研究内容和几种检验方式的定义,选用内容效度检验,考察指标与对应范畴的关联度,记第j个指标的内容效度指数为Vj。同样,采用等级评分的方式,对指标进行4个等级的评分:1代表完全不相关,2代表弱相关,3代表相关,4代表强相关。通常内容效度评价标准是Vj≥0.78[19],满足标准则说明该指标的内容效度良好,可保留该指标,否则应考虑予以修改或剔除。经过检验计算得到,政社协同指标的内容效度指数V=0.761<0.78,其他指标均通过内容效度检验。鉴于内容效度指数0.761接近于0.78且其重要性分析综合评价指数为0.56,故应考虑结合专家建议对“政社协同”这一指标进行适当调整[19]。根据编码内容,“政社协同”多强调政府同企业之间的协作,因此将“政社协同”这一概念缩小,修改为“企业参与”,继续保留在指标体系中,同时对具体测量条目进行了调整,使指标的测量更贴合政府开放数据价值实现这一主题。
至此,政府开放数据价值实现能力评价指标体系得以建立。
将前面计算得到的关键指标重要性分析指数归一化,进而计算出各一级指标和二级指标的权重,最终确定了政府开放数据价值实现能力评价体系可由5个一级指标和18个二级指标构成,见表5。
表5 一级指标及二级指标权重值
通过以上三阶段编码和关键指标筛选,本文确定了用于评价政府开放数据价值实现能力的5个一级指标和18个二级指标。为了进一步理解和衡量这些指标,本文回溯开放性编码阶段,对初始概念标签以及原始语句中提及的内容进行梳理得到与各指标对应的具体测量条目,见表6。
表6 评价指标体系及其具体测量条目
3.2.1效益指标
效益指标衡量的是政府开放数据为社会和经济创造的价值,也是本文梳理得到的评价指标体系里可直接体现和用于衡量政府开放数据价值实现能力的一级指标,故被归为直接评价指标维度。该指标包含公共服务情况、社会治理情况、政府透明度和公信力、政府数据管理能力、经济管理情况这5个二级指标。公共服务情况可通过当前政府在互联网+政务服务、互联网+社区服务建设背景下开设的业务服务情况进行评价,包括对服务渠道等的畅通程度,业务办理时重复提交发生的频率,服务流程和办事手续的简易性等的考察;社会治理情况主要是对政府在应对重大的公共突发事件或紧急事件时,数据开放和数据运用的科学性、合理性以及高效性的考察;政府透明度和公信力可通过行政事项清单、责任清单和负面清单等清单的建立及其完备性,相关的政务信息公开的及时性等进行评估;政府数据管理能力可通过政府开放数据的范围、数据共享的主体或对象、数据分级分类管理以及资源目录建立的情况进行考察和评估;经济管理情况衡量的是政府开放数据在经济管理方面的价值和作用,如帮助市场发展新的业务、开创新的业态和新的经济模式以及帮助更好地管理经济社会等。
3.2.2数据指标
数据经由平台和相应的技术处理得以开放、流通和共享,在各主体的参与开发和应用下其价值最终得以实现。数据是基础,没有数据,价值实现无从谈起。在本文构建的指标体系中,数据指标包含了数据质量、数据获取、数据应用3个二级指标。对于数据质量,数据在采集、保存、处理等环节中的真实性、完整性、准确性、及时性以及一致性均属于数据质量的考察范畴,贯穿数据生命周期的各个环节;数据获取考察数据在流向包括公众、企业等社会主体在内的数据使用者时的便捷性,本文主要侧重于使用者在获取数据时的操作便捷性,包括查询功能的便捷性、接口提供类型和数量、数据可视化程度以及数据分类的合理性等;数据应用考察数据在应用场景、应用安全性以及数据产品和服务等方面的情况,包括开放数据应用领域或应用场景的广泛度、数据交付形式与应用场景的匹配度,数据产品和数据服务的多样性以及数据应用的安全性和可靠性等。
3.2.3技术指标
技术是政府开放数据和数据价值实现不可或缺的强力支撑。平台是政府数据开放有效的载体和渠道,数据价值的实现需要通过平台经由一定的技术对其进行开发和应用。在本文构建的评价指标体系中,技术指标主要包含了平台/系统建设、数据安全保障技术、数据处理技术3个二级指标。平台/系统的建设情况包括平台数量、平台和系统功能、平台基础设施以及平台和系统整合对接的范围以及流畅度等内容,通过考察平台/系统的这些方面可对平台建设情况进行评估;数据安全保障技术保障数据在流通以及应用过程中的安全,在数据价值实现过程中同样重要,基础设施建设的完备性、监控预警的设置以及在数据安全方面关键技术的突破等均属于数据安全保障技术的考察范畴;数据处理技术在一定程度上影响数据价值的实现,适用性强、低成本、高效率的数据处理技术能够帮助数据加工者或数据使用者更为有效地利用数据,进而促进数据价值的实现。
3.2.4参与指标
参与是政府开放数据价值实现的重要一环,政府内部各部门间数据流通推动业务完成的高效和流畅、政府向社会开放数据,吸引社会主体的参与对开放数据的反馈和评价以及对数据进行挖掘和应用等,都能促使数据发挥其价值。在本文构建的评价指标体系中,参与指标包含了公众参与、企业参与和政府部门协同三项二级指标,囊括了政府开放数据中重要的三大主体。对于公众参与,目前公众参与政府开放数据的形式主要是通过平台对政府开放数据的下载、分析、应用、咨询、评价和建议反馈等。如能增加公众参与政府开放数据的途径和形式的丰富性和多样性,提高公众参与的积极性,将进一步促进政府开放数据的价值实现。对于企业参与,企业在技术、人才和应用开发经验上的优势使之成为政府数据开放生态系统中的重要主体,其在政府开放数据创新大赛举办、政府开放数据清洗和加工、数据应用程序开发等方面发挥着重要的积极作用[20]。评价企业参与,可通过考察企业在大赛举办、应用开发以及数据技术服务提供等的参与情况予以评估。政府部门协同多指政府内部各部门在业务上实现的协同,主要是跨部门跨区域跨层级的数据流通与融合。跨部门业务办理的快捷性和高效性、政府内部数据共享平台建设情况、责任分工的合理性和明确性等均可反映政府内部各部门的协同程度。
3.2.5制度法规指标
政府开放数据价值的顺利实现离不开相应的制度和法规的保障。在数据价值实现的过程中,制度和法规的保障应贯穿整个过程,开放数据前的规划和标准的问题、开放数据时的安全、隐私问题以及开放数据后出现的风险问题等理应得到有效关注和保障。故在本文构建的指标体系中,制度法规指标需要衡量信息隐私保护、数据开放、数据流通以及数据监管等指标。隐私保护制度、安全保密制度和安全规范等有关隐私保护的制度和法规的发布情况、内容完善程度等,均可反映信息隐私保护这一指标;数据开放管理可通过事先统筹和规划的合理性、可行性以及数据开放标准和规范的建立情况进行考察;数据流通考察数据在流通方面的制度和机制的建立情况,包括数据汇交机制、数据运营机制、数据交易或其他市场化形式的机制以及数据跨境流动的安全制度等,重点考察数据在流通方面的制度和机制的完善程度;数据监管是数据价值实现能力的重要保障,完备的数据安全监管制度体系应覆盖数据使用控制、管理、责任制度、监管制度、数据安全设施建设等方面制度。
在相关研究匮乏、缺少指标体系和指标数据支撑的情况下,本文基于扎根理论,从政府开放数据相关的国家级政策文件入手,对50份政策文本进行了三阶段编码,得到政府在开放数据时重点关注的内容,并在此基础上提炼出可用于评价政府开放数据价值实现能力的指标全集,最终经权重计算和筛选后构建了政府开放数据价值实现能力评价指标体系。该评价体系共有5个一级指标和18个二级指标,在一级指标中,效益指标为直接评价指标,其余的数据、技术、参与和制度法规4个指标为间接评价指标。经关键指标筛选和权重计算确定了各指标的权重。
在一级指标中,权重最高的前3位指标有数据(0.24)、制度法规(0.23)和效益(0.23)指标;二级指标中有数据质量(0.10)、数据应用(0.10)、平台/系统建设(0.10)和信息隐私保护(0.10)。由此可见,促进开放数据价值实现应重点关注数据的质量和应用、平台/系统的建设和以信息隐私保护为主的制度法规的建立。因此,本文提出如下建议,希望能为政府后续在数据开放的实施过程中推动数据价值的实现和释放提供参考和借鉴:
a.数据质量和数据应用是数据价值实现的关键。由于开放数据过程具有阶段性特征以及数据质量内涵的丰富性,政府部门在把控和提升数据质量时可根据数据开放的不同阶段对数据质量的不同要求建立相应的标准和规范,构建数据质量的监测和控制机制,以保障开放数据的真实性、完整性和及时性等;在此基础上,从管理优化、流程优化和技术优化等角度积极探讨并实施数据质量提升的有效措施。在数据应用方面,政府部门在开放数据时应根据数据来源做好应用领域的分类工作,同时充分挖掘领域下可能的应用场景,了解数据使用需求,提供相应的数据产品或数据定制、可视化等交互性数据服务,进而促进数据的广泛应用和价值实现。
b.开发利用数据以及实现数据价值都需要众多参与者共同推动,而平台是连接各类角色与参与者的枢纽,应积极建立各类数据开放和创新服务平台。平台及其功能服务供给是最主要的应用中介与载体,也是数据应用过程中的核心,应重视平台和系统的建设,以服务民生为出发点和落脚点,保障数据使用者对数据获取的高效性和便捷性,不断地完善和创新平台服务;其次,要注重平台间数据的互联互通,实现多部门数据的整合共享,避免资源浪费,提高数据使用效率,推动开放数据价值的实现。
c.制度法规等是政府实行数据开放的重要保障,保障着政府开放数据的顺利实施,保障着开放数据价值的有效实现。因此,相关部门应积极出台相应的政策,进一步明确政府开放数据的内涵、开放和共享范围、对象以及对开放数据的应用和流通进行一定的统筹监管,尤其应重点关注信息隐私保护方面的政策法规的制定,进一步完善和落实《数据安全法》《个人信息保护法》等与个人信息隐私保护相关的法律法规,对侵权行为进行追责并给予严厉惩处,用法律和制度来保障数据安全和个人隐私保护,推动建设更为完善的政府数据共享政策法规体系,保证政府开放数据在遵从政策、法律、组织要素等要求的前提下,给社会创造更大的价值。
本文研究构建了政府开放数据价值实现能力评价体系,希望为政府开放数据的相关评价研究提供一些思路,为政府数据开放建设及数据价值实现的相关政策和实践提供参考。本文尚未将指标体系应用到实践中,与实际结合提出相应的对策建议,后续研究将考虑应用该指标体系对具体省市进行评价,采集并分析相应的评价数据,进而提出更具针对性的对策和建议。