王 卫,王 晶(北京师范大学政府管理学院)
自2009年美国政府发布开放政府计划并建立全球首个开放政府数据平台Data.gov后,开放政府数据浪潮迅速席卷全球。截至2019年下半年,全球已有139个国家建立了开放政府数据平台,我国地市级以上开放的政府数据平台已有102个。[1]开放政府数据因具有政治、经济和社会等多方面的价值而受到广泛关注,越来越多的公共部门、企业和个人参与到开放和共享政府数据中。Deloitte公司对2011-2012年英国开放政府数据价值的研究显示,其产生的经济价值约为18亿欧元,若包括社会价值可达62亿欧元。[2]联合国报告指出,开放数据将为实现2015-2030年联合国可持续发展目标带来4个方面的利益:促进经济增长和就业、改善教育医疗等领域的公共服务、提高政府透明度、助力“智慧城市”建设。[3]
开放政府数据平台是政府向社会公众提供数据的主要渠道,平台的数据质量、服务质量、系统质量会直接影响用户的使用意愿与行为,进而影响开放政府数据价值实现,用户本身的绩效期望也会影响价值实现。然而,目前仍缺乏从平台和用户两个角度对开放政府数据价值实现的研究。因此,本研究结合IS成功模型和UTAUT模型,探讨影响开放政府数据价值实现的因素,同时引入系统动力学方法,深入剖析价值实现与各影响因素间的关系结构及动态变化过程,以期为开放政府数据价值的实现与可持续发展提供借鉴。
信息系统成功模型(Information Systems Success Model,IS成功模型)是研究信息系统成功与否的重要理论模型,由DeLone和McLean于1992年提出,2003年他们提出了更加完善的信息系统成功模型。[4,5]该模型包括七个变量:① 信息质量,指系统提供信息的相关性、准确性、完整性、可理解性等;② 系统质量,是对系统自身特征的量度,如易用性、可靠性、功能直观性等;③ 服务质量,指用户从系统中获得帮助的质量,如响应力、准确性、技术能力等;④ 使用意愿,指用户对使用信息系统的态度;⑤ 使用,即用户使用系统的程度和方式,如使用频率、使用范围、使用目的等;⑥ 用户满意,指用户使用信息系统的满意程度;⑦ 净收益,指信息系统在多大程度上帮助用户实现其目标。[6]
IS成功模型主要应用于电子政务领域,而开放政府数据平台同样可以被看做是一个信息系统。2017年,Purwanto等通过对印度尼西亚选举系统的实证研究,首次将IS成功模型应用于开放政府数据领域。[7]IS成功模型较好地展现了信息系统如何通过用户使用意愿与行为、用户满意度来影响净收益。
IS成功模型主要分析系统本身特性对其净收益的影响,但对系统的使用者——用户,却缺乏深入分析。为此,本研究整合技术接受与使用统一模型(Unified Theory of Acceptance and Use of Technology,UTAUT 模型)将用户的影响纳入分析。
UTAUT模型研究用户对技术的接受和使用情况,[8]包括四个核心变量(绩效期望、努力期望、社会影响、便利条件)以及四个调节变量(性别、年龄、经验、自愿性)。其中,绩效期望是指用户对信息系统预期效益的估计,努力期望是指用户对使用信息系统所需付出努力程度的判断,社会影响是指用户感知到的被周围环境影响的程度,便利条件是指用户感知到的相关技术、基础设施等对信息系统使用的支持程度。
实证研究表明,UTAUT模型对用户使用行为的解释力高达70%,比以往技术接受模型都更为有效。[9]近年来,学者开始应用该模型分析用户对开放政府数据的使用意愿与行为,Zuiderwijk等基于UTAUT模型研究用户对开放数据技术的接受和使用情况,[10]Saxena等基于UTAUT模型对印度的开放政府数据使用情况进行实证研究。[11]与以往相关研究不同,本研究将UTAUT模型与IS成功模型进行整合,同时从用户和平台两个角度出发,研究影响开放政府数据价值实现的因素。
针对开放政府数据本身特性,笔者将平台方面影响开放政府数据价值实现的因素划分为开放数据质量、开放平台质量和平台服务质量。在UTAUT模型中,努力期望和便利条件均指信息系统、技术设施对用户的影响,与平台方面的系统质量重复,因此,将用户方面的影响因素划分为用户绩效期望和社会影响。参考《中国地方政府数据开放评估报告》中的“数林指数”,并结合开放政府数据的实际使用情况,得到开放政府数据价值实现影响因素(见图1)。
图1 开放政府数据价值实现的影响因素
开放数据质量受数据量和数据质量的影响。数据量与主题覆盖面、部门数量和高需求数据量有关;数据质量与开放授权、数据格式、数据更新频率、元数据、API描述规范和数据存档等因素有关。
(1)数据量。① 数据集的主题覆盖面直接决定数据开放的广度和深度,与民生密切相关的数据蕴藏的价值更大,更应该优先开放。② 部门数量反映各级政府部门参与数据开放工作的程度,也决定着数据集来源的丰富程度,各政府部门积极参与数据开放,有助于打破部门壁垒,实现跨领域数据的互联互通,方便用户“一站式”获取不同领域数据。③ 高需求数据是指用户下载量较高、需求较高的数据。
(2)数据质量。① 开放授权是指明确授予用户免费获取、不受歧视、自由利用、自由传播和分享数据的权利。政府数据作为公共资源,原则上应免费向社会开放,允许用户平等访问、获取、使用和分享数据。② 关于数据格式,万维网发明者Tim Berners-Lee提出开放数据五星标准,[12]认为非专有的可机读格式,即CSV格式是后续数据开发、关联的基础,数据格式的多样性和机器可读性会影响数据的增值利用。③ 数据更新频率对确保数据时效性至关重要,数据开放后的更新和维护水平会影响数据的使用价值。④ 元数据是描述数据的数据,为数据集提供元数据有助于用户清楚了解数据集的内容与背景,从而更好地获取和利用数据。开放政府数据的元数据条目主要包括数据名称、摘要简介、标题关键词、数据主题、数据格式、开放属性、提供单位、发布日期、更新日期、更新频率、数据指标和数据量等。⑤ API描述规范主要包括数据资源描述和数据调用说明。其中,资源描述是指API的基本信息,如名称、简介、提供部门、更新时间等;数据调用说明是指API的调用方式、请求地址等信息。API描述规范有助于用户了解API的具体信息及获取方式,帮助其更好地调用接口并获取数据。⑥ 数据存档是指将不同时间更新的多个批次数据同时存储在平台上供用户下载,有助于用户根据时间线索来获取和利用历史数据。
开放平台质量是针对开放政府数据平台自身功能的量度,受平台概览、平台引导、数据获取、成果展示等方面的影响。① 平台概览是指开放政府数据平台呈现给用户的首页界面情况,主要包括数据更新与下载状态、最新相关资讯、可视化展示等。② 平台引导是指开放政府数据平台提供的便捷引导功能,包括分类导航功能、搜索功能、排序功能和平台间链接等。目前,我国省级开放政府数据平台主要是与其市级平台进行链接。③ 数据获取主要是指开放政府数据平台提供相关功能便于用户浏览和获取目标数据,包括提供数据预览、开放数据目录、本地获取、分级分类获取等。其中,数据目录指对平台上所有开放数据集基本情况的介绍,包括每条数据集的标识符、资源名称、资源类别、关键词、资源摘要、更新频率、发布日期等;分级分类获取是指平台根据政府数据的属性对其开放程度进行分级分类,主要包括普通开放、依申请开放和有限开放。④ 成果展示是指开放政府数据平台向社会公众展示用户利用数据研发的各类成果,有助于形成从数据开放、被利用到生成价值的闭环,包括成果类型、数据来源等。成果类型分为三种:App应用,即企业等利用数据开发的各种应用服务;传播产品,即对数据分析或可视化处理后以新闻、自媒体推送等方式向社会公众传播;研究成果,即高校、研究机构等利用数据形成的论文或研究报告。
平台服务质量是指开放政府数据平台所提供的服务能够满足用户需求的程度,主要受工具提供、互动交流和个性化服务等因素的影响。
(1)工具提供是指开放政府数据平台通过提供基本工具来帮助用户对数据进行分析和开发,主要包括可视化与分析工具、开发工具和地理空间工具等。① 可视化与分析工具允许用户在数据集页面设置不同条件来对数据进行初步统计分析或对统计结果进行可视化呈现。② 开发工具为用户进行数据的深入开发利用提供了便利。③ 地理空间工具大多与高德、百度等企业合作提供导航功能,或将一些公共部门的位置叠加在地图上提供服务。
(2)互动交流是开放政府数据平台提供的便于用户与数据提供方进行双向沟通的功能,包括数据集评价、数据请求、建议反馈、数据纠错和分享传播等功能。① 数据评价主要包括星级评价和文字评价,可以较为具体地展现用户对于数据集的评分和具体意见。② 数据请求功能允许用户在平台上请求希望开放的数据集,有助于数据提供方知悉社会公众的数据需求,从而完善数据提供服务。③ 建议反馈功能便于数据提供方采集用户建议,主要包括问卷调查和填写文字性咨询建议。④ 数据纠错功能允许用户对平台数据进行纠错。⑤ 分享传播功能允许用户将平台上的信息在微博、微信和QQ等社交媒体平台上传播,提升开放政府数据平台的社会影响力。
(3)个性化服务是指开放政府数据平台针对不同用户需求所提供的服务,主要包括个性化整合、数据集订阅或收藏、智能服务。① 个性化整合是指平台为用户提供个人中心,用户可以根据自己的需求,集中使用数据获取、工具使用、成果展示、互动反馈等功能。② 数据集订阅或收藏是指用户可以对自己感兴趣的数据集进行订阅或收藏,可随时在个人中心直接查看而无需重新查找。③ 智能服务是指平台以人机对话的方式为用户提供个性化的服务和指导,可以节省客服的人力投入并提升服务的效率和效果。
① 用户绩效预期是指用户对使用开放政府数据后所产生预期效益的估计。如果开放政府数据能有效提高用户工作效率和生活水平,用户则会更加积极、主动地使用开放数据。为提高用户绩效预期,可以尝试将数据与公民的生活、工作联系起来,开放用户需求高的数据。② 社会影响是指用户感受到的周围环境的影响,包括宏观环境和微观环境。周围环境对用户使用开放政府数据的支持程度越高,用户的使用意愿越强烈。如,如果某个很重要的人(朋友或导师)向用户推荐使用开放政府数据,则用户使用开放政府数据的概率会大大增加。
系统动力学(System Dynamics,SD)由麻省理工学院Forrester教授于1956年创立,主要研究复杂系统行为的动力学特征。[13]系统动力学是研究信息反馈系统的交叉学科,其最突出的特点是能够处理非线性、高阶层、多重反馈、复杂时变的系统问题,能较好地描述系统组成要素间的关系和变化过程。[14]
开放政府数据价值实现构成一个复杂、多因素、多因果关系、多反馈回路的闭环系统。常用的概念模型虽然能较好地确定系统的构成要素,但大多是静态的,难以展示多要素间复杂的动态关系。系统动力学作为研究复杂系统动态变化的有效方法,可以有效地描述系统结构、模拟系统变化趋势。因此,本研究引入系统动力学方法来研究开放政府数据价值实现与各影响因素之间的关系,并以可视化模型予以呈现。
构建开放政府数据价值实现的系统动力学模型,首先要明确价值实现系统的内部作用机制。如前文所述,开放数据质量、开放平台质量、平台服务质量、用户绩效期望和社会影响等均会影响用户使用意愿、行为和满意度,它们共同影响价值实现,而价值又会反过来作用于平台和用户,从而形成多反馈回路的动态系统。
为了更加直观、形象地呈现系统内部作用机制,笔者利用Vensim工具将其进行可视化。Vensim是系统动力学中常用的可视化建模工具,主要包括状态变量、速率变量、辅助变量、箭头四个构造块。其中,状态变量又称积量、存量,是系统中起到累积作用的量;速率变量即流量,用于连接辅助变量和状态变量;辅助变量简称变量,是系统中的信息量,通过直接作用于速率变量来间接影响状态变量;箭头表示因果,用于连接具有因果关系的变量(见图2)。
图2 开放政府数据价值实现系统动力学模型
在图2中存在着一条重要的因果反馈回路,即价值→用户满意→使用意愿与行为→价值。价值是开放政府数据可持续发展的内在驱动力,而用户决定着价值能否实现以及实现的程度如何。用户初次使用开放政府数据平台,或受所处环境影响初次接触开放政府数据时,会对开放政府数据形成一定的满意度分值,分值大小会影响用户再次使用开放政府数据的意愿及行为,开放政府数据利用率进而会决定价值实现的多少,而用户获取收益的多少又会反过来进一步影响用户满意度,如此形成一个正反馈循环。
(1)平台因素对价值实现的影响。由上文分析可知,平台上的开放数据是核心、平台建设是硬件、平台服务是软件。平台各因素对价值实现的影响会形成正反馈循环。首先,用户的数据需求促使其产生使用开放政府数据的意愿,而平台的建设水平、服务质量会进一步影响用户的使用行为。当平台功能齐全、系统响应及时、服务精准灵活时,用户会更倾向于使用开放政府数据。其次,平台对用户满意度的影响:用户使用平台时的体验直接影响用户的过程满意度,如平台界面布局是否清晰、搜索排序功能是否简单易用、数据集能否预览和本地获取等;用户使用平台后所获得的收益能否真正满足用户期望和需求会影响用户对平台的结果满意度,如数据集覆盖领域是否广泛、可视化结果是否形象直观、个性化服务是否精准灵活等。过程满意度和结果满意度都会影响用户再次使用平台的意愿与行为,进而影响开放政府数据的价值实现。最后,价值实现反过来影响用户满意度及其使用意愿与行为。当用户使用开放政府数据获得的收益较高时,其满意度也会较高,这会增强用户下次使用开放政府数据的意愿与行为,进一步促进其价值实现,同时,又会促使平台不断提升数据、系统、服务方面的质量。
(2)用户因素对价值实现的影响。不同类型的用户使用开放政府数据的目的、期望存在差异,如政府期望通过开放政府数据提升政府透明度和办事效率、企业期望通过对数据的开发利用创造经济效益、个人期望通过数据有效监督政府举措等。首先,用户绩效期望是在社会影响的基础上形成的。如,用户受到全球开放政府数据运动等宏观环境,以及身边领导、同事、朋友使用开放政府数据等微观环境的影响,会对开放政府数据产生一定的绩效期望。其次,用户绩效期望会促使其使用开放政府数据,而用户满意度的高低会影响其再次使用开放政府数据的意愿与行为,进而影响价值实现。价值实现的程度,即用户获取收益的多少,又会再次更新用户的绩效期望值,如此形成一个循环。再次,用户所处的社会环境会影响其对开放政府数据的使用意愿与行为,而用户满意度的高低会给他人带来宏观或微观层面的社会影响,鼓励或阻碍其他企业、个人使用开放政府数据,进而影响价值实现。
3.4.1 基于用户需求的开放政府数据平台设计流程
以价值实现为目标的开放政府数据平台设计首先要分析用户的需求。依据系统动力学模型中呈现的影响用户使用意愿与行为的各驱动因素及各因素间的作用机理,整合平台方面的影响因素,形成数据需求、功能需求和服务需求方面的知识模型。同时,需要数据提供者、平台设计者、系统维护者在理解与思考的基础上共同将知识模型转化为设计模型,该设计模型通过资源设计、功能设计和服务设计三个层面进行表达,每个层面又由众多子模块支撑,融合后形成开放政府数据平台(见图3)。
用户使用开放政府数据平台的体验会影响其绩效期望,其他用户的使用情况会对用户带来社会影响,用户绩效期望与社会影响又会引起用户需求的变化。当供需匹配时,说明平台设计满足了用户需求;反之,数据提供者、平台设计者和系统维护者应根据用户的反馈信息不断优化平台设计、完善数据开放。
图3 基于用户需求的开放政府数据平台设计流程
3.4.2 案例分析
以上海市政府数据服务网为例,该平台由数据、数据图谱、互动社区、典型应用等模块组成。
(1)在资源设计方面,该平台提供来自45个政府机构的2,000多个数据资源,涵盖经济、环境、交通等12个领域,其中教育科技和城市建设方面的数据集需求量最大。[15]平台提供开放授权,允许用户自由下载数据集,并提供API接口。数据格式包括XLS、CSV等,每一个数据项都会有字段名称、类型、长度等详细描述。但只有少部分数据集能做到及时更新,在数据更新频率方面有待完善。
(2)在功能设计方面,该平台主页将常用功能图标以模块形式排列,布局清晰简约,并提供良好的分类导航、搜索、筛选、排序功能。此外,该平台还提供数据预览、完全本地获取和分级分类获取功能,其中分级分类获取将开放数据分为普遍公开、特定公开和依申请开放三种。但目前该平台尚未提供能够下载的可机读格式开放数据目录和成果提交功能。
(3)在服务设计方面,该平台在“数据图谱”板块提供了可视化工具以及地理空间工具,但尚未提供开发工具。关于互动交流,该平台提供了对单个数据集进行评价的功能,并且允许用户无需注册便可直接进行评价,但未提供在微博、微信等社交媒体平台的分享传播功能。上海平台开通了用户个人中心,提供个性化整合服务,并允许用户订阅或收藏数据集,但尚未提供人机对话方式的智能服务。
(1)优化数据资源配置,提高用户对数据质量的满意度。获取数据资源以满足需求是用户使用开放政府数据的最主要动机,若数据资源匮乏或质量较低则无法满足用户需求,同时会导致用户需求的萎缩。因此,开放政府数据平台应从数据资源数量与种类、数据格式、元数据、数据存档等方面进行优化,同时应提供开放授权协议、API描述规范等,方便用户对数据资源的开发利用。
(2)综合运用多种技术手段,提升平台系统功能的灵活性和易用性。功能齐全、导航清晰、资源易于获取等是开放政府数据平台应具备的基本条件,功能的易用性、灵活性会影响用户体验,若平台功能复杂难懂、跳转多个界面仍无法找到所需资源或找到的数据资源无法下载等,则会消磨用户的耐性,导致用户平台数量减少。因此,开放政府数据平台的功能设计应力求简单易用、响应迅速、交互顺畅,可提供清晰的分类导航、检索、下载等数据获取功能,为用户展示数据利用成果提供便捷渠道等。
(3)注重用户绩效期望与建议反馈,提供个性化精准服务。每个用户都是独立的个体,这就要求平台应针对不同用户需求提供尽可能精准的服务,提高用户满意度。因此,开放政府数据平台应在保证工具提供、互动交流等基本服务的前提下,提供个性化数据资源整合、人机智能服务等,同时应允许用户建立个人账户,对数据资源进行收藏、订阅和分享。此外,社交工具的引入能够更好地满足用户评论、交流和分享传播的情感需求,对于提升开放政府数据的社会影响力具有重要作用。