邓 崧,姚承慧
(1,2.云南大学 政府管理学院,云南 昆明,650500)
政府数据开放,意味着进一步释放政府数据的社会价值和商业价值,为公众获取和使用数据提供便捷渠道,进而实现政府数据增值。大数据时代下,数据作为国家的核心竞争力,得到了全球范围内各层级官员的高度关注。根据联合国经济和社会事务部提供的相关报告(Unitednationse-governmentsurvey),截至2018年,193个成员国中建有政府数据开放门户的国家已达139个,占成员国总数的72%①王益民.全球电子政务发展现状与趋势——《2018年联合国电子政务调查报告》解读之一[J].行政管理改革,2019(01):44-50。。李克强总理指出,我国的各级政府机构在行使各自职能、管理社会公共事务的过程中产生并积累了丰富的公共数据,其所具有的数据量约占社会总量的80%以上。大数据被视为国家的战略性资源,是21世纪的“石油”,其重要性不言而喻。
关于政府数据开放的概念,国内外从多元视角进行了定义。从限制性许可视角,它强调利用政府数据开放的许可权。AE.Martin(2012)指出为实现数据资源的利用价值,政府数据开放必须不受限制,应对外免费开放②MARTIN A E.Open government data:setting the scene[R].The World Wide Web(Consortium)(W3C)Spain Office /CTIC,2012。黄如花和李楠(2016)指出开放许可协议是满足社会对政府数据需求的必要条件③黄如花,李楠.国外政府数据开放许可协议采用情况的调查与分析[J].图书情报工作,2016(13):5-12。。从开放的视角,国内学者周志峰等人(2013)通过探析国外政府数据开放特征,指出对于用户而言政府数据开放具有非独占性、易获取性、合法性的特点④周志峰,黄如花.国外政府开放数据门户服务功能探析[J].情报杂志,2013(03):144-147。。从开放程度的视角,它强调数据开放的深度和广度。李佳佳(2010)认为,数据开放是数据链的开放,并且开放的并非是单一数据链上的某一元数据,而是包含了由全部事实、数据、信息及知识组成的数据集⑤李佳佳.信息管理的新视角:开放数据[J].情报理论与实践,2010(07):36。。余红和刘娟(2014)指出数据开放要实现全面覆盖,它应是由政府等公共机构产生和收集的包括信息数据、统计、气象及数字图书在内的所有数据①余红,刘娟.开放数据及其对图书馆信息资源共享的影响[J].图书馆,2014(04):87-90。。从开放意义视角,它侧重于政府数据开放在治理模式上带来的积极影响。如国外学者Gurin(2014)认为政府数据开放有利于社会公众、企业和商业机构建设新产业、分析数据模式、预测数据趋势、做出数据驱动决策以及处理复杂难题②Gurin,Joel.Open Data Now:The Secret to Hot Startups,Smart Investing,Savvy Marketing,and Fast Innovation[J].Social ScienceElectronic Publishing,2014(02):42-43。。姚乐等人(2013)将智慧城市建设与政府数据开放有机结合起来,通过案例分析总结出政府数据开放有利于政府高效率运转、实现智慧城市以及提升公众的服务质量③姚乐,樊振佳,赖茂生.政府开放数据与智慧城市建设的战略整合初探[J].图书情报工作,2013(13):12-17+48。。
随着政府数据开放进程的加深,国内外对于政府数据开放的评估研究已出现不少权威性报告,例如开放数据晴雨表、全球开放数据指数、开放政府数据指数(OGD指数)等。就国内而言,比较具有影响力的为复旦大学郑磊团队(2016)提出的政府数据开放的整体评估体系,分别从基础、平台、数据、使用和效果5个维度进行指标设计④郑磊,关文雯.开放政府数据评估框架、指标与方法研究[J].图书情报工作,2016(18):43-55。。目前,国际学术界对政府数据开放评估指标体系还未达成一致共识,评估侧重点存在差异。DinicSB(2014)等学者对前述的开放原则进行创新,建立了基于Web方法的政府数据开放平台自动评估模型,并将此应用于7个数据开放网站⑤Dinic S B,Nata?a Veljkovi?,Stoimenov L.How Open Are Public Government Data? An Assessment of Seven Open Data Portals[J].2014。。G.Viscusi等学者(2014)从质量视角出发,搭建了政府数据开放完成度评价框架,基于准确性、完整性和及时性评价了意大利当地公共行政部门的政府开放数据⑥Viscusi G,Spahiu B,Maurino A,et al.Compliance with open government data policies:An empirical assessment of Italian local publicadministrations[J].Information Polity,2014,19(03):263-275。。关于用户维度的评估,学者们较为关注的则是用户参与。Lee(2012)通过社交媒体的视角,围绕数据的准备度与透明度、开放的参与性与协作性等维度建立了关于政府数据开放项目的用户参与成熟度模型,并指出政府机构一次仅应专注于实现一个级别的成熟度⑦Lee G,Kwak Y H.An Open Government Maturity Model for social media-based public engagement[J].Government Information Quarterly,2012(04):492-503。。与此同时,有少数学者基于投入、产出视角对政府数据开放展开效率评估,其评估一般从最直观的数据开放平台及其可获得的开放数据入手。马海群(2016)等人将数据量、数据内容及连通率等作为投入指标,将下载量以及访问量等作为产出指标,构建了多维度效率评价体系,运用DEA模型对国内8个省市的政府开放数据平台的效率展开评估分析⑧马海群,王今.基于DEA的政府开放数据网站效率评价[J].数字图书馆论坛,2016(06):2-7。。邓崧,海伦(2018)借鉴政府网站的评估指标,以Web对象的数量、连通率、总页面数、不重复链接数、下载时间和网站内容为输入指标,以下载量为输出指标,构建了政府数据开放评估指标体系,并对我国13个地方政府数据平台进行效率评价⑨海伦,邓崧.基于数据包络法的城市政府数据开放平台效率评估[J].电子政务,2018(08):120-126。。韩磊,胡广伟(2018)从平台及数据两大层面设计输入输出指标,构建了政府数据开放的DEA评价指标体系,对我国现已建成的所有省市政府数据开放网站进行评价,其评价指标体系共包含13个具体指标⑩韩磊,胡广伟.政府数据开放平台建设效率评估及其启示[J].数字图书馆论坛,2018(09):54-61。。
纵观学界,关于政府数据开放的研究仍有进一步研究的空间。一是对于省级政府数据开放网站关注度不够。当前研究客体多为国家级或地级市政府数据开放平台,或者将不同行政级别的省市政府置于同一个框架下进行对比分析,不做详细区分。受到经济发展程度、公众文化程度、政治环境以及信息化水平等因素的影响,将各省置于同一水平线上横向比较有失准确性,具有一定的局限性。二是主观性评价突出。大部分学者采用专家打分法等方式确定各指标的权重,这一过程容易受到专家主观因素的影响,从而降低了最终的评估结果的可靠性和客观性。三是政府数据开放研究多基于建设成效的视角进行评估,其结果具有绝对性。在上述背景下,对当前省级政府数据开放效率展开评价显示出极大的必要性。本文从效率视角切入,以已建成政府数据开放平台的省级政府作为研究客体,将省级政府数据开放效率问题量化分析,试图回应以下问题:整体而言,省级政府数据开放效率情况如何?具体而言,哪些省级政府数据开放达到了相对有效?又有哪些省级政府数据开放处于无效状态?以及各省在省级政府数据开放效率中处于何种地位?
数据包络分析法,简称DEA模型,是以相对效率概念为基础,对具有相同类型的多投入、多产出的被评价对象进行综合评价的一种非参数统计方法,处于管理科学、运筹学及计量经济学的交叉范畴。该方法的基本思路①Charnes A,Cooper W W,Rhodes E.Measuring the efficiency of decision making units[J].European Journal of Operational Research,1978(06):429-444。是把每一个能够通过一系列决策、投入一定数量生产要素、并产出一定数量产品的系统均看成一个决策单元(DecisionMakingUnit,简称DMU),由全部DMU组成被评价群体,把DMU的每个投入与产出指标的权重作为变量进行测算,确定效率包络面,将各DMU与所测算的效率包络面进行对比,计算出效率值差距,从而确定该DMU是否为DEA有效。
传统的DEA模型可以分为CCR模型与BCC模型两种类型。CCR模型,即规模收益不变模型,其得到的效率称为综合技术效率(Scale&TechnicalEfficiency,简称STE)。CCR模型的前提假设为规模收益不可变,故无法处理规模收益可变的情形。而在现实情形中,以规模收益可变的状况多,因此为弥补这一缺陷,Banker、Charnes以及Cooper于1984年对CCR模型进行了改造,提出了生产规模与技术有效的BCC模型②Banker R D,Charnes A,Cooper W W.Some Models for Estimating Technical and Scale Inefficiencies in Data Envelopment Analysis[J].Management Science,1984(09):1078-1092。。该模型放宽了假设条件的限制,在CCR模型基础上增加了一个约束条件,使每一个DMU的生产规模处于同一水平,将综合技术效率分解为纯技术效率与规模效率。传统DEA模型无法对多个达到综合技术效率有效的DMU进行排序和区分,为解决这一弊端,Petersen和Andersen于1993年基于传统模型提出了超效率DEA模型③Anderson P,Petersen N C.A procedure for ranking efficient units in data envelopment analysis[J].Management Science,1993(10):1261--1264。。它的突出特点在于评价第j个决策单元的投入产出情况时采用线性组合替代的方式把这一单元排除在其他参照单元组合之外,也就是说,决策单元有效的超效率值大于1且值越大效率水平越高,而对于没有达到DEA有效的决策单元效率值则保持不变,因此该模型可以较好区分达到DEA有效的DMU之间的有效程度,并对此作出排序。
本文通过运用传统DEA模型计算省级政府数据开放的综合技术效率、纯技术效率和规模效率,然后运用超效率DEA模型计算其超效率值,对DEA有效地区作出排名,以此对我国省级政府数据开放效率展开研究。
省级政府数据开放效率评价涉及多投入与多产出指标,投入—产出系统是较为复杂的,涵盖了多方面的要素,其数据难以获取且成本较大。为了规避指标选取的随意性与盲目性,本文借鉴前人研究,构建了省级政府数据开放效率评价指标体系,具体由3个投入指标和2个产出指标共同构成,见表1。其中,数据层和平台层数据均源于《2019中国开放树林指数报告》;人均财政支出的数据来源于我国财务部官网发布的各省市2018年预算执行情况汇编和《2018中国统计年鉴》;政府透明度指数来源于中国社会科学院权威发布的《2019中国法治发展报告》;数据集平均下载调用量则通过爬虫软件采集获得,数据采集时间集中在2019年6月18—26日。
本文主要评价省级政府数据开放效率,故本文选取已建成或试运行的省级政府数据开放平台作为评价样本。由于新疆自治区政务数据开放网并未实现真正意义上的数据开放,故未将其纳入评价范围内。同时,考虑到数据的可获得性,四川公共数据开放网的部分数据难以获取,所以也未将其纳入评价范围内。最终,本文共选择了贵州、宁夏、陕西、广东、北京、福建、海南、山东、上海、天津、浙江、河南以及江西这13个省级政府数据开放作为研究样本,见表2。
表1 DEA政府数据开放投入产出评估指标体系
表2 样本网站
为消除量纲与数量级的影响,有必要对获取到的13个决策单元的全部数据进行标准化处理,将其转化为无量纲的纯数值,从而消除所有数据的单位限制。同时,在使用DEAP 2.1软件进行相对效率评价时,要求全部投入产出数据均为非负数,因此在对上述所有投入产出指标进行0~1标准化后,需要把所有数据进行取e的指数处理,使数据转化为正数,最终处理结果见表3。
表3 省级政府数据开放投入产出数据处理结果
借助DEAP 2.1软件,运用BCC及CCR投入导向模型对当前省级政府数据开放的综合技术效率、纯技术效率、规模效率和规模收益状况进行了测度,结果如表4所示。
表4 省级政府数据开放效率
本文中省级政府数据开放效率指的是综合技术效率,它衡量的是以政府为主体的资源投入与数据开放效果产出的比率以及政府数据开放过程中资源配置的有效性,是以最少的资源投入提供更多的数据开放服务,以满足用户需求。综合技术效率值越接近于1,表明该省政府数据开放的效率越高,而效率值越接近于0,则效率越低。从表4可以得出,当前省级政府数据开放整体情况良好,省级政府数据开放的综合技术效率平均值为0.801,达到均值的决策单元占总数的61.5%。但也应注意到各省开放程度差异明显,发展不均衡。根据相对有效性的得分分布情况,约69%的得分处在0.7~1的范围内,其余决策单元有效性均低于0.7,其中决策单元11(浙江)效率值仅为0.334,效率较低。纯技术效率均值大于规模效率均值,处于相对较高水平,其中规模效率过低是省级政府数据开放效率过低的重要原因。
根据DEA有效性的一般分类原则,可把13个决策单元划分成3个层次。第一层次为DEA有效,即综合效率等于1,分别为决策单元1(贵州)、2(宁夏)、7(海南)、8(山东)、9(上海)和13(江西),有效的决策单元占总数的46%。从理论上分析,这6个决策单元同时达到了规模有效和技术有效,这说明这些决策单元在数据开放过程中投入产出效率处于相对最优水平;第二层次为弱DEA有效,即综合技术效率大于1,纯技术效率等于1,包括有决策单元3(陕西)、5(北京)及12(河南);第三层次为非DEA有效,即综合技术效率小于1,且纯技术效率小于1,包括了决策单元4(广东)、6(福建)、10(天津)和12(浙江)。从分布区域上分析,非DEA有效的决策单元主要分布于沿海地区,其中综合技术效率最低的决策单元就位于沿海地区。
具体来看,在由这13个决策单元组成的系统中,贵州、宁夏、海南、山东、上海和江西这6个地方的省级政府数据开放的综合技术效率值为1,说明其投入方面已经实现最优资源配置,且获得了最优的产出效果。其中,贵州、山东以及上海的省级数据开放平台上线时间早,对数据开放的投入多,并且获得了较高的产出,属于高投入高产出类型,因此这些决策单元为DEA有效。而宁夏、海南以及江西等地省级政府对数据开放的投入少,产出也较少,属于低投入低产出类型。但是,DEA计算得出的效率值是一个投入产出的相对值,因此这些省份仍能达到DEA相对有效。广东省和天津市这两个地区综合技术效率介于0.9与1之间,均处于边缘非有效,适当调整资源配置,提高管理、技术水平即可达到DEA相对有效。同时,河南与北京这两个地区的综合技术效率值介于0.7至0.9之间,根据该结果可以推断出这两个地区在各要素配置比例上还存在一定的不合理,存在没有得到充分利用的资源,从而导致投入资源冗余或者产出不足的现象,在资源投入结构方面需要进一步调整。此外,浙江省和陕西省数据开放的相对效率在0.3左右,综合技术效率比较低。省级政府数据开放的相对效率水平与政府内部管理和规模状况紧密相关,政府内部管理、技术和资源配置通过影响政府数据开放的投入要素及产出要素影响其带来的经济效益和社会效益,因此这两个地区应当从这两方面同时予以改进。
纯技术效率(PE)是指被评价对象的实际产出值与相同投入情况下最大产出值之间的比例关系,反映了各省级政府对数据开放的管理能力和技术水平。由表4可知,纯技术效率均值为0.931,在13个决策单元中,1(贵州)、2(宁夏)、3(陕西)、5(北京)、7(海南)、8(山东)、9(上海)、12(河南)和13(江西)的纯技术效率均达到1,纯技术效率为1说明了这些省级政府在推进政府数据开放运动中先进的技术和科学的管理理念大大促进了自身政府数据开放。广东、福建、天津以及浙江的纯技术效率值分别为0.951、0.751、0.949和0.456,其中纯技术效率过低是浙江省数据开放综合技术效率过低的重要原因。这些DEA无效的决策单元纯技术效率比较低,说明其投入的资源未能得到充分利用,产出尚未达到最优化,归根结底是由于这些省级政府部门及其公务人员不适当的管理方式以及较弱的技术能力所造成的。从产出上看,广东、福建、天津和浙江均为人口密集地区,人口规模较大,但是其数据集的平均下载调用次数偏少,说明这些省级政府在推进政府数据开放过程中忽略了向所有社会公众进行普及和宣传相关数据理念,没有提供辅助工具或人性化服务帮助社会公众便捷获取所需数据。此外,福建省和浙江省数据开放平台上线时间较晚是导致其数据集平均下载次数较少的另一客观原因。从投入上看,广东、福建、天津和浙江在开放数据内容方面仍有待完善。天津市政府数据开放平台开放数据集384个,开放数据集数量极少。而其余省级政府在开放数据集数量上虽排名靠前,但涉及决策内容、管理服务、执行和结果方面的核心数据仍未得到完全公开。因此,这些省级的政府透明度没有得到明显提高。对于这些DEA无效的决策单元,从纯技术效率的角度来看,在未来数据开放效率整体提升中,在注意增加多领域资源投入的同时,要更为増强管理、技术能力,注重提供容易操作的技术设备、普及和宣传思想文化与管理理念等,提升社会公众对现有数据的应用能力,从而有效推动政府数据开放。
根据数据包络分析法基本原理,综合技术效率由纯技术效率与规模效率两部分构成,因此要想弄清综合技术效率无效的原因,除了需要对纯技术效率进行分析,还要分析规模效率,求解出各省级政府数据开放的规模效率值。规模效率(SE)是指被评价对象在当前的管理水平和技术条件下,通过改善资源投入规模及结构所能实现的生产效率,它可以反映政府数据开放运动中生产规模的有效程度,即各省级政府数据开放是否是在最佳规模下进行的。规模效率值过高,则表明政府数据开放更靠近最优规模,反之规模效率值偏低则说明在管理、技术水平一定的条件下,政府数据开放没有达到最佳规模。
通过最终的测度结果可知,当前省级政府数据开放的规模效率均值为0.852,小于综合技术效率均值。决策单元1(贵州)、2(宁夏)、7(海南)、8(山东)、9(上海)和13(江西)的规模效率值为1,达到规模有效水平的决策单元数量占总数的46%,表明这些省级政府数据开放规模达到了最佳状态。在未达到规模效率有效的7个决策单元中,4(广东)和10(天津)规模效率值分别是0.974和0.998,高于规模效率平均水平,且规模效率值接近于1。而3(陕西)、5(北京)、6(福建)、11(浙江)和12(河南)的规模效率则均低于其平均水平。将规模效率值与综合技术效率值和纯技术效率值进行对比后发现,3(陕西)、5(北京)和12(河南)的规模效率值远低于其各自的纯技术效率值,这些地区的综合技术效率值偏低在一定程度上是由于规模效率较低而抵消了纯技术效率给省级政府数据开放效率带来的正面影响。
处于不同发展阶段的省级政府数据开放拥有其适应自身的规模效应。在DEA模型框架下,政府部门不会因为投入了更多的数据资源、平台服务技术和资金等而成为规模有效的政府,也不会因为组织结构简单而达到规模最优化。因此,不同省级政府数据开放水平可进行横向规模效益比较。
规模效益可分为规模递增、规模递减以及规模不变三种情形。如果投入增加一个单位,虽然总产值增加,但增加的速度却呈下降趋势,则表明该生产处于规模效益递减状态。相反,如果投入增加一个单位,总产值不仅增加,并且增加的速度呈上升趋势,则此时的生产处于规模效益递增状态。由表4可以看到,达到规模效率有效的决策单元均处于规模效益不变的状态,说明这些省级政府数据开放当前已经达到了最大产出规模点。对于规模效率小于1的决策单元而言,3(陕西)、4(广东)、10(天津)、11(浙江)和12(河南)的规模效益处于递增状态,其中3(陕西)的规模效率值最低为0.358,表明陕西在政府数据开放中投入规模过小,规模递增趋势较大。在合理有效的管理和较高的技术水平支撑下,只要陕西省级政府在政府数据开放方面加大投入力度,该省级政府数据开放的产出效果就能得到大幅度的增加。因此对于处于规模递增状态的省级政府而言,需要增加资源投入力度,这样省级政府数据开放才会实现更高水平的产出。此外,应注意到决策单元5(北京)的规模效益变化趋势与前述地区相反,处于规模效益递减的阶段。如果北京市政府在原有的基础上再增加投入量,则很难获得更高比例的产出效果,因此就北京市来说,其省级政府无需再加大资源的投入力度,而是要注重充分利用已有的各类资源,以使自身政府数据开放达到最大的产出状态。
根据上述结果可知仍有部分决策单元的相对效率较低,因此有必要借助DEAP2.1软件,采用CCR模型计算在生产前沿面上的投入冗余量与产出不足量以分析非DEA有效的原因,进而调整资源投入量和效益产出量以改进自身效率,决策单元资源投入调整结果和产出调整结果见表5。
对各投入产出指标的冗余不足情况进行整体分析,从表5可以发现,除产出指标中的政府透明度产出相对可观外,其余指标均存在一定的冗余或不足。从产出方面来看,产出不足主要集中在数据集平均下载量,这一指标的平均产出不足量为2.3%。其中北京市和天津市在此指标上分别表现为26%和3.7%的产出不足。从投入方面来看,各决策单元在投入指标上均存在投入冗余,在数据资源和平台服务方面出现投入冗余的决策单位数量最多,均达到了5个。数据层的平均投入冗余量为32.9%,其中浙江省政府数据开放在该方面的投入最不理想,有287.4%的投入未发挥效用;平台层的平均投入冗余量为41.2%,其中广东省在该方面的投入冗余最为严重,冗余度高达291.5%,其次为浙江,冗余度为125.3%;人均财政支出的平均投入冗余量为12.4%,其中北京市在该方面的投入冗余最不客观,有160.9%的人均财政支出过剩。
表5 省级政府数据开放冗余不足量
根据上述分析,非DEA有效的决策单元在推进政府数据开放过程中均出现了不同程度的投入冗余和产出不足,其在数据、平台和资金方面的投入相比DEA有效的决策单元而言未转化成对应的产出增加。具体来说,陕西、广东在平台投入上均存在投入冗余,陕西省在平台投入上存在0.5%的冗余。相比之下广东省投入冗余程度则更为严重,平台投入冗余度高达291.5%,表明广东省在政府数据开放中对平台服务层面的投入已经较为可观,在未来发展中政府应注重提高自身平台影响力,要提供便捷、人性化的平台服务,平台设计吸引抓人眼球,并且便于操作,使用户群体轻松获取数据,这样政府数据开放才会实现更优的资源配置与更高的综合技术效率;北京市政府数据开放在数据和资金方面存在投入冗余的现象,数据内容有27.3%没有发挥效用,而人均财政支出中则表现为160.9%的投入冗余。除此之外,北京市在数据集的平均下载量方面也表现出产出不足,产出不足量为26%。这说明北京市在政府数据开放中对数据资源和资金的投入相对比较可观,而数据集的平均下载量相对不足,因此在后续发展中该省级政府应加大宣传力度,注重提升开放数据的利用率,扩宽用户群体使用数据的覆盖面,确保所开放的数据能够被用户群体获得和利用,实现数据增值。
根据CCR与BCC模型测算的结果可知,达到DEA相对有效的决策单元数有6个,数量较多,近乎于其总数的一半,这主要是由于本文纳入分析的决策单元相对于投入产出指标过少所导致的。实际上,各个DEA相对有效(包括弱有效)的省级政府数据开放之间的效率是具有一定的差别的,因此,有必要对这6个省级政府数据开放进行后续评价。本文借助DEA-solverPro5.0软件,使用超效率DEA模型对省级政府数据开放进行排名,其最终排名见表6。
根据超效率DEA模型的基本原理可知,有效决策单元的超效率值越大说明总体效率水平越高。从表6计算出的各省级政府数据开放效率值来看,超效率均值为1.44,大于1,整体情况较为可观。但仔细分析可以发现,达到DEA有效的6个决策单元仍存在着一定问题。
一是达到DEA相对有效的6个决策单元在政府数据开放的管理、技术水平上仍存在一定的差异。这6个省级政府数据开放效率的总体有效性排名为:DUM(I)>DUM(B)>DUM(H)>DUM(G)>DUM(M)>DUM(A),即上海>宁夏>山东>海南>江西>贵州。上海市在这些省级政府数据开放中处于遥遥领先的位置,超效率值高达5.71,排名第一;宁夏紧随其后,其政府数据开放效率为2.79,位于第二;山东、海南、江西和贵州省的政府数据开放效率值则全部落于1~2的范围内。可以看到,第一名和第二名的超效率值相差近3分,差距较为悬殊,而超效率值位于3~5范围的决策单位为零,其值处于2左右的也仅是一省,其余均处在达到DEA相对有效的水平附近,这说明各省的政府数据开放仍有进一步提升的空间。上海市不仅在政府数据开放效率中稳居第一,在今年发布的开放树林指数中也处于第一的位置,可见实力强大。因此,各省可将上海市作为效率参考对象,在可行的范围内对政府数据开放的各项资源的投入进行调整,这样其产出才会有相应的增加。
表6 省级政府数据开放超效率排名
二是从排名中可以看到排名靠前的地区仍有一些为低投入低产出类型,这些地区资源投入偏少,开放规模偏小。根据《2019中国开放树林指数报告》,宁夏政府数据开放平台在13个省级平台中排名靠后,为第12名,其在数据、平台的投入极少。例如,宁夏政务数据开放平台中开放数据省级部门仅为22个。对于这些地区来说,需要抓住机遇,大力增强各项资源投入力度,注重提高产出,充分利用现有效率优势促进省级政府数据开放。宁夏作为较早推进政府数据开放的省份,其自身拥有极大优势,具有很大的上升空间。2016年6月,宁夏政府就同专业化企业合力打造了全区政务大数据服务平台,并将其作为宁夏政务数据共享开放的总枢纽,之后2018年银川城市数据开放平台也正式上线,基本实现了数据资源跨区跨部门整合。并且,该省的《共享管理办法》《平台技术规范》《信息资源目录体系》等政策文件也在陆续出台中。除此之外,宁夏还建设完成了民生在线服务门户,数据开放共享成为提升政务服务质量的反向作用力。可以说,这些项目的实施均为宁夏省级政府数据开放共享带来了强大推动力。
除宁夏外,海南和江西省级政府数据开放同样也属于低投入低产出型。目前海南对大数据这一概念缺乏较为深刻、清晰及全面的认识,数据开放的范围有限、内容单一、缺乏统一标准、无法规范收集数据,政府部门内部缺乏数据共享意识,未能最大地发挥大数据价值。海南是我国的旅游大省,拥有较好的生态环境,实现政府数据开放将助力旅游生态可持续发展,加快旅游大数据的实践,促进旅游业等领域加快发展,激活产业升级转型内生动力。因此,海南应进一步扩大数据开放的规模,以数据开放为切入点推动海南全域旅游发展。而江西省赣州港既是我国内陆国家级临时开放口岸与第一个口岸国检监管试验区,也是国际货物集散中心和国家物流枢纽,在“一带一路”中处于重要战略地位。全面实现政府数据开放将对港口操作效率的提高,优质服务的供给带来积极影响。在数据开放过程中,也有必要寻求法律救济①卢护锋,刘力菁.大数据时代个人信息保护中的法律问题——基于贵州大数据建设的思考[J].广州大学学报(社会科学版)2018,(05):80-85。。江西省应以港口发展为契机,引进先进数据开放技术和管理理念,逐步推进政府数据开放,为港口发展提供有力支撑,进而提高开放合作水平,构建全面开放新格局。
本文从投入产出视角出发,采用传统DEA模型、超效率DEA模型,对13个省级政府数据开放效率进行评价和分析,研究结论如下。
其中纯技术效率值大于规模效率均值,处于相对较高水平。而规模效率过低是限制陕西、北京、福建和河南等地省级政府数据开放效率提高的主要原因。这也启示各省在引进先进技术和提升管理能力的同时,应关注规模效益,促进规模效率的提高。
第一层次为DEA有效,即综合效率等于1,既包括了贵州、上海等政府数据开放较早的地区,也包括了宁夏、海南、山东和江西起步较晚的地区,这些地区在数据开放过程中投入产出效率达到了相对最优;第二层次为弱DEA有效,即综合技术效率大于1,纯技术效率等于1,包括有陕西省、北京市和河南省。除北京外其余地区的省级政府数据开放建设处于纯技术效率有效且规模报酬递增的状态,因此要成比例地增加投入,显著提升综合效率。而北京市政府数据开放处于规模递减的阶段,说明其对现有技术条件利用不足,没有达到最佳规模,因此在未来发展中应注意在保证自身技术进步的同时,提高对现有技术与资源的利用程度。第三层次为非DEA有效,即综合技术效率小于1,且纯技术效率小于1,包括了广东省、福建省、天津市和浙江省。从纯技术效率角度来看,这些地区的政府数据开放需要优化资源配置;从规模效率的角度来看,这些地区的政府数据开放均处于规模报酬递增状态,故应该适当的增加各项指标的投入力度,进而提高开放效率。
除去海南、宁夏和江西三个低投入低产出地区外,当前省级政府数据开放效率最佳的是上海市,其次是山东省和贵州省。超效率DEA测算的结果显示,排名第一的超效率值与最后一名相差了5.37。各省应借鉴上海市政府数据开放的经验做法,并根据自身的效率特征采取不同的政策来促进效率的提升,对于综合技术效率值较低的地区而言,应注重塑造良好政府数据开放氛围,防止投入资源过度浪费,提升资源利用率。
投入指标中冗余程度最大的是平台层指数,说明该方面的资源浪费巨大,其次是数据层指数和人均财政支出。相比之下,产出不充分的情况较好,仅数据集平均下载量这个指标稍显产出不足。对此,DEA无效省份应根据投入产出的具体情况,做出调整,使其达到DEA相对有效。