张 帅,杨丹庆,柳 敏
(山西财经大学 统计学院,山西 太原 030006)
党的十八大以来,我国经济发展进入了新阶段,外部和内部环境都发生了根本变化。国际金融危机以及由于国际力量对比和战略格局转换引发的逆全球化、周边地缘政治等问题,给我国经济带来了诸多不利因素。内部经济增长遇到瓶颈,人工成本上升,产品供需结构失衡严重,亟需培养新的动力源和增长点。在此背景下,我国对经济发展做出了“进入新常态”的判断,并提出深化供给侧结构性改革,以增加有效供给,扩大需求,提升经济增长质量。提高增长质量既是发展我国经济的内在规律,又是实现人民美好生活的必然要求。党的十九大做出了“我国经济转向高质量发展阶段”的判断,习近平总书记在中国共产党第二十次全国代表大会报告中指出,高质量发展是全面建设社会主义现代化国家的首要任务。高质量发展既是我国经济的发展阶段,同时也是我国经济发展的根本要求。
评价是推动事物发展的利器。2017年12月召开的中央经济工作会议提出,“必须加快形成推动高质量发展的指标体系、政策体系、标准体系、统计体系、绩效评价、政绩考核,创建和完善制度环境,推动我国经济在实现高质量发展上不断取得新进展”。2020年11月中共中央组织部印发的《关于改进推动高质量发展的政绩考核的通知》正式将高质量发展纳入政绩考核。高质量发展的根本目的是更好满足人民日益增长的美好生活需要,将高质量发展纳入政绩考核能够充分调动各级领导干部的积极性,是践行“发展为了人民”宗旨的体现。将高质量发展纳入绩效评价和政绩考核,需要以精准、公开、透明的高质量发展水平统计评价为前提。然而截至目前,官方尚未发布高质量发展统计评价方法,虽然已经有部分地方政府成立课题组进行研究,但是缺乏统一的评价标准,评价质量难以保证,真正投入实践应用的不多,并且多家课题组同时研究造成了大量财政资金的浪费。
学术界研究高质量发展统计评价的文献较多,目前已经集中到各具体领域。虽然研究文献不少,但是大多指标体系设计过于复杂,数据来源和计算方法受限,区域差异包容性较差,很难推广应用于政府的绩效评价和政绩考核中。我国幅员辽阔,区域之间资源禀赋和比较优势差异巨大,各地区在国家经济发展中都有着不可或缺的使命担当。例如,山西是我国煤炭供给大省,在二十大召开期间,时任山西省委常委、常务副省长张吉福曾表示山西省委要坚决扛起保证国家能源安全的重大政治责任,不让国家为煤发愁。再比如,东北一直是我国重要的粮食基地,为我国粮食安全提供着重要保障。这些具有典型优势产业的地区,构成了我国经济产业链中的重要一环。在进行高质量发展评价时,应尽量不加入对高质量发展没有直接衡量价值但是对某些地区有“歧视性”的指标,例如创新投入。事实上创新投入是投入性指标,不能直接衡量高质量发展的状态,该指标对一些以传统工业或农业为主的经济体存在“歧视”,但是已有文献在进行高质量发展评价时绝大多数都将其纳入了创新投入相关指标。构建一个让各区域信服,能够体现国家高质量发展内涵的适用于全国各省的省域高质量发展评价体系,为政府的绩效评价和政绩考核提供参考,是当下具有现实意义的课题。我国省域数据基础要远远好于市域和县域,省域高质量发展评价结果应用价值也更好。
在经济体高质量发展评价研究中,按照被评价对象可分为省域、市域和县域高质量发展评价研究。在指标体系构建上,可大致分为三类。
第一类多从新发展理念视角出发,构建含创新、协调、绿色、开放、共享5个一级指标的评价体系,分别对我国省域、市域展开研究。金碚(2018)[1]认为当前阶段高质量发展评价准则就是新发展理念。方大春和马为彪(2019)[2]采用地理信息系统与探索性空间数据分析相结合的方法考察了中国省际高质量发展水平的时空演变格局。黄敦平和叶蕾(2022)[3]利用新发展理念构建了黄河流域58个地级市经济高质量发展评价指标体系。
第二类指标体系的构建是在新发展理念的基础上增加了经济效益。第一个维度是对省域进行评价研究。薛伟和蔡超(2022)[4]采用多层次因子分析法对我国31个省份进行了高质量发展综合评价。陈梦根等(2020)[5]对我国省域经济高质量发展水平进行了综合评价,该文将TOPSIS模型中的欧式距离改为垂直距离,以解决特殊情况下评价不准确的问题。屈小娥等(2022)[6]采用纵横向拉开档次法综合评价了省域和四大区域经济高质量发展水平,利用系统聚类算法和马尔科夫链矩阵对各省经济高质量发展水平及其动态演变进行了分析。第二个维度则聚焦于市域。郭露露(2022)[7]采用熵权TOPSIS法对陕西省11市(区)经济高质量发展水平进行了评价,Wang等(2022)[8]采用主成分分析法测度了2003—2016年233个地级市经济高质量发展情况。
第三类指标体系的构建则是对上述各指标进行综合或者核心抓取。李金昌等(2019)[9]认为构建高质量发展指标体系应该抓住核心指标,根据目的区分过程指标和结果指标,并且一定要符合中国国情和国际眼光。聂长飞和简新华(2020)[10]用“四高一好”衡量高质量发展,利用纵横向拉开档次法、定基功效系数法及线性加权法对评价模型进行测度。Huang等(2020)[11]提出要兼顾高水平实现子系统的高质量发展和子系统之间的高质量协调发展,利用基于灰色相关度的改进G1方法和基于靶心距离的协调度模型分析了2016年中国30个省份的高质量发展水平。Zhang等(2022)[12]参照美丽中国和联合国可持续发展目标构建评价指标体系,对云贵地区地级市高质量发展演化采用熵权TOPSIS模型进行评价。
综上,在高质量发展评价相关研究中,学者们所应用的权重确定方法有纵横向拉开档次法、熵权法、层次分析法、主成分分析法等。
在省域的高质量发展评价研究中,孙青茹等(2022)[13]运用标准差修正G1方法对指标体系进行权重分配,评价和测度了我国31个省级行政区的粮食产业高质量发展水平。胡章婷和黄正松(2022)[14]构建了贸易高质量发展评价指标体系,运用熵值法对天津、福建和广东三省贸易发展质量进行评分排序。赵爽和赵丹丹(2022)[15]基于投入-产出视角构建数字农业高质量发展评价指标体系,采用熵权TOPSIS法测算2010—2019年河北省数字农业高质量发展水平。薛伟和蔡超(2022)[4]采用多层次因子分析法对我国2019年31个省份高质量发展水平进行综合评价。屈小娥等(2022)[6]针对1997—2019年省域和四大区域经济高质量发展水平进行评价研究。Liu等(2022)[16]利用区位熵指数分析产业集聚水平,构建区位份额模型评价2010—2019年安徽省农业发展的产业结构和竞争力。Li等(2022)[17]构建水资源与经济高质量发展的耦合关系模型,采用模糊综合评价法对湖北省水资源价值进行评价。
在市域的高质量发展评价研究中,盛子葳等(2022)[18]研究发现武汉市建筑业高质量发展对推进武汉市国民经济和社会事业健康发展具有重大意义,黄敦平和叶蕾(2022)[3]从5个维度综合评价了黄河流域58个地级市的经济高质量发展水平,李剑(2022)[19]针对曲靖市乡村产业振兴的高质量发展水平进行了评价,郭露露(2022)[7]采用熵权TOPSIS法对陕西省11市(区)经济高质量发展水平进行了评价。
在县域的高质量发展评价研究中,常丰镇等(2022)[20]从研究滨湖地区县域高质量发展角度出发,以滨鄱阳湖地区12个县(市、区)为例,运用CRITIC客观赋权法计算高质量发展指数,并进行系统聚类及相关性分析。
高质量发展评价方面的文献众多,大量理论和实证研究推动了评价方法的改进,促进了评价指标体系的成熟。在研究方法的选择上,指标体系综合评价法占主流,指标体系构建以新发展理念的创新、协调、绿色、开放、共享五个维度为主,这是多数文献认可的评价维度。也就是说,已有文献在高质量发展评价研究中,指标体系大框架已经基本达成一致,但是在指标体系具体构建和权重确定方法方面,还存在一定的改进空间。第一,已有文献普遍存在指标选择与高质量发展内涵相关性低、指标选取过多等问题,导致评价体系偏离高质量发展内涵;第二,缺乏指标之间的相关性检验,指标的代表性难以保证;第三,缺乏评价系统的稳健性检验,不稳健的评价系统在实践应用中有人为操控的风险;第四,在指标选择方面,区域可比性考虑较粗糙,比如已有文献直接使用人均可支配收入作为各地区可比的收入指标,事实上由于各地区消费水平和房价不同,人均可支配收入也是不可比的;第五,权重确定方法一般都采用熵权法和纵横向拉开档次法,这些是以信息提取最大化为目的的客观方法,倾向于给发达经济体赋予较高的分数,给欠发达地区赋予较低的分数,从而拉大二者差距。
了解高质量发展内涵是准确测度高质量发展水平的基础。以习近平总书记为核心的党中央对高质量发展的内涵、理念、实现途径等进行了系统阐述,提出高质量发展就是能够很好满足人民日益增长的美好生活需要的发展,是体现新发展理念的发展,是创新成为第一动力、协调成为内生特点、绿色成为普遍形态、开放成为必由之路、共享成为根本目的的发展。很多测度高质量发展的文献就是依据国家的高质量发展要求设计了包括创新、协调、绿色、开放和共享五个维度的评价指标体系。
学界对高质量发展内涵也有探讨。张军扩(2019)[21]认为高质量发展的本质内涵是以满足人民日益增长的美好生活需要为目标的高效率、公平和绿色可持续的发展,高质量发展是经济建设、政治建设、文化建设、社会建设、生态文明建设五位一体的协调发展。李金昌等(2019)[9]将高质量发展的内涵解释为:高质量发展是国民经济充满活力的持续发展,是以创新为基础的高效率发展,是绿色的发展,是人民生活质量不断提高的发展,是人的素养不断提升的发展。聂长飞和简新华(2020)[10]将高质量发展界定为产品和服务质量高、经济效益高、社会效益高、生态效益高和经济运行状态好,并且据此构建了高质量发展指标体系。可见,学术界对于高质量发展内涵的探讨有共同之处,都认为高质量发展含义较广,均强调高效率、创新和绿色三个特征。
本文以构建符合国家高质量发展要求的高质量发展评价体系为研究目的,围绕党中央关于高质量发展的内涵表述构建指标体系。
综合评价的作用,一是向评价结果使用方提供复杂现象的量化测度信息,服务于管理;二是促使被评价对象针对弱项短板进行改进提升,以评促改,以评促建,发挥风向标的引领作用。一个好的评价指标体系能够很好地体现评价需求方的目的,能够有效引领被评价对象的发展方向。本文将构建一个具有鲜明政策导向性,且具有推广应用价值的省域高质量发展评价系统,旨在为政府提供高质量发展的评价工具,为社会提供高质量发展的量化信息。
要构建一个既能够客观反映高质量发展水平量化程度,又能够有效发挥其风向标作用的评价指标体系,需遵守一些原则。李金昌等(2019)[9]曾对高质量发展评价指标体系构建原则进行了精彩的阐述,紧扣高质量发展主题,指标少而精,选择结果指标不要选择过程指标,选择实际区分度高的指标,选择既符合中国国情又具有国际视野的指标,这些原则为后续类似研究提供了很好的指标选择依据。除上述原则外,本文认为高质量发展评价指标体系的构建还需要遵守五个原则。第一,尽量保证指标之间独立,不出现大量重复信息,这样指标的代表性才会强,才有存在于指标体系中的必要。与经济水平高度相关的指标之间往往有较高的相关性,在指标选择时最好观察相关系数矩阵,避免高度相关的指标出现在一个评价体系中。第二,区分度特别大的指标往往需要解决离群点问题方能使用,区分度过小的指标则没必要加入。离群点的存在会导致指标标准化得分中间部分过于聚集,区分度较差,将指标选入评价系统之前可通过变异系数初步判断其蕴含的信息量。经验来看,变异系数大1的指标有可能出现离群点。变异系数小于0.1的指标区分度太小,例如生活垃圾无害化处理率,几乎所有省份都是100%,个别省份不是100%,也达到99%以上,这样的指标参评无意义。第三,构建的评价系统要稳健,不能有敏感指标出现。系统稳健是指评价结果不会由于某个指标的变化而出现评价结果大幅度变化。能够引起评价结果较大变化的指标称之为敏感指标,也可叫做关键指标,一个好的评价系统不能存在这样的敏感指标,否则容易出现人为操纵后果,不利于评价结果的客观性。第四,多设身处地为被评价对象着想,保证评价体系对每个被评价者来说是公平的、愿意接受的,这样才能保证评价体系充分发挥作用。评价指标体系的设计者往往受雇于评价者,自然而然地更多考虑评价者的需求,非常容易忽略被评价对象对评价系统的感受。多了解被评价对象的特点,必须考虑如何设置指标体系才能对每个被评价对象来说是公平的。只有被评价对象认可评价系统,评价系统才更有生命力。设身处地为各种类型的被评价对象考虑,是保证评价系统公平的重要前提。第五,指标算法尽量简单经典,指标数据尽量为公开可查询数据。高质量发展评价指标体系具有广泛的推广价值,指标算法过于复杂,指标数据难以获得,都会使其推广价值大打折扣,同时也会降低评价规则的透明度,将其纳入绩效评价和政绩考核时难以保证客观性。在指标体系构建中能用简单指标绝不用复杂的指标,尽可能使用统计局和相关部门公开的指标数据,让评价工作对任何人来说可重复、结果唯一、可信任。
新发展理念下的高质量发展有五个特征,从五个特征水平的量化测度出发,形成高质量发展评价指标体系的一级评价指标。二级指标的设计以能够准确反映一级指标为第一准则,其次是考虑数据的可获得性。三级指标的设计以反映二级指标为第一准则,以数据的可获得性和敏感度为第二准则。有些指标听起来能够反映二级指标,但是仔细观察数据发现,其反映的各省水平与现实感受不符。例如,人均受教育年限是已有文献常用来反映教育水平的指标,实际观察数据发现,像北京、上海、广州这种集聚最好教育资源的地区,反而人均受教育年限不是很高,这与高层次劳动力与低层次劳动力搭配有关。用每万人医疗机构床位数来反映医疗水平同样也不敏感,与现实感受明显不符,像这样的指标都没有被纳入。最终形成的指标体系见表1,共由5个一级指标、15个二级指标和28个三级指标构成。
表1 高质量发展指标体系
创新成为第一动力是高质量发展的第一个特征,创新的动力表现为经济生产效率提高,技术进步显著,企业的竞争力和全社会的活力增强,当然创新不仅局限于技术创新,还有制度创新、管理创新等。创新成为第一动力的量化测度,不是测度创新投入水平和创新产出水平,是指其对经济发展的影响,这一点已有文献有很大误解。李金昌等(2019)[9]强调了结果导向测度高质量发展的重要性,其设计的高质量发展评价指标体系也没有直接纳入创新投入和创新产出,本文非常赞同这一观点。创新维度中的生产效率考虑以增加值率、劳动生产率、全要素生产率和地区生产总值增长速度来反映,通过检验发现,增加值率不敏感,与现实感受不太一致,最终保留劳动生产率、全要素生产率和地区生产总值增长速度三个子指标。竞争力用万元地区生产总值高技术产业新产品销售收入和万元地区生产总值技术市场成交额反映。创新不仅使经济效率和竞争力提高,还使经济充满活力。反映活力的指标选取每万就业人员企业法人单位数,但是检验发现该指标与劳动生产率相关系数高达0.88,说明劳动生产率高的地区经济活力也强,劳动生产率能够代表活力,故最后放弃了对于经济活力的测度。
协调成为内生特点,意味着高质量发展一定表现为各领域的协调性,包括城乡协调、产业协调、物质文明和精神文明的协调等,可以用这些方面的协调程度反映高质量发展水平。城乡协调用城乡居民人均可支配收入比反映,产业协调用产业结构高级化指数反映,物质文明与精神文明协调用图书馆外借册数占比/地区生产总值占比、博物馆参观人数占比/地区生产总值占比以及艺术团体机构数占比/地区生产总值占比反映。
高质量发展是绿色成为普遍形态的发展,绿色水平是衡量高质量发展的又一维度,绿色包括生产绿色水平、使用绿色水平、环境质量以及循环利用水平。生产绿色中包含了生产过程中的耗能和碳排放两个指标,碳排放最后被放弃,是因为万元地区生产总值碳排放与万元地区生产总值能耗的相关系数高达0.89,最后保留了方便计算的万元地区生产总值能耗。使用绿色是测度本省最终使用中的完全能源需求,这是已有文献没有使用过的指标。事实上,纳入自使用最终产品完全能源需求是十分必要的。这是因为:第一,本省自己最终使用的产品规模与生产的增加值规模不同,自己最终使用产品规模包括最终消费和资本形成,等于生产的增加值加非本省生产的、从外省和国外流入的产品并扣减流出省的产品;第二,从最终使用视角测算能耗,能够测出直接和所有间接能耗的合计,也就是完全能耗,这是对从生产环节测度的直接能耗的很好补充;第三,最终使用绿色测度对各地区更加公平,能够测出能源消费转嫁,区域差异包容性更强,例如传统工业生产过程高耗能、高污染,但是传统工业品供全国使用,虽然高层次产业结构经济体不直接生产传统工业品,但也会与传统工业品产生千丝万缕的关系。很多文献测度绿色的时候使用了环境治理投资,该指标不是反映绿色形态的结果变量。
高质量发展下的开放,是高水平的开放,是国内与国外相互促进的开放,选择贸易和资金两个维度反映开放水平。贸易维度用贸易依存度反映贸易开放规模,用进口/出口反映贸易相互促进程度,该指标是居中指标,以1为目标值,过大或过小都会偏离“相互促进”。资金开放也是从规模和相互促进两个角度进行测度。
共享是高质量发展的根本目的,是指发展成果要与人民共享,依靠高质量发展解决人民日益增长的美好生活需要和不平衡不充分的发展之间的矛盾。解决这个矛盾,需要供给更高质量的产品、更高的收入、更完善的社会保障、更好的教育与医疗以及更美的环境等。结合数据的可获得性,共享维度下设收入、消费、社会保障、教育和医疗5个子指标。收入下设收入相对规模、收入与经济增长共享幅度两个指标。收入相对规模用全体居民人均可支配收入与当地最低工资标准之比来反映,将最低工资标准纳入进来是为了消除地区购买力差异,更好地包容地区差异。收入与经济增长共享幅度用不变价全体居民人均可支配收入与地区生产总值增速之比反映,在检验中发现,这个指标变异系数不到0.1,没有被纳入。消费指标用人均最终消费支出与最低工资之比反映,人均最终消费支出是支出法地区生产总值中的最终消费支出与年平均人口之比,这个口径较全体居民人均消费支出更全面,包括政府最终消费,但是检验发现其与收入指标高度相关(相关系数为0.87),故被去掉。教育水平很多文献使用人均受教育年限来反映,但是这个指标区分度较低,变异系数不足0.1,因而被放弃,换成了每十万人高等学校在校生人数。医疗水平很多文献使用的是每万人拥有卫生机构床位数,经验检验发现,这个指标不能准确反映各地区的医疗水平,2020年黑龙江、四川、辽宁、重庆4个省(直辖市)的每万人拥有卫生机构床位数最多,但是这几个省不是医疗水平最好的省。本文使用平均每个医疗卫生机构诊疗人次来反映各地区的医疗水平,这个指标值越大说明越能够吸引人们前往诊疗,能够反映当地的医疗水平。
由于各指标的量纲不同,在进行综合汇总之前需要将指标进行标准化,以消除量纲的影响。针对正向、负向和居中型指标的标准化方法也不同,为得到0~100的正标准化值,并且保证不同年份标准化数值可比,本文采用如下公式进行指标标准化:
其中,xij(tk)表示i地区tk时期第j个指标值的原始数值,x*ij(tk)是其标准化以后的数值,Mj=max{xij(tk)}表示第j个指标在纵向时间和横向截面上的最大值,mj=min{xij(tk)}表示第j个指标在纵向时间和横向截面上的最小值,λj表示第j个指标的居中目标值。本文只有一个居中型指标即进口与出口之比,其居中目标值为1。
权重确定方法有主观法、客观法以及主客观结合法,对于面板数据,纵横向拉开档次法比较受欢迎。这里介绍一下纵横向拉开档次法以及本文在其基础上进行的改进。
1.纵横向拉开档次法。纵横向拉开档次法是由郭亚军(2007)[22]提出的一种适用于面板数据的综合评价权重确定方法。该方法的思想是寻找一个被评价对象得分差距最大的权重,通过求解一个非线性规划完成。权重确定的具体模型如下:设有n个被评价对象(或系统)s1,s2,…,sn,有m个评价指标x1,x2,…,xm,且按时间顺序t1,t2,…,tT获得原始数据{xij(tk)},{xij(tk)}构成一组时序立体数据(见表2)。
表2 时序立体数据表
将{xij(tk)}进行指标类型一致化、无量纲化处理,最终得到的数据记为x*i(jtk)(i=1,2,…n;j=1,2,…,m;k=1,2,…,T)。取综合评价函数为:
确定权重系数wj(j=1,2,…,m)的原则是在时序立体数据表上最大可能地体现出被评价对象之间的差异,而s1,s2,…,sn在时序立体数据表{x*i(jtk)}上的这种整体差异可用yj(tk)的总离差平方和来刻画。
式中,W=(w1,w2,…,wm)′,H=∑Hk为m*m阶对称矩阵,而Hk=Hk*′,Hk=Xk*′Xk*(k=1,2,…,T)。
通过求解下面的非线性规划,求解权重向量W:
由拉开档次法的求解过程可知,该方法倾向于给予区分度大的指标更大的权重,因为这样才能保证被评价对象之间得分差距最大。这种思想如果仅从数学角度看,信息提取是完美的,但是如果结合经济含义未必总是合理的。例如对省域高质量发展水平进行评价时,发展质量高的发达地区其多数指标都比落后地区高,有少数指标比落后地区低,可能也相差不多。将地区间差异最大的指标赋予最大权重,差异较小的指标赋予较小权重,意味着对于发达地区而言,其比欠发达地区高很多的指标被赋予较大权重,比欠发达地区高得少或比欠发达地区低的指标被赋予较小权重,这样一来,不管是有意还是无意都刚好帮助发达地区实现了自己的权重意愿。因为这个高分被评价对象正期望在这类指标上被赋予较高权重,在其他与低分者差距小的指标上被赋予较小权重,如此就能够拉大其与低分者的得分差距,这正是他们表达赋权意愿时所期望的。
像山西、东北等欠发达地区得分低的指标一般比较多,其赋权意愿是在得分与高分差距大的指标上被赋予较小的权重,在得分与高分差距小甚至得分偏高的指标上被赋予较大的权重,这样总得分会比较高,这种意愿刚好与纵横向拉开档次法相反。也就是说,在高质量发展这样的评价中,欠发达地区在多数指标上被按照发达地区的意愿进行了赋权,与自己的赋权意愿刚好相反。那么欠发达地区就不该有机会表达自己的权重意愿吗?显然不是,正如我们人类只有从事工作种类的不同,而工作本身没有高低贵贱,只要是兢兢业业工作的人都透着平凡中的伟大,值得被尊重,区域经济发展也一样。不是生产高科技产品,搞现代服务业,就比传统工业和农业高级,只是依据区域地理位置、资源禀赋形成的比较优势不同,导致的区域分工不同而已。经济总体要实现高质量发展水平的不断提升,并非要达到各区域产业结构雷同的目标,这样做也是违背经济发展规律的,高质量发展是要促进区域协调发展,相互促进。
2.民主赋权法。纵横向拉开档次法在综合评价中存在的区域“歧视”问题,在单纯以提取信息量最大化为目标的赋权方法中都可能存在,如熵权法、变异系数法等。针对这种“歧视”的改进也不难,对纵横向拉开档次法稍作改进即可实现让每一个被评价对象表达自己的赋权意愿。只要按照每个被评价对象的意愿做一次权重的优化求解,再将所有被评价对象的期望权重取均值就可得到相对民主的赋权结果,我们把基于这样的思想求解权重的方法称为民主赋权法。民主赋权法蕴含一种新的赋权思想,以被评价对象的意愿确定权重,这与已有权重确定方法的出发点不同,已有方法均以权重设计者意愿或相关专家的意愿来确定权重。
被评价对象对权重的意愿有多种,也就是说民主赋权法按照被评价对象的不同权重愿望可以分为很多小类,这里列出两类,一类命名为瞻前型,另一类命名为瞻前顾后型。瞻前型民主赋权是指被评价对象对权重的需求是实现与比自己得分高的被评价对象的差距尽可能小,也就是要尽可能追赶高分。瞻前顾后型民主赋权法的被评价对象,权重期望更高一些,既想与比自己得分高的被评价对象得分差距尽可能小,又想与比自己得分低的被评价对象得分差距尽可能大,也就是追赶高分甩开低分。
利用瞻前型民主赋权法,被评价对象sl的权重确定数学模型为:
利用瞻前顾后型民主赋权法,被评价对象sl的权重确定数学模型为:
其中,wl=(w1l,w2l,…,wml)′表示被评价对象sl的理想权重,yi(tk)=∑wljx*ij(tk)表示在被评价对象sl的理想权重下被评价对象si的综合得分。
Ili(tk)和I′li(tk)是两个示性函数,用来判别在被评价对象sl的理想权重下,其得分是否大于等于被评价对象si的得分。Ili(tk)在被评价对象sl的综合得分大于等于被评价对象si的得分时取1,反之取0,I′li(tk)则正好相反。各下标的取值范围为:1≤l≤n;j=1,2,…,m;k=1,2,…,T。两种类型的民主赋权法都是针对每个被评价对象,都要求解一次非线性规划,最后会得到一个权重矩阵W。
民主赋权法的权重Wd=(wd1,wd2,…,wdm)′,就是权重矩阵W的行均值向量,即Wd=W*(1/n,1/n,…,1/n)′。
3.民主赋权法与拉开档次法组合。民主赋权法与拉开档次法的目标不同,选择拉开档次法还是民主赋权法,取决于指标分布和评价的目的。在高质量发展评价中,用民主赋权法确实能够包容区域差异性,但是由于发达地区少,不发达地区多,此时使用民主赋权法会出现多数省份都倾向于给其得分相对高的指标赋予较大权重,得分相对低的指标赋予较小权重,导致发达地区的赋权意愿由于少数服从多数而被淹没,后果是发达地区在得分方面的先行示范作用大打折扣。所以折中的方法是将纵横向拉开档次法与民主赋权法相结合,取二者权重的加权平均值作为最终权重,这样会同时兼顾民主与标杆引领作用。当然,两种权重谁更重要一些,取决于评价者对标杆引领作用的重视程度。如果指标数值分布较均匀,则民主赋权法的标杆抹杀作用会弱化。
采用线性加权平均的方法逐层汇总各级指标得分。除了最基础的指标外,其他指标均有子指标,有子指标的指标称之为母指标。针对每个母指标都要求解其子指标的权重,每个母指标下的子指标权重之和均为1,然后根据子指标的标准化得分和子指标的权重用线性加权综合的方法得到母指标得分。
采用逐层加权汇总的方法能够保证各层母指标得分不受子指标个数的影响。已有绝大多数文献采用一层加权汇总,所有基础指标的权重之和等于1,这样做会导致各母指标权重受到子指标个数的影响,因为一般来说指标个数越多,权重越大。然而,各母指标下的子指标个数会受数据可获得性的影响,所以子指标个数是不能代表母指标重要程度的。
本文指标数据来源于中国和各省统计年鉴、地区投入产出表、中国能源统计年鉴、国家统计局网站以及人力资源和社会保障部。大部分是简单计算或直接使用的指标,少部分指标需要进一步加工。这里对一些需要进一步加工的指标进行说明。劳动生产率由不变价地区生产总值比就业人员人数得到。劳动生产率、万元地区生产总值能耗、万元地区生产总值用水量、亿元地区生产总值二氧化硫排放量以及亿元地区生产总值化学需氧量排放量中涉及到的地区生产总值均为2020年价格的不变价地区生产总值。产业结构高级化指数的计算参考干春晖等(2011)[23]的研究,用第三产业增加值比重比第二产业增加值比重获得。全要素生产率借鉴刘秉镰等(2010)[24]的方法,用基于C-D生产函数的随机前沿模型测度,被解释变量为2020年价格的不变价地区生产总值对数,解释变量为就业人数对数和2020年价格的不变价固定资本存量对数,样本是2011—2020年31个省市的面板数据,软件使用的是StataSE17.0。2020年价格的不变价固定资本存量的计算借鉴了张军等(2004)[25]的永续盘存法,折旧率为10.96%,基期选择的是2001年,基期资本存量是用2002年投入产出表中的固定资产折旧除以折旧率获得的。
人均自使用最终产品完全能耗是一个用价值量来衡量最终使用中对能源产品的直接和间接依赖程度的指标,以元为单位,是2020年价格的不变价价值量。该指标计算需要的基础数据是2012年和2017年各省投入产出表数据和各省2020年价格地区生产总值。首先,基于各省2012年和2017年投入产出表进行计算。第一步,根据中间投入矩阵X和总投入向量q,计算出直接消耗系数矩阵A,再计算完全需求系数矩阵B,B=(I-A)-1。第二步,计算自使用最终产品列向量f*,其等于最终消费列向量和资本形成列向量的和。第三步,计算完全需求列向量q*,q*=。第四步,计算自使用最终产品的能源产品完全需求量q*0,q*0是一个数值,是完全需求向量q*中,煤炭采选产品,石油和天然气开采产品,电力、热力的生产和供应,燃气生产和供应4个产品部门对应的元素的和。2012年和2017年地区投入产出表中,虽然产品部门种类总数都是42种,但是分类有区别,使用软件计算的时候需要注意,2012年投入产出表4种能源产品分别对应第2、3、25、26行,而2017年投入产出表则分别对应第2、3、24、25行。第五步,投入产出表年份的单位自使用最终产品需要完全消耗的能源产品量λ等于能源产品完全需求量除以自使用产品总量,即λ=q*0/f*0,f*0=(1,1,…,1)f*。第六步,计算自使用最终产品总量占总增加值的比δ。其次,估算所有年份的自使用最终产品能源产品完全需求量。具体步骤为:第一步,估算非投入产出表年份的λ和δ,假定系数稳定,2011—2014年的λ和δ用2012年计算数代替,2015—2020年的λ和δ用2017年计算数代替;第二步,将现价地区生产总值用地区生产总值指数换算成2020年价格的不变价地区生产总值,不变价地区生产总值乘以δ即得到各年自使用最终产品量的估计值,自使用最终产品估计值乘以λ就是自使用产品能源产品完全需求量不变价估计值。最后,用自使用最终产品能源产品完全需求量除以年平均人口就得到人均自使用最终产品能源产品完全需求量。2020年人均自使用最终产品完全能耗北京最高(39 048元),新疆次之(28 627元),广西最少(6 424元)。人均自使用最终产品完全能耗与万元地区生产总值能耗相关系数为-0.15。
工业固体废物综合利用率=一般工业固体废物利用量/一般工业固体废物产生量*100%,这是一种估算,与严格意义上的工业固体废物综合利用率定义不一致。2018年和2019年数据缺乏,2018年的工业固体废物综合利用率用2017年数据代替,2019年用2020年数据代替。居民养老保险参保率、城镇居民基本医疗保险参保率和失业保险参保率,是依据官方公布数据计算得到的指标,旨在提供一个各省市可比的参保规模,与严格意义上的参保率算法不一致。居民养老保险参保率=居民养老保险参保人数/(15岁及以上人口占比*年末常住人口),居民养老保险参保人数=城镇职工参加养老保险人数+城乡居民社会养老保险参保人数,15岁及以上人口占比(人口抽样调查)=15岁及以上人口数(人口抽样调查)/人口数(人口抽样调查),城镇居民基本医疗参保率=城镇居民基本医疗保险年末参保人数/城镇年末人口,失业保险参保率=参加失业保险人数/城镇单位就业人员,每个医疗卫生机构诊疗人次=医疗卫生机构诊疗人次/医疗卫生机构数。
指标标准化得分按照式(1)设计的算法计算,在计算标准化得分之前对所有指标均使用箱线图中的离群点确定方法,寻找离群点并进行处理,即低于25%分位数1.5倍四分位差的数用25%分位数减1.5倍四分位差代替,高于75%分位数1.5倍四分位差的数用75%分位数加1.5倍四分位差代替。极值处理能够提高标准化得分的区分度,并且几乎不影响各地区的得分排序。权重方法选择的是拉开档次法和瞻前顾后型民主赋权法的均值,权重计算结果见 表1,计算软件使用的是Matlab R2022b。
高质量发展总得分计算结果显示,2020年浙江高质量发展水平最高,为67.3分,其次是上海、天津和北京。各省高质量发展水平基本呈上升趋势,2020年由于新冠疫情影响,导致各省得分有所下降。高质量发展水平上升最快的是甘肃、山西、安徽和青海。新疆高质量发展水平低,增速也低。
本文分别计算了2011—2020年各地区在一级指标和总得分上的均值和排名。表4数据显示:从2011—2020年的均分来看,北京得分最高,以67.9分排名第一,在创新、开放和共享三个维度得分均很高;其次是天津,均分65.7,在协调和开放方面得分比较高;海南在协调、绿色和开放三方面得分较高,均分排到第7名。
表4 2011—2020年各地区5个一级指标得分均值
表5列示了中国省域5个一级指标得分均值,历年数据显示:共享水平以年均5.0%的速度在增长,增速最快,表明居民充分享受到了发展带来的福利;协调程度和开放水平年均增长速度分别为3.9%和1.7%;绿色水平变动比较小,2020年与2011年基本持平;创新动力增长有所下降,主要原因是经济增长速度放缓。2020年除共享水平外,其他维度均大幅下降,主要是疫情突然爆发所致。
表5 高质量发展5个一级指标历年均值
运用核密度估计方法,对中国省域高质量发展的总得分分布特征进行分析。选取Epanechnikov核函数选项,运用StataSE17.0软件,分全国、东部、中部和西部对2011年、2015年和2019年的高质量发展总得分绘制核密度图。由图1可以看出,2011—2015年,我国高质量发展水平总体提升缓慢;分地区来看,东部地区提升较快,西部和中部地区提升不明显。2015—2019年,我国高质量发展水平中位数呈现右移,高质量发展水平整体呈现上升趋势;分地区来看,中部地区高质量发展水平提升最快,其次是西部地区,东部地区提升较慢。
图1 全国及东、中、西部地区高质量发展总得分核密度曲线图
不同区域高质量发展是否呈现聚集特征,可通过空间自相关分析得到答案。使用距离权重矩阵计算高质量发展得分的全局莫兰指数,2011—2020年高质量发展得分的全局莫兰指数绝对值均小于0.1,接近于0,且P值大于0.05,说明区域高质量发展之间不存在显著的空间相关,也就是说空间集聚效应不显著,这与聂长飞和简新华(2020)[10]的研究结论不同。
表6 2011—2020年高质量发展总得分的全局莫兰指数
人均地区生产总值是代表一个地区经济发展水平的重要指标,如果人均地区生产总值与高质量发展水平相关度较高,则很多时候就无需费时费力地做高质量发展评价,直接用人均地区生产总值衡量即可。本文计算了2011—2020年人均地区生产总值(2020年价格的不变价人均地区生产总值)与高质量发展得分的相关系数,二者相关系数为0.74,属于较强相关。从二者的散点图来看,人均地区生产总值高于10万元的地区包括北京、天津、上海、江苏、浙江、福建等省份,其高质量发展水平随着地区生产总值的提高上升很慢,也就是二者的线性关系很弱。人均地区生产总值高于10万元的地区,高质量发展水平相差不多。对于人均地区生产总值5万元左右的地区,人均地区生产总值与高质量发展关系比较弱。人均地区生产总值在7~10万元的地区,人均地区生产总值与高质量发展的线性关系较强。由此可见,人均地区生产总值与高质量发展水平的关系是分段的,人均地区生产总值为7~10万元的时候,其与高质量发展水平的线性关系较强,代表性较好,在其他区间代表性不好。
图2 人均地区生产总值与高质量发展总得分散点图
在理论分析部分,我们已经从定性角度分析了民主赋权法和纵横向拉开档次法的一些特点,现将两种方法的权重计算出来进行对比分析(表7)。民主赋权法使用的是瞻前顾后型民主赋权法。纵横向拉开档次法权重分布比民主赋权法均衡,绿色水平权重为0.26,协调程度和共享水平的权重均为0.21。民主赋权法绿色水平权重为0.36,比纵横向拉开档次高,这是因为绿色水平分布集中于高分。纵横向拉开档次法在共享水平上权重更高,因为共享水平得分分布两尾较厚。
表7 两种权重方法一级指标权重的比较
开放水平 0.15 0.15 0.15绿色水平 0.26 0.36 0.31共享水平 0.21 0.14 0.17合计 1.00 1.00 1.00
本文对纵横向拉开档次法、民主赋权法以及二者权重算术平均组合三种权重赋予方法下的高质量发展得分进行比较分析(表8)。从得分来看,纵横向拉开档次法分值更加离散,从30.9增加到70.7。民主赋权法分值更加集中,从31.7到60.3,确实有减小得分差距的作用。组合法的得分介于二者之间。从排名来看,民主赋权法相比纵横向拉开档次法,可能会使有强项的地区排名上升,例如,海南的协调和绿色发展水平是强项,黑龙江的协调是强项。对于没有强项的地区,民主赋权法也不能使其排名上升。
表8 (续) 三种权重方法下2011—2020年高质量发展水平得分均值
表8 三种权重方法下2011—2020年高质量发展水平得分均值
高质量发展是经济、社会、文化、生态环境等全方位的发展,高质量发展评价不可能是一个简单的评价系统。这样一个复杂的评价系统,应该比较稳健,也就是说,不会因为一个地区某个指标的进步就引起高质量发展水平得分的显著提高,只有当一个地区的各领域同时进步,方能使高质量发展水平得分显著提高。如果系统不稳健,对个别指标敏感,则不适用于绩效评价或政绩考核,因为容易人为操控,有滋生腐败的风险。这里将通过两种方法对高质量发展评价系统的稳健性进行检验。一是借鉴弃一法交叉验证的思想,对评价系统各指标的重要性进行检验,观察是否有能够主导系统得分的关键性指标。二是通过将每个指标标准化得分提高10%,观察其对总得分的影响程度,以此来判断评价系统对个别指标变动的敏感程度。一个稳健的评价系统会表现出很强的系统性,不存在关键性指标,也不会对某个指标变动敏感。
1.基于弃一法交叉验证的评价系统稳健性检验。弃一法交叉验证即每次抛弃一个指标,利用剩余的(m-1)个指标构成的评价系统进行高质量发展评价,将得分结果与原评价系统得分进行比较,从而判断被抛弃的指标是否会对评价系统产生重要影响。设yi(j)(tk)为抛弃第j个指标得到的综合得分,{yi(j)(tk)}(j=1,2,…,m;i=1,2,…,n;k=1,2,…,T)为进行m次交叉验证得到的综合得分集合。
借鉴变异系数的思想,构建敏感性指标ej:
表9 弃一法交叉验证的ej计算结果
表9 (续) 弃一法交叉验证的ej计算结果
2.基于各指标提高10%的系统稳健性检验。本文分别对28个指标中的每个指标施加一个10%的波动,计算其对高质量发展得分的影响,计算结果显示,人均自使用最终产品完全能耗增长10%,会导致总得分下降1.8%,总得分对其变动最敏感。人均自使用最终产品完全能耗均分为55分,其提高10%即提高5.5分,将使总得分下降0.99分。从2020年各地区得分来看,相邻排序分差一般都大于1分,也就是说,即使调整最敏感指标比较大的幅度,也不至于改变排序。城镇基本医疗保险参保率是最不敏感的指标,其提高10%,总得分会提高0.2%。
表10 施加10%波动的ej计算结果
高质量发展评价指标体系最终保留的28个指标是相关系数均不高于0.8的指标,相关系数矩阵下三角378个元素中,有63%小于0.3,37%位于0.3~0.8之间,指标之间不存在极强的线性关系。指标的变异系数位于0.1~1.8之间,指标的区分度较好。
以服务于政府绩效评价和政绩考核为目的,以紧扣内涵、精简、易操作为原则,基于高质量发展内涵,本文构建了包括创新动力、协调程度、绿色水平、开放水平和共享水平5个一级指标、15个二级指标、28个三级指标的省域高质量发展水平评价体系。在指标选取上,全部选择结果指标,避开过程指标,并尽可能保证指标容易获得,区分度高,独立性强。在赋权方法选择上,针对基于最大信息提取原则赋权的思想可能存在的地域歧视问题,本文提出了一种新的赋权方法,称为民主赋权法,该方法的赋权理念与已有方法不同,是基于被评价对象个体意愿赋权。民主赋权法具有能够突出被评价对象某一方面亮点、得分差距较小等优点,与纵横向拉开档次法形成互补,本文最终使用两种方法的权重平均数作为评价使用的权重。通过对评价系统的稳健性、指标的独立性和区分度进行检验发现,构建的高质量发展评价系统具有良好的稳健性,各指标的代表性较好,区分度较高。
实证研究发现的主要结论有:(1)我国高质量发展水平呈现上升趋势,2015—2019年较2011—2015年上升速度更快;(2)十年间,发达地区的高质量发展水平提升幅度小于欠发达地区;(3)由于经济进入新常态和疫情原因,2020年以来经济增速放缓,以结果导向测度的创新驱动能力下降;(4)共享发展水平以每年5%的速度迅速提高,居民从发展中得到了更多实惠;(5)省域高质量发展空间相关性不显著,集聚效应不明显。依据上述主要结论可知,我国全面提升高质量发展水平应更加注重欠发达地区的推动,其政策的边际收益更大。甘肃、山西、安徽和青海在高质量发展道路上步伐大,速度快,其经验值得交流与学习。
构建一个能够经得起实践检验的评价系统不是一件容易的事情,虽然本文在指标选取和权重确定方法方面对区域经济差异更加包容,使评价系统更加公平,指标体系也尽可能体现高质量发展内涵,但是仍有遗憾。第一,关于居民收入差距,仅有城乡居民人均可支配收入比一个指标,缺乏反映城乡居民内部收入差距的指标。第二,开放领域的指标更多考虑了开放规模和协调程度,没有加入反映开放质量的指标,今后研究可以加入高技术产业进出口占比等一些反映贸易质量的指标。