朱飞飞
(浙江省统计局,浙江杭州 310012)
GDP数据质量评估方法研究*
朱飞飞
(浙江省统计局,浙江杭州 310012)
GDP数据质量备受关注。本文介绍了逻辑关系检验法等几种统计数据质量评估办法,指出目前国家统计局针对地区GDP数据质量的评估办法中存在的问题,并提出了改进思路。
GDP数据质量;评估;改进
统计质量是统计工作的生命线,是统计工作永恒的主题。随着经济的发展,社会各界对GDP数据质量的要求也越来越高。尽管国家统计局有一套相对规范的GDP核算方法,但由于受到各种因素的影响,各地区的GDP数据质量还是有区别的,一些地区的数据还会经常引起社会各界的质疑。那么,如何提高GDP数据质量呢?本课题认为加强GDP数据质量评估是提高GDP数据质量的有效手段。
统计数据质量评估就是对已经获得的统计数据进行验证、分析和评价。目前关于统计数据质量的评估办法实质上仍然是围绕统计数据的准确性而展开研究的,主要有以下几种方法:
1.逻辑关系检验法。逻辑关系检验法是以统计指标之间存在的包含、恒等以及相关等内在逻辑关系为判断标准,实现对统计指标数据的可信度的粗略检验。如果在检验中某一组统计指标数据违背了它们之间所存在的特定关系,则表明这组数据存在可信度问题,有可能是其中的一个或一部分数据不可信,也有可能是整组数据均不可信,需要进行进一步的分析与核查。按照检验所依据的逻辑关系的不同,该方法可分为基于平衡关系的逻辑检验和基于相关性的逻辑检验。
基于平衡关系的逻辑检验是由统计指标内涵口径以及核算方法决定的,如资本形成总额应大于固定资产形成总额;全国GDP应为国内各地区生产总值的总和;支出法GDP应为消费、资本形成总额以及净出口之和等等。多数学者和公众媒体都是凭此方法质疑统计数据,一个典型的例子就是我国各地区生产总值的总和显著大于全国GD以及各地区生产总值增长率的加权平均数显著高于全国GDP增长率。基于平衡关系的逻辑检验普遍应用于各级统计部门的数据审核工作。它既可用于原始调查资料,也可用于汇总数据。
基于相关性的逻辑检验是以统计指标之间的高度相关关系为判断标准,这种相关关系是由社会经济客观现象决定的统计指标之间的高度相关关系。一般地,一个社会经济变量变动会导致另一个社会经济变量随之变动,并且在一定的生产技术条件下这种变动关系保持相对稳定,即一些统计指标间存在稳定的相关性,它主要有两种表现形式:一是总量指标本身之间存在比较稳定的比例或比率关系,即由此计算的相对指标应在特定的范围里取值,如增加值率、财政收入占GDP比重、三次产业间的比例、固定资产投资完成额与施工项目计划总投资等均应比较稳定;二是总量指标的变动趋势之间存在相当程度的同向或反向一
致性,亦即各自的增长率之间应该在方向上相符、在幅度上一致,如工业增加值增长率与工业用电量增长率、货物周转量增长率与GDP增长率等。
2.计量模型分析法。计量模型分析法是指以建立计量经济模型为基础、对相关指标的数据质量进行评估的一类统计数据质量评估方法。由于社会经济统计指标之间的相关关系十分复杂,相关逻辑检验法在评估统计数据质量时经常失效,一些学者便尝试借助于计量经济模型等一些功能更为强大的工具来评估统计数据质量,从而形成了统计数据质量评估的计量模型分析法。该方法的基本思路与步骤是:首先,通过深入的分析,依据相应的经济或统计理论建立计量经济模型,因变量通常为待评估的指标;其次,选取样本数据对所构建的模型进行参数估计,并对估计结果进行初步检验,得到具体的模型;第三,对所得到的具体模型进行分析,再根据相应的理论或假设得出待评估的统计数据是否可信的结论。
将计量经济学模型应用于统计数据质量评估,是国内近年来比较普遍的做法。但实际上,在诸多国外涉及政府统计数据质量评估方法的指导手册或者科研文献中几乎从未涉及这一方法。其根本原因在于计量经济学模型和统计数据准确性评估之间存在一个无法解决的逻辑悖论。这一逻辑悖论可以表述为:统计数据准确性评估基于正确构建并估计出反映真实关系的计量经济学模型,而正确的计量经济学模型的估计依赖于统计数据的准确无误。事实上,我们进行数据质量评估的出发点,就是怀疑数据本身是不准确的。那么,用假定不准确的数据对模型进行回归估计,得到的回归模型本身就是不可信的。基于这一不可信的回归模型再进行数据评估也就毫无意义。因此,在这种方法下,对整个样本期内的历史数据进行追溯评估是不现实的,而对当期数据进行评估则需假定历史数据正确以及经济结构稳定,这样的假定显然也是纯粹主观的。
3.统计分布检验法。在社会经济统计领域,统计总体中的各个个体的标志值在理论上会服从某一特定的统计分布。鉴此,通过对各个个体的标志值进行特定的统计分布检验,可初步判断出各个个体的标志值是否正常、可信。
统计分布检验法的过程是:第一,通过对待评估指标进行深入的理论分析或对其历史资料展开翔实的经验研究,找出其服从的具体的统计分布;第二,检验待评估指标在各个个体上的取值的经验分布是否与分析得出的理论分布一致,若检验通过,则说明待评估指标在各个个体上的取值总体上是可信的,否则说明待评估指标在个体上的取值存在较大的误差,还需进一步分析原因;第三,以分析得出的理论分布为基础,应用Grubbs准则、Dixon准则等识别待评估指标在各个个体上的取值的异常值,并对异常值进行认真审核,判断其是否可信。引发异常值的原因一般有两种:一是客观因素,如统计指标值因外部经济环境突变或者其他未知因素造成的极端表现;二是主观因素,既包括有意造假的虚报、瞒报,也包括日常工作过程中的数据录入、计算和汇总错误,还包括对调查方案执行不力,如样本框选择不当或不完全、违背抽样原则等等。从原因看,异常值并不一定是质量有问题,只有人为因素导致的异常值才是质量有问题,因此,统计数据质量评估还要对异常值的产生原因做进一步的分析和判断。
统计分布检验法的缺陷也较为明显:一方面,所应用的前提条件是待评估指标服从某一特定的概率分布,但在许多情况下却很难获得这种理论分布;另一方面,对于各个个体数据中出现的一致性偏差还尚无法估计,即使得到肯定的检验结果也无法排除在各个个体数据中存在系统性偏差的可能性;而对于非一致性偏差其探测能力也受到各个个体所处的位置影响,那些处于理论分布中心位置附近的个体,即便出现较大的统计偏差也不一定会表现为数据异常点而被探测到。
4.核算数据重估法。核算数据重估法是指从统计核算的角度重新估计特定的统计指标数据为基础,以实现对相关统计指标的数据质量进行评估的一类统计数据质量评估方法。评估的基本思路是:第一,以待评估统计指标的统计核算规范或方法为依据,通过分析找出待评估统计指标在核算实践中存在的具体问题,并对其展开详细的分析;第二,根据具体的分析结果,最大限度地挖
掘现有资料,有针对性地采用一些替代数据或者运用规范的方法来重新估计待评估统计指标数据;第三,以重新估计得到的统计指标数据为参照标准,对官方公布的统计指标数据进行准确性评估。运用该方法进行统计数据质量评估的关键是如何重新估计待评估的统计指标数据。核算数据重估法是对于逻辑关系检验法的另一拓展,多用于评估GDP及其构成项目的现价水平数据和增长率数据的准确性。
从核算的角度重新对统计数据进行估算,也存在不少问题。比如采用不同的估计方法,即使采用的是相同数据,估计结果也可能相差甚远,而且这种差距难以解释。又如,由于所需要的基础数据难以获得,因而估算必须建立在很强的假设之上,这将导致估算结果出现偏差或可靠性受到质疑。尽管如此,通过严格规范的方法重新对有关指标进行估算,不但是对官方统计数据强有力的检验,同时也为指标计算提供了更为丰富的统计依据。当然,由于宏观统计数据特别是国民经济核算数据的估算是非常复杂的系统工程,且数据的收集异常艰难,因此,这种方法的应用也仅限于专门的机构和研究人员。
尽管统计数据质量评估方法有很多,但真正要对GDP数据的准确可靠程度做出判断也非易事。国家统计局也一直致力于GDP数据质量评估方法的研究,但目前推出的GDP数据质量评估方法,还仅供内部使用。现将国家统计局核算司制定的地区GDP数据质量评估方法做一简要介绍。
国家统计局核算司制定地区GDP数据质量评估办法的目的是为了提高地区GDP数据质量和地区之间GDP数据的可比性。目前所采用的地区GDP数据质量评估方法主要是差异比较法,即将各地区的评估指标与其标准值进行比较,按照差异大小来判断地区GDP总量和增长速度数据质量。各地区的评估指标是利用GDP与各项税收、全社会用电量、客货运周转量、存贷款余额以及城镇居民家庭人均可支配收入和农村居民家庭人均纯收入之间的相关关系来确定的。评估指标的标准值是依据各项评估指标的地区平均值确定的一个区间值(下称“标准区间值”)。如果某一项评估指标高于标准区间值的上限,则得分较高,表明GDP与该项相关指标匹配性较高,GDP数据质量和协调性较好;如果某项评估指标低于标准区间值的下限,则得分较低,表明GDP与该项相关指标匹配性有待于改善,GDP数据质量和协调性需要进一步提高。再利用各项评估指标的得分乘以其相应的权重进行加权,得到各地区的综合得分,并依此评判各地区GDP数据质量和协调性。
从国家统计局目前所使用的GDP评估方法来看,主要还是采用逻辑关系检验法。这是由于逻辑关系检验法在操作性和及时性上能基本满足对季度GDP数据评估的要求。但目前国家统计局针对地区GDP数据质量的评估办法还是存在一些问题。
1.逻辑关系检验法本身有缺陷。逻辑关系检验法可以分为基于平衡关系的逻辑检验和基于相关性的逻辑检验,该方法具有操作简单、通俗易懂等优点,但也存在一些缺陷。比如基于平衡关系的评估办法即使满足平衡关系也只是统计数据准确的必要而非充分条件,因为即使数据通过检验也不能证明被评估数据一定真实可靠,况且当数据违背平衡关系时,该方法也不能指明是哪个或哪些数据不准确。基于相关关系的评估办法采用的是用已知准确的指标(我们称之为判别指标来对被评估指标进行评估,如果指标间数量关系超出正常范畴,则可以初步判定被评估指标存在一定的质量问题。该评估办法的检验依据虽然从整体与部分的关系扩展到社会经济现象中普遍存在的相关关系,可以将统计部门之外的第三方数据作为参照对象纳入评估体系中来。但问题是如何衡量判别指标的准确性,如何测定指标间数量关系是否超出正常范畴,这些都是有一定难度的。在当今复杂多变的经济形势下,指标之间的相关关系可能是不稳定的,稳定的高度相关性往往并不成立。
2.判别指标的代表性问题。国家统计局在制定GDP数据质量评估办法时更多地是站在全国的角度选取判别指标的,在评估地区一级的数据质量时就会带来一些问题。比如国家统计局在评估GDP数据质量时,其中选用了客货运周转量发展速度来评估GDP速度的合理性。从全国角度来看,客货运周转量与GDP之间确实存在着比较高的相关关系,但对地区来说,相关关系就不一定表现得那么明显。根据交通部的统计制度规定,客货运周转量是按照注册地统计的,如果某一地区注册车辆增长不快,就会推导出这一地区的客货运周转量也一定增长不快,但这并不代表这一地区实际营运的客货运周转量也增长不快。因为交通运输单位的注册地和经营地常常是分离的,注册车辆增长不快并不代表营运车辆也增长不快。实际上,由于种种原因,这几年进入浙江省营运的外省登记车辆不断增加,而本身注册车辆增长不快,由于这些外省车辆在浙江营运的周转量不能计入其客货运周转量统计数据中,导致这几年浙江省按注册地统计的道路运输客货运周转量增长速度一直在个位数徘徊,从而导致浙江道路运输客货运周转量统计数据不能客观真实地反映其实际情况。如果用此指标来评估浙江省的GDP增长速度就会带来代表性不足问题。如果用此指标来评估地市的GDP数据,代表性问题将会更突出。
3.判别指标的口径问题。由于某些判别指标的口径问题,在对被评估指标进行评估时会对各地区带来结果的较大差异。比如财政收入一般可以分公共财政预算收入(以前为地方一般预算收入)和财政总收入。而公共财政预算收入又可以分税收收入和非税收入,一般来说,公共财政预算收入的大小不仅受上划中央“四税”收入的影响,也受非税收入的影响。因此,如果用公共财政预算收入来评估GDP就会受到某一地区非税收入以及上划中央“四税”比例的影响。如果某一地区非税收入在公共财政预算收入中所占比重越高,用它来评估GDP的数据质量效果就越差;同样,如果某一地区上划中央“四税”比例越高,用它来评估GDP的效果也越差。此外,财政总收入各地的口径也是五花八门,比如浙江的财政总收入仅包括公共财政预算收入和上划中央“四税”收入,江苏的财政总收入在浙江所包括的范围基础上还包括基金收入和社保收入,广东的财政总收入在江苏所包括的范围基础上,再包括国有资本经营收入。因此,如果用财政总收入来评估GDP数据质量,也会带来很多问题。又如利用税收收入这一指标来评估GDP也会受到指标口径的影响。比如目前国家统计局要求上报的全部税收收入是包括全部国税收入和地税收入,但全部国税收入中有国税部门组织的税收收入和包括了海关代征的增值税和消费税的国税税收收入两种口径,若某一地区海关代征的增值税起伏较大,就会对全部税收收入的增长率带来较大的影响,从而影响对被评估指标的评估。
4.判别指标本身的数据质量问题。目前国家统计局评估GDP数据质量所采用的判别指标大多为统计部门之外的第三方数据,这虽然有一定的客观性,但第三方数据由于种种原因也存在一些质量问题。比如前面提到的道路运输客货运周转量,虽然交通部有一套道路运输统计调查方案,但各地在执行过程中数据质量很难有保证,比如有些地区是运管部门在统计,有些地区是委托科研机构在统计等等。又如利用全社会用电量来评估GDP时,由于工业用电量受线损的影响较大,在评估时也会带来一些困惑等。
由于国家统计局目前出台的GDP数据质量评估方法基本还是采用逻辑关系检验法,为了保持与国家局评估方法的一致性,我们的改进思路是在国家统计局已经出台的评估方法基础上,结合浙江实际情况,提出浙江省的GDP数据质量评估办法,在选取判别指标以及分析评估结果时需要考虑以下因素:
1.判别指标的选取与被评估指标要有一定的相关性。我们在制定各市GDP数据质量评估办法时,首先要考虑判别指标是否能收集到,其次要考虑收集到的判别指标是否与被评估指标有一定的相关性。比如铁路货运量在评估GDP时是个很好的判别指标,在克强指数中也运用到它。但如
果用铁路货运量来评估地市一级的GDP数据可能就会带来问题。一方面,目前的铁路运输统计是按照大区统计的,浙江的铁路运输是在上海铁路局统计的,上海铁路局无法提供浙江各市的铁路运输情况,那么我们就很难用各市的铁路货运量来评估各市的GDP数据;另一方面,有些地区铁路运输线路还没有覆盖到,比如舟山,那就更无法用铁路货运量来评估舟山的GDP数据了。因此,我们在选取判别指标时一定要关注它的可得性以及相关性。
2.判别指标在全省范围内尽可能要做到口径一致。选取的判别指标在评估各地的GDP数据质量时至少要在各地具有可比性。比如前面提到的公共财政预算收入由于受到非税收入以及上划中央“四税”的影响,就不是很适合作为判别指标来评估GDP的数据质量,因为可比性相对较差。全部地税和国税税收收入由于受到海关代征的增值税和消费税的影响,也不是很适合作为判别指标。因此,我们应采用地税的税收收入加上划中央的“四税”收入作为评估GDP数据质量的判别指标之一。总之,若要评估各地的统计数据质量,选取的判别指标在各地要有可比性非常重要。
3.加强与相关部门的沟通与合作,尽量提高判别指标的数据质量。由于我们选取的判别指标大多为统计部门之外的第三方数据,因此,我们要加强与相关部门之间的沟通和合作。比如客货运周转量是一个很好的判别指标,但由于统计制度以及数据质量等原因而导致使用效果不理想,那么我们就要加强与交通部门的沟通与合作,尽量在源头上(即交通部)提出改革交通运输统计制度的建议;其次多加强与省级交通部门的沟通,在业务上帮助省级交通部门提出适合我省实际情况的交通运输统计制度改革。此外,也要与其他相关部门沟通与合作,尽可能多地了解相关判别指标在口径、范围、含义等方面的变化,以方便我们及时修正或调整相关判别指标。
4.加强对评估结果的分析与研究。我们建立评估办法,目的就是要让评估结果能基本反映各地的实际情况,从而促进各地统计数据质量的提高,但由于种种原因,有时也会有不尽如人意的地方。比如我们按照GDP数据质量评估办法,对2013年上半年和1-3季度各市数据进行试算,发现评估结果还是能大致反映各市的数据质量,对各市具有参考意义,但也存在一些问题。比如用全社会用电量来评估11个市的GDP数据,我们发现舟山得分特别低,分析其原因,原来舟山经济的发展对用电的需求要大大低于其他市;又如我们用城镇单位从业人员来评估11个市的GDP数据,发现金华得分特别高,分析其原因,金华由于2013年年度以来建筑业的从业人员在统计口径上发生了一些变化。因此,尽管我们制定了评估办法,但还是要加强对总体评估结果以及分项评估结果的分析研究,以便更好地反映各地的统计数据质量。
5.加强对GDP以及与GDP相关的统计指标计算方法的研究。为了提高GDP数据质量,我们除了要研究GDP数据质量评估方法,更要加强对GDP以及与GDP相关的统计指标计算方法的研究,形成两条腿走路。比如在现行的季度GDP核算方案中,信息传输计算机服务和软件业增加值是采用电信业务总量的速度来推算的,这与近几年浙江互联网和相关服务、软件和信息技术服务业的高速发展是极不相符的,为此,我们就要建议国家统计局改进信息传输计算机服务和软件业增加值的核算方法,以便在源头上提高统计数据质量。又如现行的规模以上月度工业增加值是按上年的增加值率来推算的,若两年之间企业经济效益变化比较明显,采用上年工业增加值率来推算本年工业增加值就会带来数据失真,从而影响GDP数据质量,因此,就要建议国家统计局考虑改变本年工业增加值的计算方法。总之,只有不断改进GDP核算方法以及与GDP相关的统计指标的计算方法,不断跟进GDP数据质量评估方法,我们的GDP数据质量才能不断提高。
课题负责人:朱飞飞
课题组成员:王启金、金良家、汪维薇、王娟张序旦、张琦、莫乐平
课题执笔人:朱飞飞
(责任编辑:牛域宁
*本文荣获2013年度浙江省统计学术类课题二等奖。