郑 莉付瑞全刘少博赵 执彭 星
(1.国家海洋信息中心,天津 300171;2.中国海洋大学 经济学院,山东 青岛 266100)
随着海洋经济的持续快速发展,海洋经济在国民经济中的地位日益提高,据初步核算,2017年全国海洋生产总值77 611亿元,海洋生产总值占国内生产总值的9.4%。20世纪80年代以来,尽管我国海洋统计逐步制度化、规范化,为海洋经济宏观调控提供了重要依据,但是也存在着部分统计数据质量管理机制不够健全等不足,新时期海洋经济统计机遇与挑战并存。《全国海洋经济发展“十三五”规划》提出了“加强海洋经济监测评估”要求,“十三五”以来,通过建立涉海企业直报制度,开展涉海部委数据共享等方式,海洋经济监测内容日益丰富,监测评估能力逐步提升,但各级领导对海洋经济统计数据的准确性和可靠度要求也越来越高,高质量的数据能为海洋经济管理决策提供可靠的参考依据。
当前,我国海洋经济统计数据的质量控制主要集中在数据产生过程,对于后期数据使用过程的质量评估方法较少涉及。虽然我国海洋经济统计建立了数据审核、沟通反馈流程,形成了完整性、逻辑性、准确性等审核,但是使用的审核方法较为简单,审核方法与工作机制有待完善。为进一步提高海洋经济统计数据准确性和可靠性,需要扩充海洋经济统计数据质量评估方法并逐步推进业务化工作。考虑到针对海洋经济统计数据质量评估方法的文献较少,本文拟分析当前主要宏观经济数据质量评估方法在海洋经济领域的适用性,得出结论并提出相关工作建议。
统计数据是对经济活动的记录,也是进行社会经济问题研究的基础,数据质量对数据使用者具有极其重要的作用。为充分发挥统计信息在政府决策中的作用,国外特别是发达国家如英国、加拿大、瑞典、荷兰等国家统计机构建立了比较健全的数据质量综合评价和管理体系;此外,国外也建立了对单个统计项目如国民核算、消费价格指数、国际收支、住户调查等数据的质量管理机制。国外统计质量评估方法分为两个层次,一个层次是国际数据质量评估框架,如国际货币基金组织(IMF)的数据质量评估框架(DQAF)、欧盟统计局(ESS)的数据质量评估框架(Dat QAM)、联合国统计署的通用国家质量保证框架(NQAF)等;另一个层次是不同学者从不同角度提出的评估方法,如Alexander等(1999)提出了评价网络数据6个评价标准,即权威性,准确性,客观性,及时性,可覆盖性,可交互性[1]。Gauch(2000)则认为应从及时性,便捷性,有效性,权威性,普及性和一致性6个方面评估数据质量[2]。
国内对于宏观经济统计数据质量评估的研究起步晚于国外研究,国内研究侧重理论探索统计质量的含义、管理和评估体系。如卢二坡(2006)归纳总结了统计数据质量的逻辑评估法、异常值评估法、误差角度质量评估、核算角度质量评估四大类方法的特点及应用场合[3];王华等(2009)评析了逻辑规则检验、经验参数比对、相关指标变动趋势比对、基于模型的异常数值识别与参数稳定性分析等几类数据准确性评估方法[4];王华等(2010)针对统计数据质量开展了用户满意度测评,并建构了统计用户满意度测评的方法论框架[5];郭越等(2010)指出可用逻辑判断法、增长率法、结构法、关联系数法、抽样调查法等方法监控海洋统计数据质量[6];许涤龙等(2011)详细讨论了逻辑关系检验法、计量模型分析法、核算数据重估法、统计分布检验法、调查误差评估法以及多维评估法6个类别统计数据质量的评估方法各自的评估过程、适用性及其优缺点[7]。
随着近30年海洋经济统计工作不断发展完善,通过制度统计、企业直报系统、调查等传统渠道及大数据等新兴渠道获取的海洋统计数据日益丰富,且海洋经济统计数据具有覆盖内容广、来源多且可信度不一等特点,在这种情况下保证报送数据的准确性和可靠性政府和相关统计部门的迫切需求。特别是在当前大数据发展背景下,国内学者从最初研究统计数据调查误差逐步向研究统计数据综合质量转变发展。具体可分为以下三个阶段:
第一阶段(1988-1998年),初步发展阶段。该时期海洋统计工作初步开展,统计数据主要来源于各涉海部委,数据的可得性是当时评估评价海洋统计数据质量的唯一标准。
第二阶段(1998-2013年),迅速发展阶段。随着统计工作的深入开展,依次创建了《海洋统计综合报表制度》 《海洋统计快报制度》 《海洋生产总值核算制度》等,并出台了《全国海洋统计数据审核办法》 《全国海洋统计工作考评方法》等规范化管理办法,在这个阶段准确性成为评价海洋统计数据质量的出发点。
第三阶段(2013至今),拓展完善阶段。随着统计调查体系的完善、信息化的推进和标准体系的构建等,在新时期大数据背景下,海洋经济统计数据质量评价标准由单一化逐步向多维化发展,评价方法也呈现出多样化复杂化趋势。
随着我国海洋经济统计工作的日益完善,我国海洋经济统计数据质量评估方法也不断发展完善,统计数据质量也在不断提高,但仍存在审核方法简单、效率低、范围窄等不足。主要表现在以下4个方面。
2.2.1 数据质量标准化管理较薄弱
虽然我国出台了海洋经济数据审核办法,但在具体的业务化工作中并未实现全面实施推进,且近年来随着海洋经济监测高频数据日益丰富,形成的统计数据存在数据来源多且可信度不一等问题,而针对这些统计数据的质量标准管理工作也并未及时更新推进,海洋经济数据质量的标准化管理总体较为薄弱。
2.2.2 审核集中在数据生产环节且使用方法较简单
目前,我国海洋经济统计数据的质量控制主要集中在数据产生过程,且多采用增速法、图形法、目测法等较为基础的审核方法,对于后期数据使用过程中的质量评估较少涉及,对于有些数据,在采集过程中可能难以发现数据异常,而在使用过程中可能会发现与其他指标变化趋势不一致等情况。
2.2.3 数据审核信息化水平相对滞后
现阶段海洋经济统计数据审核的效率低,还没有全部实现系统化,虽然部分统计制度数据初步实现了系统审核,但是系统审核方法较为简单,还需辅以人工做进一步审核判断,数据审核信息化水平还处于相对滞后的发展阶段。
2.2.4 数据质量评估范围较窄
我国海洋经济统计数据质量评估目前主要是针对数据的完整性、逻辑性、准确性等,且多基于指标本身的质量评估,对于相关指标、用户层面的质量评估较少涉及,为与国际接轨,需要不断扩展质量评估维度。
当前,宏观经济统计数据质量评估常见的方法有逻辑规则检验法、计量模型分析法、核算数据重估法、统计分布检验法、调查偏差评估法、多维质量评估法六大类。其中前三种是针对总量统计数据的评估,统计分布检验和调查偏差评估是针对个体或分类数据的评估,多维评估法用于评估统计数据质量的多个维度,在国外统计数据质量评估中较为常见。为进一步丰富海洋经济统计数据质量评估方法,结合海洋经济统计数据质量评估现状,下文分析各类主要统计数据质量评估方法在海洋经济数据质量控制领域的适用性。
逻辑规则检验法是针对宏观总量数据质量的一种评估方法,即根据统计数据中各个指标之间的包含、恒等以及相关等内在逻辑关系来粗略检验数据的可信度。若待评估统计指标数据之间不满足特定的逻辑关系,则需要做进一步的核查与分析。逻辑规则检验较多基于传统的社会经济统计理论,因其具有通俗易懂、可操作性强等特性,较广泛应用于政府统计工作中。但是,这种评估方法依据的检验规则过于单一,通过逻辑关系检验也无法确保数据的可信度,此外,当被检测统计数据违背特定逻辑关系也无法确定哪个数据有问题,因此仅以通过逻辑关系检验作为判定数据可信度的标准,较为粗略草率。
目前,我国海洋经济统计指标数据之间存在大量逻辑关系,如增减平衡关系,指标间相对比例关系、分项指标间的结构比重关系等,可以将逻辑规则检验作为初步评估海洋经济总量数据质量的方法,并结合其他方法,更好地得出统计数据的可信度的检验结论。
计量模型分析法也是一种针对宏观总量数据质量评估的方法,在统计指标之间难以简单判定存在确切的逻辑关系的情况下,可通过建立计量经济模型,检查数据是否出现异常情况。在具体质量评估中,首先,需要依据相应经济或统计理论建立计量经济模型,该模型要能准确有效反映统计指标之间的相互影响关系或内部发展规律;然后,选取一定时期样本数据进行参数估计;最后,基于模型结果,通过分析参数估计值的时期稳定情况或预测值与实际值的差异情况等,得到数据质量评估结论。
由于海洋经济统计指标之间存在错综复杂的逻辑关系,增减逻辑检验和相关逻辑检验在评估数据质量时可能失效,此时需要借助传统回归模型、经典时序模型、面板数据模型等计量经济模型做进一步判定。当通过构建模型发现变量存有异常值或参数异常变动,则须确认是由于外部冲击等因素造成,还是统计数据准确性问题。此方法作为逻辑规则检验的补充,需要建模者有较强的经济或统计理论基础,能根据模型结果做进一步评估分析,虽然在政府统计工作中较少应用,但在大数据背景下,随着海洋经济统计数据的日益丰富,此方法将作为深度评估海洋经济数据质量的方法并逐渐得到广泛应用。
统计分布检验法,是针对分类数据的一种质量评估方法。这种评估方法首先需要确定评估数据统计分布特性,然后验证待评估数据统计分布与理论分布情况是否一致,进而得出统计数据质量评估结果。在社会经济统计领域,统计个体的数据在理论上会服从某一特定的统计分布,通过对个体数据进行特定统计分布检验,可初步判断各个个体标志值是否异常,此处的异常值是指在数据集中与众不同的数据,使人怀疑这些数据并非常规随机偏差导致,而是产生于完全不同的机制(总体或分布)。该评估方法在实际操作中最难之地在于如何确定统计数据的分布形式,主要可通过理论分析和调查研究实现。
对于海洋经济统计数据,在确定其理论分布形式后,需要对比理论数据与待评估数据的分布是否一致,若发现异常点则需进一步验证分析其具体误差情况,从而判断海洋经济统计数据质量。根据宏观经济统计数据质量评估相关研究成果,在理论上可认为反映规模大小的海洋经济统计数据(如产值、增加值等)近似服从对数正态分布,通过验证待评估试验数据是否符合对数正态分布数据达到检测数据质量的目的。
核算数据重估检验法是从核算角度对数据进行评估,是对逻辑规则检验法的拓展。该方法通过分析现有指标核算中存在的问题,挖掘现有资料重新估算指标数值,并与官方估算值进行比对检验以实现质量评估。核算数据重估检验法的关键在于如何重新估计待评估统计指标,该方法的评估结果只能找出问题的大致方向未能呈现具体错误,其结果只能作为参考依据。在宏观经济统计中尤其适合用于评估GDP及构成项目数据、增长率数据的准确性。
随着海洋经济统计渠道的扩充,海洋经济核算所需的数据参考资料不断更新与发展,可利用偏差修正重估法估算现价的海洋生产总值,并与公布的海洋生产总值数据进行比对;可利用价格指数重估法估算海洋生产总值及其各构成产业增长率数据;可利用物量指数重估法估算海洋渔业、海洋交通运输业等海洋产业增加值增长率数据。
统计调查有抽样误差和非抽样误差两大误差来源。抽样误差可通过数理统计方法进行度量并确定可接受范围,并以此对调查所获数据做出准确性判断。非抽样调查误差可通过事后抽查等方法检验,即通过事后质量抽查来评估非抽样误差大小。因此,调查偏差评估的实际应用有限,主要适用于像人口普查等地区性普查统计数据的分析。
调查偏差评估法已在海洋经济统计评估领域得到应用,如第一次全国海洋经济调查工作中采用了事后质量抽查法检验全国及分省份数据质量,即按照一定的抽样方法抽取沿海地区对涉海单位漏报的数量、比例及具体指标,以了解涉海单位真实性和调查对象源头数据质量情况等。最后根据综合差错率,对第一次全国海洋经济调查全国及分省数据质量进行定量评估。
在大数据时代发展背景下,统计数据内容将逐步向多样性、多维化方向发展,那么对于统计数据质量的内涵也逐步由一维趋向多维,相应地,统计数据质量的评估方法也由一维的准确性评估向多维评估延伸。当前,多维质量评估法主要包括多维多级测量法、质量指标集法、用户满意度调查法、模糊综合评价法等。
随着海洋经济统计数据非结构化特性彰显和各级管理部门对统计数据质量的关注,海洋经济统计数据多维化评估方法将逐步受到重视,海洋经济数据准确性评估也将由一维延伸至多维。今后可通过对海洋经济统计数据用户进行问卷调查获取基础质量信息,然后进行综合质量评估,以此达到对数据质量的分级。
本文基于国内外宏观经济统计数据质量评估发展背景,结合海洋经济发展现状,提出了主要质量评估方法在海洋经济统计数据质量控制工作中的适用性,以期为今后海洋经济数据质控工作提供更多方法参考。在当前互联网大数据时代发展背景下,为进一步提高传统海洋经济和新海洋经济统计指标的数据质量,促进决策部门能更敏锐地把握海洋经济走向并制定实施科学合理的海洋经济政策,现提出以下工作建议[8-10]:
(1)不断扩充新形势下海洋经济统计数据质量的内涵。海洋经济统计数据质量评估要顺应海洋统计数据质量的内涵扩大而有相应的调整,今后不仅需要对海洋经济统计数据的准确性进行评估,还应该对海洋经济统计数据的及时性、相关性、可比性、可衔接性、可解释性、可取得性、有效性等其他质量内涵进行多个维度的评估,逐渐把满足用户需求的程度作为评价数据质量的标准。
(2)逐步推进信息技术与数据质量控制技术方法应用的有效融合。充分利用信息化技术,将海洋统计数据质量控制各类方法逐步应用于海洋统计数据处理工作中,使海洋统计数据的处理全过程步步衔接,数据质量大大提高,更有效率地完成海洋统计工作,提高海洋统计服务水平。
(3)积极应对大数据环境下海洋经济统计数据质量管理工作的技术挑战。大数据时代背景下海洋经济统计将面临新的变革,文字、图片、视频、音频等信息都将纳入数据库,从而增加数据维度,获取高品质海量数据。由于具有规模大、多样性高和更新速度快的特点,大数据存在数据质量问题的可能性更大,与传统数据质量管理相比,大数据质量管理存在计算困难、错误混杂等方面的技术挑战,亟待进一步研究。