利用专项调查修正运输量历史数据的方法

2019-03-28 05:50秦芬芬
统计与决策 2019年5期
关键词:运输量水路月度

秦芬芬,王 屾,段 新

(交通运输部科学研究院,北京 100029)

0 引言

为掌握我国经济规模和结构的变化,摸清各领域经济活动的基本概貌,为确定国民经济发展战略目标和制定相关的社会经济政策提供科学依据,国家统计局历年来相继组织实施了多项大规模的普查工作。普查工作完成后,为了提高历史数据的可比性和准确性,各级统计部门相应地开展了基于普查数据成果的历史数据修正工作,确保了数据的有效衔接。

运输量是交通运输行业统计的核心指标,为了摸清公路水路运输量的总量和结构数据,真实和准确地把握我国公路水路运输行业的发展脉搏,交通运输部分别于2008年和2013年开展了公路水路运输量专项调查,并于2015年组织开展了规模相对较小的小样本调查。在专项调查工作完成之后,本年度的统计数据以专项调查为依据进行了修正,历史年份的数据则未进行同步的修正,因此不可避免的出现了数据衔接的问题,给数据使用者带来了很大的困难。基于此,本文在对修正目标和数据基础进行探讨和分析的基础上,基于现有修正方法的适用性分析,选用趋势离差法,对2008—2015年公路水路货物运输量进行了历史数据修正,得到了相应的修正结果。

1 修正的目标和数据基础

专项调查工作为后序统计工作确定了新的基数,下一年度的日常统计工作将在此基础上进行,对未来而言,专项调查主要影响的是基数。对历史而言,专项调查改变了当年的数据,在与上一年度或者历史数据进行比较时,则会出现数据上的断层,推翻之前基于统计数据的一系列的分析结论。因此,以专项调查数据为基准对历史数据进行修正的核心目标在于,使专项调查之前年份的历史数据与专项调查之后年份的数据进行有效的衔接。

运输量包括运量和周转量两个指标,现有的公路水路运输量统计具体包括公路客运、公路货运、水路客运、水路货运四个类别,水路从航区上又可划分为内河、沿海和远洋。从时间频度上来讲,日常统计包括年报和月快报,即颗粒度细化到月度。从地区上来讲,交通运输部的统计中包括全国和分省的数据,地市及以下层级的数据由各省自行负责确定。和日常统计相同,2008年和2013年专项调查的数据成果包括调查年度分省分月度的运输量数据,2015年小样本调查仅开展了公路客货运输和内河货物运输的相关部分,不包含水路客运、沿海货运和远洋货运。专项调查年度,由于专项调查数据结果具有一定的延迟性,日常统计中的月度统计和年快报统计工作照常开展,年度统计不再进行。

梳理之后,可将历史数据修正的目标进行进一步地具体化,即需要对2009—2012年的公路水路运输量、2014年公路运输量进行修正,颗粒度为分省分月。由于2008年第一次开展公路水路运输量专项调查,从1949—2008年的时间跨度较大,相关历史资料较少,因此这里暂时不考虑2008年之前的历史数据修正。

2 修正的原则

基于修正使数据有效衔接的目标,在修正时主要遵循以下原则:

(1)尽量保证数据变化趋势不变

若专项调查的数据结果与统计数据的差异较小,修正的幅度不大,修正后数据与原数据也会比较接近。若专项调查的数据结果与统计数据的差异较大,则无论采取何种修正方法,在两次专项调查数据确定的前提下,从上次专项调查到本次专项调查年度的数据变化量是一定的,数据修正能做的仅是把该变化量按照一定的规则和方法分配到中间的年份,也就是说趋势线的起点和终点是确定的,修正仅对线型进行调整,那势必会在整体上或者部分年份和原始数据相差较大。因此,在选择修正方法的时候,就要有所侧重,一是绝对量的变化趋势不能随意改变,比如增长变成下降,或者下降变成增长,若发生这样的变化,则应考虑修正方法的适用性;二是相对趋势尽量地变化小,也就是增长率的变化趋势尽量与修正前保持一致,在统计数据的使用中增长率的趋势往往比绝对量的趋势更为重要,因此对修正结果进行评估时,增长率的变化大小是衡量修正后数据质量的重要因素。

(2)尽量选择统一的方法进行修正

运输量修正既包括客运又包括货运,既包括公路又包括水路,既包括运量又包括周转量,既包括全国又包括地区,在选择修正方法时,要尽量选择统一的方法。比如运量和周转量本身就是相关性很强的两个指标,二者之间通过运距进行联系,运距会随着时间的变化发生缓慢的变化,但不会在短时期内发生巨变,选择相同的修正方法可保持运量和周转量的内在联系尽量不受影响。运输量修正包括全国数据的修正也包括地区数据的修正,尽管运输量指标和整体经济社会的发展具有相关性,纵向上看经济形势好的年份各地区的运输量数据普遍上涨较快,经济形势较差的年份则增幅都会减小甚至出现负增长,但各地区的经济总量差异较大,发展不均衡,且交通运输行业特点不同,因此还是存在较大的地区差异性。在选择修正方法时,不同地区尽量选择相同的修正方法可以保证地区间数据的可比性,避免出现因为方法不同带来的数据修正的反方向的变化。客运和货运、公路和水路在发展趋势上会有所不同,然而选择统一的修正方法在可读性、可解释性和实际操作上相比选择不同的方法都具有一定的优势。

(3)尽量一次修正,不进行历史追溯

运输量统计工作由来已久,日常统计中由各省交通运输主管部门负责分省数据统计并上报交通运输部,交通运输部汇总后报送至国家统计局,专项调查年份,由交通运输部负责确定全国及分省的数据并反馈给各省交通运输主管部门。2009—2012年的数据修正以2008年和2013年专项调查数据为基础,2014年的数据修正以2013年专项调查和2015年小样本调查数据为基础,每年的数据仅做一次修正,不再基于2015年小样本调查数据对2013年及之前年份的数据进行历史追溯,也就是在做下一次修正时认可上一次专项调查数据及上一次修正结果的合理性。

(4)从全国到地区,从年度到月度,逐步修正

历史数据的修正是一项整体性的工作,因此修正后的数据必须保持一致性,包括全国和地区数据的一致性,年度和月度数据的一致性。修正时可以先对全国数据进行修正并以修正后的数据为目标量对地区数据进行修正,也可以先对地区数据进行修正,再加总得到全国数据。第一种方法中首先确定的是全国数据,然后根据全国数据和地区数据加总后的差异再对地区数据进行微调,第二种方法中首先确定的是地区数据,全国数据的修正幅度取决于地区数据的修正结果。运输量属于核算指标,而非全面调查直接汇总的指标,两种方法的修正结果必然会存在一定的差异。考虑到在数据的重要性上全国数据优于地区数据,首先确定全国数据更有利于对数据修正结果的把握,选择第一种方法,自上而下先修正全国数据,再修正分省数据,若有需求再修正分省数据后,再进行分地市数据和分区县数据的修正。专项调查的年度数据通过调查月数据和波动系数相结合计算得到,年度数据是最重要的目标量,因此采用与自上而下相同的思路,从大到小、从粗到细,先修正年度数据,再修正月度数据。

(5)有必要开展修正后数据的评估以保证结果的可用性

数据修正完成有必要开展一定修正后数据的评估工作,对评估的效果进行检验,若评估结果较差,则修正后数据不可直接使用,需要重新梳理评估方法和各个环节,查找问题,对修正结果进行调整或者重新进行修正。修正后数据的评估可以通过从几个方面对修正后数据和原数据进行比较分析来进行:一是修正后数据内部一致性的检验,包括全国和地区、年度和月度、水路总量和分航区数据等总量数据和结构数据的一致性;二是修正后数据与原数据趋势一致性的评估,包括绝对量变化趋势的一致性,增长率变化趋势的一致性,不同年份间修正幅度的差异性等;三是不同地区不同月份数据的相对稳定性,各省数据的排名应尽量不变,不同月份数据的波动情况应尽量不变,以保证数据的地区分布、时间分布的稳定性;四是与外部数据的协调性检验,比如运输量的变化趋势与经济指标的发展趋势是否协调。

3 修正的方法

运输量修正包括基于2008年和2013年专项调查数据对2009—2012年的数据修正,以及以2013年专项调查和2015年小样本调查数据为基础对2014年的数据修正,也就是两头确定,采用内插法修正中间年份的数据。目前常用的修订方法有等差内插法、等比内插法、相关指标加权法、趋势离差法、等速内插法和最小二乘法。

等差内插法是将专项调查数据与本年度统计数据之间的差距均匀分摊到中间各个年度中,也就是在构造等差数列的基础上,使得不同年份之间的增长量的变化值相同。这种方法计算简便,也很容易理解,但若专项调查数据与当年统计数据差异较大,修订后数据的增长率趋势与原数据偏离较多。

等比内插法是将专项调查数据与本年度统计数据之间的增长幅度以等比序列的方式分摊到中间各个年度中,也就是在构造等比数列的基础上,使得不同年份之间的增长率的变化值相同。这种方法可以保证修订后数据的增长速度与原数据保持一致的变动趋势。

相关指标加权法是利用相关指标序列的变动趋势构建时间序列从而对目标量进行修正的一种方法,对相关指标的选取依赖性很强,若相关指标与目标量变化趋势一致则效果较好,否则效果较差。

趋势离差法是将时间序列分解成趋势项和循环变动项,构造出趋势值结合原数据的趋势离差计算出新的修正后的时间序列数据,其修正效果的好坏主要取决于趋势离差是否稳定。

等速内插法是在各个年份原有增长率的基础上,增加一个相同的增长速度,使得专项调查数据与本年度统计数据刚好相同。这种方法更多的关注增长率的变化,使得各年度修正数据增长率的变化与原数据完全一致。

最小二乘内插法是通过调整各个年份的修正数据,使得修正后的增长率与原数据的增长率之差的平方和达到最小。这种方法目的在于从整体时间序列的角度保证修正的幅度最小。

从运输量数据自身来看,具有以下几个特点:一是地区差异较大,各省的运输量绝对量规模差异较大,同一时期的增长速度也差异较大,某个省份甚至会和全国出现相反的变化趋势,尤其是水路运输,由于客观自然条件的不同,地区间的数量级都差很多,有些省份数据为0;二是季节性影响较大,以公路货物运输量为例,春节期间相对正常月份来讲可能只有一半左右,水路货运在不同地区也存在不同的停航时间;三是专项调查时对部分指标进行了统计口径的调整,专项调查数据与统计数据间自身存在无法衔接的问题;四是数据生产方式不同,日常统计数据自下而上产生,各省采用的方法有所差异,专项调查则由交通运输部统一基于抽样调查的样本数据进行核算,采用相同的方法进行自下而上的数据计算,即便基于相同的原始数据结果也难免因为方法的不同而产生差异。

考虑各种修正方法的特点以及运输量数据的自身特性,运输量修正以趋势离差法为主进行,分以下几个步骤:首先采用趋势离差法进行全国年度数据的修正,然后进行分省年度数据的修正,最后结合统计数据中月度数据与年度数据的比例关系进行分省分月度数据的修正。

4 实证

本文对2009—2012年公路水路运输量、2014年公路运输量进行修正。

4.1 公路旅客运输量

(1)2009—2012年

2008年专项调查全国公路客运量为268.21亿人,其中营业性客车完成151.24亿人,旅客周转量为12476.11亿人公里,其中营业性客车完成10717.79亿人公里,2013年专项调查全国公路客运量为185.35亿人,旅客周转量为11250.94亿人公里。对照由于2008年和2013年专项调查的基准数据,客运量和周转量均有所下降,而依照日常统计数据,这两个指标均处于逐年稳步上涨的趋势,因此由于基准数据口径的不同,修正后数据与原数据的变化趋势势必会不同,原数据为逐年上涨,而修正后数据为逐年下降,不过这和公路客运的行业发展趋势是一致的。由表1以及图1、图2所示可以看出,尽管绝对量的变化趋势发生了相反的变化,但修正后数据增长率的变化趋势与原数据基本吻合,不同年度增长率之差也基本相似。

表1 根据趋势离差法修正后的2008—2013年全国公路客运量

图1全国公路客运量趋势图

图2全国公路客运量增长率趋势图

采用相同的方法,对各省的公路旅客运输量进行初步修正,地区数据之和与全国数据略有差异,根据修正后各省数据在全国所占比例进行相同幅度的调整,则可得到修正后的分省年度数据。以2010年为例,由下页表2可以看出,各个省份修正后数据在全国的占比与原数据相比变化不大,绝对量排名也未发生大范围明显的变化。

年度数据修正之后需要对月度数据进行修正,一方面要保证月度数据之和等于年度数据,另一方面要尽量使得修正后的数据季节性波动与原数据保持一致。由于日常统计中月度统计与年度统计本身存在着不一致性,12个月数据之和不等于年报的全年数据,这里简化处理,将修正后年度数据与修正前月度数据在12个月数据之和中所占比例的乘积作为分省修正后月度数据的结果,也就是将各个月度的数据按照同样的比例进行上浮或者下调。全国修正后月度数据则可通过分省月度数据汇总得到,这一方法也同时满足了全国月度数据和年度数据的一致性要求。以2010年为例,由表3可以看出,修正后和修正前全国各个月度数据在全年中的占比大致相同。

表2 修正后的2010年分省公路客运量

表3 修正后的2010年全国分月公路客运量

以上为公路客运量的修正过程,公路旅客周转量的修正方法和技术处理相同,这里不再赘述。

(2)2014年

2014年数据的修正方法与2009—2012年有所不同,之前是已知两个数,修正四个数,而现在是已知两个数,修正一个数,变得简单很多。考虑到增长率比绝对量更加受重视,在年度数据修正时,假设2014年和2015年两个年份的增长率相同,则可根据2013年专项调查的基准数据和2015年小样本调查的基准数据计算出2014年修正后的数据。这种方法下,全国修正后数据和各省修正后数据之和也会存在小的差异,为简便处理,以各省修正后的数据为准,对全国数据进行略微调整,影响并不大。修正后月度数据的计算与之前相同,同样是基于2014年日常统计数据进行一定的浮动即可。

4.2 公路货物运输量

(1)2009—2012年

由于直接采用趋势离差法调整后的数据与其他运输方式的货物运输量在匹配性上存在略微的差异,因此在趋势离差法计算之后又进行了小幅度的调整,得到全国年度修正后的数据。由表4以及图3、图4所示可以看出,从绝对量和增长率来看,修正的结果都较好。

表4 修正后的2008—2013年公路货运量

图3 全国公路货运量趋势图

图4全国公路货运量增长率趋势图

分省年度数据和分省月度数据的修正方法和公路旅客运输量相同,相关结果如下页表5和表6所示。

(2)2014年

2014年数据的修正方法与公路旅客运输量相同。

4.3 水路旅客运输量

水路运输量与公路运输量存在较大的差别:一方面体现在总量上未必长期处于增长态势,比如近年来水路货物运输不景气,年度间波动较大;另一方面体现在地区差异和季节性波动都很明显。修正方法整体上采用趋势离差的方法,但由于水路运输存在分航区的统计,即按照内河、沿海和远洋分别统计,在修正时还需考虑整体修正还是分航区修正。从水路客运来看,绝对量相对别的运输量方式占比很小,2013年水路客运量在全社会客运量中仅占1.11%,多数省份仅有某一类航区的数据,或者以某一类航区的数据为主,因此修正时不再考虑分航区数据而进行整体修正。

对于北京、河北、内蒙古、西藏、新疆等日常统计中没有水路运输量的省份,在修正时直接从省份列表中予以剔除。另外修正过程中还发现有部分原数据缺失的情况,比如山西由于绝对量较小,2009—2012年统计数据中仅有年度数据没有月度数据,在进行月度数据修正时缺乏原数据,因此采用最近一次专项调查年度也就是2013年专项调查月度数据的比例作为基准进行修正。

表5 修正后的2010年分省公路货运量

表6 修正后的2010年全国分月公路货运量

表7 根据趋势离差法修正后的2008—2013年水路客运量

由表7可以看出,尽管原数据绝对量逐年上涨,但年度之间增长率差异较大,也就是趋势离差不稳定,导致修正后2010年出现了负增长的情况,2013年增长率也出现了反向的变化,采用趋势离差法的效果没有公路运输量好。

4.4 水路货物运输量

水路货物运输量的分航区数据中,内河、沿海、远洋的货运量占比依次减小,但货物周转量占比依次增加,尤其是远洋货运的运距远远高于内河货运。在实际统计工作中沿海和远洋的界限并不清晰,数据存在一定的此消彼长的状况,而内河和沿海、远洋则相对比较独立。因此综合考虑这两方面因素,针对内河和海洋(含沿海和远洋)分别进行数据修正,然后汇总得到水路货物运输量修正后的数据。

在采用趋势离差法进行年度数据修正时,还存在一种情况,即个别省份由于绝对量较小,原数据不是每年都有,因此需要进行特殊处理,不能和其他省份一并进行修正,须单独修正后再加回。以内河货物运输量为例,由表8的数据结果可以看出,绝对量上原数据和修正后的数据均呈现稳步上升的趋势,但修正后的增长率则在2013年出现了相反的变化趋势。这里有一个影响因素在于2013年原数据采用年快报数据,而年快报数据中不区分航区,分航区的数据依照2013年专项调查基准数据进行拆分。

表8 修正后的2008—2013年内河货运量

内河货物运输量修正中同样存在有年度数据无月度数据的情况,通过分析有月度数据年份的数据变化情况,采用相近年份的比例代替进行缺失数据的补充,进而完成月度数据的修正。2010年全国分月度修正后数据的结果如表9所示:

表9 修正后的2010年全国分月内河货运量

5 修正中的特殊处理

5.1 统计口径调整

运输量修正中涉及到的统计口径调整包括两个方面:

公路旅客运输量的统计口径调整。2008年专项调查时公路旅客运输量的统计范围包括三部分:营业性客车、公交汽车在公路上产生的运输量以及出租汽车在公路上产生的运输量(大口径)。2009—2013年的统计口径与2008年相同,2013年专项调查时调整为营业性客车产生的运输量(小口径),不再包含公交汽车和出租汽车的部分,自2014年起则沿用2013年专项调查的口径。从数据基础来看,2008年的基准数据同时有大口径和小口径数据,2013年的基准数据为小口径数据,而2009—2012年的原数据仅有大口径数据,按照大口径进行数据修正更加合理,然而考虑到修正的目的在于与未来数据的衔接,小口径数据实用性更强。从日常统计中的实际情况来看,公交汽车和出租汽车产生运输量的统计规范性不同,有些省份统计的多,有些统计的少,同时随着班线客运逐渐转向公交的行业发展趋势,营业性客车的数量本身也在减少,很难界定每个省份各个年度大口径和小口径的差异有多大。因此对于口径调整问题不再给予过度划分,以2008年的大口径数据和2013年的小口径数据为基准值,各年度的大口径数据为原数据,进行数据修正。

公路货物运输量的统计口径调整。2008年专项调查时公路货物运输量的统计范围包括三大部分:营业性载货汽车、其他载货机动车和轮胎式拖拉机(大口径),2013年专项调查时不再包含其他载货机动车和轮胎式拖拉机两个部分(小口径)。与公路旅客运输量不同的是,由于车辆数较少且吨位较小,这两部分在整体中所占比例原本就比较低,2008年货运量占16.92%,货物周转量占5.91%,随着交通运输行业的不断发展,这两类车辆占比越来越少,其运输量比重也在逐年降低。因此采取与公路旅客运输量的处理方式,假设口径差异稳步减少,以2008年的大口径数据和2013年的小口径数据为基准值,各年度的大口径数据为原数据,进行数据修正。

5.2 数据缺失

修正需要的数据基础包括专项调查的基准数据和两次专项调查之间各年份的原数据,并且需要细化到月度数据。公路运输量不存在数据缺失的问题,水路运输量则不同程度地存在一定的数据缺失,具体而言又可以分为以下几种情况:第一种情况是专项调查基准数据缺失,个别省份由于专项调查的调查月恰好处于停航时段,因此未开展相应的调查,但日常统计中均有相应的统计工作,这些省份专项调查的基准数据直接采用统计数据进行代替;第二种情况是年度数据缺失,即少数省份个别年份运输量数据为零,不能直接使用趋势离差法进行修正,这些省份不再与其他省份一起进行数据修正,年度数据使用原数据,仅对月度数据进行必要的修正;第三种情况是原数据中月度数据缺失,即绝对量较小时仅统计年度数据不统计月度数据,这时可以根据专项调查或者相近年份的月度数据在全年中所占比例进行月度数据的修正。

6 不足与展望

(1)历史数据修正是一项复杂的工作,其复杂性不仅体现在修正方法的摸索研究和细节的技术处理上,还体现在如何做好数据修正的解释和说明,包括修正后数据与原数据的趋势差异,修正后数据是否可以更好地反映真实情况,并与未来数据有效衔接,因此还需要从这个角度进行更多的探讨和研究,以使修正结果更好地被公众理解和接受,更加广泛地应用于各项相关工作。

(2)修正的原则中提到需开展对修正后数据的评估工作,以确保修正方法的合理性和结果的可用性,这就需要引入适用的评估方法来进行科学完善的评估,比如数据自身趋势的合理性、和外部数据的匹配性、协调性等角度的评估,因此在后续研究中还需进一步加强评估方面的工作。

(3)本文在进行运输量数据修正时采用的是先研究确定统一的修正方法,然后开展实证分析的思路,并未采用多种方法进行修正进而对不同方法下的修正结果进行比较分析,从而摸索出更适合于运输量指标的修正模型,因此还需做更多的实证分析工作为修正模型的理论研究提供更好的数据支撑。

猜你喜欢
运输量水路月度
洗扫车低压水路系统优化技术研究
国内客运恢复快速 航司第一季度亏损程度收窄
水路
选择
9月份中国民航旅客运输量同比增长7.9%
宠物保险的漫漫试水路
月度聚焦
月度聚焦
月度聚焦
月度聚焦