曾华燕 郑琼芳 蔡铭洲
(1.深圳大学,深圳 518052;2.佛山市自然资源局顺德分局,佛山 528333)
在预测研究中,研究目标一般会被视为因变量,例如一个城市的年度公共交通客运量(包括公共汽车客运量和轨道交通客运量,不包括出租车客运量)。在现实生活中,公共交通客运量的影响因素一般包括该城市的人口情况、交通管理政策、居民出行习惯、公共交通服务水平,以及公共卫生条件、司乘人员的健康情况等。分析现实因素对因变量的影响,一般被称为因果分析或相关分析法。如果因变量影响因素的变化规律随时间的发展而保持大体一致,那么可以将在以往年份的因变量数值列成一个序列,将影响因素看成时间,采用预测函数来模拟因变量的变化规律,这种方法一般被称为时间序列预测方法[1-2]。
相对于因果分析法而言,时间序列预测法不需要采集很多现实数据,使用起来较为方便,能够迅速预测未来的客运量情况;但时间序列预测法无法一一辨别影响因素对因变量的影响程度,因此非常依赖于现实因素是否一直保持大体一致的变化规律。在一般情况下,人们可以利用以往若干年的数据,模拟得出一条时间序列曲线,如果预测值与真实数值的相对误差和标准差在可接受范围内,则认为此时能采用时间序列法来预测因变量在未来若干年的变化,以辅助管理者进行决策;在这种情况下,时间序列法是一种较为简便的、具有一定实用性的预测方法[1-2]。
(1)一般情况下,建议采用以下3 种函数来模拟时间序列的变化规律[1-2]:直线、指数曲线和二次曲线,曲线的参数可以采用最小二乘法来计算。
(2)计算出3 种曲线的预测方程之后,代入预测方程,可计算出往年的预测值。
(3)再计算出历年预测值和真实值之间的相对误差、以及误差平方和,来作为筛选预测曲线的指标之一;直线函数还可以采用相关系数来分析预测方程的准确性。
利用Excel 可以快速计算出预测曲线的各个参数;而如果需要手算的话,可以通过对时间单位进行简化,来快速提高手算速度,其预测准确度和使用软件计算原自然年份下的时间序列的准确度是相同的。
由于时间序列法的应用前提是假定因变量的影响因素随时间变化而保持大体一致,因此在理论上,当自变量采用线性变化时,也即时间年份发生线性变化时,相当于因变量在时间横轴上左右移动,因变量的具体数值不受影响,而时间数值的改变可以简化参数的求解过程。
本文利用直线方程来说明简化算法。用最小二乘法确定的直线预测方程的参数方程组为:
上述方程组中,在求解参数a 和b 时,如果对t 进行线性变换,即令T = t- k,并使得尽可能小,或使则能大大简化计算[1]。
在本文中,因变量为一个城市的公共交通客运量(包括公共汽车客运量和轨道交通客运量,不包括出租车客运量)。例如,根据深圳市统计年鉴数据[3],深圳市的公共交通客运量在2009-2018 年的变化情况如表1、图1 所示。
设:公共交通客运量为因变量y,年份为自变量t,则该序列是一个为期10 年的序列。y 和t 都可以加上下标来表示年份之间的差别,客运量为yi,时间为ti,i 为正整数(1、2、3……10)。
表1 深圳市公共交通客运量表
图1 自然年份下深圳市公共交通客运量的散点图
(1)使年份之和归零的简化方法
如前文1.2 节所述,若令T = t - k(k 为年份的平均值),使得可简化手算求解参数方程组的过程。
本例中,年份ti为自然正整数,是一个等差数列,其前n 项之和为:
此时,数据列表和折线图如表2、图2 所示。
由表2 可方便地计算得出式(2)各参数项的数据(表3)。
表2 年份简化后的深圳市公共交通客运量表(1)
图2 第1 种年份简化法得到的客运量散点图
表3 年份简化后的预测曲线参数
把表3 数据代入式(2),计算得出直线预测方程的参数项a,b。
这种简化方法使得相邻2 个时间数值的间隔仍是一年,上述表格中的数据序列是10 年,是偶数值,简化后的年份数据带有小数点;如果数据序列是奇数值,则年份数据可以关于纵轴对称,年份数据可以简化为正整数。
(2)使年份从1 开始的简化方法
也有将自然年份简化为从1 开始的方法,同样可以明显简化手算过程[1]。此时,令W = t - 2008,则数据列表和折线图如表4,图3 所示。
表4 年份简化后的深圳市公共汽车客运量表(2)
图3 第2 种年份简化方法得到的客运量散点图
采用第2 种简化方法后,关于简化年份数据W2的运算可以保持在百位数以内,比原来自然年份的千位数运算要简单,也能大大提高手算速度。接下来可以验算年份简化后所获得的预测数据,与用原自然年份计算获得的预测数据可以保持同样的准确度。
可以采用Excel 中的linest 函数计算预测结果,来验算分别使用原自然年份和两种简化方法所求得的预测数据。计算3 种年份数据的预测数据[1]如表5 所示。
将式(1)自然年份、简化年份T 和简化年份W 对应的3 组参数分别标记为a1 和b1、a2 和b2、a3 和b3,利用linest 函数计算出3 组参数(表6)。
由表6 中可以看出,3 条直线的斜率b 是一样的,区别在于年份在横轴上有了变化,使得直线在纵轴上的截距a 有所差别。
利用3 个直线方程代入3 种年份数据,可计算得到3 组相同的预测数值(表7)。其中,预测值与真实值相对误差 = (预测值-真实值) / 真实值。
从表7 中第一至第五列的数据可以看出,年份进行简化后,得到的预测数值是一样的。从第六列数据可以看出,直线方程预测值与真实值相对误差较小(〈±9%),在-7.83%~8.09%之间。
这意味着深圳市在2009 年至2018 年这十年间公共交通客运量发展趋势有较好的一致性,使用时间序列法预测公共交通客运量具有一定的准确度,其预测结果可以辅助管理者进行公共交通规划方面的决策[2]。当需要更高预测准确度、特别是当需要考虑实际因素来人为地调整公共交通客运量的发展变化时,需要使用相关分析法来进行分析和预测[1-2]。
表5 自然年份和两种年份简化方法的数据表
表6 自然年份和2 种年份简化方法对应的预测参数表
表7 自然年份和2 种年份简化方法得到的预测数据计算表
在满足一定的前提下,时间序列法是一种较为简便的预测方法,可以用于预测公共交通客运量的变化,以辅助管理者进行公共交通规划方面的决策;在使用最小二乘法来求解时间序列预测方程时,可以采用两种简化年份的做法来简化计算过程[1],能够得到同样的预测结果,有助于使用者更快地完成计算过程,并更好地理解时间序列预测法的本质含义。