严彦 侯剑
【摘 要】 为正确预测内河港口货物吞吐量,以江苏省主要内河港口为例,从港口设施及腹地经济出发,采用主成分分析法提取影响江苏省内河港口货物吞吐量的3个因素:第二产业值、地区生产总值及社会消费品零售总额,并在此基礎上建立预测模型。结果表明,模型可以较为准确地预测出江苏省主要内河港口的货物吞吐量,该模型拟合是有效的。
【关键词】 主成分分析;内河港口;货物吞吐量;影响因素;预测
0 引 言
内河港口是在河流、湖泊、水库等水域内建造的港口。内河港口与沿海港口一样,在综合运输网中充当“车站”的作用,是运输网络的节点,其对于水路运输而言具有非常重要的作用。内河港口货物吞吐量是指一段时期内经水运输出、输入港区并经过装卸作业的货物总量,是反映内河港口生产经营活动成果的重要数量指标,也是衡量该地区城市建设和发展的量化参考依据。[1]内河港口的发展将促进港口城市的繁荣,城市的繁荣又为港口货运提供有力的支撑,港口与城市之间具有相辅相成、协调发展的关系。此外,随着我国水路运输业的发展,内河港口在综合运输网络中的作用也越来越突出,正确预测内河港口货物吞吐量对港口城市的发展十分重要。
影响内河港口货物吞吐量的因素有很多,不仅有港口自身因素,还有港口腹地经济因素。正确选择指标对预测江苏省内河港口货物吞吐量十分重要。近几年来,针对内河港口货物吞吐量的研究不多,且大多是依靠经验来选取变量的,但这样的做法很可能由于经验的偏误而遗漏主要的影响因素,从而使得模型出现偏差。因此,本文在前人的研究基础上,选取2007―2015年影响江苏内河港口货物吞吐量的指标数据,采用主成分分析法提取影响江苏内河港口货物吞吐量最主要的几个因素建立预测模型,为预测江苏内河港口货物吞吐量提供重要参考。
1 建立模型
主成分分析法融汇了“降维”思想:利用线性组合的方法,将多个指标变成少数几个综合指标,使相关的指标化成不相关的指标,将问题简单化,在减少计算量的同时避免了由于信息重复所引起的虚假性。
设n个样品,x1,x2,…,xp-1,xp代表n个样品中各个样品观测的p项变量,得到初始数据阵为
X==(x1,x2,…,xp)(1)
式中: xi=(x1i,x2i,…,xpi)', i=1,2,…,p。
利用矩阵X的x1,x2,x3,…,xp这p个变量作线性组合,可得:
(2)
此外,主成分分析的步骤如下:
(1)建立样本矩阵;
(2)标准化初始数据;
(3)建立相关系数矩阵;
(4)根据特征值计算出方差贡献率及累计方差贡献率;
(5)求因子载荷矩阵:先取累计方差贡献率大于一定数值的主成分,然后求出所取的主成分的因子载荷矩阵,其中数值视解释精度而定,此处定为85%;
(6)求每个指标的综合得分:由因子载荷矩阵乘以主成分的方差贡献率可计算出综合得分,指标的综合得分可较全面地反应其影响程度[2]。
2 实证分析
2.1 指标选择依据及数据来源
根据江苏内河港口实际情况,选取2007―2015年可能影响江苏内河港口货物吞吐量的指标数据(见表1),其中包括总人口x1、地区生产总值x2、第二产业值x3、第三产业值x4、进出口总额x5、货运量x6、社会消费品零售总额x7、泊位个数x8、泊位长度x9。
2.2 主成分分析
2.2.1 计算方差贡献率
为了消除量纲的影响,首先对数据进行标准化处理,其次对标准化处理后的数据求其方差百分比及累计方差贡献率,结果见表2。由表2可以看出:第一主成分方差贡献率为82.833%,特征根为7.455;第二主成分方差贡献率为12.351%,特征根为1.112。前两个主成分的累计贡献率为95.184%,特征根也均大于1,满足特征值大于1或累计方差贡献率达到85%以上的提取原则,因此选取前两个主成分,剩余可舍去。
2.2.2 计算因子载荷矩阵
为了使3个主成分可以充分代表9个指标的信息,依据所提取的主成分计算因子载荷矩阵,结果见表3。
2.2.3 计算各项指标的综合得分及排名
在主成分分析中,每个指标的综合得分及排名状况可以直观地反映该指标影响江苏内河港口货物吞吐量的程度。指标的综合得分可由主成分因子载荷乘以相应的贡献率求出,具体结果见表4。由表4得知,综合得分排名前3的指标分别为第二产业值、地区生产总值、社会消费品零售总额,表明这3个指标对江苏省内河港口货物吞吐量的影响最大的因素,因此在预测江苏省内河港口货物吞吐量时要着重考虑。
2.3 吞吐量预测
根据主成分分析结果,以第二产业值、地区生产总值、社会消费品零售总额为自变量,运用SPSS 14.0软件建立预测模型。
由可决系数及F统计量(见表5)可知,调整后的可决系数为0.994,表明该模型对数据拟合优度较高。由于显著性<0.001,可以判断出所建立的方程是显著的并且自变量与因变量之间具有显著的线性关系。
因此,可建立江苏省内河港口货物吞吐量预测模型:
y=3.087.725 + 0.358 z1 + 6.085 z2 0.746 z3(3)
式中: z1代表地区生产总值; z2代表第二产业值; z3代表社会消费品零售总额;y代表内河港口货物吞吐量。
江苏内河港口货物吞吐量预测结果见表6。从表6可知,除了2008年外,模型预测值与真实值之间的误差均小于3%,表明该模型的拟合是有效的。
2.4 结 论
由以上分析得知,第二产业值、地区生产总值及社会消费品零售总额对江苏省内河港口货物吞吐量的影响最大,原因在于:
(1)在江苏省第二产业中,建筑业发展迅速,每年总产值都以20%以上的速度发展,使得江苏省成为全国同行公认的建筑大省。建筑业的发展带动了江苏省对建筑材料的需求,建筑材料需要通过内河港口进行运输,因而推动港口货物吞吐量的发展。此外,江苏的苏绣等纺织品很受国内外的欢迎,纺织品需要通过内河港口运往国内外,因而纺织品产量增加的同时也推动了江苏省内河港口货物吞吐量的提升,从而带动内河港口的发展。
(2)地區生产总值可以直接反映港口城市的经济发展状况,港口城市经济发展繁荣给港口货运提供了有力的支撑。江苏省地理位置优越、经济发达,2016年GDP达77 388.28亿元,在省级GDP排名中稳居第2。发达的经济为江苏省内河港口的发展营造了良好的环境,给江苏省内河港口货运提供了有力的支撑,促进了内河港口货物吞吐量的提升。
(3)生活必需品等一般消费品是内贸集装箱的主要货物,在促进港口货物吞吐量增长方面会起到一定的促进作用;但是在模型中,社会消费品零售总额的系数估计值为负数,这是由于江苏省内河港口集装箱使用量不能很好地满足社会消费品的需求,还需进一步加大集装箱的使用力度。集装箱的推广使用不仅可以降低货物运输过程中的损失、节省货物转运装卸的时间,而且还可以大大降低运输成本,为江苏省内河港口发展带来更大的机遇。
3 结 语
采用主成分分析法提取出影响内河港口货物吞吐量最主要的3个因素,打破在研究内河港口货物吞吐量影响因素时凭借经验选取变量的传统思想;以主成分分析结果为基础建立预测模型,为内河港口进一步发展提供有力的模型数据支撑,打破在研究内河港口货物吞吐量时只单一地研究影响因素或只单一地进行预测分析的传统思维。以江苏省内河港口为例进行预测分析,结果表明模型可以较准确地预测江苏内河港口货物吞吐量。
对港口的外部影响因素有很多,如政策的调整、国际环境的改变等都会对内河港口货物吞吐量造成一定的影响,因此该方法较适用于中短期研究,对于研究长期内河港口货物吞吐量还需进行进一步的分析和论证。
参考文献:
[1] 真虹.港口管理[M].2版.北京:人民交通出版社,2009.
[2] 张萍,张守国.江苏沿海港口吞吐量影响因素及预测分析[J].水运工程,2011(10):63-65.