基于系统聚类的港口平均装卸效率分析

2017-09-26 08:32滕志强王晓峰
现代计算机 2017年21期
关键词:吞吐量聚类港口

滕志强,王晓峰

(上海海事大学信息工程学院,上海201306)

基于系统聚类的港口平均装卸效率分析

滕志强,王晓峰

(上海海事大学信息工程学院,上海201306)

港口吞吐量反映出港口整体发展状况,港口平均装卸效率能从细节上反映出港口的运作状况。构造港口装卸效率模型,从平均装卸效率出发,利用系统聚类的方法对我国23个港口进行聚类分析,综合分析港口吞吐量与港口效率研究港口发展现状,有助于明确港口现状以及未来发展策略的制定,提高核心竞争力。

装卸货效率;系统聚类;港口

0 引言

近年来,我国经济和航运事业的蓬勃发展,使得航运成为了一个重要的运输方式,而港口则是这个运输过程中的一个重要环节,是沿海以及顺江城市的一个重要经济资源,港口发展对于这些城市的经济有着直接的影响[1],另外我国改革开放是从沿海城市开始,并以港口群为纽带带动区域经济快速发展,港口的快速发展带动了相应的经济圈的经济以超过其他地区更快的速度发展[2]。港口的迅速发展虽然给当地城市带来了巨大的经济效益,但是如果不能掌控港口发展状况,会引起很多不良问题,例如港口管理不当导致的效益低下,临近港口的盲目投资导致功能重叠而造成资源浪费等。因此我们要针对港口进行必要的评价与分析,从历史业务数据出发,挖掘港口潜在规律,这样有利于明确港口的发展现状和前进方向,实现港口在实际运营中发现问题、解决问题从而不断提高核心竞争力。

目前港口评估研究多以吞吐量作为主要依据,例如Turner,H.S.结合北美港口产业竞争特征与过剩投资和终端吞吐量的关联性,仿真研究港口管理集装箱租赁政策与吞吐量的关系,进一步考察了港口系统绩效[3],杨莹等人通过港口进出口货物吞吐量的聚类分析对我国主要港口进行分析定位[4],刘晓玲等人,以日本濑户内海地区港口吞吐量和集装箱吞吐量来表示地区港口发展状况,利用灰色关联分析法对各县港口与产业发展间的关系进行分析研究[5],焦新龙等人建立了港口物流层次分析模型,选用基于"差动"原理的赋权法计算各指标的权重,应用模糊综合评价法对其进行绩效综合评价[6];此外,港口物流效率方面研究也取得了丰硕成果,例如Bichou K与Gray R通过物流和供应链管理方法概念化港口,提出一个港口业绩框架,对港口业绩进行评估[7],邓娟从运输枢纽、物流服务、资源配置等对港口效率进行了多方面的研究[8]。以上研究表明,现阶段港口评价研究的主要因素是港口的物流能力,港口的吞吐量或者某类货物的吞吐量。吞吐量反映了港口的作业量,是评价港口的重要依据之一,但港口平均装卸效率更能反映港口的管理水平和竞争力。

在港口吞吐量方面,较大港口对较小港口在吞吐量方面的天然优势,在物流效率方面,港口周围基础设施影响对港口的最终分析与评价。因此本文构建了港口装卸效率模型,以港口的平均装卸效率为主要标准、港口吞吐量为参照更加科学合理地对港口的发展以及核心竞争力进行评估。

本文利用系统聚类的方法,依据港口的平均装卸效率对港口进行聚类分析,是从一个全新的方面,更加细致化地去分析港口的发展与评估。聚类结果的分析可以展现港口之间、港口自身的优劣以及业务重叠区,凸显港口的定位与特色业务,也可以作为港口发展定位和评价的一个依据。

1 数据预处理

本文的原始数据源于船舶到离港时间和装卸作业量等实际生产记录,由于现实生产过程复杂和人工操作不规范等因素,导致存在很多无效的数据记录,无法直接应用。因此,在进行数据聚类分析之前有必要对数据进行预处理。具体处理如下:

(1)数据存储方式转换。原始数据Excel格式不方便数据的处理,所以利用Navicate for MySQL把Excel记录储存到MySQL数据库中。

(2)数据处理。对以下的几种情况采取的处理方式:

①数据缺失。缺失数据元素的处理分为两种情况:第一种情况,缺失的数据元素不能补全,这种情况进行删除操作;第二种情况,缺失的信息元素可以通过其他信息元素进行补足,这种情况采取信息补录的方式。例如,某条记录的停靠港口缺失,但是机构名称存在,可以根据机构名称对停靠港口进行补录。

②数据匹配。原始数据的出港卸货记录和进港装货记录是分别储存的,不能达到本文数据要求,所以对出港卸货记录和进港装货记录进行匹配,并保存到MySQL数据库中。

③数据过滤。根据日常规律,船舶停靠港口时间一般不小于0.1天、不大于20天,所以对结果数据中超出该范围的数据进行过滤,降低对结果的影响。

④港口名称一致性。港口名称变更以及港口合并等因素造成了港口名称记录的不一致,在数据处理之后手动进行港口名称统一,例如:宁波港和舟山港合并后的名称宁波-舟山港;还有一些记录的是港口区域名称,例如:佛山港,在记录中则有佛山顺德、佛山三水等。

2 港口装卸效率模型

平均装卸效率不同于港口效益、港口效率和港口作业效率。港口效益是从港口为使用者通过功能服务效用最大化的角度提出的;港口效率是以港口为研究对象,根据港口的投入情况计算港口最大产出的能力,即港口配置各种资源投入的能力[9];港口作业是指船舶进出港口而进行的各个环节的操作,包括进行调度、装卸货物、排除障碍等,港口作业效率是港口对于船舶进入港口一系列活动做出应对的能力;而平均装卸效率则是在港口现有设施以及资源的情况下,单位时间内对货物装卸的能力。因此根据平均装卸效率评估港口必须考虑到港口的管理水平,资源利用率以及员工整体素养等因素,多方面分析在现有设施的基础上制约平均装卸效率的影响因素。

港口装卸效率模型研究的统计时间为季度。因为船舶停靠港口装卸货物的时间有的3天或者5天、有的10多天之久,把天或月作为单位时间可能会因为短时间内货运量的激增或者骤减对装卸货的效率产生较大影响,不能很好的反映出港口的平均装卸效率,因此把季度作为了该模型的统计时间计算出港口的平均装卸效率。通过系统聚类,分析港口自身不同年以及港口之间在同年的不同季度的平均装卸效率变化,明确港口自身的现状,突出港口的优势以及影响港口平均装卸效率的季度因素,同时也不会因为短时间的货运量突变而影响平均装卸效率的整体趋势。

设港口一个季度内的吞吐量为W(单位:TEU3TEU:是英文Twenty-foot Equivalent Unit的缩写,是以长度为20英尺的集装箱为国际计量单位,也称国际标准箱单位。),所有船舶停靠港口的总时间为T(单位:天),船舶装卸货物的平均效率为V(单位:TEU/天),可以得出单个港口的平均装卸效率:

聚类算法把符合条件的多个港口合并为一类,设合并港口类的平均装卸效率为V0(单位:TEU/天),该类包含的港口为gi(i=1,2,…,n),对应的停靠港口时间为Ti(单位:天),在gi港口的装卸货量为Wi(单位:TEU),可以得到合并后港口类的平均装卸效率:

3 系统聚类法

初始状态将每个港口看作是一个类别,然后计算港口与港口之间的特征距离,选择特征距离最小的一对合并成新的一类,计算新类与其他类之间的特征距离,再将特征距离最近的两类合并,循序渐进,直至所有的港口归并一类为止。

设Gi表示港口类别,把G1,G2,G3,G4,…,Gn各自成一类,Vi表示Gi的平均装卸效率,dij表示Gi与Gj之间的特征距离:

聚类步骤:

(1)使用式(3)计算各个港口类之间的距离,得到特征距离矩阵D0,各港口集合自成一类。

(2)在矩阵D0非对角线的元素中找出最小元素,设为dij,将Gi和Gj合并成一类GM1,则{gi,gj}即GM1的全部样本港口,使用式2.2计算出GM1的平均装卸效率。

(3)使用式(3)计算GM1与其他港口类别的距离,得到距离矩阵D1。

(4)重复(2)(3)步骤,直到所有的港口类别归为一类。

例:现在有G1、G2、G3和G4,各个港口类的平均装卸效率为15TEU/天、13TEU/天、20TEU/天、16TEU/天,第一步计算出D0矩阵(因为通过特征距离得出的矩阵式对称矩阵,所以现在只展现上三角矩阵)为:

纳入标准:(1)具有脊髓型颈椎病的典型症状如肌力、感觉减退,病理征阳性等,经至少6个月保守治疗无好转者;(2)经MRI确认压迫节段至少≥3个;(3)随访时间至少为1年,并有完整的随访期复诊资料。排除标准:(1)主要症状表现为根性或轴性症状,而非压迫脊髓引起;(2)合并有后纵韧带骨化、椎管狭窄、黄韧带肥厚、骨折或肿瘤等其他颈椎疾病;(3)接受前后路联合手术,或过往经历颈椎手术者。

第二步:可以从D0中看出G1和G4的特征距离最近归为一类成为GM1。

第三步:计算GM1与其他类的特征距离,得到特征距离矩阵D1:

第四步:重复第二、三步骤,直到所有的分类都归为一类为止。

4 港口的聚类分析

4.1 港口业务数据选取

2012年到2014年港口集装箱贸易量由高到低排名,把连续三年都在前三十内的港口作为聚类分析对象,满足此条件的港口有大连、东莞、佛山、福州、广州、海口、连云港、南京、宁波-舟山、钦州、青岛、泉州、日照、厦门、汕头、上海、深圳、太仓、天津、温州、武汉、张家港、重庆二十三个港口,总吞吐量在三年中均占全国的70%以上(注:本文仅作为学术研究,为了客观的进行评价,所以在文章中仅以数字代表各个港口)。

以集装箱为例,探讨不同港口集装箱平均装卸效率业务类型的聚类分析。

4.2 聚类结果

(1)港口平均装卸货效率的聚类分析

系统聚类把港口自然形成了不同的类别,各个类别按照A、B、C各自的平均装卸效率依次降低,并把每年各类别平均效率以柱状图的形式呈现,更加清晰地呈现每年四个季度平均装卸效率的差异。

图1 2012年各季度分类情况柱状图

图2 2012年各季度分类情况柱状图

表1 2012年各季度聚类结果

图3 2013年各季度港口聚类谱系图

图4 2013年各季度分类情况柱状图

系统聚类算法根据港口平均装卸效率把港口分成了不同的类别,由表1、表2和表3可以得出,港口类型大致可以分为三类:一、港口装卸效率在总体中保持平稳的地位,在聚类结果中季节没有对其造成明显的影响,例如19号、1号等港口;二、季节对该类港口有明显的影响,在不同的季节港口分属于不同的聚类类别,例如:22号等港口;三、该类港口对季节的敏感度不高,但是随着季节的变化在聚类类别中有一定的改变,例如:6号等港口。另外,从图2、图4、图6的柱状图,可以清晰看出,对应季度平均装卸效率也存在差异,并且各个季度聚类的类别之间的差值也随着季节变化呈现了不同的波动。

表2 2013年各季度聚类结果

图5 2014年各季度港口聚类谱系图

图6 2014年各季度分类情况柱状图

表3 2014年各季度聚类结果

(2)平均装卸货效率与吞吐量的综合分析

基于前一小节的聚类结果,本节把港口的吞吐量与装卸效率进行比对,综合分析论证该模型的合理性(以2012年的数据为例)。纵轴表示吞吐量排名,横轴表示平均装卸货效率的排名,散点标签代表港口号码。

图7 2012年港口吞吐量与平均装卸效率散点图

实虚线是辅助线(两端的点是标点),用来更好展示各个港口在吞吐量与平均装卸效率方面的优劣势。两个实线之内的港口,吞吐量和平均装卸效率都能兼顾,并且越靠近虚线与远点越优秀;分布在绿色实线与纵轴区域内的港口,从效率上优于其他的部分港口,但是吞吐量却劣于其他港口,在量上表现不佳;反之,分布在蓝色实线与横轴区域内的港口,吞吐量排名占据了很靠前的位置,从量上优于其他部分港口,但是平均装卸效率排名却低于其他港口,在效率上处于劣势。

吞吐量从量上反映出了一个港口的整体发展现状,也是港口实力的一种表现形式,同时它的变化趋势也反映出了港口的潜在发展能力[9];而平均装卸效率则是从细节上反映出当下港口的运作状况,也反映出了港口的管理水平,它的状况直接影响了未来一段时间内港口的发展水平。结合前一小结的聚类结果再综合港口季度吞吐量的分析可以发现有一部分港口吞吐量与装卸货效率大致是一致的,但是不管哪个类别都普遍存在着装卸效率和吞吐量非正相关的现象。

通过对所选港口的聚类结果分析,可知港口资源条件对港口的发展有着直接的影响,吞吐量高的港口资源条件明显优于吞吐量较低的港口,由图4-7可知,部分高吞吐量港口的平均装卸效率却没有提升到相应的高度,说明了该类港口的管理水平有限,资源配置的优化需要进一步的加强。不同的季度港口平均装卸效率的变化对经济状况敏感度很高,在经济较好的情况下平均装卸效率基本不受季节的影响,但是在经济不景气的情况下影响比较突出。2012年国内装备工业、高耗能行业、轻纺行业、海关统计的贸易等方面经济增速比2011年明显回落,而2013年相交于2012年有着良好的发展期望[10],因此在图2、图4中,2012年的港口平均装卸效率波动较大,2013年港口平均装卸效率则表现相对平稳。除此之外,港口装卸一线工人的整体技能以及港口信息化建设也在一定程度上影响着港口的平均装卸效率。

5 结语

本文构建了港口装卸效率模型,综合港口平均装卸效率和吞吐量对选出的23个港口进行了研究分析。以2012—2014年我国港口贸易统计数据为基础,通过系统聚类的方法对选出的23个港口进行聚类分析,挖掘港口平均装卸效率存在的季节性特征和规律,港口可以根据聚类结果结合自身现状在不同时间采取适当的措施提升自身效益。考虑到港口吞吐量也是反映港口现状特征的主要特征之一,在聚类结果的基础之上引入了特征变量—港口吞吐量,通过散点图的方式展示,清晰的呈现出港口平均装卸效率与吞吐量的关系,更加精确明了地反映出港口的发展情况与管理现状,为港口未来的宏观发展与具体管理运营提供可靠的参考依据。

[1]游道柱.长三角集装箱港口布局研究[D].大连海事大学,2011.

[2]邓超风.环渤海主要港口吞吐量预测模型研究[D].武汉理工大学,2006.

[3]Turner H S.Evaluating Seaport Policy Alternatives:a Simulation Study of Terminal Leasing Policy and System Performance[J].Maritime Policy&Management,2000,27(3):283-301.

[4]杨莹,王晓峰,顾美玲,等.基于聚类法的港口业务类型分类[J].水运管理,2016(05):16-18+25.

[5]刘晓玲,姚岳林,杨忠振.基于灰色关联分析和综合评价法的港口与产业发展关系研究[J].水运工程,2011(05):70-74.

[6]焦新龙,刘雪莲,马天山.港口物流绩效定量评价理论及应用[J].经济地理,2009(12):2034-2038+2079.

[7]Bichou K,Gray R.A logistics and Supply Chain Management Approach to Port Performance Measurement[J].Maritime Policy&Management,2004,31(1):47-67.

[8]邓娟.基于功能演进的港口效率内涵解析及实证研究[J].河北大学学报,2011,36(6):100-105.

[9]李世泰.港口核心竞争力影响因素及分析评价研究[J].特区经济,2006(7):327-328.

[10]许宪春.2012—2013年经济形势分析和展望[J].全球化,2013(2):18-36.

Analysis of Port's Average Efficiency of Cargo-Handling Based on System Clustering

TENG Zhi-qiang,WANG Xiao-feng

(College of Information Engineering,Shanghai Maritime University,Shanghai 201306)

Port throughput reflects the overall development of the port.The port's average efficiency of cargo-handling reflects the operation of the sit⁃uation in detail.Constructs the port's average efficiency of cargo-handling model,considers the port's average efficiency of cargo-handling as a characteristic variable and analyzes 23 ports in China by using the method of system clustering.The results contribute to clarify the sta⁃tus of the port and make the future development strategies to improve the core competitiveness.

1007-1423(2017)21-0010-06

10.3969/j.issn.1007-1423.2017.21.002

滕志强(1990-),男,河南周口人,硕士研究生,研究方向为航运数据挖掘;王晓峰(1958-),男,教授,博士生导师,研究方向为数据挖掘与知识发现、人工智能、航运信息化;;

2017-04-28

2017-07-15

Port's Efficiency of Cargo-handling;System Clustering;Port

猜你喜欢
吞吐量聚类港口
聚焦港口国际化
中国港口,屹立东方
港口上的笑脸
数种基于SPSS统计工具的聚类算法效率对比
面向WSN的聚类头选举与维护协议的研究综述
改进K均值聚类算法
2017年3月长三角地区主要港口吞吐量
2016年10月长三角地区主要港口吞吐量
2016年11月长三角地区主要港口吞吐量
惠东港口