杨新湦,王梓旭
(中国民航大学 a.中欧航空工程师学院;b.空中交通管理学院,天津 300300)
复杂网络是一种用来描述自然科学、社会科学以及工程技术中相互关联的理论。自从文献[1]研究小世界网络和文献[2]探索无标度网络开始,复杂网络构型和特性的研究进入了全新的领域。有国外学者指出,自然界中存在的各种复杂系统都可以通过形形色色的网络加以描述,如生物网络、社会网络、计算机网络、电力网络以及交通网络等。通过对世界航空网络和北美航空网络的研究得出:世界航空网络是一个小世界网络,有着幂律下降的度分布[2]。文献[3]指出航空网络区别于其他复杂网络。国内学者也应用复杂网络方法对航线网络进行了积极探索。文献[4]对国际航空客运网络做了系统分析,得到其度分布有双幂律特征。文献[5]基于121个通航城市对中国航空网络基本性质做了相关研究,也得到类似的性质。近些年学者们着眼于更为细节的网络,如春运期间中国航空网络,介-度总体呈现较明显的指数相关性,在度值较小时呈现出较大的“波动性”,小城市向大城市聚集[6]。航空货运网络呈东南密西北疏的态势,度分布呈指数分布,不同于客运航线网络的幂律分布[7]。枢纽机场航线网络连接效率逐年增长,网络演变具有异速增长特征[8]。文献[9]运用市场集中度模型对中国国际客运航空网络的演化进行了分析。文献[10]基于复杂网络探讨了航空运输的复杂性。但是,在已有的文献中,没有从航线网络多种特征的变化入手探索网络结构的变化,以及变化在现实中的表现,现有的网络结构划分的方法也差强人意。因此,本文基于中国机场统计公报中所列出的机场(不包括港澳台地区)和飞常准中的中国国内航线数据,对中国的航线网络结构及抗毁性做分析,探究其特性。
本文研究了中国218个机场及其5 573条航线数据,利用pajek可视化软件,将各机场经纬度坐标转化为平面直角坐标,绘制中国有向航线网络图,以便从宏观上了解整个网络,如图1所示。由图1可以明显地看出:中国大部分航班量集中在东部地区。往西航班量呈递减趋势,西部有乌鲁木齐和拉萨这两个主要航班量集中点,也是与东部地区连接的主要途径,西部地区的其他城市很少与东部地区直接相连。
度是描述单节点属性的基础,是非常重要的概念。在航线网络中,节点代表机场,度代表机场在航线网络中的性质。无向网络中节点i的度ki定义为与节点直接相连的边的数目。有向网络如航线网络的度分为出度与入度,每个节点出入度之和为节点总的度数,即机场所拥有的航线数量。
以机场节点的总度数为数据源建立邻接矩阵,航线集中在小部分机场。度值最大的是西安咸阳机场,为135;最小的是富蕴机场,为1。网络的平均度为25.03,即平均每个机场约与25个其他机场直接相连。
度分布从概率论的角度来看就是从网络中随机选取一个节点,其度为k的概率P(k)。在探究度分布性质时,本文采用每个节点的总度数。将度k和P(k)绘制在双对数坐标系中,进行拟合,度分布见图2。由图2可以看出:度分布曲线依然有双段幂律分布的特点,其幂指数λ越小,说明节点度分布差异越小。幂律分布转折点在度为43处。实际上,度小于43的机场节点占总数的87%,度值为1~43;度大于43的节点占总数的23%,度值为47~135。后段的λ值为4.0,明显大于前段λ值(1.7),说明后段度值范围广、节点数量小,度分布变化快;前段则相反。中国的航线网络呈现双幂律无标度特性(绝大部分度值相对较低的特性称为无标度性)。
图1 中国有向航线网络图图2 度分布
度相关性是二阶度分布的描述,其中,同配系数r刻画网络同配异配的程度[11]:
(1)
其中:r∈(-1,1),r的大小反映网络同配异配强弱程度;r﹥0,网络是同配;r﹤0,网络是异配。
通过MATLAB软件,得到中国航空网络的同配系数r=-0.248 8,是异配网络,即点度小的机场节点倾向于直接和点度大的枢纽机场相连,这就导致如果点度大的枢纽机场发生延误,那么延误网络在整个航空网络中易于传播。
一般地,假设复杂网络中的一个节点i有k条边将其和其他节点相连,这个节点就是节点i的邻居节点。显然,在ki个节点之间最多可能有ki(ki-1)/2条边。而ki个节点之间实际存在的边数E1(i)和总的可能存在的边数ki(ki-1)/2之比定义为节点i的聚类系数CC1i。度为1时,CC1i无穷大。
(2)
整个网络的聚类系数就是
(3)
很明显CC1小于1,只有复杂网络中任意两个节点之间直接相连时等于1。中国航线网络的簇度
图3 聚类系数与度的相关性
相关性通过图3展示。当度较小时,无明显相关性;当度大于30时,则有负相关性。
节点i与j之间的距离dij表示连接这两个节点的最短路径上的边数目,网络的平均路径长度L定义为任意两点之间距离的平均值[6]:
(4)
通过MATLAB软件计算得L=2.091 67,说明机场节点之间平均通过一次转机就可到达。网络的直径为4,即两个机场节点间最大的转机次数为3,航线是从佳木斯到阿拉善。
(Ⅰ)介数中心性。以经过某个节点的最短路径的数目来刻画节点重要性的指标。对于枢纽型的航线网络来说,定位为国内枢纽机场的介数应该比较大。介数定义式[11]为:
(5)
(Ⅱ)接近中心性。对于网络中的每一个节点i,可计算该节点到网络中所有节点的距离的平均值[11],记为di,有:
(6)
其中:di值的相对大小在某种程度上反映了节点i在网络中的相对重要性,di值越小意味着节点i更接近其他节点。把di的倒数定义为节点i的接近中心性:
(7)
将航线网络中各机场节点的大小正比于其介数中心性和接近中心性重新构建网络图,分别得到图4a和图4b。
(a) 介数中心性
(b) 接近中心性
图4 基于介数中心性和接近中心性的中国航线网络
图4a中介数最大的是西安咸阳机场,为0.101 898;北京首都机场介数为0.090 000,广州白云机场介数为0.070 000;整体的介数水平不高,介数最高的节点对于网络中的交通流动具有最大的控制力,说明枢纽网络还不健全,枢纽功能有待提升。图4b中全国绝大部分机场的接近中心性相差不大,究其原因,现今支线小机场都纷纷与主枢纽机场通航,而与枢纽机场通航后转达各地的路径长度就大大减小,对于枢纽机场来说因为大多机场都想与其通航,所以其平均路径长度不大,这就使得接近中心性的差别不大。但是各支线小机场之间以及区域枢纽之间通航水平较低,就使得介数水平整体偏低。
结合文献[4]、文献[5]和文献[10]的研究经验,分析中国航线网络的基本性质在近些年的演化,如表1所示。
表1 中国航线网络基本性质演化表
从表1中可见:随着年份的演变,网络一直具有较小的平均路径长度和较高的聚类系数,说明中国航线网络具有小世界特性。机场节点逐渐增加,使网络通达性提高,而聚类系数下降表明网络机场节点更倾向于连接枢纽节点机场,即与少数枢纽节点机场直接相连的节点机场增加,这对于优良的航线网络构建是不利的。一方面,枢纽机场的航班延误会容易传播至其他节点;另一方面,与北京首都机场等定位为国际枢纽的机场直接相连的中小支线机场过多,就占用了过多的航班时刻,从而使国外通航城市的航班没有充足的资源,发挥不了其国际枢纽的作用。实际上,在2018年,北京首都机场国际航班只有23.2%,旅客量占比26.3%,高频次国际航线数量少。与北京首都机场通航的国内支线机场中,年旅客吞吐量小于200万人次的机场有81个,时刻份额占总时刻份额的16%,航线旅客量仅占国内旅客量的12%,而这样的结构使北京首都机场产生的延误传播速度与广度也是中小机场不能解决的问题。疏解北京首都机场的压力,彻底转变其职能对于合理航线网络的构建也是至关重要的。
抗毁性通常指网络在遭受随机攻击或蓄意攻击时保持其功能的能力[12]。航线网络对于随机节点攻击的抗毁性,在实际问题中就是机场因为天气、设备维修限制等因素而不能使用时对全局网络的影响。蓄意攻击主要是根据某种依据对机场节点或者连边进行刻意攻击,使整个网络瘫痪[13],多见于战争或恐怖袭击。
衡量抗毁性的指标通常有网络效率(网络平均路径的倒数)、最大连通子图中节点的比例和聚类系数等,在探讨以上网络常见特性的基础上,分别以这3个指标衡量网络在随机连续攻击与蓄意连续攻击中的抗毁性,其中,蓄意攻击分为介数排序攻击和度排序攻击。以图1中的网络进行仿真实验,结果如图5~图7所示。
图5 网络效率损失抗毁性
图6 聚类系数损失抗毁性
图7 最大连通子图抗毁性
由图5和图6可知:从网络效率损失的比例和聚类系数损失的比例不能很明显地看出蓄意攻击中,介数排序攻击和度排序攻击的效果差异。而图7通过最大连通子图节点数比例指标,可以较明显地看出介数排序攻击的效果更好,更能反映整个网络的连通状况,更好地表达网络性能。由图7可知:当介数排序攻击节点数小于10%,就可以让网络性能下降到60%;攻击节点数为50时,网络性能下降到原来的10%;攻击节点数为60左右时,网络性能下降为0。而随机攻击的抗毁性就明显要好很多,这是因为只有少数枢纽机场在全局网络中起到关键作用。
网络结构划分是对网络结构组成的进一步探索,各个网络社团内部的节点之间连接较为紧密,每个社团之间的连接相对来说就比较稀疏[14]。Louvain算法是基于模块度的社团发现算法,该算法在效率和结果上都有很好的表现,并且可以展示社团结构的层次性。下面引入模块度的概念。模块度是衡量网络划分好坏的度量方法,其含义是社区内节点的连边数与随机情况下(零模型)的变数之差[15],定义如下:
(8)
其中:aij为实际网络的邻接矩阵;M为图中所有边的权重值和;Ci与Cj分别表示节点i与节点j在网络中所处的集团,如果Ci与Cj属于同一集团,σ取1,否则σ取0;ki与kj分别为原网络中节点i和节点j的度。
网络结构程序流程图与划分结果分别见图8和图9。从图9可以看出:网络结构划分为4部分,分类明显与地域有很大关系。其中:红色为东北地区;绿色为西北地区;黄色和蓝色为西南地区和东南地区。东南地区(珠三角和长三角)航线网络最为密集,其次是西南地区(围绕昆明、重庆和成都),以乌鲁木齐为核心的西北地区最为稀疏。在结构划分中也有特殊存在,北京首都机场没有划分到京津冀或东北地区,而是划分到西南地区,说明首都机场与西南地区联系比东北地区多。上海两个机场被划分到不同区域,上海虹桥机场与北京首都机场处于同一结构划分,上海浦东机场被划分到东北地区,说明其联系东北地区较多。这几个大型枢纽在结构划分中体现出跨地域的特点。东南地区与西南地区机场交错划分,没有明显的界限与特点。
图8 网络结构程序流程图
图9 中国航线网络结构划分
通过应用复杂网络对中国航线网络进行研究,发现中国的航线网络结构是小世界网络,有着较短的平均路径和较大的聚类系数。整体上有待完善,要改变过多支线小型机场与国内一级枢纽直接通航的情况。从近年网络性质的变化可知:中国正在努力建设枢纽型的航线网络结构,不过枢纽型网络由于其自身的特点,容易导致延误的波及效应,在现今网络的优化上减缓延误传播的广度与速度是亟待解决的问题。通过对航线网络的划分可知:中国的航线网络结构与地域有相关性。本文是对中国航空网络的初步探索,还有一些网络的性质未提及,此外,对航空网络的影响因素考虑尚有不足,将在以后继续这方面工作。