地铁网络无标度特性分析

2013-12-29 07:17王志如梁作论袁竞峰李启明
关键词:幂律标度数目

王志如 梁作论 袁竞峰 李启明

(1东南大学土木工程学院,南京210096)(2中国电子科技集团公司南京第十四研究所,南京210031)

网络的标度特性是复杂网络研究的一个重要领域[1-4].网络的标度特性决定网络演化的连接机制[2].对地铁网络标度特性的研究是了解地铁网络的内在演化机制、建立地铁网络演化模型及研究地铁网络动力学问题的基础.

目前对地铁网络标度特性的研究,主要有数学归纳法和数理统计法.基于数学归纳法的地铁网络节点度分布模型的假设条件比较严格,如Angeloudis 等[5]构造的地铁网络节点度(节点被连接次数)均为偶数,与实际并不相符.基于数理统计的地铁网络标度特性研究分为以节点(地铁车站)被连接次数作为节点度计算指标和以经过节点的线路数目作为节点度计算指标.前者指该车站连接到其他车站的次数,经实证分析得到地铁网络度分布服从指数分布[6-7]、Possion分布[8]、幂律分布[9-10].后者指经过该车站的地铁线路数目,Derrible 等[1,11]通过实证分析得到15个地铁网络度分布服从幂律分布.

在以线路为演化单位的交通网络中,“节点被连接次数”不能够反映实际网络的演化机理,而以“经过车站的线路数目”作为评价度分布的指标才具有实际意义.虽然Derrible 等[1,11]提出的“经过车站的线路数目”的评价方法有很大改进,但由于因变量“给定节点度对应的节点数目”因网络规模而异,不同网络之间不具有可比性,频次不同于概率值,运营线路数目不具有唯一性.基于以上不足,本文提出基于经过车站拓扑线路数目的节点度分布评价方法,通过改进线路计量方法、函数因变量方面的不足,增加拟合回归样本,改进拟合方法,得到地铁网络节点度分布函数.

1 地铁网络标度评价方法

1.1 拓扑线路定义

节点度定义为经过车站的拓扑线路数目.拓扑线路是指网络中存在的有固定的、物理形态上的复线轨道(复线是指含有双向独立轨道的线路),不同于运营中所指的线路.运营线路依赖与拓扑线路,相同的拓扑线路可以有不同的运营方式,例如,在图1所示的拓扑网络中,最多可以产生6条运营线路,分别是:运营线路1-4,4-2,4-3,1-2,1-3,2-3,6条线路通过不同的组合可以产生多种运营方式.因此,拓扑线路具有唯一性,而运营线路不具有唯一性.

图1 含有2条拓扑线路的网络

1.2 标度评价指标

给定地铁网络中含有拓扑线路L1,L2,…,La,节点i的度Li定义为经过该节点的拓扑线路数目,令Lj=1,j=1,2,…,a,节点i的度表示为

(1)

地铁网络节点度的分布用分布函数P(L)来描述,P(L)表示一个随机选定的节点度恰好为L的概率,viL表示如果节点i的度为L,则记为1,否则为0;V表示地铁网络节点数目,基于经过节点线路数目的度分布函数表示为

(2)

将被解释变量P(L)作为函数的因变量,是基于如下2个原因:① 原始的解释变量和被解释变量的函数形式与其累计分布一般都不相同[12],也就是说,无法通过累计的度分布函数得到地铁网络的演化机制.② 双对数化过程会导致残差的增加,影响拟合效果.

1.3 回归检验方法

最大似然估计(MLE)和普通最小二乘法(ordinary least squares,OLS)是最为常见的统计拟合准则.Goldstein等[13]认为MLE结合Kolmogorov-Smirnov (KS)检验更加适用于幂律分布的参数估计.然而,MLE适用于大样本参数估计,在小样本中会低估残差值.由于52个地铁网络样本中,数据点最大为6个,因此MLE不适用于本研究.而OLS无论样本大小都是取残差平方的最小值,因此本文选取OLS作为参数估计方法.

拟合效果检验通过非线性回归的拟合优度系数R2和残差平方和SSE检验[12],当R2接近于1,且SSE接近于0时,认为拟合效果很好.

2 案例分析及讨论

2.1 基础数据

地铁网络按照单模式网络L-Space建模方式[14];采用人工识别方法统计拓扑线路数目;节点度由线路搜索算法计算;52个地铁网络样本节点度分布部分基础数据见表1.

2.2 节点度分布函数拟合

在52个地铁网络样本中,10个地铁网络样本含有大于3个数据点(见表1),21个地铁网络样本含有3个数据点,21个地铁网络样本有2个数据点.由于度分布函数至少含有1个回归系数、1个常量,所以在52个地铁网络样本中,剔除含有2个数据点的21个样本.含有大于3个数据点的10个地铁网络样本的度分布折线图如图2所示.

图2 含有大于3个数据点的10个地铁网络样本的度分布折线图

表1 52个地铁网络样本的标度分析部分基础数据

由图2可见,在地铁网络中,只有1条拓扑线路经过的节点概率为0.743~0.946,有2条拓扑线路经过的节点概率急速下降到0.054~0.176,节点同时被3条及以上拓扑线路经过的概率就更加小.这种现象与幂律分布中“大多数节点只有比较少的连接,而少数节点有大量的连接”性质[15]一致,因此,初步估计地铁网络度分布形式为幂律分布.本文选取3种函数对地铁网络度分布进行拟合,分别是一般形式的幂律函数[16]f(x)=axb、漂移幂律(shifted power law,SPL)[17]f(x)=(x+a)b,及纵轴平移(longitudinal shifted power law,L-SPL)的f(x)=axb+c幂律函数,拟合回归参数及检验结果见表2.

表2 3种函数对含有大于3个数据点的10个样本的拟合回归参数及检验结果

由表2可见,在置信度为95%的情况下,3种分布函数拟合得到的R2都接近于1,SSE接近于0,这说明拟合效果非常好.对于含有大于3个数据点的10个地铁网络样本,L-SPL分布函数拟合得到的R2和SSE要优于SPL分布函数和一般形式幂律函数,SPL分布函数拟合结果优于一般形式幂律函数.以纽约地铁网络为例,6个数据点都较好地落在了3条拟合曲线上(见图3).

图3 3种分布函数对纽约地铁网络度分布拟合曲线

为了进一步证明L-SPL分布函数能够很好地描述节点度分布,本文对3种度分布函数的预测值与真实值进行分析,并比较残差大小.以纽约地铁网络为例,取该样本中的前5个数据点,通过对3种分布函数拟合,得到3种度分布函数的回归参数,由拟合得到的回归方程预测第6个数据点.第6个数据点的预测数据与真实值的残差见图4.

由图4可见,与SPL和一般幂律形式的分布函数拟合得到的残差值相比,L-SPL度分布函数拟合得到的残差值更加接近于零.但是,从预测值来看,L-SPL度分布函数预测的节点度L=6的度分布值P(L=6)=-0.003 97,小于0(见图5),而度分布为频次的百分比值,不可能出现负值.从L-SPL解析式可知,解析式中包含的参数c是一个加性误差项,由表2给出的10个地铁网络样本的3种度分布函数拟合得到的回归参数可以看出,参数c在10个样本中只有2个为正值,其余都为负值,所以会导致度分布随着节点度的增加而出现负值.因此,L-SPL函数不适用于地铁网络度分布拟合.

图4 3种幂律函数拟合残差图

图5 3种分布函数预测结果

SPL分布和一般形式幂律分布对节点度为6的度分布预测值都为正值,当节点度增大时,2种分布函数的预测值都无限接近于0,且SPL分布的收敛速度要大于一般形式幂律分布(见图5).在实际建设中,若一个地铁车站同时有多条线路经过,则车站容量及换乘设施必须满足大客流需求,因此会增加施工难度并导致建设成本过高;同时,一个车站发生故障,经过该车站的线路越多,受影响的范围越大,同时还会产生严重的社会影响;因而在规划地铁站时,会避免多条线路同时经过一个地铁车站,所以,地铁网络中不可能出现拥有几十条线路的站点.因此,当节点度趋向于100时,收敛速度快的分布函数更适合于地铁网络度分布;其次,通过R2和SSE比较,SPL分布要优于一般形式幂律分布.由此认为,SPL分布形式更加符合地铁网络度分布,即地铁网络度分布为漂移幂律SPL分布,由于漂移程度参数的a值非常小,故不影响其幂律分布的实质.

2.3 结果分析及讨论

在大于等于3个数据点的31个地铁网络样本中,香港地铁网络的SPL函数拟合得到的非线性回归的拟合优度系数R2=0.967 5,在31个样本中的拟合程度最低;相比其他30个样本,香港地铁网络的残差平方和为SSE=0.005,大了1个数量级,因此认为,香港地铁网络度分布拟合效果最差.究其原因,香港地铁网络中存在大量共线拓扑线路,导致共线段的车站都有2条线路经过,从而增加了节点度为2的车站数目,使节点度为1的车站数目到节点度为2的节点数目平缓下降,因而产生“肥尾”特征,标度系数b=-2.312,然而,同时有3条线路经过的车站的增长速度远小于有2条线路经过的共线车站增长速度,导致节点度为3的车站数目稀少,无法落到肥尾曲线上.除香港地铁外,其他30个城市地铁网络的拟合优度系数R2都大于0.99,拟合效果良好.

52个地铁网络样本的标度系数-b在2~5范围内,且在只含有2个数据点的21个样本中,标度系数-b随着节点度为1的度分布值与节点度为2的度分布值的比值的增大而增大,标度系数-b越接近5,换乘车站在网络中占的比例越小,吸引力强的点越少,网络的异质程度越低;标度系数-b越接近2,换乘车站在网络中占的比例越多,吸引力强的点越多,网络的异质程度越高.标度系数最大的日本Sapporo地铁网络,为典型的星型网络结构,共含有2个换乘车站,一个位于城市中心,有3条径向线路同时经过,另一个车站有2条径向线路同时经过.因此,同等规模的地铁网络中,星型结构的标度系数最大.

在节点数目大于300的纽约、巴黎、伦敦、柏林4个大规模网络中,标度系数-b落在了2~3之间(见表2),表明在规模较大的地铁网络中,存在较多吸引力强的节点,如在纽约地铁网络中,存在6条线路同时经过的节点,换乘站点在网络中所占比例较高,度分布曲线呈“肥尾”.在8个发达城市(地铁网络站点数目大于200的城市),除上海地铁网络之外,标度系数都小于3,说明地铁网络随着网络化程度的提高,标度系数会同其他大多数大规模网络一样,落在2~3范围内,这也表明连接偏好现象存在于地铁网络中.

3 结语

本文提出的基于经过站点的拓扑线路数目的地铁网络节点度分布评价方法,能够反映地铁网络的内在演化机制,突出以线路为演化单位的公共交通网络与以节点为演化单位的社会网络、航空网络、WWW网络等的区别,且拓扑线路数目的量化标准相比运营线路,其结果具有唯一性;通过3种分布函数对52个地铁网络样本节点度分布的拟合,证明了漂移幂律SPL分布函数对地铁网络度分布拟合效果最好,SPL函数实质上是一种介于指数和幂律之间的分布,当常数项a=0时,SPL函数为幂律分布;当a→∞时,SPL函数趋于指数分布;由于拟合结果中52个地铁网络样本a分布在0~1范围内,说明了地铁网络度分布是介于幂律和指数分布之间的漂移幂律函数,这与实际现象相吻合.

)

[1] Derrible S,Kennedy C. The complexity and robustness of metro networks [J].PhysicaA,2010,389(17): 3678-3691.

[2] Albert R,Barabsi A L. Statistical mechanics of complex networks [J].ReviewsofModernPhysics,2002,74(1): 47-97.

[3] 汪小帆,李翔,陈关荣. 复杂网络理论及其应用 [M]. 北京:清华大学出版社,2006: 8-14.

[4] 张君超. 基于复杂网络的城市公交网络特性分析与演化研究[D].成都:西南交通大学交通运输规划与管理学院,2010.

[5] Angeloudis P,Fisk D. Large subway systems as complex networks [J].PhysicaA,2006,367: 553-558.

[6] 汪涛. 城市公交网络的拓扑结构和演化模型研究[D].南京:南京航空航天大学经济与管理学院,2009.

[7] 王燚,杨超. 上海市轨道交通网络的复杂网络特征研究[J]. 城市轨道交通研究,2009(2):33-36.

Wang Yi,Yang Chao. Characteristics of the complex network in shanghai urban rail transit [J].UrbanMassTransit,2009(2): 33-36. (in Chinese)

[8] Han C,Liu L. Topological vulnerability of subway networks in China [C]//IEEEManagementandServiceScience. Wuhan,China,2009: 1-4.

[9] 王志强,徐瑞华. 基于复杂网络的轨道交通道路网可靠性仿真分析[J]. 系统仿真学报,2009,21(20): 6670-6674.

Wang Zhiqiang,Xu Ruihua. Reliability simulation analysis of urban rail transit networks based on complex network [J].JournalofSystemSimulation,2009,21(20): 6670-6674. (in Chinese)

[10] 王云琴. 基于复杂网络理论的城市轨道交通网络连通可靠性研究[D].北京:北京交通大学交通运输学院,2008.

[11] Derrible S,Kennedy C. Characterizing metro networks: state,form,and structure [J].Transportation,2010,37(2): 275-297.

[12] 何晓群,刘文卿. 应用回归分析 [M]. 2版. 北京: 中国人民大学出版社,2007: 294-295.

[13] Goldstein M L,Morris S A,Yen G G. Problem with fitting to the power-law distribution [J].EuropeanPhysicalJournalB,2004,41(2): 255-258.

[14] 叶青. 基于复杂网络理论的轨道交通网络脆弱性分析[J]. 中国安全科学学报,2012,22(2): 122-126.

Ye Qing. Vulnerability analysis of rail transit based on complex network theory [J].ChinaSafetyScienceJournal,2012,22(2): 122-126. (in Chinese)

[16] 何大韧,刘宗华,汪秉宏. 复杂系统与复杂网络[M]. 北京: 高等教育出版社,2009: 267-269.

[17] Chang H,Su B B,Zhou Y P,et al. Assortativity and act degree distribution of some collaboration networks [J].PhysicaA,2007,383(2): 687-702.

猜你喜欢
幂律标度数目
移火柴
大数据时代下幂律分布在医学领域中的应用价值
基于改进AHP法的绿色建材评价指标权重研究
基于幂律分布的房地产泡沫破裂风险预警研究
基于多维标度法的农产品价格分析
四川地区降水幂律指数研究
幂律流底泥的质量输移和流场
《哲对宁诺尔》方剂数目统计研究
加权无标度网络上SIRS 类传播模型研究
牧场里的马