沪深300 股票网络的复杂网络特性分析

2015-08-13 09:38张建刚
当代经济 2015年33期
关键词:阀值标度聚类

○康 宏 张建刚 刘 宇

(1、山东科技大学经济管理学院 山东 青岛 266590 2、国际关系学院信息科技学院 北京 100091)

一、引言

近年来,随着复杂性研究的蓬勃发展,自然界中存在大量的复杂系统,如细胞网络、城市交通网络、社会网络、万维网等都可以用复杂网络来描述。复杂网络是对复杂系统的抽象和描述方式,它突出强调了系统结构的拓扑特征。原则上说,只要是存在相互关系的系统,当把构成单元抽象成节点、单元之间的相互关系抽象为边时,都可以当作复杂网络来研究。

图1 沪深300股票复杂网络图

证券市场是一个复杂系统,其行为是通过证券指数来表征的。Mantegna首次根据股票价格数据构建了股票关联网络,运用该股票关联网络对标准普尔500支股票进行了聚类等级分析。随着对现实世界中复杂网络研究的不断深入,人们逐渐发现现实中的很多复杂网络都表现出鲜明的、区别于随机网络和规则网络的特征,这种特征被称为小世界特性和无标度特性。Kim等建立了标准普尔500支股票价格变化相关性加权网络,研究发现网络节点的影响强度服从无标度分布;Onnela等研究了纽约证券交易所477支股票形成的关联网络拓扑性质,如派系数量和规模、平均聚集系数,并将实际网络与同等规模的随机网络进行了对比。国内研究中,庄新田等建立了上海证券市场网络,分析了该网络的拓扑结构,发现该网络具有典型复杂网络的统计特性——小世界效应和无标度特性。本文以沪深300股票网络为研究对象,通过计算不同阀值下的复杂系统参数,得出沪深300股票网络具有小世界特征,是无标度网络。研究结论说明,在该网络中存在少量占主导地位的股票来影响和反映整个股市,这些股票的价格波动很容易影响到其他股票。

二、复杂网络建模

要建立金融市场中股票的网络模型,首先需要确定金融市场中进行交易的不同股票间的相互关联。本文以沪深300股票为节点集,以股票价格波动相关系数为边,构造一个无向无权网络。

记股票i在时间t的收盘价格为P(t)。股票i从时间(t-1)到时间t的对数收益率定义为Ri=lnPi(t)-lnPi(t-1)。

通过计算两支股票收益时间序列之间的相关系数,确定一对股票的相似程度,文中采用应用最为广泛的Pearson相关系数,股票i和股票j的相关系数ρij可表述如下:

式中,i,j是股票的标号,E(Ri)为股票i在n期内的平均收益率。计算n支股票的相似程度,可以得到一个n×n的关联矩阵。由定义可知,ρij的值域为[-1,1],并且ρij=-1,i,j两支股票是完全负相关的;ρij=1时,i,j两支股票是完全正相关的;ρij=时,两支股票是不相关的。因为计算两支股票的相似程度时,ρij=ρji,因此,相关系数矩阵是对称矩阵。当相关系数小于0时,股票节点对之间负相关,即一支股票的价格涨跌情况会引起另外一支股票朝着相反的方向变化。但负相关也是节点间相关性的表现,所以本文在计算时对相关系数取绝对值。

为了实现金融市场的复杂网络建模,需要对关联矩阵进行量化。考虑随机噪声的影响,为关联矩阵设定一个阀值θ(θ∈[0,1]),只有两支股票间的相关系数的绝对值大于θ,才能表明他们之间有边相联,对应元素设为1。并假设连接节点的边没有方向,且权系数等于1,即该边是无向无权的边。当两支股票间相关系数绝对值小于θ,它们之间没有边相连,对应元素设为0。同时考虑到同一支股票的自相关系数为1,而对应网络不允许自连接,所以矩阵对角元素全部设为0。用这个二元矩阵作为股票网络的生成矩阵,将金融市场中股票之间的相互关联抽象为一个网络。

图1是用pajek做的沪深300股票复杂网络图,其中θ取值为0.50,绘图时,去掉了节点度为0和1的节点。

三、复杂金融网络的拓扑结构特征

1、小世界特性

统计物理学家把小的平均路径长度和大的聚集系数两个统计特征合在一起称为小世界效应,具有这种效应的网络就是小世界网络(smallworldnetwork)。这就是Watts和Storgatz提出的小世界网络模型。

网络中两个节点i和j之间的距离d(ij)定义为连接这两个节点的最短路径上的边数。网络的平均路径长度l定义为任意两个节点之间距离的平均值,表示为:

其中n为网络节点数。

聚类系数用来表示网络中节点的聚集的疏密程度。假设网络中的一个节点i通过ki条边和其他节点相连,这ki个节点就称为节点i的邻居,它们之间最多有ki(ki-1)条边连接。节点i的实际存在的边数Ei和总的可能的边数之比就是节点i的聚集系数ci,即:

网络的平均聚集系数c为所有节点的聚类系数的平均值,即:

这里0≤c≤1,当c=0时,表明网络中的所有节点全部为孤立节点,即网络中没有任何的连边;当c=1时,表明网络中任意两个节点都直接相连。

2、无标度特性

度分布是描述网络性质的一个重要统计量。节点度是指连接节点的边数,节点度分布是指一个任意选择节点恰好度数为k的概率,也等于网络中节点度数为k的节点数占网络节点总数的百分比,用分布函数p(k)表示。从某种意义上说,节点的度越大,说明该节点越“重要”;反之,如果节点的度很小,则说明该节点在网络中所起到的作用较小,不会对网络产生很大的影响。

实验研究发现,大量真实网络的节点度服从幂律分布。就是说,具有某个特定度的节点数目与这个特定的度之间的关系可以用一个幂函数近似的表示,即:

其中,γ 是幂律指数,(5)式也可等价表示为:

幂函数曲线是一条下降相对缓慢的曲线,这使得度很大的节点可以在网络中存在,这些度很大的节点称为网络的Hub点,Hub点对无标度网络的运行起着主导作用。把节点度服从幂律分布的网络叫做无标度网络(scale-free networks),并称这种节点度的幂律分布为网络的无标度特性。

四、实证分析

1、数据来源与说明

选取沪深300指数中的300只股票作为研究对象。沪深300指数是由上海和深圳证券市场中选取300只A股作为样本编制而成的成份股指数。沪深300指数样本覆盖了沪深市场六成左右的市值,是反映沪深两个市场整体走势的“晴雨表”,可以反映沪深两个市场整体走势,具有良好的代表性。

选取2014年1月1日,至2014年12月31日之间的238个交易日的数据点。剔除这个时段内停牌时间较长,或者上市较晚的股票17支,剩余283支股票。

2、小世界特性

在不同的阀值θ 下,由式(2)和(4)求沪深300的平均路径长度和聚类系数。其中求平均路径长度用的是佛洛依德(Floyd)算法。

表1 沪深300股票网络的统计特征

与文献中的普遍模型的基本统计数据相比较,表1中所列的平均路径长度和聚类系数说明沪深300股票具有典型的小世界特征。它具有比较小的平均路径长度,说明在沪深300网络中,任意两只股票都可以通过较少的网络中其他节点而连接。由于网络中的边表示股票间价格波动的相关性,因此,说明该网络中,当一支股票价格发生变化时,其他股票很容易受到影响而随之发生变化。同时它又具有比较大的聚类系数,说明某支股票的价格波动,该股票的邻近股票更容易受到影响而随之波动,影响程度较大。

当θ=0.50时,网络中节点度小于或等于1的节点为65个;当θ=0.55时,网络中节点度小于等于1的节点为107个,孤立节点较多,在计算平均路径长度时,去除这些孤立节点的影响,剩余180个节点之间连通性较强,所以平均路径长度从2.0636下降到1.0394。表明在θ=0.55时,去除掉的孤立节点较多,关键信息丢失,影响网络拓扑结构特性。

图2 θ=0.50时网络度分布双对数分布曲线

图3 θ=0.55时网络度分布双对数分布曲线

3、无标度特性

本文选取了不同阀值θ,计算了沪深300股票网络的度分布情况。当θfflt;0.50时,节点度不服从幂律分布;θ=0.60时,网络中节点度小于等于1的节点为142个,多于选取的283支股票的半数,许多关键信息丢失,所以θ 的取值范围为0.50≤θ≤0.60。

由图2和图3可以看出,当θ=0.50、θ=0.55,经过Matlab仿真,在双对数坐标系下,其度分布曲线大约在一条直线的附近。当θ=0.50时,直线的斜率为-0.5563;当θ=0.55时,直线的斜率为-0.6409。表明当θ=0.50、θ=0.55时,沪深300股票网络节点度服从幂律分布,幂指数分别为0.5563与0.6409,沪深300股票网络是无标度网络。表明沪深300股票遵从“马太效应”,Hub节点股票价格波动更容易影响到其他的节点。

4、结果分析与讨论

本文通过对沪深300股票网络的分析,构建了沪深300股票收益率复杂网络,讨论了相关系数的取值范围及其所代表的意义。通过分析对比不同阀值下的网络平均路径长度和聚类系数,分析了阀值的取值对分析结果的影响,并得出沪深300股票网络具有较小的平均路径长度和较大的聚集系数,具有明显的小世界特性,说明在这个股票网络中,单支股票的价格波动会对其他股票的价格波动产生影响。本文分析了不同阀值下沪深300股票网络的节点度分布,得出其度分布服从幂律分布,在双对数坐标下可以以一条直线来拟合,说明沪深300股票网络同时为无标度网络。同时,在该股票网络中,存在对整个网络具有重要作用的节点,这些股票价格波动会对整个股市产生影响,即通常所说的“龙头效应”。因此,要加强对这些股票的监管。

[1]XinB,WuZ:Neimark—SackerBifurcationAnalysisand01 Chaos Testofan Interactions Model between IndustrialProduction and EnvironmentalQuality in a Closed Area[J].Sustainability,2015(8).

[2]庄新田、闵志锋、陈师阳:上海证券市场的复杂网络特性分析[J].东北大学学报,2007(7).

猜你喜欢
阀值标度聚类
分数算子的Charef有理逼近与新颖标度方程的奇异性质
任意阶算子的有理逼近—奇异标度方程
无标度Sierpiński网络上的匹配与最大匹配数目
面向WSN的聚类头选举与维护协议的研究综述
改进K均值聚类算法
激光多普勒测速系统自适应阀值检测算法
基于多维标度法的农产品价格分析
基于模糊数学的云南省区域经济研究
某尾矿库在线监测设防阀值确定方法
基于Spark平台的K-means聚类算法改进及并行化实现