李茂++齐福全
摘要:以复杂网络理论为理论范式,在中国2010年投入产出表的基础上,构建了2010年中国产业关联网络模型。利用网络分析软件计算了网络模型的几个基本拓扑特征,并对这些基本拓扑特征进行了产业经济学方面的解释,并提出了后续研究的方向。
关键词:复杂网络;投入产出表; 拓扑特征;产业经济
DOI:1013939/jcnkizgsc201613095
一、引言
产业关联网络是指一个国家和地区在一段时间内各社会生产部门、流通部门和其他经济部门所构成的有机总体。这个网络是由互相联系、互相影响的经济环节、经济层次、经济部门和不同的经济区域构成的。从形成机制角度来看,一个地区的产业关联网络由不同经济部门通过产业链、价值链、创新链等纽带有机地构成,从而形成了一个复杂系统(Complex Systems)。
分析产业关联网络的有力工具之一就是投入产出表(Input-Output Tables)。WLeontief(1936)在前人关于经济活动相互依存性的研究基础上提出并研究、编制了投入产出表,为学术界研究国民经济系统中投入产出关系提供了有效工具,通过投入产出表可以揭示出生产过程中各部门之间相互依存和相互制约的经济技术联系。但随着国民经济部门的不断发展与细化,投入产出表的体量越发庞大,以投入产出表中的中间消耗中间产出矩阵为例,从最简单的三产投入产出表发展到现在的139部门的投入产出表,一些指标如直接消耗系数、完全消耗系数从最简单9个(3×3矩阵)增长到1764个(42×42矩阵),再到现在的19321个(139×139矩阵)。指标增多与数据增多带来的是更为烦琐的关系,不利于有效地研究国民经济系统的宏观特征与内部联系。
复杂网络理论(Complex Networks Theory)是20世纪末兴起的一门交叉学科,融合数学、物理学、系统科学等理论知识,对复杂系统的内在性质进行分析研究,为复杂系统的形成、联系与运行机制提供了有效的方法与工具。本研究将借助相关理论,将北京产业系统视为一个复杂网络,以2010年中国投入产出表为基础,将不同经济部类视为网络中的节点,不同经济部类之间的投入产出关系视为节点之间的连接线段,构造一个以经济部门为基础节点,节点之间相互联系的北京产业关联网络模型,通过复杂网络的统计学分析与揭示它的拓扑特征和内部联系,并为深层次研究打下基础。
二、研究述评
Erdos与Renyi(1960)建立的随机图理论(Random Graph theory)是现代复杂网络理论研究的滥觞。DJWatts和SHStrogatz(1998)提出的WS小世界模型,刻画了现实社会中网络关系的部分规则部分随机特性。ALBarabasi和RAlbert(1999)提出的BA无标度模型,较好地描述了现实网络关系中的不均衡性、非平衡性和复杂性。这三项具有里程碑意义的研究推进了学术界对于复杂网络的研究进程,在这几个复杂网络模型的基础上,专家学者们又增加了不同的建模条件,陆续发展出来各种不同的复杂网络模型。
国内的学者学习借鉴了复杂网络模型的构建思想,利用它来分析国家和地区经济体系的内在特征与联系。方爱丽、高齐圣、张嗣瀛(2008)提出了投入产出关联网络模型及其统计属性研究的基本方法与思路,刘刚、郭敏(2009)发现直接消耗系数为边的中国122部门产业网络为小世界网络和无标度网络,度、权及边权近似幂律分布,度簇之间、度度之间为负相关,度与权之间为正相关;王茂军(2013)利用2005年北京市42部门的投入产出表数据,建立了产业交易链接网络,分析了该网络的基本特征;基于调节变量回归分析方法,讨论了产业网络在产业发展规模中的效能。
以上研究为本文提供了充实的基础,但也应该注意到以上研究存在以下问题:首先,仅仅分析了产业网络系统的某些拓扑特征,说明其所属的复杂网络性质,并没有揭示这些特征的内在本质与相互联系,这是本研究将要重点改进之处;其次;有些研究以直接消耗系数为边的方法还有待于改进,以完全消耗系数为边更能反映出产业网络系统的内在联系,这是本文将要突破的地方;最后,有些研究的数据需要更新,以往的研究都是基于2005年或2007年的数据,而我国2010年的42部门投入产出表、2012年的139部门投入产出表均已公布,现实研究要以最新的数据为基础,这样才能揭示出当前我国产业网络体系的内在特征。
三、模型构建与建模数据
复杂网络模型的构建需要有节点(Nodes)、边(Edges)和连接规则(Rules)。
(一)节点构造
本文以投入产出表延长表为基础,将投入产出表中的42个不同部门视为复杂网络的节点(Node),为了研究方便起见,按照字母顺序对这42个节点进行命名(见表1)。
(二)边的构造
在构造点之间的边(Edge)时,要考虑到以下几个问题。
第一,为了简化问题,更加深刻地揭示产业网络系统之间的内部联系,节点之间的边的构造应采用无向无权边(Undirect & Unweighted)。因为,无向无权图可以通过对有向图的无向化处理和加权图的阈值化处理而得到,无权无向图是最简单的表现方式,有助于简明扼要地描述各部门之间的关系。
第二,避免构成一个全局耦合网络(Globally Coupled Network)。我们知道,在投入产出表中每个行业部类之间都有联系,如果不采用阈值化处理的话,那将构成一个全局耦合网络:网络中任意两个节点之间都有边直接相连。这样的模型的确反映了现实联系,但不利于我们深入分析问题,一些本质关系被繁芜的关联所覆盖。因此,在构建模型时应该采用阈值化处理,设定阈值。即两个节点之间的联系大于或等于这一阈值的视为“有联系”,设定一条边,低于这一阈值的视为“无联系”,不设边(具体设定见下文)。
第三,应采用完全消耗系数的行业平均值作为阈值。已有研究大都采用直接消耗系数作为边的权,但本文将采用完全消耗系数作为连边的阈值。在产业网络各部门之间,各种产品在生产过程中除有直接的生产联系外,还有间接联系,这使得各种产品间的相互消耗除了直接消耗外,还有间接消耗。完全消耗系数则是这种直接消耗和间接消耗的全面反映。与直接消耗技术相比,完全消耗系数揭示了部门之间的直接和间接的联系,它更全面更深刻地反映部门之间相互依存的数量关系。通过计算可以得到2010年中国投入产出表的直接消耗系数矩阵A,在此基础上利用公式:
B=(I-A)-1-I
计算出投入产出表的完全消耗系数矩阵B,其中:A,B为42×42矩阵,I为单位矩阵。得到完全消耗矩阵后,计算矩阵中1764个元素的平均值,得到阈值化系数θ。
(三)连接规则
至此,我们明确了点、边之后,就可以设定连接规则,构建一个以完全消耗矩阵B为基础(bij为矩阵元素),有42个节点的产业网络系统复杂网络模型G(42,Eij)。注意,为了简化模型突出重点,这个模型中没有自环(self-edge),也没有重边(multi-edge)。其中连接规则(邻接矩阵Eij)如下式所列,1代表两点之间有边相连,表示有联系,0代表两点之间无边相连,表示无联系:
第一,核心(Nucleus,图2的黑圈内的部分),它们是由kmax-壳中9个节点组成,这些节点包括:A、B、F、L、M、W、AA、AD、AE。这些节点具有最高的度,处于网络的中心位置。
第二,对等连通片(Peer-connected component,图2中黑圈外灰圈内的部分)。这些节点包括K、C、I、N、E、G、J、AF、AL、D、H、U、V、Z、AN、AP等,这些节点具有一定的度,处于网络中的中间位置。
第三,孤立片(Isolated component,图2中白色圈的部分)。这些节点的度较低,处于网络中的边缘位置,只有通过网络中的核心节点才能与网络的其他部分联系。
五、分析与解释
(一)对度、平均度与度分布的分析与解释
度、平均度和度分布是复杂网络的最基本网络特征。对于本文所设定的产业网络系统复杂网络模型G(42,Eij)而言,度就是刻画与反映不同生产部类之间的显著联系性(设立边的时候进行了阈值化处理)。
从计算结果来看,从表2可以看出,模型中Dmax=14(C、O、P节点),对照表1,表明石油和天然气开采业、金属制品制造业和通用设备制造业具有最大的度值,这三类行业与其他国民经济行业具有较高的联系度,是国民经济中的支柱产业。从实际情况上来看,石油天然气开采业为社会生产提供能源支持,金属制品制造业和通用设备制造业为社会生产,特别是现代化大生产提供生产资料,这些行业在我国产业网络体系中的重要性不言而喻。模型中Dmin=4(AC节点),对照表1,表明批发和零售业与其他国民经济行业的显著联系性较低。从实际情况来看,批发和零售业是终端行业,基本上没有下游产业,直接面对广大消费群体,其与其他产业的显著联系性较低也是正常的。平均度为Daverage=10357,表明每个行业平均与上下游10个产业之间保持紧密联系,一个产业变动将会带动上下游10个产业变动。
度分布服从泊松分布表明产业网络系统复杂网络模型属于同质性网络(也称为均匀网络,Homogeneous network),网络中的度基本上分布在平均度Daverage周边,度值在5~15的情况占据了95%的可能性,极大的度与极小的度出现的可能性很低(如图3所示)。这表明国民经济中的生产部类是普遍联系的,每个部类都与其他部类保持紧密联系,并不存在着一业独大并独自发展的极端情况。
(二)对路径长度的分析
通过软件计算得出,产业网络系统网络G(42,Eij)模型中有172条边,这表明42个生产部门之间的显著性联系有172对。其中最大路径长度Lmax=4,是节点D和节点 AF之间的联系,对照表1,可以发现金属矿采选产品业与信息传输、软件和信息技术服务业路径行业最大,说明在这些显著联系中,这两个行业的联系程度最低,产业关联较为疏远。整个网络的平均路径长度Laverage=183833,表明任意两个产业之间只要通过1个产业就可以产生联系,呈现出明显的“小世界”特性,尽管“隔行如隔山”,整个经济体系内部三产部类繁多,但是内在联系却十分紧密。
图3 模型节点度的概率分布散点图
注:横坐标表示样本个数n,纵坐标表示概率值p
(三)对聚类系数的分析与解释
通过软件计算可以得出产业网络系统网络G(42,Eij)模型的聚类系数C=03646。国民经济部类中任意三个产业当中,互有紧密联系的概率为03646,其值较低说明我国产业群效应不明显,产业群的显著联系水平不高,产业之间的联动发展空间还比较大。
(四)对中心性的分析与解释
在本模型中,度数中心性最大的节点为C、O、P∶DCimax=03414,对应的是石油和天然气开采业、金属制品制造业和通用设备制造业。度中心性说明这个节点对于整个系统而言就越重要,从石油和天然气开采业、金属制品制造业和通用设备制造业的实际地位来看,这三大产业是我国当前的支柱产业,这三个产业具有较强的连锁效应,对各部门、所处地区的经济结构和发展变化有深刻而广泛的影响。
介数中心性最大的节点为BCimax=008784(节点L),对应的产业是化学产品制造业。从控制信息传输的角度而言,介数越高的节点其重要性也越大,去除这些节点后对于网络信息的传输影响性也就越大。在国民经济体系中,信息的传输主要是通过的生产要素价格作为信号。化学产品制造业对发展农业生产,扩大工业原料,巩固国防,发展尖端科学技术,改善人民生活以及开展综合利用都有很大作用,它是国民经济中的一个重要组成部分,对于生产要素价格的调节具有至关重要的作用。
接近中心性最大的节点为CCimax=04000(节点AH、AJ),对应的产业是房地产业和科学研究和技术服务业。根据定义,接近数最大的节点对于信息的流动具有最佳的观察视野。从这两个行业的内在属性来看,它们都具有先导性、基础性、带动性等特点。房地产业的上下游产业众多,价值链联系紧密,较其他产业来看其要素价格信号传导作用较强;科学研究和技术服务业提供智力支持,智力成果的应用本质上属于高质量的加工信息的传输。因此,这两个行业的具有显著的先导性,具有“春江水暖鸭先知”的功能。
(五)对k-核分解与解释
基于度的k-核分解的最直观意义就是甄别核心产业和边缘产业。通过分解可以发现,节点A、B、F、L、M、W、AA、AD、AE对应的产业是农业、煤炭采矿、食品和烟草行业、化学产品制造业、非金属矿物制品业、废品废料处理业,水的生产和供应业、交通运输仓储邮政业和住宿餐饮业。这些节点在模型中体现出来的特点是有着较大的度,这说明这些产业与其他国民经济部门保持着紧密的联系,尽管总体产值占国民经济生产总值的比例有限(占比7485%),但这些行业提供了大量的生产资料和生活资料,在经济社会运行中起到了承前启后的作用,在整个国民经济体系中的地位十分重要。
与之相对应的处在外围孤立片的节点为Q、R、S、T、X、AC、AI、AJ、AK、AM、AO等节点,对应的是专用设备制造业、交通运输设备、电气机械和器材、通信设备、计算机和其他电子设备金属制品、机械和设备修理服务业、批发和零售业、租赁和商务服务业,水利环境和公共设施管理业、教育业、文化体育和娱乐业。这些行业的度值较低,所处的产业链位置居于下游,与国民经济部门其他产业之间的联系度较低。
其他节点位于核心和外围孤立片之中,具有一定的产业联系度,也具有一定的国民经济带动能力,但在模型中的地位不及核心产业。
六、结论和未来研究方向
本文在学习借鉴已有研究的基础上,利用中国2010年投入产出表的完全消耗系数矩阵,设定连接阈值,构建了一个以42个部门为节点的复杂网络模型G(42,Eij)。通过Pajek软件分析了该网络的几大拓扑学特征,分析结果显示:
网络模型中的Dmax=14(C、O、P节点),Dmin=4(AC节点),平均度为Daverage=10357,节点度分布属于泊松分布,表明网络性质是同质性网络。模型中有共有172条路径,其中最大路径长度Lmax=4,(节点D和节点 AF之间);平均路径长度Laverage=183833,具备了复杂网络中的“小世界”特性。模型的聚类系数为C=03646。度数中心性最大的节点为C、O、P,DCimax=03414;介数中心值最大的节点是L,BCimax=008784;接近中心性CCimax=04000(节点AH、AJ)。进行6-核分解,可以将网络上的节点划分成核心、对等连通片和孤立片三层。随后,本文对计算结果进行了分析与解释,指出了这些拓扑特征的产业经济学和产业网络学含义。
需要指出的是,在后续研究中以下几个方向是需要重点突破的。
首先,进行历时态的拓扑性质对比,比较不同时间段的产业网络的网络拓扑特征,探寻国民经济系统的内在规律性;其次,考虑不同产业部门之间的流入流出关系,引入有权有向图,对国民经济系统深层次联系进行进一步分析;最后,利用软件分析网络模型中的群落、派系和层次,对产业集群以及产业去除后的鲁棒性进行研究,为提出对策性建议提供理论支持。
参考文献:
[1]钟契夫投入产出分析[M].北京:中国财政经济出版社,1993
[2]王海建经济结构变动与能源需求的投入产出分析[J].统计研究,1999(6):30-34
[3]李冠霖第三产业投入产出分析[M].北京:中国物价出版社,2002
[4]赵进文,温宇静中国经济结构变动的投入产出分析[J].财经问题研究,2004(4):3-12
[5]李勇复杂网络理论与应用研究[D].广州:华南理工大学,2005
[6]黄守坤,李文彬产业网络及其演变模式分析[J].中国工业经济,2005(4):53-60
[7]刘涛,陈忠,陈晓荣复杂网络理论及其应用研究概述[J].系统工程,2005,23(6):1-7
[8]汪小帆复杂网络理论及其应用[M].北京:清华大学出版社,2006
[9]方爱丽,高齐圣,张嗣瀛投入产出关联网络模型及其统计属性研究[J].数学的实践与认识,2008(9):34-38
[10]刘刚,郭敏中国宏观经济多部门网络及其性质的实证研究[J].经济问题,2009 (2):31-34
[11]王茂军,柴箐北京市产业网络结构特征与调节效应[J].地理研究,2013(3):543-555
[12]Leontief W WQuantitative Input-Output Relations in the Economic System of the United States[J].Review of Economics & Statistics, 1936, 18(3):105-125.
[13]Erd?s, P, Rényi, AOn Random Graphs I[J].Publ.math.debrecen, 1959,6(6):290-297.
[14]Freeman L CA Set of Measures of Centrality Based on Betweenness[C].Sociometry1977:35-41.
[15]Freeman L C, Borgatti S P, White D RCentrality in valued graphs: A measure of betweenness based on network flow[J].Social Networks, 1991, 13(2):141-154.
[16]Watts D J, Strogatz S HCollective dynamics of 'small-world' networks.[J].Nature, 1998, 393(6684):440-442.
[17]Barabasi A L, Albert REmergence of Scaling in Random Networks[J].Science, 1999, 286(5439):509-512.
[18]Albert R, Barabasi A LStatistical Mechanics Of Complex Networks[J].Review of Modern Physics, 2001, 74(1):xii.
[19]Newman M E J, Girvan M ,Finding and evaluating community structure in networks.[J].Physical Review E Statistical Nonlinear & Soft Matter Physics, 2004, 69(2 Pt 2):026113-026113.
[20]Lda FCosta, FARodrigues, GTravieso& PRVillas Boas, Travieso G, Boas P R VCharacterization of complex networks: a survey of measurementsAdv Phy[J].Advances in Physics, 2005, 56(1):167-242.
[21]Tao Z, Zhongqian F, Binghong WEpidemic dynamics on complex networks[J].Progress in Natural Science, 2005, 16(5):452-457.
(编辑:韦京)