傅毅明,赵彦云
(中国人民大学 统计学院,北京 100872)
基于公路交通流的城市群关联网络研究
——以京津冀城市群为例
傅毅明,赵彦云
(中国人民大学 统计学院,北京 100872)
构建了基于公路交通流大数据的城市群关联网络分析方法,并应用于京津冀城市群分析,为京津冀协同发展提供政策建议。实证分析上,基于河北地区公路收费数据建立了冀中南城市群OD矩阵,并结合城市GDP、人口和地理位置等因素,对城市层面和收费站层面的交通流分布进行统计分析,揭示冀中南城市群内部及其与京津和周边地区的交通流特征;进一步应用重力模型对城市群交通流进行模拟预测,深化了交通流大数据在城市群关联网络的模拟应用。研究发现,冀中南城市群的交通流分布呈现内外分化特征,内部以就近出行为主,对外交通则有明显的过境交通特征;城市群关联网络发展水平较低,一体化程度不高,石家庄的影响辐射范围有限,网络的核心与联系有待加强。建议加快建设京津冀交通大数据分析平台,在大数据开放共享与经济运行监测预警等国家大数据战略重点领域先行探索突破。
公路交通流;大数据;京津冀城市群;关联网路
国家“十三五”规划纲要提出实施国家大数据战略,注重应用大数据等技术提高经济运行信息及时性、全面性和准确性。交通流是人流、物流等要素流动的主要载体和显示方式,交通流大数据对于经济运行监测和区域关联分析等具有重要意义。
“京津冀一体化”和“京津冀协同发展”战略推进,需要加强京津冀城市群关联网络的分析研究。交通一体化发展是京津冀协同发展的首个重点突破领域,如何立足交通大数据来反映城市群关联网络特征和协同发展程度,是当前理论和实践的热点。本文旨在探讨基于公路交通流大数据分析城市群关联网络与经济运行的方法,并应用于京津冀地区,为京津冀协同发展和交通一体化等提供监测工具和政策建议。
与铁路客流或航空客流等相比,城际间公路交通流有明显的差异和特征。航空运输和铁路运输均属于运距较大的中长途运输方式,适合研究跨度较大的区域和城市群关联网络。对于空间上距离较近或者紧邻的城市而言,运距较小和通行时间较短,更加偏好于利用公路出行方式。因此,利用公路交通流研究空间分布上较为紧凑的城市群会更加有优势,同时也能更加直观和全面地展现不同城市之间的关联关系。
运用交通流等“流数据”解析城市群关联网络是国外城市地理与区域经济研究的热点。Taylor P J等指出,20世纪后期“场所空间”与“流空间”交互作用,城市等级体系和职能分工体系等发生了深刻变革,区域空间结构研究也由传统的基于等级规模为理论核心的中心地模式逐步向开放、流动、多中心的网络化模式转变;网络表征媒介也日趋多样化,包括经济联系、社会联系和文化联系等方面[1-2]。在实证研究上,Malecki E J等通过信息和航空等基础设施、企业组织和社会文化等路径展开各种尺度的城市网络研究[3-5]。总体上,受限于基础设施网络运行数据的获取,国际上基于交通流视角考察城市网络的研究相对较少,针对中国的研究主要集中于航空和铁路交通流视角[6-7],基于公路交通流大数据解析城市网络的研究仍处于起步期。
国内基于交通流研究城市网络的相关研究已经有一定基础,金凤君等基于航空流对中国航空网络发育和演化等方面作出了系统的研究[8-9];戴特奇利用1991—2000年约200个城市的铁路客流量数据对我国城市群关联网络进行分析,并指出从铁路客流的角度上看,城市群空间结构存在中心极化和区域重组的趋势[10];武文杰利用1983年,1993年,2006年3个节点的航空数据分析了我国城市空间关联网络的时空演变,并利用K-means聚类的方法指出我国重要的交通枢纽城市为广州、北京、上海和深圳[11];冯长春等以城际轨道流对珠三角城市区域功能多中心进行探讨[12]。公路交通流的相关研究开展相对较晚,罗震东等运用公路客运班次在省域单元层面对城市间关系和区域空间结构特征进行了解析[13];高鑫利用2012年10月份重庆公路收费站数据揭示了重庆市各区县的网络结构和关联关系[14]。
京津冀城市群网络结构是近年来的研究热点,但是基于交通流大数据的分析应用尚未突破。陈阳利用企业母公司注册所在地和分公司注册所在地的空间结构重点研究了京津冀地区的关联网络[15]。鲁金萍等借助引力模型和社会网络分析方法,以京津冀城市群的经济联系网络为研究对象进行实证分析和研究[16]。当前大多数研究停留在运用模型对城市网络进行模拟估计,缺少交通流大数据的精细化分析与验证等。
在城市群关联网络的研究分析方法上,既有研究多停留在较为宏观的分析层次上,高鑫在利用重庆高速公路收费站数据对重庆市各区县网络结构的研究中也仅仅是对车辆类型进行了简单的货流与客流的分类,并未作进一步的探索与分析;而且也缺乏对所得数据质量的评估,并且受限于数据可得性,大多数研究未能根据交通流数据对城市群的关联网络开展实证分析。另外,既有研究主要停留在对交通网络的构建和度量,对于交通网络运行的时空分布特征,及其蕴含的城市间多种社会经济关联的精确信息等缺少挖掘,尚未形成基于交通流大数据的城市群关联网络监测分析的理论方法和实践应用。
因此,本文在对公路收费大数据开展数据质量评估和数据清洗的基础上,构造冀中南城市群货流和客流的OD(Orignation Destination,出发到达)矩阵,包括与京津和周边地区交界收费站的车流OD矩阵,并根据不同车型的交通流数据对城市关联网络作更加系统和深入的分析,为城市群关联网络研究提供一套规范化的数据处理和统计分析技术方法,并在京津冀城市群开展创新应用。
(一)基本概念与分析模型
1. OD矩阵。用一个n×n的矩阵Y,描述一个封闭系统中n个地点之间要素(客流,货流)的定向流动关系。
Y即通常意义上的OD矩阵,对于任意i,j(i,j≤n)而言,Yij表示的是从i地出发,终点为j地的总流量。
利用公路收费数据构建城市群OD矩阵。收费公路是一个单向通行并且中间封闭的系统,在收费公路上行驶的每一辆汽车都需要经过收费站和被记录,收费站进出数据可以作为城市间OD矩阵计算的重要依据。另外,收费站的数据记录还包括了车辆类型、里程和载重率等信息,为进一步探索分析提供了必要的支持。收费公路的两端,连接着城际间出行的起点和终点,是城市间交通流的重要接口。
基于公路收费数据可构建不同层级的OD矩阵。从站点汇总与区域层级维度看,最原始的是收费站与收费站之间的OD矩阵,在此基础上,可根据收费站所属地区进行汇总,生成县际、城际与省际等不同区域尺度的OD矩阵。从时间维度看,可以构建逐秒、分、时、日、月、季与年等不同时间尺度的OD矩阵。实际构建的OD矩阵,都有明确的时空尺度与对象范围。
根据《收费公路管理条例》,收费公路收费站的设置,是由省、自治区、直辖市人民政府审查批准并管理的,需要在各省交界处设置省界收费站,因此,OD矩阵不仅能够反映城市群之间内部的联系,同时利用省界处收费站的数据,还可以分析城市群与周边省份地区的交通流,比如河北地区同北京、天津、山东、河南和山西等地区的联系。
2. 重力模型。重力模型来源于万有引力定律,用来揭示两个实体的空间关联与作用强度,也是揭示交通流生成机理的经典模型,原始表达式为:
其中,Yij代表从j地到i地的流量,K为常数系数,Xi为i地的解释变量,Xj为j地的解释变量,g为两地的距离。
重力模型的对数表达式为:
lnYij=lnK+βilnXi+βjlnXi+γlng+ε
如果特定城市群区域的交通流生成规律基本一致和稳定,即对于任意i,j而言,其回归方程的系数lnK,βi,βj,γ均相同,可得到总体的线性回归模型:
lnY=lnK+βolnXo+βDlnXD+γlng+ε
其中,Y代表两地流量,Xo代表了出发地的解释变量,XD代表了到达地的解释变量,g代表两地距离,βo=βi(i=1,2,...n),βD=βi(j=1,2,...n)
3. 首位联系强度。首位联系强度的公式如下所示[5]:
其中,Lik为i城市的首位联系强度,k代表i城市的首位联系城市,n代表城市数量,Tij与Tji分别代表i城市流向j城市和j城市流向i城市的公路流,Oi和Di分别代表i城市公路流的出发流量和到达流量。
利用首位联系强度,可以计算得出与目标城市关联最为密切的首位联系城市,通过计算每个城市的首位联系城市,可以判断出一个城市群网络的核心城市。
(二)实证分析框架
本研究范围为京津冀地区,由于部分片区的收费体制差异和数据整合尚未完成,选用冀中南地区的收费站数据进行实证分析。利用冀中南地区收费站数据生成公路交通流OD矩阵,并使用首位联系分析得出每个城市的首位联系城市,同时结合每个城市的经济指标对所得交通流OD矩阵进行宏观层面和微观层面的描述性分析,最后引入重力模型,对城市群间的交通流量进行拟合与分析,得出结论(图1)。
图1 实证分析框架
(一)数据概况
数据来自河北省收费站2013年1月份共计31天的公路收费实时数据。每天的数据量大致在40万条左右,其中最高的数据量达到55万条左右,最低的数据量为14万条左右(图2)。每一条数据代表一次完整的通行刷卡记录,即从进入河北省收费公路到离开河北省收费公路的全过程,包括收费公路的进入站点(ENTRYSTATION)和出发站点(EXITSTATION),以及车辆的车种、进站时间和出站时间等信息。河北省公路收费站字典表显示,收费站数量超过400个,每个收费站都有唯一的编号、名称、所属公路线路以及是否是省界站等属性信息。
图2 河北公路收费车流量统计(万辆/日)
(二)数据处理
1. 无效数据剔除。无效数据是指在收费站数据中出现收费站编号,但是无法在字典表中找到对应的收费站编号的数据。
数据量:31天的数据中都存在类似的无效数据,每一天的无效数据量大致在1 000~2 000条之间浮动,占当天总数据量的0.5%~1%左右。
2. 缺失数据站点剔除。缺失数据站点是指在字典表中出现的收费站名称,但是在收费站数据中无法找到对应的收费站编号的收费站点。
由于收费体系的差异,张家口、承德、唐山和秦皇岛的收费站存在一定程度的数据缺失,因此本研究主要关注冀中南城市群交通流特征。
3. 冀中南城市群OD矩阵构建。利用字典表,将统计数据中每个收费站所隶属的地级市作为新的变量加入至原有数据中,增加车辆进入收费公路的所在城市和离开收费公路的所在城市。同时,利用EXCEL VBA和数据透视表的功能,生成31天的车辆流量的OD矩阵,汇总得到2013年1月份城市群收费公路的OD矩阵。通过筛选分析,得到不同车辆类型和车辆类别的OD矩阵(表1)。
表1 冀中南城市群收费公路交通流OD矩阵(2013年1月) 单位:辆
注: 行向量为出发城市,列向量为到达城市,对角线上的元素为市内交通流量。
(三)数据分析
1. 市内交通流量占比最大。每一个城市公路收费交通流的最大组成均发生在城市内部(图3)。
图3 2013年1月冀中南城市群车流总量
市内交通流量占出发或到达流量汇总中的比例,除衡水之外,都均超过50%,远高于城际流量(表2)。说明冀中南城市群的公路交通流以市内出行和就近出行为主。
表2 市内交通流量占比
2. 经济规模与交通流量高度相关。GDP与人口是衡量一个地区经济规模的两个核心指标,是交通流生成的重要决定因素。从河北省统计年鉴获取2012年各城市GDP、人口数据,与该城市的到达流量(到达流量和出发流量接近)进行比较,发现经济指标越高的城市,吸引车流量也越多(图4)。
石家庄地区的GDP在7个城市中排名第一,到达石家庄市的总流量也越高。但是,沧州的各项经济指标都低于邯郸,而到达沧州的车辆总流量却远高于邯郸,与沧州市内拥有年吞吐量超过亿吨的黄骅港密切相关。另一方面,邯郸市处于河北省的最南边,地理位置上的劣势使得其与河北省内城市的交互和联系较少,其经济发展更多依靠与周边省份城市的交互合作。
图4 冀中南城市群经济与交通流量对比
3.客流与货流的OD分析。将城市群交通流划分为客流和货流,构建客流与货流OD矩阵(图5—6)。
与经济指标作进一步对比(表3)。
图5 客流OD矩阵透视
图6 货流OD矩阵透视
表3 城市经济指标及客流和货流排名
石家庄无论是在客流和货流上,都稳居第一;而沧州由于黄骅港的存在,虽然其在GDP和人口上并不占优,但是它的货流总量却是在7个城市中排名第二,客流总量也在7个城市中排名第三;廊坊对于客流的吸引远高于货流,其客流排名第四,超越了GDP和人口均高于自己的邯郸,但是其货流排名仅为第六;邯郸虽然GDP和人口都排名第三,但是由于地理位置上的边缘化,在冀中南城市群中的交通流相对靠后。
4. 重点车型交通流OD分析。根据公路数据车型分类,客车可分为7座以下的客车,8座至19座的客车,20座至39座的客车,40座以上的客车等4种类型;货车分类为2吨以下,2吨~5吨,5吨~10吨,10吨~15吨,15吨~30吨,30吨~45吨,45吨以上,集装箱,货车等9种类型。选择7坐以下小客车和集装箱货车,分析重点车型的OD矩阵(图7—8)。
图7 小客车的OD矩阵透视
图8 集装箱货车OD矩阵透视
经计算,7座以下客车的车流量为6 772 050辆,占总客车流量的93.40%。
坐拥黄骅港的沧州在集装箱运输中占据了十分重要的地位,远高于其他城市。
5. 收费站OD矩阵分析。对收费站OD矩阵进行分析,选取2013年1月1日(元旦)和2013年1月9日(周三)分别作为节假日样本数据与工作日样本数据。由于冀中南城市群收费站点超过200个,为便于OD矩阵显示分析,仅提出当日交通流生成与吸引量前5名的收费站OD流量进行展示分析(图9—10)。进入前5名的收费站清单见表4。
图9 假期(1月1日)交通流生成与吸引前5名的收费站OD分布
图10 工作日(1月9日)交通流生成与吸引前5名的收费站OD分布
表4 收费站编号及其线路、名称和属性
在节假日,冀中南城市群收费公路交通流生成最大的5个站点有4个是省界站,交通流吸引最大的5个站点有3个省界站,说明冀中南城市群节假日期间的交通流具有明显的过境特征。交通流分布上,生成交通流最大的G2京沪高速青县主线站,主要车流来自北京和天津方向,主要流向是G2吴桥主线站,通往山东和上海方向。
在工作日,冀中南城市群收费公路交通流生成和吸引前5名的站点仍主要是以省界站为主,同样具有明显的过境交通特征。交通流分布上,生成交通流最大的站点吴桥主线站,仍然分布在G2京沪高速上,但是车流方向刚好相反,主要车流来自山东和上海方向,主要流向是G2青县主线站,通往天津和北京。
可以看出,G2京沪高速通道由于连接京津冀和长三角城市群的两大核心城市,是冀中南城市群收费公路交通流最繁忙的路段。假期交通流倾向于从北京到上海的下行方向,而工作日交通流则倾向于从上海到北京的上行方向,与北京和上海的城市功能定位相符。
6. 首位联系强度。计算冀中南城市群的首位联系强度(表5)。
表5 冀中南城市群首位联系强度
石家庄作为省会城市,在冀中南城市群关联网络的核心优势并不明显,辐射影响范围有限。虽然石家庄市是冀中南城市群中首位联系城市多的城市,但是3个城市均是接壤城市。而石家庄的首位联系城市是与其接壤的经济总量倒数第2的邢台。
冀中南城市群的首位联系城市均是接壤城市,说明冀中南城市群交通流主要分布在范围较小的市内和临近城市,就近运输特征明显,缺少强大的核心城市吸引带动较大范围的城际交流(图11)。
图11 2013年1月份冀中南城市群OD分布
总体上,冀中南城市群空间关联网络发展水平不高。
选取了2013年1月OD矩阵的数据作为研究对象y,将城市的GDP和人口作为解释变量,构建冀中南城市群的重力模型,变量清单见表6。
表6 模型中使用的变量
经过参数估计和假设检验,分析结果见表7。
表7 模型参数估计与检验
模型方程为:y=1.064X起_GDP+0.978X终_GDP-0.505X起_人口-0.363X终_人口-0.536G_距离+6.715
其中,样本个数n=49;R2=0.832,说明模型的拟合效果较好。
对于解释变量的系数,X起_GDP,X终_GDP,G_距离的p值均<0.001,说明起点城市GDP对流量有显著的影响,起点城市的GDP越高,车流量也会越多,终点城市GDP对车流量也会有显著的影响,终点城市的GDP越高,车流量也会越多;城市之间的距离对车流量也会有显著的影响,城市之间距离越大,两地之间的车流量就会越少。另外,X起_人口和X终_人口的p值分别为0.174和0.327,尚无法认为起点城市的人口和终点城市的人口对城市间的车流量有显著影响,这可能是因为交通流变量中没有将客流与货流区分,人口对客流的影响更加显著,对综合交通流量的影响没有GDP显著。
拟合值的部分结果见表8所示。
表8 部分拟合结果
可见,基于公路收费大数据构建的城际公路交通流网络,为模拟解析城市群空间关联网络结构提供了有效工具。
第一,基于公路交通流解析城市群关联网络是必要、可行与有效的。相比铁路、航空等其他交通方式,公路交通流更适宜分析城市群尺度的空间关联网络。通过对冀中南城市群的实证研究,利用公路收费数据构建城市之间和收费站点间的OD矩阵,能够揭示城市群之间宏观和微观的交通流网络特征。通过实际的公路收费数据构建的城市群OD矩阵,结合重力模型,可以开发出统计模型,为描述、测量和模拟解析城市群关联网络提供有效工具。
第二,揭示了特定时空范围内的京津冀城市群交通流网络的分化特征。冀中南城市群内部的交通流分布以就近出行为主要特征,交通流量与GDP和人口等经济总量指标一般成正比,但也受到交通资源分布的影响,比如沧州由于黄骅港的存在,其集装箱货车进出量都远高于其他城市。在对外交通上,冀中南地区交通流分布具有明显的过境特征,成为京津地区与其他地区交流的过境通道,具体表现为节假日大量车辆从北京往上海等方向下行,而工作日车流方向相反。
第三,揭示了京津冀城市群关联网络的局部非均衡发展特征。冀中南地区在京津冀协同发展中明显滞后,一方面,北京作为京津冀协同发展核心区在生成和吸引交通流方面优势明显,而冀中南城市群更多地承担过境交通功能,在吸引交通流方面能力较弱;另一方面,冀中南城市群内部关联网络发展水平也较低,石家庄作为省会城市对于周边城市的影响辐射能力不足,城市群出行半径普遍较短,关联网络的核心与层次性不明显。邯郸等南部地区与京津冀城市群的关联网络相对较弱,有游离于京津冀城市群协同发展的迹象。在京津冀协同发展中,要充分重视和发挥冀中南城市群的交通资源与区位优势,比如沧州市的黄骅港,带动冀中南腹地城市协同发展,支撑引领河北省建设“全国现代商贸物流重要基地”。
第四,建议加快建设京津冀交通大数据分析平台,统筹整合三地公路、铁路、航空等综合交通大数据资源,提高大数据生产服务的标准化水平,在大数据开放共享与经济运行监测等国家大数据战略实施重点领域先行探索突破。平台一方面服务于京津冀交通一体化的精细化管理;另一方面,服务于区域经济运行分析,通过交通大数据来揭示和预测京津冀城市群的经济与社会关联状况,为京津冀协同发展提供监测预警技术支持。
[1]TAYLOR P J, HLYLER M, VERBRUGGEN R. External Urban Relational Process: Introducing Central Flow Theory to Complement Central Place Theory[J]. Urban Studies, 2010, 47(13): 2803-2818.
[2]TAYLOR P J, CATALANO G, WALKER D R F. Measurement of the World City Network[J]. Urban Studies, 2002, 39(13): 2367-2376.
[3]MALECKI E J. The Economic Geography of the Internet’s Infrastructure[J].Economic Geography, 2002, 78(4): 399-424.
[4]DERUDDER B, WITLOX F. Mapping World City Networks Through Airline Flows: Context, Relevance, and Problems[J]. Journal of Transport Geography, 2008, 16(5): 305-312.
[5]MAHUTGA M C, MA X, SMITH D A, et al. Economic Globalization and the Structure of the World City System: The Case of Airline Passenger Data[J]. Urban Studies, 2010, 47(9): 1925-1947.
[6]WANG JIAO’E, MO HUIHUI, WANG FAHUI. Evolution of Air Transport Network of China 1930-2012[J]. Journal of Transport Geography, 2014, 40: 145-158.
[7]WANG JIAO’E, JIN FENGJUN, MO HUIHUI, et al. Spatio Temporal Evolution of China’s Railway Network in the 20th Century:An Accessibility Approach[J]. Transportation Research PartA: Policy and Practice, 2009, 43(8): 765-778.
[8]金凤君.我国航空客流网络发展及其地域系统研究[J].地理研究,2001,20(1):31-39.
[9]金凤君, 王成金. 轴-辐侍服理念下的中国航空网络模式构筑[J]. 地理研究, 2005, 24(5): 774-784.
[10]戴特奇,金凤君,王姣娥.空间相互作用与城市关联网络演进——以我国20世纪90年代城际铁路客流为例[J].地理科学进展,2005(2):80-89.
[11]武文杰,董正斌,张文忠,等.中国城市空间关联网络结构的时空演变[J].地理学报,2011(4):435-445.
[12]冯长春, 谢旦杏, 马学广, 等. 基于城际轨道交通流的珠三角城市区域功能多中心研究[J]. 地理科学, 2014, 34(6): 648-655.
[13]罗震东, 何鹤鸣, 韦江绿. 基于公路客流趋势的省域城市间关系与结构研究[J]. 地理科学, 2012, 32(10): 1193-1199.
[14]高鑫.基于交通流的重庆市各区县关联网络研究[D].长春:东北师范大学,2014.
[15]陈阳.京津冀地区城市体系演化研究——基于关联网络和价值区段的分析方法[M]//中国城市规划学会.多元与包容——2012中国城市规划年会论文集(01.城市化与区域规划研究).北京:中国城市规划学会,2012:10.
[16]鲁金萍. 京津冀城市群经济联系网络研究[J]. 经济问题探索, 2015(5):117-122.
【责任编辑 郭 玲】
Research on the Association Network of Urban Agglomeration Based on Highway Traffic Flow ——Taking Beijing-Tianjin-Hebei Urban Agglomeration as an Example
FU Yi-ming, ZHAO Yan-yun
(College of Statistics,Renmin University of China, Beijing 100872, China)
This study constructed an analysis method of urban agglomeration association network based on large data of highway traffic flow, applied it to analyze Beijing-Tianjin-Hebei urban agglomeration, and provided policy recommendations for the coordinated development of Beijing-Tianjin-Hebei areas. By empirical analysis, based on Hebei Province highway toll data,the paper established an OD matrix in middle and south of Hebei urban agglomeration, and by combining with the urban GDP, population and geographical location and other factors, the paper did the statistical analysis on the city level and charges station level of traffic flow distribution to reveal the traffic flow characteristics in middle and south of Hebei urban agglomeration and Beijing-Tianjin and the surrounding areas; further, by using the gravity model to simulate the traffic flow of urban agglomeration, the application of the large data of traffic flow in the urban agglomeration association network is deepened. The results showed that the distribution of traffic flow in Mid-southern Hebei region is differentiation between internal travel which is near and external travel which is border crossing. The association network of Mid-southern Hebei region is weak, the degree of integration is root high,the influence range of shijiazhuang is limited,and the core and connection of the network should be strengthened. Finally,the suggestions on accelerating the construction of Beijing-Tianjin-Hebei traffic big data platform were given for exploring the big data open sharing and economic operation monitoring and early warning and other national big data strategies.
highway traffic flow; big data; Beijing-Tianjin-Hebei urban agglomeration; association network.
2016-04-20
中央在京高校重大成果转化项目:“京津冀协同一体化发展研究”专项资助。National University’s Transformation of Major Achievements: “Research on the Policy for Collaborative Development of Beijing-Tianjin-Hebei”
傅毅明(1984—),男,福建南安人,经济学博士,中国人民大学统计学院博士后、高级工程师,主要研究方向:公共政策分析、大数据统计应用等。
F503
A
1005-6378(2016)04-0091-10
10.3969/j.issn.1005-6378.2016.04.013