基于移动网络流量日志的城市时空行为分析

2016-06-30 07:46强思维陈夏明姜开达金耀辉
计算机研究与发展 2016年4期

强思维 陈夏明 姜开达 金耀辉,

1(区域光纤通信网与新型光通信系统国家重点实验室(上海交通大学) 上海 200240)2(上海交通大学网络信息中心 上海 200240) (qiangsiwei@sjtu.edu.cn)

基于移动网络流量日志的城市时空行为分析

强思维1陈夏明1姜开达2金耀辉1,2

1(区域光纤通信网与新型光通信系统国家重点实验室(上海交通大学)上海200240)2(上海交通大学网络信息中心上海200240) (qiangsiwei@sjtu.edu.cn)

摘要城市的空间组织和居民行为研究是城市地理学研究的重点,随着信息技术的快速发展,居民的时空行为对城市空间的组织和结构的影响呈现出日益增加的趋势,因此,对城市空间以及居民时空行为的深入分析具有很高的研究价值.通过采集杭州市区移动3G网络流量日志,首先采用空间点模式的分析方法研究了城市居民的聚集模式,并研究了居民移动的距离、方向等方面的特征;之后采用网格的方法对城市空间进行分块,并以区块为主体研究了热点区块出现的时空点、区块人流的更迭速率、工作日人流的潮汐效应;提出了区块差异指数的概念,并利用其对区块进行聚类,分析了区块间的相关性和区块间距离之间的关系.由于所研究的数据来源于移动3G网络流量日志,因此具有覆盖面广、数据量大等特点,非常适合从大时空尺度层面研究居民和城市空间活动.

关键词时空分析;空间点模式;移动性分析;更迭速率;潮汐效应;差异指数

城市和居民的时空行为研究一直以来都是城市地理学研究的重点,主要包括:城市交通研究[1-2]、城市功能分区研究[3-4]、城市等级体系研究[5-7]等.随着信息技术的快速发展,居民的时空行为对城市空间组织和结构的影响呈现出了日益增加的趋势.因此,对居民时空行为的深入分析具有很高的研究价值.

时空数据的采集与处理通常是研究城市和居民时空行为的关键点和难点.传统的数据获取手段以人口普查和活动日志为最常用[8].然而,这类途径获取的数据通常具有一些弊端,例如,现有的人口普查方法并不能获知居民在物理空间中移动的实时情况、活动日志数据的精确性也因调查者的回忆、填写态度等影响而有不同程度的失真.在信息时代,除了利用以上传统方法,城市和居民的行为数据还能够通过智能手机、出租车、智能卡等方式获取,例如手机通话流量和位置数据、出租车位置信息、公交或地铁站点的刷卡数据[8].通过这一类途径获取的数据具有很好的实时性,并能够准确反映居民的真实行为和状态,其收集数据对应的用户群体、定位精度、定位时间、适合于研究的问题对比如表1所示:

Table 1 Comparison of Different Data Sources

本文主要的研究问题包括:杭州市区居民的时空行为的特点,包括了总人口的空间聚集性、居民的移动距离和移动方向;利用网格的方法将城市空间进行分块,主要包括定义和研究了热点区块出现的时空点、不同区块人流的更迭速率、展示了工作日人流的潮汐效应、提出区块差异指数的概念,利用其对区块进行了聚类,并分析了区块间的相关性和距离之间的关系.

1相关工作

随着定位技术的不断发展与广泛应用,基于GPS等定位技术的居民行为时空数据已被广泛应用于居民行为的研究中,研究的主体是城市居民,研究方向主要围绕城市居民通勤的特征,例如通勤模式、不同群体的通勤差异、职住关系与通勤行为、城市空间与通勤行为、过量通勤等[9-13],研究方法主要运用描述性统计、回归分析等分析方法.文献[14]通过收集10万用户的手机通话和短信时段基站定位的位置信息,分析说明用户的移动性除了包含随机性,在更大程度上更遵循一定的周期规律性,因此在对用户移动性建模时除了传统的莱维飞行或随机游走模型,还应该考虑时空的相关性.文献[15]通过调查获取了典型街区实体空间信息、被调查者的社会属性、通勤行为空间和对通勤沿路相关实体要素感知信息等对居民的通勤行为进行分析与模拟.文献[16]以北京市天通苑与亦庄2个郊区巨型社区为案例,采用GPS定位数据和活动日志相结合的为期1周的居民时空行为数据,分别利用传统方法和通勤弹性视角研究了居民的通勤特征.文献[17]基于2008年北京市连续1周的公交IC卡刷卡数据,结合2005年居民出行调查、地块级别的土地利用图,识别公交持卡人的居住地、就业地和通勤出行,分析了3大典型居住区和6个典型办公区的通勤出行特征,研究了通勤出行的主导方向以及2008年和2005年通勤时间和距离的相似性.文献[18-19]分别借用自然语言处理中的隐狄利克雷分布和改进DBSCAN聚类算法,通过分析城市中出租车的流量特征对城市的不同区块按照其功能的相似性对其进行分类.前人多就居民为研究对象展开研究,对于城市不同区块所承载的居民时空行为异同的研究较为有限,同时由于受限于数据来源,例如出租车的GPS数据只能涵盖一部分的城市人流特征,同时会受限于出租车的功能和道路等情况,因此研究对象的数量相对较少,运动轨迹受到约束,同时实时性也相对较弱.

2数据来源和基本研究方法

本文使用的数据来源于杭州市区移动3G网络流量日志,包含2012年8月16—28日大约2周的数据,数据包含移动用户识别码(IMSI)、用户上网时连接的基站的位置区编码(LAC)和小区标识(CI)、HTTP请求的时间戳等.本文主要通过IMSI字段区分单个用户,并将LAC和CI转换成基站的经纬度坐标,结合HTTP请求的时间戳标定用户出现的时空点.

图1是研究区域范围内的基站分布的密度统计图.可见市区中心的基站分布的密度较大而周边较小,但考虑到3G基站的覆盖范围最大可达数千米,因此,研究范围内的全部基站基本能够完全覆盖研究范围.

Fig. 1 Base station density.图1 基站密度

图2是按1h为时间窗口统计的工作日和周末的平均总接入用户数.可见,白天接入的用户较多,夜间较少,且工作日大于周末,白天每小时的接入用户数大约为7×104.

Fig. 2 The number of users connected to base station hourly.图2 每小时连接基站的总用户数统计

基于本文数据源,挖掘的难点主要体现如下:1)定位误差相对GPS定位误差较大,通常为数百米,无法将用户位置准确还原到城市的道路或建筑物中,缺少与之相关的语义信息;2)由于只有在用户上网的时间段才能获取用户的空间位置信息,因而,用户在时间轴上具有很大的跳跃性,难以从中推测出用户的轨迹信息.数据的来源限制了无法针对单个用户的挖掘,同时常用的轨迹挖掘方法也难以奏效.

由于难以准确获取个体用户连续时空位置,轨迹挖掘的方法失效,本文并不针对个体用户的行为进行挖掘,而是针对用户群体或利用网格对城市空间进行分块(将地理空间切分成均等大小的方块,经实验,粒度选为200~500m较为适宜,一方面与基站定位精度的尺度相当,同时保证了具有一定用户量以满足统计特性),研究大尺度范围内的城市空间和居民的时空行为.由于用户上网行为符合统计学规律,因此针对群体的统计能够符合真实情况.

本文的基本研究方法包括数据的存储、数据的处理和计算.由于数据量庞大,利用传统的关系型数据库进行管理和挖掘几乎不可能,因此,本文采用了HDFS对数据进行存储,并采用UCBerkeleyAMPLab所开源的HadoopMapReduce通用的并行计算框架Spark进行计算和分析,由于中间输出结果可以直接保存在内存中不再需要读写HDFS,因此Spark能够更好地适用于数据挖掘与机器学习等需要迭代的MapReduce算法.

3空间点模式和移动性分析

3.1空间点模式分析

平面空间点模式分析方法通常可被分为2类:1)检测空间过程的一阶影响,主要研究点事件的均值随着空间变化而变化的过程,常用方法是核密度估计法;2)检测空间过程的二阶影响,主要考察点过程之间的空间依赖性,其中Ripley’sK函数使用研究范围内的全部点之间距离来对集聚模式进行度量,因而更加稳定可靠[20].采用空间点模式的分析方法进行分析能够揭示出用户空间分布的基本规律.

核密度估计根据观测值获得概率密度的平滑估计值.对某区域内任意点上的事件密度进行估计,最常用的方法就是以该点为圆心,统计以r为半径范围之内事件发生的数量,然后除以圆的面积,因此s处的密度可以表示为

(1)

其中,r为带宽;k(·)为核函数,常为对称密度函数,可理解为点i处的权重,常用核函数有均匀核、二次核、三角核、高斯核、余弦核;di s为点i到点s的距离.带宽r决定了密度曲面的平滑程度.

本文首先利用网格方法对空间进行划分,统计出单日连接过区块内基站的用户数,再进行核密度估计.通常选择何种核函数不是密度估计中最关键的因素,因为任何核函数都可以保证对密度估计具有稳定性.本文选取采用了高斯核,而带宽选择对密度曲线边界的影响很大,带宽较小时边界光滑性较差;反之,当带较大时边界光滑性较好,但曲线拟合度较差,经实验比较区块和带宽的粒度选为500m较为适宜.图3是平均单日用户数统计的核密度估计图,显示了用户分布情况,可见,西湖周边区域人数较为密集,并向四周扩散呈现递减的趋势.

Fig. 3 Kernel density estimation of daily user number.图3 单日用户数核密度估计

K函数的基本思想是:假定依次在各个事件中心设置半径为d的圆,统计出落入圆内其他事件的数量,计算出其期望并除以总事件密度,并对于不同距离值不断重复这个过程.K函数定义为

(2)

Ripley’sL函数是Ripley’sK函数的一个变形,用来衡量点分布模式随尺度的变化规律,保持了方差的稳定.

(3)

在随机分布的假设下,L(d)的期望值等于0,L(d)与d的关系图可用于检验依赖于尺度d的事件的空间分布模式.L(d)第1个峰值对应的d值表示了事件空间集聚的特征空间尺度.

Fig. 4 L function analysis.图4 L函数分析

图4是工作日和周末的L函数分析图,横坐标为研究尺度d,纵坐标为L(d).由函数的曲线可见用户在空间分布上呈现出明显的聚集性,工作日更为明显,由函数的峰值可见用户分布的特征空间尺度约为6 200m.

3.2移动性分析

用户移动性分析主要分析运动用户移动的距离和方向,包括用户平均移动距离和时间之间的关系,以及位于不同区域的用户到达下一地点的方向和距离的倾向性,来揭示用户移动的基本时空规律.

用户的移动距离近似为某时间窗口内用户所有连接基站之间的最大距离.计算公式如下:

(4)

其中,uti.distance是用户u在时间窗口ti内移动的最大距离,在时间窗口内连接的基站数为n,dist(pi,pj)是基站pi和基站pj之间的距离.

图5是用户移动距离的统计和时间的关系,时间窗口为1h,箱线图包含了数据中的5个主要统计量:最小值、第一四分位数、中位数、第三四分位数以及最大值,能够显示数据的基本分布情况.由图5可见,工作日相对于周末的平均移动距离较大,并且在早、晚高峰显示出较为明显的通勤特征.

Fig. 5 Relation between moving distance and time of day.图5 移动距离和时间的关系

用户移动距离和方向的倾向性关于空间位置的关系,通过计算相邻2个时间窗口用户位置的变化来显示.其中用户在时间窗口ti的位置通过用户在时间窗口ti连接的所有基站位置的期望来近似,公式如下:

(5)

其中,uti.lng和uti.lat分别对应了用户u在时间窗口ti的经度和纬度,在时间窗口ti连接的基站数为n,pj.lng和pj.lat分别是第j个基站的经度和纬度.

图6所示的用户单日移动方向和距离图通过将用户在2个相邻的时间窗口的位置进行连线,按照东、南、西、北、东北、东南、西北、西南8个方向进行归类,计算出每个方位移动距离的期望.在图6中分别选取了位于市中心东(C)、南(D)、西(A)、北(B)、中(E)共5个地点进行观测,每个方向的半径分别表示了单日内用户向各个方向移动的期望距离.由图6可见,从区位关系上看,从各个地点到下一地点的移动方向大多指向中心城区,表明中心城区也是城市职能的强中心.

Fig. 6 Moving direction and distance of users in different areas.图6 不同区域用户移动方向和距离

4网格分块的区块行为分析

4.1热点区块

定义1. 热点区块.热点区块是某时间窗口内总人数统计中相对最多的x%区块.

研究热点区块(即人数最为稠密的区域)的时空行为对城市的规划,包括城市空间的组织和结构的调整以及相关公共资源,例如城市交通设施的建设、网络基站的部署,具有重要的指导意义.

本文首先利用网格方法对空间进行划分,粒度选为500m,总共有33 750个区块,之后统计出各时间窗口内各区块所包含的总用户数,并对其进行排序,取前0.1%(前34)的区块标记为该时间窗口内的热点区块.

图7分别对工作日、周末的白天和晚上各个时段统计单天内热点区块出现的空间位置以及出现的小时数,时间窗口为1h,柱状图的高度正比于热点出现的总时长.由图7可见,与西湖相邻的东北区域是白天热点的高发区域,其南北相邻的2块区域为晚上热点的高发区域,并且周末的热点与工作日相比较为分散.由此可以推测出,西湖相邻的城区中心区域可能为商业区,而两侧可能多为住宅区,工作日人口活动区域相对比较集中,而周末则比较分散.

Fig. 7 The position and duration of hot spots’ occurrences.图7 热点区块出现的位置和总时长

图8显示了1周内出现过热点的区块中热点出现的时间,有色部分表示该区域是该时间段的热点区域,并以区块每个小时热点是否出现为特征进行kmeans聚类得到的结果,其中k=3.由图8可见,热点出现可以分为3种模式,即白天出现(推测为商业区)、晚上出现(推测为住宅区)、突发出现(可能与突发事件相关).

Fig. 8 Hot spots’ occurrence time in one week.图8 一周内热点区块出现的时间

4.2区块人流更迭速率

定义2. 更迭速率.区块的更迭速率是区块在相邻时间窗口内所包含的相异用户的数量和相同用户的数量的比值,计算公式如下:

(6)

其中,sti和sti+1分别是时段ti和时段ti+1的区块用户的集合;#[·]表示集合大小.更迭速率的大小可用来说明区块内用户群体的稳定性或流动性.r越小表明用户集合越趋于稳定,反之流动性越强.

图9是工作日上午8时区块人流的更迭速率正规化后的结果,即某区块i的更迭速率如下:

(7)

其中,n为所有区块的数量.

Fig. 9 The change rate at 8:00 AM on weekday.图9 工作日上午8时区块人流更迭速率

由图9可见,工作日早高峰时段,区块更迭速率与区块的功能有着密切联系,更迭速率最大的一部分区块恰好位于主要道路.

Fig. 10 The relation between change rate and time of day.图10 区域平均更迭速率和时间的关系

图10显示了各个区块的平均更迭速率和时间的关系.可见白天人口的流动性高于夜间,早晚高峰最强;除早晚高峰,周末人口的流动性强于工作日,早晚高峰时段工作日人口流动性最强.

4.3差异指数和区块相似性

定义3. 差异指数. 区块的差异指数是区块人数在1d内的分布和全部区域人数在1d内的分布的差异,计算公式如下:

(8)

图11是工作日不同时刻差异指数经过正则化后在空间中的分布,红色和蓝色分别表示人口相对密集和稀疏的区域.可见,早、晚人口在杭州市周边区域较为密集,而白天则在中心区域较为密集,显示出工作日人流的潮汐效应,即早高峰人流流向市中心,晚高峰则相反.

Fig. 11 The tidal effect on weekday.图11 工作日人流的潮汐效应

图12是选取到的3个特殊地点计算出的差异指数随时间的变化趋势,图12中A,B,C分别对应了艮秋立交桥、黄龙时代广场、三塘北村东区.艮秋立交桥位于杭州市交通主干道的十字路口,黄龙时代广场位于商业区,三塘北村东区则位于住宅区,分别代表了城市的3种主要功能区域.由差异指数可见,以艮秋立交桥为代表的交通路段在早晚高峰呈现出明显的密集性,而以黄龙时代广场为代表的商业区和以三塘北村东区为代表的住宅区则分别在白天和晚上呈现出密集性.

Fig. 12 The relation of difference index and time of day on three example areas.图12 3个实例地点的差异指数随时间的变化

差异指数的分析有助于分析城市不同区域的功能特征,并能够利用其对城市的不同区块进行聚类,获知不同功能区块在空间中的分布情况.图13是提取各个功能区块的差异指数的时间序列作为特征,对其进行k-means(k=3)聚类得到的结果.图13(a)展示了3种不同类别的功能区域在空间中的分布情况;图13(b)展示了其聚类中心的差异指数随时间的变化,可以推测出蓝色、红色、绿色区域分别对应了交通路段、商业区、住宅区这3种典型的城市功能区域.

Fig. 13 The spatial distribution and the relations between the difference index and time of day for three clusters.图13 聚类的空间分布和聚类中心差异指数随时间的变化

利用差异指数还能够计算区块之间的相关性,其计算公式如下:

(9)

图14所示区域间的相关性和距离之间的关系,横坐标为对数坐标,可见区域间相关性与距离近似符合如下关系:

c(r)~-γlgr,

(10)

其中,γ表征了区域间相关性关于距离衰减的程度.同时可见,在4 000m空间尺度范围内区域间呈现正相关关系,大于4 000m则呈现出弱负相关性.

Fig. 14 The relation between the correlation of blocks and their distances.图14 区块间的相关性和距离的关系

5结束语

深入分析城市和居民时空行为对城市规划,包括城市空间的组织和结构的调整,具有很高的研究价值.本文通过采集杭州市区的移动3G网络流量日志,采用统计学的方法分析了杭州市区居民时空行为的特点.由于数据具有覆盖面广、数据量大等特点,处理过程中运用了Spark等大数据的处理工具和方法.研究内容主要包括了2方面:1)基于用户群体的空间点模式和移动性分析;2)基于网格分块的区块行为分析.前者采用空间点模式的分析方法,研究了城市居民的聚集模式以及居民移动距离、方向等方面的特征;后者则基于网格分块的区块行为分析,采用网格的方法对城市空间进行分块,以区块为研究对象,重点研究了热点区块出现的时空点、区块人流的更迭速率、工作日人流的潮汐效应,提出了区块差异指数的概念,并利用其对区块进行聚类,其中的每一个类别都对应了一种具有典型功能的区域,最后分析了区块间的相关性和距离之间的关系.

参考文献

[1]BeckerRA,CaceresR,HansonK,etal.Ataleofonecity:Usingcellularnetworkdataforurbanplanning[J].IEEEPervasiveComputing, 2011, 10(4): 18-26

[2]LiuY,KangC,GaoS,etal.Understandingintra-urbantrippatternsfromtaxitrajectorydata[J].JournalofGeographicalSystems, 2012, 14(4): 463-483

[3]HollensteinL,PurvesR.Exploringplacethroughuser-generatedcontent:Usingflickrtagstodescribecitycores[J].JournalofSpatialInformationScience, 2013, 1(1): 21-48

[4]CranshawJ,SchwartzR,HongJ,etal.Thelivehoodsproject:Utilizingsocialmediatounderstandthedynamicsofacity[C] //Procofthe6thIntAAAIConfonWeblogsandSocialMedia.MenloPark,CA:AAAI, 2012: 58-65

[5]NaamanM,ZhangAX,BrodyS,etal.OnthestudyofdiurnalurbanroutinesonTwitter[C] //Procofthe6thIntAAAIConfonWeblogsandSocialMedia.MenloPark,CA:AAAI, 2012: 258-265

[6]KringsG,CalabreseF,RattiC,etal.Urbangravity:Amodelforinter-citytelecommunicationflows[J].JournalofStatisticalMechanics:TheoryandExperiment, 2009, 7(3): 1-8

[7]KangC,ZhangY,MaX,etal.InferringpropertiesandrevealinggeographicalimpactsofintercitymobilecommunicationnetworkofChinausingasubnetdataset[J].InternationalJournalofGeographicalInformationScience, 2013, 27(3): 431-448

[8]QinXiao,ZhenFeng,XiongLifang,etal.Methodsinurbantemporalandspatialbehaviorresearchinthebigdataera[J].ProgressinGeography, 2013, 32(9): 1352-1361 (inChinese)(秦萧, 甄峰, 熊丽芳, 等. 大数据时代城市时空间行为研究方法[J]. 地理科学进展, 2013, 32(9): 1352-1361)

[9]SohnJ.Arecommutingpatternsagoodindicatorofurbanspatialstructure[J].JournalofTransportGeography, 2005, 13(4): 306-317

[10]LeeBS,McDonaldJF.DeterminantsofcommutingtimeanddistanceforSeoulresidents:Theimpactoffamilystatusonthecommutingofwomen[J].UrbanStudies, 2003, 40(7): 1283-1302

[11]SchwanenT,MokhtarianPL.Whataffectscommutemodechoice:Neighborhoodphysicalstructureorpreferencestowardneighborhoods[J].JournalofTransportGeography, 2005, 13(1): 83-99

[12]CaoX,MokhtarianPL.Howdoindividualsadapttheirpersonaltravel?Aconceptexplorationoftheconsiderationoftravel-relatedstrategies[J].TransportPolicy, 2005, 12(3): 199-206

[13]HornerM.Extensionstotheconceptofexcesscommuting[J].EnvironmentandPlanningA, 2002, 34(3): 543-566

[14]GonzálezMC,HidalgoCA,BarabásiAL.Understandingindividualhumanmobilitypatterns[J].Nature, 2008, 453(7196): 779-782

[15]ZhouSuhong,YanXiaopei.Theimpactofcommuters’travelpatternonurbanstructure:AcasestudyinsometypicalcommunitiesinGuangzhou[J].JournalofGeographicalSciences, 2006, 61(2): 179-189 (inChinese)(周素红, 闫小培. 基于居民通勤行为分析的城市空间解读——以广州市典型街区为案例[J]. 地理学报, 2006, 61(2): 179-189)

[16]ShenYue,ChaiYanwei.StudyoncommutingflexibilityofresidentsbasedonGPSdata:Acasestudyofsuburbanmega-communitiesinBeijing[J].JournalofGeographicalSciences, 2012, 67(6): 733-744 (inChinese)(申悦, 柴彦威. 基于GPS数据的城市居民通勤弹性研究: 以北京市郊区巨型社区为例[J]. 地理学报, 2012, 67(6): 733-744)

[17]LongYing,ZhangYu,CuiChengyin.IdentifyingcommutingpatternofBeijingusingbussmartcarddata[J].JournalofGeographicalSciences, 2012, 67(10): 1-14 (inChinese)(龙瀛, 张宇, 崔承印. 利用公交刷卡数据分析北京职住关系和通勤出行[J]. 地理学报, 2012, 67(10): 1-14)

[18]JingYuan,YuZheng,XingXie,DiscoveringregionsofdifferentfunctionsinacityusinghumanmobilityandPOIs[C] //Procofthe18thACMSIGKDDIntConfonKnowledgeDiscoveryandDataMining.NewYork:ACM, 2012: 186-194

[19]PanGang,QiGuangde,WuZhaohui,etal.Land-useclassificationusingtaxiGPStraces[J].IEEETransonIntelligentTransportationSystems, 2013, 14(1): 113-123

[20]GatrellA,BaileyT,DiggleP,etal.Spatialpointpatternanalysisanditsapplicationingeographicalepidemiology[J].TransoftheInstituteofBritishGeographers, 1996, 21(1): 256-274

QiangSiwei,bornin1989.PhDcandidateinShanghaiJiaoTongUniversity.Hisresearchinterestsincludedataminingandbigdataprocessing.

ChenXiaming,bornin1987.PhDcandidateinShanghaiJiaoTongUniversity.Hisresearchinterestsincludenetworkdataanalysisandbigdataprocessing.

JiangKaida,bornin1980.WorkinNetwork&InformationCenter,ShanghaiJiaoTongUniversity.Hisresearchinterestsincludenetworksecurity.

JinYaohui,bornin1971.ProfessorinShanghaiJiaoTongUniversityanddeputydirectorinNetwork&InformationCenter.Hisresearchinterestsincludecloudcomputinganddatamining.

UrbanSpatio-TemporalBehaviorAnalysisBasedonMobileNetworkTrafficLogs

QiangSiwei1,ChenXiaming1,JiangKaida2,andJinYaohui1,2

1(State Key Laboratory of Advanced Optical Communication Systems and Networks (Shanghai Jiao Tong University), Shanghai 200240)2(Network & Information Center, Shanghai Jiao Tong University, Shanghai 200240)

AbstractCity organization and residents’ behavior are one of the key researches in urban geography. With the rapid development of information technology, the impact of residents spatial and temporal behavior on urban spatial organization and structure shows a growing trend, therefore in-depth analysis of the spatio-temporal behavior of city space and urban residents has high research values. After the acquisition of Hangzhou mobile network traffic logs, the gathering patterns of urban residents are studied with spatial point pattern analysis, and the features of moving distance and direction are analyzed. Using grid approach, we divide the urban space into blocks, and focus on the emergence of hotspot point, the change rate of human flow, tidal effects on weekdays, and present the concept of blocks difference index which is used to cluster blocks and analyze the relationship between the correlation of blocks and their distances. Since our research data comes from mobile network traffic logs, it has a wide coverage and a large volume, which is ideal for search on residents and city behavior on large spatio-temporal scales.

Key wordsspatio-temporal analysis; spatial point pattern; mobility analysis; change rate; tidal effects; difference index

收稿日期:2014-11-24;修回日期:2015-05-27

基金项目:国家自然科学基金项目(61371084,61431009,61433009);国家“九七三”重点基础研究发展计划基金项目(2010CB328205)

中图法分类号TP274

ThisworkwassupportedbytheNationalNaturalScienceFoundationofChina(61371084,61431009,61433009)andtheNationalBasicResearchProgramofChina(973Program) (2010CB328205).