基于手机信令的空间位置数据计算职住地

2017-01-07 01:27许洪波许金辉
北京测绘 2016年6期
关键词:居住地信令城市交通

许洪波 许金辉

(北京亿阳信通科技有限公司,北京 100093)

基于手机信令的空间位置数据计算职住地

许洪波 许金辉

(北京亿阳信通科技有限公司,北京 100093)

通过手机信令数据提取人们在使用手机时记录下来的基站位置和服务时间,用以识别居民出行的职业地和居住地。在分析提取到的手机信令数据时,由于数据采集、整合的质量问题,需要对手机信令数据进行提取、清洗、关联等预处理,在预处理后的标准化数据的基础上,通过搭建数学算法、模型来识别职业地和居住地,用以辅助城市交通调查、规划。

手机信令 职业地 居住地 交通调查 交通规划

1 引言

近年来,随着定位技术、互联网技术和移动通讯技术的不断发展以及政府在数据开放、共享上的政策推动,人们迎来了“大数据时代”[1]。至2015年10月,中国移动电话用户规模突破13亿[2],手机已经成为了人们日常生活的必需品。在出行群体中的手机拥有率和使用率已达到较高比例。在人们使用手机接打电话、收发短信、上网浏览网页等行为时,就会记录下来手机所在的基站位置和服务时间。手机大数据使得我们获取大量动态的、带有精准时空信息的个人数据成为可能,为关注个人的时空间行为提供了重要的契机和数据基础,同时深刻影响着居民的生活方式和学者的研究范式,在交通规划领域掀起了手机信令数据研究的一次热潮。

通过海量手机信令数据分析,构建数学模型、算法,可掌握城市居民的职住地出行的往返特征,为城市交通规划研究提供了一种全新的数据获取技术方法。本文结合厦门市手机信令数据与城市交通规划的大数据研究,阐述了手机信令数据的基本处理流程和职业地与居住地的识别算法。

2 数据处理

2.1 信令数据

研究采用的手机信令数据是一种典型的手机大数据,它通过数量庞大的基站连续不断地追踪手机用户的位置、状态等信息,实现对居民活动比较全面完整的记录。与传统数据和其它大数据相比,手机信令数据的突出价值在于近似全面样本性、全时性,以及借助定位基站而附带的时空间信息,因此在研究城市交通规划上最切合需求。

手机信令数据主要包括四个信息:

(1)匿名用户编号MSS:可以理解为手机用户的ID;

(2)时问戳:记录了信令事件的发生时问;

(3)基站小区编号:信令事件发生时所在的基站小区;

(4)信令事件类型:记录了用户手机行为属性,如挂机、发短信、接短信、主叫、被叫、正常位置更新、小区切换等。

2.2 数据预处理

对手机信令数据进行清洗,剔除异常数据,主要的数据处理过程:

(1)数据表的整理主要是将信令的原始txt文件的几个表数据,经过关联处理,整理成如下结构的规则如表1:

表1 数据整理规则表

续表1

(2)删除重复数据的方法是基于表1:

1)以IMSI分组,按ODATE及OTIME升序排序;

2)遍历数据,以IMSI分组,找出经纬度坐标相同的连续记录块;

3)对于相同IMSI的一组连续的记录块,将第一条记录的DDATE和DTIME替换为最后一条记录的DDATE和DTIME,保留第一条记录,删除其余记录;

4)处理完所有连续记录块后,根据每条记录离开时间与进入时间之差,计算停留时长STAY;

5)全月数据整体处理,不按日期分割,需要注意不同日期交接处的数据处理,以及停留时间的计算。

(3)剔除无效切换的数据过程如下:

1)针对同一IMSI编号,顺次选取三条记录(第n-1条、第n条、第n+1条),如果第n-1条记录与第n+1条记录坐标相同,且与第n条记录不同,则标记第n条记录为一条乒乓记录;例如:CABABABAD标黄的部分为重复组,红字表示乒乓记录,这个情况属于具有5条乒乓记录的重复组。

2)对于只有一条乒乓记录的重复组(CABAD),考虑两点间的距离和事件发生的时间。首先,计算第n条记录的穿越速度(Dn/TSn),当第n条记录与第n+1条记录距离小于1km时,穿越速度如果大于步行平均速度(6km/h),则第n条记录坐标修改为第n-1条记录的坐标;否则不作修改。其次,以记录时刻为依据,将凌晨02:00:00-06:00:00来回切换的数据(指其中的B记录的time1或time2落在该时段内),直接替换为相邻坐标。

3)对于大于等于两条乒乓记录的重复组(CABABD以及CABABAD),将第一个乒乓记录坐标替换为其相邻的记录坐标,一个重复组内沿用相同规则进行替换,不再依次进行判断。

4)遍历结束后重复步骤2。

(4)标识停留点

完成前三步骤的数据处理后,根据每条记录的STAY字段,筛选出大于等于30min的记录,为所有用户的停留点,标识为1

3 数据分析

职住出行是指从家(居住地)中往返工作地点的出行过程,职住出行是城市居民最基本和最重要的出行,相对于其他出行,职住出行在时间和空间上具有更大的规律性,其时间安排直接影响城市居民其他活动和出行的选择。特别是随着城市进程加快,城市扩张迅速,导致居民就业范围的扩大,职住出行的距离、时间不断增加,使得职住出行日益复杂。因此,有必要对居民的职住出行特征进行全面的分析研究,掌握职住出行的规律,改善出行的交通环境,为城市交通规划研究提供数据支撑。

(1)居住地识别的主要算法过程:

1)根据居民的生活及休息时间的特征判定绝大多数居民,在所观测时间段内(22:00-6:00),都处于休息、睡眠状态。在这段时间,居民应该主要停留在居住地,因此,我们可以计算居民在每个停留点的相对停留时间,作为识别居民居住地的指标。样本i在停留点j的相对停留时间为:

3)针对每一个居民,我们选取使得P取值最大的j作为居民的居住地,即:

4)表2给出了7个样本的前5个P的取值(按照由大到小排列),我们可以发现,通常每个用户的最大相对停留时间要远大于其他相对停留时间。

表2 相对停留时间表

按照这种方法,我们能够将所有用户的居住地识别出来。但是,这种方法忽视了上夜班或者作息不规律的一部分人,可能将其工作地错误地识别为居住地。但考虑到此类情况在居民中所占比例不大,利用大数据大样本的优势,这种方法在一定误差范围内也能够被接受。以厦门市的移动运营商的数据为数据源,识别出来的居住地可视化图(图1)。

(2)职业地的识别:

根据居民的生活及上班的时间特征,从预处理的数据中提取平均停留时间和平均信令条数大于一定的阈值的数据,识别某地是工作地或是非工作地,计算过程分为以下3步:

1)根据时间截取数据:提取原始数据中工作日(周一到周五)每天上午9点到下午5点之间的数据work_data;

2)根据步骤(1)得到work_data,计算每个经纬度点的累计停留时间,累计信令天数及该经纬度点出现的天数;

3)根据步骤(2)结果计算每个经纬度点的特征值:

a)平均停留时间=累计停留时间/出现天数

b)平均信令条数=累计信令条数/出现天数

通过设置平均停留时间和平均信令条数的阈值,识别为工作地,以厦门市移动运营商的数据为数据源,识别出来的职业地热力图,见图2。

4 结语

本文通过手机信令数据,构建数学模型计算职住地,所得结果经与城市交通调查的数据成果对比,一致率达到90%,所得结果与实际调查结果极为接近,成果可信度高。

本文的研究成果可用于交通规划的通勤特征分析,如通勤距离、通勤时间、职住特征等研究,这是本文后续的研究方向。

[1] 柴彦威.大数据研究需“以人为本”[J].城市规划学刊,2015,(3):4-4.

[2] 中华人民共和国工业和信息化部.2015年通信运营业统计公报[EB/OL].2016[2016-01-21]. http://www.miit.gov.cn/n1146290/n1146402/n1146455/c4611243/content.html.

[3] 张天然,基于手机信令数据的上海市域职住空间分析 [J].城市交通,2016,(1):15-22.

[4] 杨超,张玉梁,张帆,基于手机话单数据的通勤出行特征分析-以深圳市为例 [J].城市交通.(1):30-36.

[5] 王德,王灿,谢栋灿等,基于手机信令数据的上海市不同等级商业中心商圈的比较-以南京市东路、五角场、鞍山路为例 [J].城市规划学刊,2015,(3):50.

[6] 汪光焘,大数据时代城市交通学发展的机遇 [J].城市交通,2016,(1):01-07.

Calculation of Spatial Position Data Based on Mobile Phone Signaling Work and Live

XU Hong-bo,XU Jin-hui

(Beijing Boco Inter-Telecom, Beijing 100093, China)

Using the mobile phone signaling data to extract the location of the base station and the service time recorded when the mobile phone is used to identify the occupation and residence of the residents. In analysis to extract the cellular signaling data, due to the data acquisition, the integration of quality problems and need of cellular signaling data extracting, cleaning and relatedpre processing, in the standardization data preprocessing based, through building the mathematical model and algorithm, to identify occupation and residence, to assist urban traffic survey and planning.

mobile phone signaling; work place; place to live; traffic investigation; traffic planning

2016-05-13

P208

B

1007-3000(2016)06-4

猜你喜欢
居住地信令城市交通
水泄不通
你熟悉“成长经典”吗
共享单车对城市交通的影响
共享单车对城市交通的影响
鸟类居住地
城市交通旅游电子地图的研究与应用分析
浅谈JSQ-31 V5数字程控用户交换机NO.7及NO.1信令参数设定及不同
LTE网络信令采集数据的分析及探讨
流动人口参与居住地选举的困境及其实现路径
围绕城市交通出行,博世打造兼具软件和服务的数字化企业