杨 飞,姚振兴
(西南交通大学交通运输与物流学院,四川成都610031)
基于手机传感器数据的出行特征提取方法
杨 飞,姚振兴
(西南交通大学交通运输与物流学院,四川成都610031)
手机调查方法的已有研究较多集中于基于手机信令数据的宏观出行特征获取,而手机传感器数据在个体出行链微观出行特征提取方面具有优势。针对城市居民多采用组合交通方式出行的特征,研发智能手机应用软件,实现GPS数据(位置坐标与速度)、加速度计、服务基站、WiFi等传感器数据采集。运用小波分析、神经网络等数据挖掘技术分析不同交通方式出行数据差异,探索多种数据挖掘算法用于个体出行参数提取的可行性及效果。结合实际案例,总结应用手机传感器数据进行出行特征精细化提取的难点和技术关键。最后,探讨精细化个体出行数据在交通模型和理论优化方面的应用。
大数据;智能手机;传感器数据;出行特征;数据挖掘;交通模型优化
纸质问卷、电话采访、邮件访问等传统居民出行调查方式依赖被调查者主观回忆,长期存在数据精度低、样本量有限、组织烦琐困难等缺陷,越来越难以支撑规划师对居民出行时变规律和个体精细化出行参数的把握,交通规划方案常常不能达到预期效果。随着无线通信技术的发展和智能手机的快速普及,利用手机采集居民日常出行位置数据具有很好的应用前景。据工业和信息化部统计,截至2015年7月,中国手机用户已达到12.9亿[1]。相对传统调查技术,手机调查方法具备数据客观精确、时空连续、样本量大、内容丰富等优势。目前手机出行调查技术正处于起步后快速发展阶段,技术创新和应用推广是当前阶段研究的重点与难点。
根据研究对象不同,应用手机移动定位技术提取个体出行参数主要分为手机信令调查技术和手机传感器(GPS、加速度计、WiFi等)调查技术两大方向。
21世纪初开始,逐渐有研究机构致力于利用手机信令数据分析城市居民活动规律和出行特征。当前该技术已能够采集城市人口职住分布、通勤出行特征、热点地区人流来源去向、大区OD量等内容。研究指出,手机定位调查技术在动态数据获取、数据精度方面存在明显优势[2],手机信令调查技术相对其他评估手段具备数据精确、完整、操作方便、成本低廉等优点[3]。上海等城市从2010年开始陆续开展手机信令调查技术研究和应用试验,在人口昼夜分布特征、职住平衡、查核线调查、大区OD调查等方面取得较好的研究成果[4]。
随着智能手机的快速发展和普及,手机GPS、加速度计、WiFi等传感器的精确定位能力快速引起国内外学者的关注,手机传感器数据能够很好地弥补手机基站大尺度定位问题,对提取精细化交通参数具有更好的帮助和支撑。2008年,文献[5]提出一种基于网站信息提示的个体出行调查方法,首先利用手机GPS定位数据识别个体出行活动特征,进而利用网站信息公布的形式帮助出行者完成出行活动回忆调查,从而最大限度地减少被调查者回忆负担。研究表明,该方法对于个体出行活动的调查效果较好,居民调查配合意愿较高。2012年,美国俄亥俄州交通部(Ohio Department of Transportation)依托综合交通调查对克利夫兰市4 545户家庭进行手机GPS出行数据采集,并要求其中的1 300户家庭进行网上出行日志填写,这些出行日志信息主要用来校核出行目的、出行方式等识别结果[6],该综合交通调查首次完全应用手机GPS调查技术取代传统问卷调查。
由于中国居民日常出行经常由多种交通方式组合完成,国外已有数据提取算法对中国城市的针对性和适用性不足,且对于一些关键数据的处理经验性较强,当交通环境变化时,方法普适性不理想。同时,当前智能手机大都配备了GPS、加速度计、陀螺仪、WiFi等多种传感器芯片,多类传感器数据有望实现互补融合,弥补单一数据源的局限和缺陷,若能结合用地性质和GIS地理信息,手机传感器调查技术用于精细化交通参数提取将具有很好的行业前景。
不同交通方式出行将产生差异化手机传感器数据,高效的个体出行信息提取算法应具备准确识别不同交通方式数据规律的特性。应用手机传感器数据进行个体出行参数提取通常包含两大步骤:1)通过识别出行停留点(出行目的地和换乘点),将全天候手机传感器数据分割为多个出行数据段,每段出行又进一步分割为多个单一交通方式出行子段;2)应用数据挖掘算法识别每一字段对应的交通方式、出行时间等出行链信息。
已有研究大多通过设置时间和距离阈值来判断个体出行停留点,当两个连续定位点间隔时长超过时间阈值且间距小于距离阈值时,则认为该个体到达目的地或者换乘点。该类方法中时间和距离阈值通常根据经验设定,依赖专业人员对大量样本数据的学习和判断,方法普适性和可移植性较差,不同案例中时间和距离阈值差异较大[7-10]。当前还有待探索更为智能、普适的数据挖掘算法用于手机传感器数据切割。
由于手机GPS传感器能够以1s·次-1的频率连续记录个体出行过程中的速度数据,速度波动特征与信号波的波动特征非常相似,而个体出行停留点则与信号波奇异点(突变点)特征非常相似,因此本文提出应用小波分析算法进行交通停留点识别。
若信号f(t)在某点有突变或某阶导数不连续,则称信号在此处有奇异性。一般用Lipschitz指数(简称Lipα)来描述信号的奇异性程度,设有非负整数n,n≤α≤n+1,如果存在常数A>0以及n次多项式使得
根据小波变换原理,当小波分析尺度较小时,母小波高速振荡并快速衰减,时间定位能力最强;而随着尺度的增加,小波将发生自身膨胀,母小波振荡频率减慢,时间定位能力变差。因此,小尺度上小波变换模极大值点对居民出行方式换乘时间定位最准确,本文出行停留点识别就是通过最小尺度上小波变换模极大值对应的时间点精确提取,即模极大值线与时间轴的交点为出行停留时间点。
小波分析中,一个奇异点处可能出现多条模极大值线,模极大值线的条数取决于小波函数的消失矩阶数。对于居民多种方式组合出行,交通换乘通常可以理解为在某地点瞬时完成,因此选择小波函数时,函数消失矩应尽量小一些,最好为1阶消失矩函数。同时,小波函数的选择也应兼顾奇异点时间识别的准确性。本文检验了Haar小波、Daubechies系列小波(D(n))、Gaussian系列小波(Gaus(n))等不同小波函数的应用效果,结果显示Complex Gaussian(1)在交通方式换乘点识别应用中效果最佳。
出行时间、出行距离等交通参数能够从手机传感器数据直接或简单计算获得,交通方式识别是手机传感器调查技术的主要难点。应用手机传感器数据进行交通方式识别的算法主要有逻辑规则算法和智能数据挖掘算法两大类。
逻辑规则算法通过学习不同交通方式出行数据特征,设置多组分类指标阈值进行识别[7-9,11]。通常这类算法运算较为简单,数据量大时仍能保持较高的计算效率,但算法过多依赖分类指标阈值的合适性,且道路交通条件变化时,固定的分类阈值必然会导致交通方式识别正确率较低。
为了减少主观经验判定,同时提升交通方式识别准确率,智能数据挖掘算法得到了广泛关注。目前能够用于交通方式识别的智能数据挖掘算法主要有神经网络[12]、模糊逻辑[10]、随机森林[13]、支持向量机[14]和贝叶斯网络[15]。智能数据挖掘算法的基本原理是通过大量自适应学习手机传感器数据与交通方式对应内在联系,进而构建交通方式判别函数进行模式识别。根据已有研究,智能数据挖掘算法一般能够准确识别步行、自行车和机动车三类方式,而对于机动车中小汽车和公共汽车方式,由于两者出行特征过于相似,区分较为困难,识别正确率约为40%~80%[10,13-14]。近年来,逐渐有学者尝试利用GIS地理信息匹配技术辅助公共汽车和小汽车的识别,例如基于公共汽车站匹配的公共汽车模式识别,公共汽车和小汽车的区分正确率约达到90%[13],算法具有较好的应用价值。
本文应用非线性识别能力较好的神经网络算法进行交通方式识别。对于神经网络输入属性设置,由于不同交通方式出行平均速度、最大速度都存在明显差异,因此将每分钟平均速度、最大速度作为神经网络训练输入属性;拥堵时段机动车流通常表现出断续前进现象,每分钟速度标准差和加速度方差能够较好地反映拥堵时段不同交通方式速度波动差异,同样也作为神经网络输入属性。交通方式为神经网络模型的输出属性。
本文基于开发的一款智能手机应用软件(APP)(见图1)进行手机传感器数据采集。与传统手持GPS仪器相似,智能手机GPS模块能够连续采集日期、时间、经纬度、卫星数、水平定位精度(HDOP)等数据;手机加速度计能够连续记录运动过程中手机平面三维加速度数据;手机WiFi模块则能够实时记录沿途WiFi热点名称。
图1 手机传感器数据采集软件Fig.1 Mobile app for cellular probe data collection
该软件同时考虑了数据采集和商业推广问题,强化了用户体验。数据采集方式分为两种:一种为定时性数据采集,即交通相关部门或企业根据需要在特定时间组织开展居民出行调查,按照现有抽样模式,安装软件并完成数据采集,给予被调查者一定的调查补贴;另一种方式为不定期数据采集,即在APP上发布各类调查活动,居民根据意愿参加数据采集,按规定上传完成调查数据后,给予一定的话费、打车券或公交刷卡次数等奖励。
图2 手机GPS传感器数据地图匹配结果Fig.2 Results of matching between mobile GPS data and map
图3 交通方式换乘点识别结果Fig.3 Transfer point identification for different travel modes
如图2所示为从出发点(重庆火车北站)到目的地(伊美大酒店)的一次试验出行分析过程。黄色点串为APP记录的GPS位置点轨迹,该用户从走出火车车厢A点开始打开APP记录传感器数据,步行至轻轨站B乘坐轻轨,其中B—C、D—E段为地下轻轨出行,因GPS信号受屏蔽而无法获得数据,用户在E点下车后步行到达目的地H。该次出行组合交通方式为步行—轻轨(部分位于地下)—步行。
图3为根据前文所述方法获得的交通方式换乘点识别结果。图3a为原始GPS速度折线图,其中有三段速度波动曲线,第一段和第三段速度波动较小,为步行出行段,中间速度波动较大的部分为轻轨在地上运行的数据曲线。图3b为该样本在不同分析尺度下小波变换系数模值计算结果图谱,可以看出,在交通方式换乘点,小波变换系数模值明显大于其他位置(即亮度增高)。图3c为图3b中尺度取特定值70时得到的小波变换系数模值曲线,交通方式换乘点小波变换系数的模值最大。图3d为不同分析尺度下,将模极大值点相连后获得的模极大值线,随着尺度的增加,最终只有在交通方式变化点才能够形成模极大值线。
对比出行日志数据发现,图3d识别结果基本与实际出行一致,其中轻轨在地面和地下运行的转换点也成功识别。在结束轻轨出行后步行穿过一个大型立体交叉口下时,由于GPS信号遮挡产生的波动也顺利识别,但这只是临时变换点而没有改变交通方式,需要将前后两段合并整合为同一步行方式段。
本案例的交通方式换乘点识别结果为:189 s(步行—轻轨),1 105 s(轻轨—步行)。对比出行日志发现,交通方式换乘点误差均在20 s以内,数据采集精度相较于传统调查方法得到大幅提升。这一案例也部分验证了在山地城市多GPS信号遮挡环境下算法的适用性。
1)构建基于活动的交通模型。
四阶段模型存在明显缺陷,交通领域一直在探索用于交通需求分析的新模型,基于活动(Activity-based)的交通需求分析成为研究重点。然而基于活动的交通需求预测模型要实现从理论到实践的跨越,必须有足够精细、准确的个体出行特征数据作为支撑,传统问卷调查获得的数据质量远远不能满足交通需求模型的升级要求。
本文提出的基于手机传感器数据的交通出行调查技术能够连续、全天候追踪个体出行活动全过程,通过互补、融合多种手机传感器数据,未来结合城市GIS、用地性质等数据,有望获得大样本(甚至全样本)个体出行链详细参数,包括出行OD、出行时间、出行距离、出行方式、换乘时间、换乘点、出行轨迹、出行目的等,能够为构建基于活动的新一代交通规划模型提供支撑。
2)提升传统四阶段模型精度。
通过采集个体出行参数,能够利用小样本精确数据标定优化传统四阶段模型,提升模型应用效果。例如交通分配阶段,不再根据路网阻抗,而是真实个体出行轨迹偏好和规律进行分配,路段流量分配结果将更加符合实际。再如,精细化的手机传感器数据能够支撑更加细化的交通小区划分(见图4),基于交通小区细分的四阶段模型能够取得更好的交通需求预测和分配效果;小样本准确数据还能够用于四阶段模型应用结果的校正与优化。
3)优化公共交通线网。
优先发展公共交通是缓解中国大城市交通拥堵问题的根本手段。当前很多城市公共交通车站300 m,500 m覆盖率达到较高水平,然而这并不意味居民能够方便乘车(如附近无所乘线路)。因此,准确掌握个体出行线路轨迹,解决公共交通出行难问题,成为提升居民公共交通出行意愿,进而提升公共交通分担率的重要手段。
手机传感器调查技术能够准确追踪并获得个体从公共交通车站到出发地和目的地的过程及时空距离,有助于深入了解车站客流来源去向,掌握公共交通沿线主要客流吸发点,揭示最后一公里规律特征,对指导轨道交通与公共汽车接驳、优化已有公共汽车交通线网有很好的指导意义。
4)指导新区开发建设规模与时序。
大型城市新区开发建设过程中的土地利用和开发项目是按照时序逐步推进的,商业项目建成后的人气聚集需要长时间的积累过程,面对新区逐渐增长的交通需求不确定性,交通服务配置较为困难。例如公交线路、发车频率的确定,以及公共自行车配置规模等。
传统居民出行调查方法很难获取新区开发过程中动态的出行需求,而手机传感器调查技术通过采集进入新区内个体移动轨迹、基站小区服务人数等信息,有助于摸清新区范围内以及与新区相关区域的全天候出行活动特征,从而弹性配置交通配套服务,避免设施闲置浪费。
5)其他应用。
基于智能手机传感器数据的出行特征精细化提取方法还可用于掌握大型交通枢纽客流的集散交通方式和流向分布,为交通枢纽精细化交通组织设计提供科学依据。此外,还能够用于监测地区人员活动强度,对大型活动期间公共场所安全人流密度监测和控制提供支撑,预防踩踏事故等。
图4 交通小区与交通子区的出行OD期望线对比Fig.4 Comparison of desire lines between traffic zones and sub-zones
本文将理论研究与实践相结合,深入探索利用手机传感器数据挖掘提取个体交通出行链信息的技术流程和实现方法,提取的精细化个体出行数据可应用于构建基于活动的交通模型、传统四阶段模型校正、公共交通线网布局优化、新区交通规划、公共安全预警等方面。基于此成果,可以进一步探索在多种道路交通环境条件下,手机传感器数据提取出行信息的可行性及效果评估方法。
[1]中华人民共和国工业和信息化部.2015年7月电话用户分省情况[EB/OL].2015[2015-07-16].http://www.miit.gov.cn/n1146312/n1146904/n1648372/c3337869/content.html.
[2]Calabrese F,Diao M,Di Lorenzo G.Understanding Individual Mobility Patterns from Urban Sensing Data:A Mobile Phone Trace Example[J].Transportation Research Part C:Emerging Technologies,2013,26:301-313.
[3]Aguiléra V,Allio S,Benezech V,et al.Using Cell Phone Data to Measure Quality of Service and Passenger Flows of Paris Transit System[J].Transportation Research Part C:Emerging Technologies,2014,43:198-211.
[4]Shanghai Meihui Software Co.,Ltd.Traffic Data Experts with Muti-source Data[EB/OL].2015[2015-11-21].http://www.meihuichina.com/e-index.htm.
[5]Auld J,Williams C,Mohammadian A,et al.An Automated GPS-based Prompted Recall Survey with LearningAlgorithms[J].Transportation Letters,2009,1(1):59-79.
[6]Wolf J,Bachman W,Auld J,et al.Applying GPS Datato Understand Travel Behavior[R].NCHRPR 775,Washington DC:Transportation Research Board,2014.
[7]Bohte W,Maat K.Deriving and Validating Trip Purposes and Travel Modes for Multiday GPS-based Travel Surveys:A Large-scale Application in the Netherlands[J].Transportation Research Part C:Emerging Technologies,2009,17(3):285-297.
[8]Stopher P,FitzGerald C,Zhang J.Search for a Global Positioning System Device to Measure Person Travel[J].Transportation Research Part C:Emerging Technologies,2008,16(3):350-369.
[9]Chen C,Gong H,Lawson C,Bialostozky E.Evaluating the Feasibility of a Passive Travel Survey Collection in a Complex Urban Environment:Lessons Learned from the New York City Case Study[J].Transportation Research Part A:Policy&Practice,2010,44(10):830-840.
[10]Tsui S Y A,Shalaby A S.Enhanced System for Link and Mode Identification for Personal Travel Surveys Based on Global Positioning Systems[J].Transportation Research Record,2006,1972(1):38-45.
[11]Chung E H,Shalaby A.A Trip Reconstruction Tool for GPS-based Personal Travel Surveys[J].Transportation Planning and Technology,2005,28(5):381-401.
[12]Gonzalez P A.Automating Mode Detection for Travel Behavior Analysis by Using Global Positioning Systems-enabled Mobile Phones and NeuralNetworks[J].IETIntelligent Transportation System,2010,4(1):37-49.
[13]Stenneth L,Wolfson O,Yu P S,Xu B.Transportation Mode Detection Using Mobile Phones and GIS Information[C]//Agrawal D,Cruz I,et al.Proceedings of the 19th ACM SIGSPATIAL International Conference on Advances in Geographic Information Systems.Chicago:ACM SIGSPATIAL,2011:54-63.
[14]Zheng Yu,Liu Like,Wang Longhao,Xie Xing.Learning Transportation Mode from Raw GPS Data for Geographic Applications on the Web[C]//Huai J,Robin C.Proceedings of International Conference on World Wild Web.Beijing:Beijing Beihang Assets Management Co.,Ltd.,2008:247-256.
[15]Feng T,Timmermans H J.Transportation Mode Recognition Using GPS and AccelerometerData[J].Transportation Research Part C:Emerging Technologies,2013,37:118-130.
Cellular-based Data Extracting Method for Travel Characteristics
Yang Fei,Yao Zhenxing
(School of Transportation and Logistics,Southwest Jiaotong University,Chengdu Sichuan 610031,China)
Existing research of cellular-based survey methods mainly focus on travel characteristics at macro level.It should be known that cellular probe data also have great advantages of extracting travel characteristics at micro level–individual travel chains.Considering majority of urban residents'multimodal travel patterns,a mobile app is developed to retrieve traveler disaggregated data,such as GPS(coordinates and speed),accelerometer through base station and Wi-Fi connectivity.This paper analyzes the difference in data from various travel modes using wavelet analysis,neural network and other data mining techniques.The feasibility and multiple data mining algorithms used to extract individual travel parameters are discussed.Based on case studies,the paper summarizes difficulties and key technical points of using cellular probe data to extract accurate travel characteristics.Finally,the paper discusses the application of individual travel data in transportation modeling.
big data;smartphone;probe data;travel characteristics;data mining;optimization of transportation models
1672-5328(2016)01-0009-06
U491.1
A
10.13813/j.cn11-5141/u.2016.0102
2015-08-31
国家自然科学基金面上项目“融合多源移动定位时空数据的居民出行调查与活动行为分析技术研究”(51178403)、教育部“新世纪优秀人才支持计划”项目“基于新一代移动通信事件和定位技术的城市交通管理决策支持研究”(NCET-13-0977)、成都科技局资助项目“新型城镇化战略下的成都市城乡交通发展策略研究”(2014-RK00-00034-ZF)
杨飞(1980—),男,重庆人,教授,博士生导师,主要研究方向:智能交通。
E-mail:yangfei_traffic@163.com