陆化普,孙智源,屈闻聪
(清华大学交通研究所,北京100084)
大数据及其在城市智能交通系统中的应用综述
陆化普*,孙智源,屈闻聪
(清华大学交通研究所,北京100084)
大数据给城市智能交通系统的技术发展与应用革新带来了机遇和挑战.从交通大数据的基本概念、交通大数据带来的问题和大数据驱动的数学建模方法等方面,阐述了交通大数据给智能交通系统带来的变革.为了深入理解交通大数据的内涵,分析交通大数据的产生背景,提出了交通大数据的“6V”特征,总结了智能交通系统中大数据的基本类型.面对交通大数据带来的数据安全、网络通信、计算效率和数据存储等诸多问题,提出了应对策略和思路.对数据驱动的建模方法进行了分析,说明了混合模型的意义.最后,讨论了大数据驱动的智能交通系统的体系框架.
智能交通;交通大数据;数据驱动;智能交通系统
随着信息技术、通信技术、计算机技术等的快速发展,数字城市(Digital City)与智慧城市(Smart Ctiy)接踵而来.1998年1月,美国前副总统戈尔发表了题为“数字地球——新世纪人类星球之认识(The Digital Earth:Understanding our planet in the21st Century)”的演说,数字地球的概念由此产生[1].2008年11月,时任IBM董事长兼CEO的彭明盛发布了题为“智慧地球:下一代领导人议程(A Smarter Planet:The Next Leadership Agenda)”的主题报告,正式提出了“智慧地球”(Smart Planet)的概念[2].数字城市和智慧城市都是美国的舶来品,二者都是信息化背景下现代城市发展的高级形态.当前,英国提出了“数字英国(Digital Britain)”计划[3],韩国提出了“U-Korea”战略和“U-City”综合计划[4],我国于2013年前后开展智慧城市试点示范工作[5].
数字城市与智慧城市的建设促进了移动互联网、物联网、云计算等技术的发展,并直接推动了大数据(Big data)时代的来临.2008年,Nature出版了“Big Data”专刊[6];2011年,Science出版了“Dealing with Data”专刊[7].2012年,美国政府正式发布了“大数据研究和发展倡议”[8];我国于2011年发布了“物联网‘十二五’发展规划”,并陆续发布了一系列的发展规划与白皮书.
在交通领域,传统的数据采集向电子化设备与高级应用转变,助力交通大数据的形成与发展.从传统的感应线圈和微波雷达等固定检测、基于浮动车的移动检测,向北斗卫星导航系统[9]、智能手机[10]等新型检测手段,以及集约的交通传感器布局[11]和稳定的多源数据融合[12]方向发展.交通大数据为“感知现在、预测未来、面向服务”[13]提供了最基本的数据支撑,是解决城市交通问题的最基本条件,是制定宏观城市交通发展战略和建设规划,进行微观道路交通管理与控制的重要保障.
数据是智能交通系统的基础,交通数据采集手段和处理方法的深度革新将引领智能交通系统的变革.在大数据背景下,对交通大数据进行深度分析,明确交通大数据的基本概念,了解交通大数据带来的问题,理解大数据驱动的数学建模方法,探讨在智能交通系统中的应用具有非常重要的意义.
2.1 交通大数据的特征
交通大数据与传统交通数据的不同主要体现在特征中.当前对大数据特征的描述主要有:3V[14]、4V[15]和5V[16]等.结合交通大数据的基本类型,认为交通大数据具有6V特征,具体如表1所示.
表1 交通大数据的特征Table 1Characteristics of traffic big data
2.2 智能交通系统中的大数据
根据数据来源分布,智能交通系统中的大数据划分如表2所示.
表2 智能交通系统中的大数据Table 2Big data in ITS
(1)交通流数据(固定检测器).
传统固定检测器获取的交通流数据为智能交通系统的传统应用提供了基础数据支撑.以北京为例,基于微波雷达、超声波、感应线圈、视频监控等检测器,北京市公安局公安交通管理局建立了交通信息采集、处理、发布系统,北京市道路交通流预测预报系统[17]等.
(2)交通流数据(移动检测器).
通过固定检测器与移动检测器的数据融合[18],获取更加准确的交通流数据.以北京为例,北京市公安局公安交通管理局开展了“北京市道路交通流综合分析与数据质量评价体系研究”的项目,对固定检测器、移动检测器等获取的多源数据进行研究,优化交通数据质量[19].
(3)位置数据(移动检测).
先进的移动通信技术拓展了交通移动检测的应用范围,由传统的交通流数据获取推广到位置数据的获取,使得基于位置的服务成为可能.基于公交智能卡的数据,实现出行者出行行为的分析,为公交基础设施建设和运营服务管理提供支持[20].基于出租车车载终端的数据,研究出行距离、出行时间和道路偏好对驾驶员路径选择的影响,进而实现路径的预测[21].应用智能手机,可实现出行轨迹、出行方式、出行范围、出行总量等的获取[22,23].此外,车联网的出现大大提高了城市交通信息综合获取的水平,丰富了交通数据来源和发布途径[24,25].海量位置数据的处理和分析,为交通出行行为分析[26],公交系统优化[27],车辆优先控制[28]等提供了支撑.
(4)非结构化视频数据
非结构化视频数据一方面可用于宏观态势监控,以广西柳州为例,建设高空高清视频监控系统,掌控多交叉口或较大区域的交通宏观态势.一方面,通过视频处理模块,提供交通流特征参数及其他参数,以卡口系统、电子警察系统等为例,还可应用于车辆类型识别[29]、交通状态识别[30]等.
(5)多源的互联网、政务网数据
互联网、政务网为智能交通系统提供了广泛的数据来源与发布途径.以社交网络为代表的互联网可为智能交通系统提供交通事件的视频等数据.另外,互联网也可成为交警非现场执法、公交系统优化等的重要数据来源.政务网为城市决策者和管理者提供了安全稳定的信息交互平台.通过政务网,可为智能交通系统接入城市路网结构、气象变化、特大活动、突发事件、应急救援等数据.
3.1 数据安全问题
交通大数据具有“Value”特征,蕴含了众多的信息,有些信息涉及国家安全,例如,公安网传输的数据;有些信息涉及个人隐私,例如,卡口系统检测的车辆轨迹数据.在交通大数据采集、传输、存储、处理、应用等过程中,数据安全问题非常重要.智能交通系统依托智能交通专网进行系统内部的数据传输,以及与外网之间的数据交互时,必须符合规范和标准,保证网络安全[31].另外,在数据处理过程中,需要遵循隐私保护机制,应用隐私保护方法[32].
交通大数据具有“Veracity”特征,去伪存真是数据安全的另一重要问题.大量的冗余数据和错误数据不仅占据大量的存储空间,浪费存储资源,还会大大降低数据分析的有效性和稳定性[33].进行异常数据识别,缺失数据补充,错误数据修正,冗余数据消除具有非常重要的意义.
3.2 网络通信问题
交通大数据具有“Volume”、“Velocity”、“Visualization”特征,要求网络通信要满足大容量数据的快速、稳定传输,特别是高清视频图像数据.交通大数据的“Variety”特征决定网络通信方式的多样化.目前,城市建立智能交通系统多采用自建专网、租用城市公网相结合的模式,具备有线通信与无线通信并存且互通特征.智能交通系统常用的网络通信技术包括:有线电缆、光纤通信网络、无线传感网络、移动通信系统、卫星定位系统等.
3.3 计算效率问题
交通大数据具有“Velocity”特征,要求智能交通系统具备较高的计算效率,例如,交通数据预处理,交通状态识别,短时交通流预测,实时交通流控制,动态交通诱导,实时公交调度等均具有时效性要求.云计算技术的发展带来了新的解决方案,智能交通云的概念由此提出[34].基于云计算技术,使得计算机硬件和软件得到有效利用,提高智能交通系统的计算效率.
3.4 数据存储问题
交通大数据具有“Volume”特征,特别是长时间序列的非结构化数据积累,给数据存储带来了巨大的压力.存储技术的发展远赶不上数据增长的速度,大量存储服务器的购买提高了智能交通系统的建设成本,并占用了数据中心的建筑面积.当前智能交通系统均采取缩短数据保存时限,降低数据存储质量的方式来减少存储成本,影响了大数据的价值.云存储技术的发展带来了新的解决方案,基于云存储与智能压缩算法可以初步解决大数据的存储问题.
2000年,美国自然科学基金会(NSF)首次提出了动态数据驱动应用系统(Dynamic Data Driven Application Systems)的概念[35].数据驱动模型与机理模型、知识模型同属常用的数学建模方法.机理模型从本质上反映客观规律,但是,建模过程繁琐,参数标定难度较大;知识模型以经验总结为基础,模型简单易于实现,但是,模型精度较低,研究对象的复杂性具有局限性;数据驱动模型从数据出发,是一个自下而上的建模过程,无需了解机理,精度较高,但是,模型的可解释性较低,模型推广性能较弱.对于复杂系统,特别是在某些情况下,机理模型不可行或难度较大,知识模型的精度较低,数据驱动模型的意义凸显.常用的数据驱动方法如表3所示.
表3 传统数据驱动方法Table 3Traditional big data driven method
大数据概念的提出,推动了大数据驱动思想的产生,促进了机理模型、知识模型和数据驱动模型的混合使用.在大数据的背景下,机理模型、知识模型和数据驱动模型存在相互渗透、优势互补的关系,3种模型构成的混合模型具有较好的应用前景.依据知识和数据,简化机理模型,并将数据驱动模型结合在一起,完成模型标定,互为补充.机理和知识可以优化数据,减少噪声,确定合适的训练样本,提高模型鲁棒性.以基于时间序列、空间数据和历史数据的短时交通流预测为例,知识模型用于初步确定与研究对象路段相关的数据集合,确定合适的训练样本;机理模型用于标定基于组合模型的短时交通流预测方法;数据驱动模型用于发现组合模型误差与交通状态的模式匹配关系,实验表明混合模型具有较高的精度.
交通大数据给智能交通系统带来了变革,主要体现在基本概念、面临问题和建模方法等3个方面.面向上述变革,研究大数据驱动的智能交通系统具有重要的意义,体系框架如图1所示.
(1)感知对象.
大数据驱动的智能交通系统具有海量的监控对象.智能交通系统的感知对象从人、车、路、环境四个方面展开,包括:个体出行、营运车辆、交通管理和静态系统等.
(2)全面感知.
大数据驱动的智能交通系统具有多样的检测手段和丰富的数据来源.针对城市交通数据源的分布情况和智能交通系统的数据需求,以固定检测和移动检测构成的传统交通信息采集系统为依托,拓展交通数据源的类型和数量,增加新型交通数据采集的使用,实现城市交通及相关系统的全面感知.全面感知体现在多样的数据格式和数据类型上.
图1 智能交通系统的体系框架Fig.1 System framework of ITS
(3)网络通信.
大数据驱动的智能交通系统具有快速的网络通信.针对交通大数据的实时传输要求,建立有线通信、长距离和短距离无线通信构成的互联互通信道,实现数据源、智能交通系统、服务对象的数据交互.智能交通专网作为数据交互的中心,与互联网、政务网、公安网等连接,网络接口具备合乎规范的网闸,以保障网络通信的安全运行.
(4)中心平台.
大数据驱动的智能交通系统具有高效的数据处理、存储、共享与应用.中心平台承担了智能交通系统的数据挖掘、数据存储、数据共享等功能.数据挖掘以信息论、控制论、系统论为基础,应用交通流理论、交通网络分析、交通工程学等交通基础理论,或建立数据模型描述机理,或应用模式匹配推断结论.构建智能交通云的体系架构,以云计算、云存储、云共享等新兴技术解决数据处理速度、数据存储空间、数据共享效率的问题.
(5)综合服务.
大数据驱动的智能交通系统具备优质的综合服务.综合服务是智能交通系统的主要目的,包括基础应用和高级应用.基础应用体现了“感知现在和预测未来”特征,实现多源数据的集成管理,从个体车辆、路段和交通网络等方面进行交通状态的视频监控和量化分析,并对交通态势进行短期和长时间序列的分析和研判.高级应用体现了“面向服务”特征,基于基础应用分析,实施交通控制与诱导,指导特勤任务、稽查布控等警务工作,并为应急救援等城市综合管理提供决策支撑,通过共享发布优化综合服务质量.
(6)服务对象.
大数据驱动的智能交通系统具备广泛的服务对象.根据智能交通系统的需求分析,服务对象主要包括:政府决策者、交通管理者、企业运营者、科研工作者、个体出行者等.
移动互联网、物联网、云计算等技术快速发展,智慧城市、智能交通系统等应用快速推广,交通大数据应运而生.本文对当前的大数据及其在智能交通系统中的应用进行分析,旨在为大数据驱动的智能交通系统立项、建设和运营提供建议.以下几个问题可能实未来的研究热点:
(1)硬件设计方面.
大数据背景下,需研究多源、海量数据的有效采集、稳定传输、快速处理和合理存储方法,特别是交通数据采集设备的研发问题.数据是智能交通系统基础,大数据为智能交通系统提供了广泛的数据来源,然而,智能交通系统的部分功能,以交通控制为例,需要准确的、定制化的交通基础数据.在此背景下,交通数据采集设备的研发显得尤为重要.
(2)软件开发方面.
软件是智能交通系统得以广泛应用的首要工具,是智能交通系统距离用户最近的一部分,特别是在大数据的背景下,用户可以通过个人电脑、手机、显示屏等终端设备获取信息,软件开发的意义重大.在丰富数据的基础上,从日益增长的交通管理和服务需求出发,兼顾城市发展和交通运行特征,进行软件的功能设计和操作优化,以提高交通管理和服务的智能化水平.
(3)交通建模方面.
交通属于典型的开放复杂巨系统,在交通建模研究中,机理、知识、数据的系统化应用具有特殊的意义.大数据为交通模型的建立、标定奠定了基础,倒逼交通模型的自我完善,特别是混合交通流特性的研究、交通出行行为规律的发现、动态交通流时空特征的提取等基础问题.此外,以大数据为基础,交通控制的集成化、智能化、多模式化,交通诱导的群体覆盖、个性支撑等逐渐成为可能.
[1]Gore A.The digital earth:Understanding our planet in the 21st century[J].Photogrammetric Engineering and Remote Sensing,1999,65(5):528.
[2]Palmisano S.A smarter planet:The next leadership agenda[R].New York:IBM,2008.
[3]Department for Culture,Media and Sport,Department for Business,Innovation and Skills.Digital Britain final report[R].London:Office of Public Sector Information, 2009.
[4]金江军.韩国城市进入U-CITY时代[J].信息化建设, 2009(10):9-10.[JIN J J.Korea city to the era of UCITY[J].Informatization Construction,2009(10):9-10.]
[5]郭慧鹏.智慧城市:应用日渐丰富多彩[N].中国信息化周报,2013-12-30028.[GUO H P.Smart city: applications becoming increasingly colorful[N].China Information Weekly,2013-12-30028.]
[6]Frankel F,Reid R.Big data:Distilling meaning from data[J].Nature,2008,455(7209):30-30.
[7]LosW,WoodJ.Dealingwithdata:Upgrading infrastructure[J].Science,2011,331(6024):1515-1516.
[8]李德仁,姚远,邵振峰.智慧城市中的大数据[J].武汉大学学报(信息科学版),2014,39(6):631-640.[LI D R,YAO Y,SHAO Z F.Big data in smart city[J]. GeomaticsandInformationScienceofWuhan University,2014,39(6):631-640.]
[9]于渊,雷利军,景泽涛,等.北斗卫星导航在国内智能交通等领域的应用分析[J].工程研究——跨学科视野中的工程,2014,6(1):86-91.[YU Y,LEI L J,JING Z T,et al.Brief probe into the status and trend of compass navigation’sapplicationindomesticintelligent transportationsystems[J].JournalofEngineering Studies,2014,6(1):86-91.]
[10]Ahas R,Aasa A,Silm S,et al.Daily rhythms of suburban commuters’movements in the tallinn metropolitan area: Casestudywithmobilepositioningdata[J]. TransportationResearchPartC:Emerging Technologies,2010,18(1):45-54.
[11]Gentili M,Mirchandani P.Locating sensors on traffic networks:Models,challengesandresearch opportunities[J].TransportationResearchPartC: Emerging Technologies,2012,24:227-255.
[12]Bachmann C,Abdulhai B,Roorda M J,et al.A comparative assessment of multi-sensor data fusion techniques for freeway traffic speed estimation using microsimulation modeling[J].Transportation Research Part C:Emerging Technologies,2013,26:33-48.
[13]何非,何克清.大数据及其科学问题与方法的探讨[J].武汉大学学报(理学版),2014,60(1):1-12.[HE F,HE K Q.The scientific problems and methodology of big data[J].Journal of Wuhan University(Natural Science Edition),2014,60(1):1-12.]
[14]ZikopouposPC,EatonC,de Roos D,et al. Understanding and streaming data[R].McGraw-Hill Companies,2012.
[15]Chen M,Mao S W,Zhang Y,et al.Big data related technologies,challenges and future prospects series[M]. Springer Briefs in Computer Science,2014.
[16]李清泉,李德仁.大数据GIS[J].武汉大学学报(信息科学版),2014,39(6):641-644,666.[LI Q Q,LI D R.Big data GIS[J].Geomatics and Information Science of Wuhan University,2014,39(6):641-644,666.]
[17]Li R M,Ma H L,Lu H P,et al.Research and application of the Beijing road traffic prediction system[J].Discrete Dynamics in Nature and Society,2014,316032.
[18]李嘉,刘春华,胡赛阳,等.基于交通数据融合技术的行程时间预测模型[J].湖南大学学报(自然科学版), 2014,41(1):33-38.[LI J,LIU C H,HU S Y,et al.A travel time prediction model based on traffic data fusion technology[J].Journal of Hunan University(Natural Sciences),2014,41(1):33-38.]
[19]北京市公安局公安交通管理局,清华大学,北京交通大学,等.北京市科技计划课题任务书(Z12110000031210)[R].北京:北京市科学技术委员会,2012.[BeijingTrafficManagementBureau, Tsinghua University,Beijing Jiaotong University,et al. Topicsmissionstatementofbeijingscienceand technology program(Z12110000031210)[R].Beijing: Beijing Municipal Science and Technology Commission, 2012.]
[20]Tao S,Corcoran J,Mateo-Babiano I,et al.Exploring bus rapidtransitpassengertravelbehaviour using big data[J].Applied Geography,2014,53:90-104.
[21]Sun J,Zhang C,Zhang L H,et al.Urban travel behavior analyses and route prediction based on floating car data[J].Transportation Letters,2014,6(3):118-125.
[22]Abdulazim T,Abdelgawad H,Habib K,et al.Using smartphonesandsensortechnologiestoautomate collection of travel data[J].Transportation Research Board,2013(2383):44-52.
[23]冉斌.手机数据在交通调查和交通规划中的应用[J].城市交通,2013,11(1):72-81.[RAN B.Use of cellphone data in travel survey and transportation planning[J].Urban Transport of China,2013,11(1):72-81.]
[24]汪成亮,张晨.面向车联网的交通流参数检测[J].计算机工程与应用,2012,48(23):212-218.[WANG C L, ZHANG C.Detection model of traffic flow parameters oriented internet of vehicles[J].Computer Engineering and Applications,2012,48(23):212-218.]
[25]段宗涛,康军,唐蕾,等.车联网大数据环境下的交通信息服务协同体系[J].长安大学学报(自然科学版). 2014,34(2):108-114.[DUAN Z T,KANG J,TANG L, etal.Trafficinformationservicecooperation architecture based on vehicular network big data[J]. Journal of Chang’an University(Natural and Science Edition),2014,34(2):108-114.]
[26]Gonzalez MC,Hidalgo CA,Barabasi AL.Understanding individual human mobility patterns[J].Nature,2008,453 (7196):779-782.
[27]Aguiléra V,Allio S,Benezech V,et al.Using cell phone data to measure quality of service and passenger flows ofParis transit system[J].Transportation Research Part C, 2014,43:198-211.
[28]Al Azri A,Chilamkurti N.Priority-based vehicle-toinfrastructure communication(PV2I)in UMTS[C].6th International Symposium on Wireless and Pervasive Computing,Hong Kong,2011.
[29]Sun X,Lu H P,Wu J.Bus detection based on sparse representationfortransitsignalpriority[J]. Neurocomputing,2013,118:1-9.
[30]廖律超,蒋新华,邹复民,等.基于交通视频的交通拥堵状态自动识别方法[J].公路交通科技,2014,31(1): 110-117.[LIAO L C,JIANG X H,ZOU F M,et al.An automatic recognition approach for traffic congestion states based on traffic video[J].Journal of Highway and Transportation Research and Development,2014,31(1): 110-117.]
[31]公安部交通管理科学研究所.公安交通集成指挥平台通信协议[S].GA/T1049,2014.[Institute of Traffic Management Research,Ministry of Public Security. Communicationprotocolsofpublicsecuritytraffic integrated command platform[S].GA/T1049,2014.]
[32]王璐,孟小峰.位置大数据隐私保护研究综述[J].软件学报,2014,25(4):693-712.[WANG L,MENG X F. Locationprivacypreservationinbig data era:A survey[J].Journal of Software,2014,25(4):693-712.]
[33]刘智慧,张泉灵.大数据技术研究综述[J].浙江大学学报(工学版),2014,48(6):957-972.[LIU Z H,ZHANG Q L.Research overview of big data technology[J]. Journal of Zhejiang University(Engineering Science), 2014,48(6):957-972.]
[34]钱哨,张云鹏,黄少波.智能交通云:基于云计算的智能交通系统[J].计算机与现代化,2010,11:168-171. [QIAN S,ZHANG Y P,HUANG S B.Intelligent transport cloud:ITS based on cloud computing[J]. Computer and Modernization,2010,11:168-171.]
[35]周云,黄柯棣,胡德文.动态数据驱动应用系统的概念研究[J].系统仿真学报,2009,21(8):2138-2141. [ZHOU Y,HUANG K D,HU D W.Conceptual study on dynamic data driven application system[J].Journal of System Simulation,2009,21(8):2138-2141.]
[36]Qu J G,Cui Y H,Zhou G C,et al.Application of multiple linear regression model in the performance analysis of traffic rules[J].Journal of Chemical and Pharmaceutical Research,2014,6(3):164-169.
[37]Gao J W,Zhang Bin,Leng Z W,et al.Short-term traffic flow forecasting based on phase space reconstruction and optimized RBF neural network[J].ICIC Express Letters,Part B:Applications,2015,6(1):19-26.
[38]Ding L,Yu F,Peng S,et al.A classification algorithm for networktrafficbasedonimprovedsupportvector machine[J].Journal of Computers(Finland),2013,8(4): 1090-1096.
[39]Chan K Y,Dillon T S.On-road sensor configuration design for traffic flow prediction using fuzzy neural networks and taguchi method[J].IEEE Transactions on Instrumentation and Measurement,2013,62(1):50-59.
[40]El-Tantawy S,Abdulhai B,Abdelgawad H.Design of reinforcementlearningparametersforseamless application of adaptive traffic signal control[J].Journal ofIntelligentTransportationSystems:Technology, Planning,and Operations,2014,18(3):227-245.
Big Data and Its Applications in Urban Intelligent Transportation System
LU Hua-pu,SUN Zhi-yuan,QU Wen-cong
(Institute of Transportation Engineering,Tsinghua University,Beijing 100084,China)
Big data brings both opportunities and challenges to technological development and application innovation of urban intelligent transportation system.Significant changes of ITS,which brought by traffic big data,are shown in three aspects:the concept of traffic big data,problems brought by traffic big data,and big-data-driven based mathematic modeling methods.This paper is intended to deeply understand big data, the background and category of traffic big data are sketched,the“6V”characteristics of traffic big data are proposed,the basic types of traffic big data in ITS are summarized.Strategies and ideas are presented based on the problems of traffic big data,namely,data security,network communication,computational efficiency, and data storage.This paper also analyzes the method of data driven model,and describes the significance of hybrid model.Finally,system framework of ITS based on traffic big data is proposed.
intelligent transportation;traffic big data;data driven;intelligent transportation system0
1009-6744(2015)05-0045-08
U491.1
A
2015-02-04
2015-08-30录用日期:2015-09-09
“十二五”国家科技支撑计划(2014BAG01B04-03);国家自然科学基金(51408023);清华大学苏州汽车研究院(吴江)返校经费课题(2015WJ-B-02).
陆化普(1957-),男,辽宁铁岭人,教授. *
luhp@tsinghua.edu.cn