王印海,崔志勇
(美国华盛顿大学土木与环境工程系,美国 西雅图 98105)
作为智慧城市的重要组成部分,智慧交通在城市综合发展与新技术的推动下不断发展完善。随着新型智能感知、数据存储、移动通信等领域取得长足发展,交通行为所产生的海量交通数据在以大数据、云计算、人工智能为核心的现代智慧交通研究与应用中扮演着举足轻重的作用。海量交通数据拥有广义大数据所具有的数据量大、种类多、形式多样、产生速度快、价值密度低等特性[1]。云计算以其实时性、易扩展性及泛在的强大计算能力,为海量交通数据的存储、提取、处理、融合和分析提供了可靠硬件保障,也为高效准确地实施管理决策提供了技术支持。而新兴人工智能技术在计算机科学领域与互联网相关产业取得的巨大成就,也给现代智慧交通提供了一个强有力的分析决策手段。在这样的大背景下,一批以智慧城市为代表的“互联网+交通”项目在中国广泛开展并取得了诸多成果,有效提升了城市的智能化水平[2]。
然而,对交通海量数据进行进一步的有效挖掘与使用需要相关的理论支撑。建立在大量理论假定和小样本数据验证基础上的传统交通科学,难以满足新时代智慧交通的发展与建设需求。因此,亟须建立与发展交通数据科学来满足智慧交通的理论与实践需要。顾名思义,交通数据科学是以数据为驱动,通过对海量数据的分析与挖掘来探索交通问题的理论体系与解决方案。交通数据科学将利用多源交通数据,结合交通系统特征及传统交通理论方法,为交通的管理与运营提供切实可靠的决策依据,解决拥堵与安全等交通核心问题,推动新型智慧城市的发展。本文在已有研究基础上简要介绍交通数据科学,总结以海量数据为基础的智慧交通科研与实践所面临的挑战与发展前景。
交通数据科学是利用海量交通数据解决交通问题的计算密集型科学,致力于为交通系统的高效、安全运行提供科学的分析决策手段。其核心是海量交通数据的管理与理论分析,主要包含以下几方面内容:
1)多源交通数据的关联体系。每项交通数据的采集可能来自于交通系统内的某个具体任务,也可能是系统外某项应用的副产品。这些数据具有不同的时空精度、格式、对象。将这些数据有机地组合使用无疑将会带来更大价值。而将各类数据关联的最佳方法往往是将每项数据都绑定到交通系统网络上(例如道路网、航空网等)。
2)数据质量控制。海量交通数据往往伴随各类噪声和杂质,需要去伪存真或者剔除杂质来形成质量可靠的可用数据。
3)针对具体问题并结合各个数据集及采集点的时空关系构建模型。这是一个极具挑战性和创造性的过程,传统的交通系统理论、运筹学理论、机器学习及其他人工智能方法都可以得到充分的展示与应用。
4)运用交通大数据平台或其他云计算平台的强大运算功能求解目标问题。根据结果对模型和计算方法进行适当调整与修正,并从个案中提取普遍规律,逐步完善交通数据科学理论。
当然,现阶段以海量交通数据为驱动的智慧交通在研究和应用层面都面临着诸多挑战,这些挑战也是交通数据科学在建立与发展过程中所要面对的。
首先,多源交通数据的采集、存储、清洗、提取是科学利用交通数据的前提,而新型多源交通数据的体量巨大、数据多元、类型复杂、利用难度高等特点都不是传统交通科学所熟悉的。尽管现阶段交通数据的存储、清洗、处理方法已有显著进步,大部分城市交通系统依然存在交通数据源单一或者多源数据无法融合的问题。
其次,传统交通理论及方法较多依赖数学模型,这些理论模型对现实复杂交通问题的拟合不够准确、全面,难以有效指导参与者类型繁多且过程复杂的实际交通问题。虽然新兴的人工智能技术能够利用大数据解决一些传统理论或模型无法解决的交通问题,但是如何在传统交通理论的基础上,结合新兴人工智能技术,为专门解决复杂的交通问题设计一系列新模型、新方法是我们所面临的巨大挑战之一。
再次,在新模型新方法层出不穷的大背景下,如何验证新方法的有效性、可靠性、可扩展性以及如何依据新方法实现对交通需求及交通行为的精准调控,是基于数据科学的智慧交通系统有待发掘和提升之处。
此外,由于现阶段海量交通数据的采集与利用缺乏统一的管理标准,数据的传输与应用存在较高的安全风险。随着政府与民众对个人隐私和数据安全的关注程度的提升,包含国家安全和交通参与者隐私信息的交通数据的安全性也应在解决交通问题的同时受到足够的重视。值得一提的是,现阶段不同种类的交通数据的采集和存储往往由不同的交通管理部门或商业公司执行完成,如何破除横亘在多源数据之间的壁垒同时简化数据共享、集成的流程是一大挑战。
尽管面临诸多挑战,滴滴、Uber、Lyft等共享出行企业已经基于海量交通数据在出行服务、缓解拥堵、智慧交通平台等领域进行了一些成功的探索。此外,高德、百度、谷歌等推出的众多电子地图应用也在出行导航、出行规划等智慧交通领域取得突出成果。现阶段,基于海量交通数据的人工智能技术在智慧交通、智慧制造和智慧物流等领域的研发与应用方兴未艾。基于海量交通数据的交通数据科学在以下几个方面有着广泛的应用前景:
1)海量交通数据的处理与融合仍在技术与理念上有极大的发展空间。由于大部分交通数据具有时间、空间属性,依据多源交通数据中共享的属性建立互相连接的数据结构或可成为多源数据融合的一种解决方案。例如基于地理空间信息的多源数据融合技术[3]以及具有处理多源数据能力的交通数据平台[4]有能力解决这一问题。
2)将新型机器学习、人工智能方法与传统交通分析理论相结合,形成具有智慧交通特色的理论分析体系,将成为交通领域又一重要前瞻性课题。现阶段人工智能等新技术的应用主要集中在基于深度学习的时空数据、高维数据、视频图像数据的分析[5-6]以及基于强化学习的交通信号控制、网约车智能调度、高效路径规划、自动驾驶等领域[7-8]。但作为交通数据科学的决策中枢,模型和方法的选取需要根据具体数据类型和特定的交通问题具体分析、量体裁衣。利用众多新型深度学习模型[9-11]的强大分析能力,探索复杂交通问题的形成和发展机理值得进一步发掘与创新。与此同时,复杂度极高、参与者极多的大规模城市交通网络以及智能网联自动驾驶汽车也为更高级人工智能技术的产生和发展提供了新的实验与应用场景。
3)由于涉及交通系统的人、车、路、环境等各个方面海量交通数据的加速整合,囊括了汽车制造、共享出行、地图应用等行业的智慧出行生态系统以服务为导向,在出行即服务(Mobility as a Service)领域有着广阔的应用前景。交通数据科学有能力以分析交通历史数据和交通参与者的出行模式为基础,在多种交通基础设施、交通工具的支持下,为多方式组合的综合交通体系提供决策支持。
4)自动驾驶、智能网联汽车、车路协同等将成为多源交通数据、人工智能及智慧基础设施在智慧交通中深入融合与应用的典型场景。作为自动驾驶、车路协同的主要承载者,道路的智能化能够极大地促进人、车、路、环境等各个方面的有机结合。智慧道路已经受到学术界和工业界的关注[12]。以自动驾驶为例,实时多源数据融合、可靠高速数据传输、高精度地图信息、网联道路基础设施等均成为其技术发展的关键模块[13]。
5)交通安全作为交通领域的核心问题之一是所有交通参与者关注的问题。新环境下交通安全的提升也应依托交通数据科学,从数据采集、分析方法、决策建议等方面做出改进。未来多源交通数据有能力覆盖交通事故发生地点及周围环境的时空信息,以此为基础提出或选择适当的分析模型,能够为交通事故提供有效分析并给出改善对策。
当前,国内外城镇化进程持续加速,科技进步日新月异,基于交通数据科学的新型智慧交通必然能在机遇与挑战并存的大环境下,在未来智慧城市的发展中扮演更重要的角色。人工智能技术在计算机视觉、复杂结构数据分析等领域取得的成就也带动了自动驾驶、智能网联汽车在交通领域的研究与应用。随着逐步迈入以自动驾驶和出行即服务为特征的新时代,传统的交通参与者、出行方式,甚至交通规则都会产生巨大变革。未来以数据为驱动的智慧城市综合交通体系的设计和实现将成为城市交通发展的重要方向,而新型城市交通建设因其复杂程度也给城市交通的研究人员、设计者、管理者留下极大的想象与创新空间。因此,在新时代新环境下,通过进一步为海量交通数据的采集和共享提供支持、不断提升解决复杂交通问题的能力,交通数据科学的理论内涵和应用必将得到极大的提升与加强。在交通数据科学的理论指导与支持下,智慧交通的建设将会更加高效并富有成果!