同济大学 教授
城市交通云数据平台的建设有两条不同的技术路线——以交通大数据为契机的“另起炉灶”,以及重视既有资源逐步“云化”。
网络数据、移动通信数据等是一种不同于传统交通数据的资源,其分析逻辑也与传统数据具有相当程度的差异。正是出自此原因,相当部分以新数据资源为主体的城市交通数据云平台基本上采用的是一种重新构建的模式,以探索发挥新数据资源能力,提升城市交通状态管控水平。
另一方面,将新的数据资源与传统数据资源相互融合,基于城市交通复杂适应系统特征,探寻慢变量(城市建成环境、空间联系结构、不同交通方式间空间资源分配等对系统状态演变产生重要影响的因素)与快变量(道路信号控制、交通诱导、需求管理等对系统运行状态产生直接影响的因素)协同调控思想,这将涉及更多管理部门的既有仿真系统、数据中心等需要融入云数据平台建设之中,且云数据平台本身应视为一个需要成长管理的生命体系统,在此背景下必然采用“逐步云化”的推进路径。
两种技术路线背后,实际上是不同的建设目标,以及不同调控对策范围,不存在绝对的对错。采用哪条技术路线,取决于更大范围中的城市交通对策体系顶层设计。当我们更加看重当前困难,力图利用新技术缓解面前压力,并认为自动驾驶等新技术将在中短期内对城市交通产生革命性影响的情况下,选择“另起炉灶”的技术路线具有一定的道理。如果判断自动驾驶等新技术近中期不会对城市交通压力产生颠覆性解脱,我们仍然需要从城市空间结构、空间行为模式寻找可持续发展道路,则“逐步云化”的技术路线更加具有吸引力。
之所以这样说,是因为当需要在更大范围内调动资源和力量应对城市交通压力时,作为决策支持基础的城市交通云数据平台必须考虑更为复杂的组织关系,更加充分地利用既有技术资源,更多地融入现有对策体系中的经验,这些都不是“另起炉灶”在短期内可以解决的问题。
当然,两条技术路线并非截然对立,具有一定程度的互补性。但是在当前发展阶段均需要一定的自身积累取得经验,才谈得上如何相互协同。构建城市交通大数据云平台的不同技术路线,将影响平台架构、数据组织、项目实施组织等方面的决策,需要事先加以明确。
在城市交通云信息平台建设中似乎有一些误解:只要把海量数据积存下来就是资源,面对未来使用的数据组织可以留待明天逐步解决;数以万计服务器构筑的云数据中心具有巨大潜力,在这种惊人规模的系统面前,初期架构上即使存在问题,也可以在后期得到弥补。由此可能出现的错误,是在系统架构设计的关键阶段中,缺乏对于交通系统深入理解,从而造成数据组织上产生了致命缺陷。
面对城市交通这样的复杂巨系统,即使拥有数十万台服务器所提供的巨大处理能力,也不可能在缺少合理数据组织,以及定义在数据结构基础上精心设计的数据处理算法的情况下,有效地从数据海洋中发掘有价值的信息。海量数据既可能成为决策分析和运行管理的资源,也有可能成为造成决策过程中干扰判断的数据垃圾。海量数据究竟成为资源还是垃圾,相当大程度上取决于云数据平台建设中的数据组织和信息提取方案。
所谓“信息”是组织起来的“数据”。城市交通云信息平台中的各种数据,需要在合理的维度空间中,采用合理的方式表达成为特征,并形成逐步浓缩的层级结构,才有可能成为有价值、能够为多种用户使用的信息。为此需要强调,城市交通云数据平台要高度重视数据组织架构的重要性!
这首先是由于城市交通数据观测规模远超出一般人的想象。例如,试图通过百万路视频数据对交通行为个体的空间活动进行观测时,一个月的数据量就可能达到EB(1024千万亿字节)级。显然直接存储这些数据再在需要时进行历史行为分析是不现实的(甚至直接在云端进行如此海量数据分析也是不合理的),因为一个月的数据对于分析行为主体的空间活动模式来说,观察时间长度并不足以发现空间活动模式的变化。为此,需要从这些视频中提取特征数据,或者识别高价值图像来加以保存,以支持下一阶段研究分析工作。城市交通演化的研究周期往往长达几年乃至二、三十年,将短期观测的精细化数据与长期分析的抽象数据建立紧密关联,一方面是当前阶段信息提取的要求,另一方面是将当前观测数据与当时观测条件下留存的历史数据相融合的需要(城市交通领域中历史经验具有非常巨大的价值)。
其次,数据抽象是深入理解城市交通内在规律的必要手段。正如复杂热力系统所显示的那样,追踪每一个分子的行为会极大地分散研究者的注意力,反而难以识别系统整体规律。城市交通涉及海量的行为主体,不进行适当信息浓缩,就难以做出有效的决策判断。城市交通行为主体的空间活动,源于其社会属性产生的“活动”需求,以及城市建成环境等外部的影响,从而有一定的共性规律在发挥作用。认识这种共性规律,对于公共政策制定是极为重要的。数据组织的任务之一,就是从分散的、个体的行为之中,提取背后隐藏的统计规律,以支持对于内在规律的研究。
第三,交通信息平台所支持的决策分析,涵盖了规划、需求管理、状态管控等不同层面的问题,作为服务对象的决策主体的思维模式,也囊括了从宏观到微观的不同类型。特定的决策主体往往需要从系统中提取不同抽象程度的信息,也往往只适应某一抽样层面的问题思维,因此系统往往需要设计轻度、中度和高度抽象等不同级别的信息组织,以满足不同用户的需求。
第四,城市交通数据产生于多种多样的信息系统,全部集中到云端进行集中处理并不一定是合理的技术架构方案。考虑到管理组织结构的多样性,以及问题决策的层次性,形成有序的前后端数据处理的分工合作,应该是城市交通信息平台能够有效工作的前提。
总之,在城市交通云信息平台建设中,数据组织和信息提炼是一个需要在信息工程师与交通工程师之间深入讨论的重大问题,初期的含糊其辞会留下后期造成系统崩溃的巨大隐患。