杨东援
城市交通大数据分析的方法隐藏于目的之后,因此本书的目标专注于大数据支持下城市交通的决策判断思维和技术思路问题,而舍弃对于具体技术的详细讨论。伴随大数据和复杂系统理论的发展,城市交通理论面临着新的变革。大数据创建的新技术环境基础上,依托复杂性理论等指导,融合传统技术形成新的决策支持框架,会产生推动城市交通理论革命性发展的激流。
但是技术道路绝不平坦,在初步尝试的喜悦之后,越来越多的困难呈现在人们面前。大数据的模糊性和盖然性特征引发研究者对于大数据分析与传统模型分析技术方法内在差异的思考;更加广泛的信息被塞入基于OD的理论框架,也暴露出不相适应与所受制约;将碎片化信息转化为决策依据过程中,大量“间接证据”的使用表现为一条半隐半现的技术路径;交通决策者与分析技术人员之间缺乏与大数据体系相适应的技术语境,出现了新的沟通困难。
《透过大数据把脉城市交通》
杨东援, 段征宇著
汪光焘丛书主编
出版社: 同济大学出版社
多年的研究经历产生了一种感受:大数据与城市交通的融合犹如一个技术领域的“围城”,圈外的研究者受到新技术展现出来优势的不断诱惑,而身陷其中的“探路者”则在苦恼如何跳出不完备数据环境的泥沼。
面对这一系列问题,需要在总结已有经验基础上梳理交通大数据研究和应用思路。研究实践也使我们深切地感受到,如果技术要求和方向得以明确,具体技术的实现不会成为致命障碍,而思路迷茫与混乱却正在阻碍大数据技术快速融入交通工程学科领域。
对于将大数据技术融入城市交通分析体系来说,有三个重要的技术障碍横亘在面前:
首先是分析技术必须实现对“盖然性”的包容。虽然都与“不确定性”具有紧密关联,但是数字化的“概率性”与证明力的“盖然性”却是有着重要的区别,证明力的盖然性评估不能简单等同于数学上的概率验算问题。概率指的是事物出现的可能性,而盖然性则是对于事实真相认知程度的表征。例如,在应用IC卡数据分析用户乘坐公交行为过程中,根据刷卡时间间隔判断是否属于公交换乘,可以认为是在特定时间间隔内刷卡属于“换乘行为”的概率问题,但是要根据用户一段时间(例如1~3个月)的公交使用特征,判断其是否属于“依靠公交通勤”的用户,就成为一个盖然性问题。由于并不能肯定用户始终使用1张IC卡,由于分析者并不能确定用户属于上班一族等多方面复杂原因,我们只能判断一部分用户肯定(或者否定)是公交通勤用户,但是存在相当一部分难以真正判定其属性。也就是说,我们并没有掌握研究对象是否属于公交通勤用户的直接证据,而是根据其与内在属性模糊联系的表面行为特征做出了具有盖然性的判断。因而,力图通过大数据把脉城市交通,就遇到了分析者到底多大程度上掌握了事实真相的评估门槛,不迈过这一门槛就难以做出对策决断。
其次必须在“相关”与“因果”之间架设桥梁。在大数据时代,相关分析由于其具有可以快捷、高效地发现问题的优势而受到广泛的关注,在商业分析、医疗诊断等领域的成功使其大有替代“因果”的趋势。的确,对于复杂适应系统来说,错综复杂的联系以及行为主体的适应性演化,造成构建精巧模型完整、准确地反映系统演化规律几近奢望。但是对于承担巨大社会责任的管理者来说,面对意见分歧的尖锐争论和心中无数的社会响应,完全撇开“因果”又是一种难以接受的决策方式。正因为如此,交通领域中相当程度的技术研究都围绕着将大数据纳入基于OD的模型体系框架而努力,但所取得的进展相当有限。事实上,大数据在时空范围内的观察广度,以及对研究对象的大样本覆盖,超越了依托小样本数据构建的模型的观察能力。但是对于复杂适应系统反映基本规律的内部模型的认识,基于行为的模型、基于活动的模型,以及网络交通流分析模型等具有不可替代的优势。如何融会两者的优势,实现宏微观融合、大样本分析与案例剖析融合,对于城市交通分析创新具有战略性意义。
第三是需要从趋势外延预测走向反馈基础上修正认识掌控未来。由于城市交通的复杂适应系统特性,造成未来的演化具有很强的不确定性。简单根据过去趋势与特征推演未来的线性思维预测方法,难以适应快速变化的现实。大数据环境所提供的连续追踪观测的能力,为基于复杂性理论研究城市交通创建了不可或缺的基础。问题在于这并非简单的分析技术变革,而是决策模式和管控方法,乃至城市交通规划与管理体系的变革。兼顾管理、工程和研究的理论体系的建立,需要不断的实践与探索,当务之急是尽快明确理论与技术的发展方向。这种学科发展的战略抉择,并非可以简单依据理念与愿望,而是需要在城市交通系统管控中所积累经验的支持,以及案例研究的启示。
总体来看,大数据对于城市交通所带来的机遇绝不仅是一种技术手段,它使我们有可能拥有对复杂适应系统多方位、深入持续观测的战略技术手段,从而改变传统的城市交通规划与管理方法。同时,大数据又不是与传统分析技术的对立和排斥,毕竟绝大多数情况下大数据只能告诉我们“是什么”,却难以回答“为什么”。大数据的价值在于支持管理大智慧,在战略层介入管理决策才无愧于“第四范式”的称谓。
在上述认识的基础上,本书围绕如下问题的思考而展开:什么是交通大数据?城市交通为什么需要大数据?城市交通领域大数据应用与其他领域的差异是什么?能否将大数据技术植入城市交通传统技术框架? 城市交通大数据应用的技术主力是谁? 融合大数据技术与传统技术的框架是什么?多源数据基础上信息融合的技术特点是什么?如何在宏微观分析之间架设桥梁?如何建立城市交通战略调控的技术框架?
本书分为两个基本部分:第一部分由第1、2、3章构成,论述城市交通领域大数据思维的主要技术概念;第二部分由第4、5、6、7章构成,讨论大数据分析中的主要技术如何在城市交通领域中应用。对于信息技术人员来说,通过本书可以了解如何在城市交通这一舞台上展现大数据的魅力;对于交通工程师来说则希望能够帮助他们增强大数据思维;而对于交通数据分析师来说,希望通过本书能够引导他们建立一个技术框架。
尽管在交通数据分析领域进行了十余年的摸索,但是面对思维方式差异很大的学科跨度,以及有限的实践经验积累,要写好本书仍然感到力不从心。好在虽然仅是“一家之言”,仍然能够引发关注与讨论,聊以宽慰自身付出的努力,以及助手、学生和同事的信任。