李季倬,夏 婷,朱 敏
(四川大学 计算机学院,成都 610065)
伴随着城市的快速发展,交通问题日渐突出,交通拥堵日益严重[1].居民出行需求的增加与出行时空分布规律的变化,加剧了城市道路拥堵.公交站点设置是公共交通规划的重要组成部分,优化不合时宜的公交站点设置,可以缩短乘客候车时间、提高公交利用率[2]从而缓解城市交通拥堵.
政府相关报告[3]显示,“公交+共享单车”出行方式比“公交+步行”出行方式出行效率提高大概18.6%.共享单车在一定程度上填补了城市交通方式,且对于覆盖公交盲区、强化轨道交通优势、解决“最后一千米”问题、完善城市微循环中发挥了积极的作用[4].共享单车GPS设备记录了单车在某个时刻的地理信息,能间接反映人们出行情况.共享单车数据、城市POI(Point of Interest)数据、卫星光强度数据、公交站点位置数据等构成的多源数据集,可以反映出公交线路周边的人口分布情况、土地利用性质等信息,为调整与优化公交站点提供决策依据.
数据可视化指的是采用视觉通道的方式来展现数据,数据的属性用视觉元素形式呈现出来,使得用户可以高效地理解数据[5].本文构建了基于多源数据集的公交站点优化可视分析模型,并设计了有效的可视化组件用于展示公交站点各维度属性,提出了一种新颖的可视化设计来显示不同地图缩放级别下站点附近的POI分布和共享单车分布,设计了环形雷达热力图来分析公交站点附近人流的时间序列,设计并实现了可视分析原型系统VisB4B,用于辅助交通规划者探索、分析与比较公交站点环境,通过真实数据案例与相关领域的专家反馈,验证了VisB4B系统的有效性和实用性.
城市道路交通规划中,公交车站点选址通常受土地利用性质、沿线客流集散点分布、路网信息等因素影响[6].Alejandro[7]分析了高需求市场中公交站点大小、运行速度、间距和拥堵之间的相互影响,对公交站点位置和间距的理论和实践进行了全面的回顾.Avishai等[8]提出了一种公交站点布置的数学模型方法,首次将不均匀地形的影响纳入考虑.Cui等[9]主要研究处于交叉路口的公交站点设置问题,采用CA(Cell automaton)模型建立混合交通流模型,然后根据交通模拟器的模拟确定最佳公交车站设置计划.Saeid等[10]研究了乘客总出行时间成本对于环线公交建设可行性的影响.Liu等[11]提出了基于理想布局模块的公交站点迁移建议.Wu等[12]以出行成本最低为目标,将共享单车服务融入公交系统规划,不仅降低了用户成本,而且降低了公交运营成本.柳祖鹏等[13]提出了基于时间距离轨迹的公交站点布设优化方法,以降低公交车流的延误率.
现有的研究从多个方面对公交站点优化进行了分析,但并没有充分利用交通规划人员的固有知识、经验和直观判断,对交通数据进行交互和迭代分析.
Chen等[14]介绍了交通数据可视化的基本概念和流程,概述了相关数据处理技术,并总结了用于描述交通数据的时间、空间、数值和分类属性的现有方法.Zhu等[15]总结了不同时空数据热点分析的可视化方法框架,并阐述了各类方法的研究现状和优缺点.Li等[16]提取了POI文本中的关键词,嵌入地理视图中,用于探索文本分布与空间特征.Pei等[17]利用改进式节点重要性评价算法、速度矩阵视图、流图等对城市交通和公交拥堵模式进行研究.Chen等[18,19]研究了如何探索城市区域的情感感知以及多时空约束下的城市结构动态可达性问题.Lee等[20]使用LSTM模型预测交通拥塞,通过可视化手段辅助用户探索交通拥堵原因.Zhou等[21,22]致力于城市OD(Origin-Destination)流数据的可视分析与研究.Yan等[23]基于共享单车的空间,时间和用户信息构造张量,并使用张量分解来提取并可视化潜在的用户活动模式.Jin等[24]使用主题模型提取文本化的出租车轨迹,通过多视图联动辅助用户探索轨迹主题.
现有研究主要集中在交通热点分析、城市布局分析、交通拥堵分析等领域,对于辅助交通规划的研究较少.而且数据源较为单一,无法全方位、多角度地呈现环境复杂的属性.
本文使用的数据包括上海市共享单车数据、公交站点数据、POI数据、卫星光数据以及市政数据,格式如表1所示.
表1 数据格式Table 1 Data format
共享单车b中,t为时间戳,id为单车编号,lat与lng为在当前时间戳下的经纬度,时间跨度为2017/6/7-2017/6/25与2017/7/16-2017/7/25.在公交站点s中,no为公交线路编号,name为公交站点名称,lat与lng为公交站点经纬度.卫星光sl中,light为地点卫星光强度,lat与lng为地点经纬度.市政数据g包括税率tr、人均年收入in,人均年支出ex,与公交需求运载率q等.城市POIp中,name为城市POI名称,c为POI类别,共有6类,lat与lng为POI经纬度.
与交通规划领域的专家交流后发现,对公交站点进行选址及位置优化需要考虑多种因素.针对专家们的需求,制订了以下可视分析任务.
T1 站点环境分析
交通规划者需要建立对站点周围环境的整体理解,并对环境属性进行分析,找出可能蕴含的潜在模式,以制定站点优化策略.因此,提出以下站点环境分析的底层目标细节:
G1 土地利用性质:该站点附近的土地用途与分布情况如何?如,该位置是属于生活区还是商业区?
G2 人口分布情况:该站点附近的人口分布情况如何?如,该位置是位于人口密集区域还是人口稀疏区域?
G3 人流量时序分析:该站点附近的人流量时序变化情况如何?如,该位置在什么时候人流量最高?为什么?
T2 备选站点分析
交通规划者需要在系统推荐的备选站点和自己标注的备选站点间进行对比分析,以确定更合适的备选站点,因此,确定以下两个分析目标:
G4 备选站点生成:如何生成备选站点?
G5 备选站点比较:对于生成的备选站点,哪一个备选站点是比较好的?
随着国内无桩共享单车投放量和覆盖率的增大,共享单车产生的海量GPS数据能反映出人们的活动行为.本文采用共享单车数据表示人流量,使用模糊C-均值聚类[25]对共享单车GPS数据进行聚类分析,通过聚类发现单车停放点的簇中心,结合公交线路/站点、地图路网信息用于辅助用户发现疑似不合理的站点.为了提高计算效率,把整个上海市划分为88个矩形区域,对该区域内单车GPS地理经纬度进行聚类.考虑到站点覆盖范围,将聚簇数目定为区域内公交站点数量的一半,以便于观察站点附近的人流量集中分布点.
针对公交站点的优化,本文使用基于乘客出行时间费用最小的站距优化模型[26],结合税率、人均年收入、人均年支出、公交需求运载率等市政数据与公交线路数据,计算出上海每条公交路线的理想站距,站点理想站距范围内的区域作为该站点的辐射区域.本文通过站点的前后站点辐射区域来定位预期优化位置(G4),若该站点位于前后站点辐射区域交集外,则可认其为待优化站点,需要在前后站点间公交道路上选择合适的位置作为备选优化站点.
基于上文提及的多源数据集、可视分析任务、单车聚类算法与站距优化模型,本文构建了基于多源数据集的公交站点优化可视分析模型.
图1 可视分析模型Fig.1 Visualization analysis model
如图1所示,收集上海市共享单车数据、公交站点数据、POI数据、卫星光数据、市政数据,清洗并构建结构化多源数据集,通过经纬度映射、站距优化模型、地图划分、卫星光强度映射、模糊C均值聚类与时空信息统计等操作,实现可视分析目标G1-G5.最后,结合多视图可视化与交互联动,展示公交站点的各维度信息,实现公交站点环境分析(T1)与备选站点分析(T2)两个可视分析任务,从而帮助城市交通规划部门工作人员更好地管理城市公共交通,提高居民出行效率.
VisB4B系统的主界面如图2所示,图2(a)为系统的控制面板,用于输入待查询的公交线路、选择需探索的数据集、设置站点优化模型参数、生成备选站点等;图2(b)-图2(d)为地图主视图,在用户的交互下,显示不同的可视化视图,如POI空间分布视图、公交线路信息、共享单车聚簇等;图2(e)为人流量日历图,用于分析站点周围以天为粒度的人流量时序变化情况;图2(f)为人流量时序分析环状热力图,用于分析公交站点附近人流量时序演化情况;
POI空间视图用于分析公交站点周围的土地利用性质(G1).为了避免直接使用POI数据映射导致的视觉混淆,突出数据在数量上和类别上的差异性,本文利用蜂窝状六边形对地图进行划分,通过调整缩放等级,分析不同粒度下的POI类别与数量.如图2所示,图2(b),图2(c),图2(d)分别大粒度、中粒度与小粒度下的POI空间分布视图.
图2 系统主界面Fig.2 Diagram of system main interface
在大粒度下,每个六边形表示地图上的一个区域,主要由两部分构成:外侧环状区域与内侧六边形区域.外侧环状区域表示该六边形区域内共享单车的数量,使用灰度值映射其数量.内侧六边形区域在不同缩放等级下显示不同的POI信息.在中粒度下,六边形被划分为6个三角形,同样使用灰度值映射POI数量.在小粒度下,每个三角形进一步被划分为6个等面积的区域,6个等面积的区域映射6类不同的POI数据,区域灰色越深表明POI数目越多.从六边形中心点往外,6个等面积区域依次表示医疗机构、居民住房、教育区域、政府机构、旅游景点、公司建筑.
本文针对用于交通数据的环状热力图[27]进行了改进,在圆环内圈嵌入了雷达图,用于分析公交站点附近人流量时序演化情况(G3,G5).改进的视图增加了可展示的数据维度,还可以通过对比雷达图的形状,发现站点在人流量演化模式上的相似性.本文使用停靠共享单车数量表示人流量.
如图2(f)所示,本文将环状热力图中环状部分等比划分为7圈24列,每圈时间粒度为天,代表一周7天,每列时间粒度为小时,代表一天24小时.划分之后的每个单元格用灰度值映射某个公交站点附近的人流量.为了发现在一周中,同一时刻上人流量变化情况,在环状视图内部嵌入了雷达视图.雷达图使用灰度值表示单车总量,灰色越深则该公交站点附近的人流量越多.雷达图中也有24个轴,对应每天24小时,离圆心越远,表示该时刻人流量越大.即,雷达图越接近圆,表示不同日期相同时刻,在站点理想站距范围内的人流量越大.
本文使用日历图与热力图辅助分析区域人流量变化与人口分布情况.人流量日历图用于分析站点周围以天为粒度的人流量时序变化情况(G3).本文使用日历图表示相邻月份的人流量演化情况.人流量日历图有7行9列,每个格子表示一天,从上往下,日期递增,格子的灰度值编码人流量数值.格子所处的行号表示是周几,这种设计有助于发现周期性的演化规律.人口分布热力图用于分析不同区域的人口密度(G2).本文使用卫星光数据表示人口密度与繁华程度,将卫星光数值映射到地图上的热力图.
本文邀请了两位交通规划部门的工作人员与两位交通可视化领域的研究人员使用了本系统,并收集了4位专家在系统使用过程中的反馈意见.本文通过两个案例研究和专家反馈验证系统VisB4B的有效性.
专家在控制栏输入框输入“705”,点击查询按钮,在地图视图上显示705线路的所有站点.为了了解705线路沿途的POI分布情况,专家点击左侧“Data Sets”中的“POI Data”,地图视图被分割为相同大小的六边形图.随着专家调整地图缩放级别,地图上显示不同粒度下705线路公交站点所在区域的POI分布情况,发现沿线大部分区域都具有较多POI或共享单车.
直观印象中,公交线路中各个站点之间的站距长度应该接近.专家观察到,相较其他站点,站点A(“杨泰路宝杨路”)距离上一站点B(“松兰路镇泰路”)和下一站点C(“杨鑫路杨泰路”)距离较长,故专家对站点A进行详细分析.
为了进一步探索站点A,专家将POI缩放等级调至最大,以展示站点A附近POI分布情况.专家点击“FCM Clustering”按钮,在地图上呈现共享单车聚类中心点,以了解站点A附近的人流量大致情况.如图3(a)所示,在六边形图中,专家观察到站点A所处的5号区域内最内侧区域灰色较深,说明该区域主要POI为医疗机构.此外,站点A离六边形图中的单车聚类中心(F1-F4)较远,表示该区域人流量较少.而站点C所处的4号区域内,由内向外第2层区域灰色较深,即该区域主要POI为居民住房,且该区域存在单车聚类中心(F1,F4),表明该区域人流量较大.站点A上方的6号区域中,由内而外的第3层区域灰色较深,表明该区域主要POI为教育机构.如图3(b)所示,在实际地图中也可验证站点A左下方有医院H(“杨行地段医院”),站点C上方为居民住宅区R(“杨泰二村”),站点A右上方存在中学S(“华东师范大学附属杨行中学”).
图3 站点区域POI分布详情Fig.3 Stop area POI distribution details
在建立起对站点A附近的POI分布理解之后,为了进一步了解站点附近的人流量变化情况,专家选中站点A,观察人流量日历图,如图2(e)所示.
专家观察到在6月7日-6月25日之间,站点A附近人流量较为稳定,但在6月10-6月13日期间,站点A附近人流量明显提高.专家对此很意外,由上文可知,站点A附近主要POI为医院、中学与居民区,专家推测突然提高的人流量可能是由高考结束后的考生们带来的.此外,7月人流量明显小于6月,专家推测可能是因为气温升高,人们减少了外出.
上述对公交站点周围环境的理解,可以用作调整公交站点发车频率或新增站点的依据,本文使用2020年3月705公交线路的数据对实验结果进行验证.在最新的705公交线路中,站点A与站点B之间新增了站点N1(“杨行镇”)(经纬度:121.447552,31.383228)和站点N2(“镇泰路富杨路”)(经纬度:121.44611,31.388052),其中新站点N1与图3中站点A上侧的单车聚类中心F2(经纬度:121.446102,31.38362)相对应,间隔距离在150米内.
专家在控制栏输入框中输入“143”,然后点击查询按钮,地图视图上显示出143线路所有公交站点.如图4所示.图4(a)中,专家直观发现站点E(“都市路向阳路”)与其前后站点相隔较远,故对站点E进行分析.专家点击左侧“Data Sets”中的“Satellite Light Data”,在地图视图上显示人口分布热力图.图4(b)中,专家发现,相较于143路公交沿线的其他站点,站点E所处区域人口密度较小,可以考虑将站点向下迁移.
图4 143公交线路异常站点发现Fig.4 Finding abnormal bus stop
为了进一步探索如何迁移站点,专家点击地图视图中站点E,然后点击控制栏中的“Generate Solution”按钮,展示其相邻站点所辐射的区域.如图5(a)所示,站点E(“solution#0”)位于站点F辐射区域边缘,距离站点G较远.如图5(b)所示,专家点击站点F与站点G辐射区域与道路交点,系统自动生成3个备选站点(“solution#1”-“solution#3”),此外,专家还手动添加了1个与站点E相对称的备选站点(“solution#4”).
图5 系统推荐备选站点生成Fig.5 Generation of alternative stop
为了对比备选站点人流量分布情况,专家分别点击“solution#0”-“solution#4”,查看各个站点人流量周期分布热力图.如图6所示,专家发现“solution#0”与“solution#1”的人流量时序分布较为相似,与直观上“solution#0”与“solution#1”相邻的印象符合.“solution#2”的环状图比前两者颜色更深,且中心的24h雷达图更圆润,即比前两个备选站点人流量更大、分布更均匀.比前3个备选站点,“solution#3”与“solution#4”的环状图颜色明显更深,且“solution#4”比“solution#3”中心的人流量时序分布更均匀,因此专家认为“solution#4”是比较合适的备选站点.
图6 5种方案人流量时序分析环状热力图比较Fig.6 Comparison of annular thermal maps for time series analysis of human flow in five schemes
本文使用2020年3月143公交线路的数据对实验结果进行验证.在最新的143公交线路中,站点E(经纬度:121.415019,31.070501)迁移到了站点E′(经纬度:121.415745,31.068777),新站点E′与专家结论中“solution #4”(经纬度:121.415629,31.069047)相对应,间隔距离在35米内.
本文邀请了上文提到的4位领域专家使用本系统,并在操作之前,对使用流程进行了简单的培训.使用结束后,本文邀请专家对任务定义中的5个可视分析目标进行评分.此外,就系统的易用性与有用性设计了2个问题,请专家进行评价.5个可视分析目标与2个问题的具体细节如表2所示.
表2 目标任务与问题Table 2 Goals and problems
如表3所示,专家(E1-E4)对5个可视分析目标(G1-G5)的完成度进行了评分,满分为5分,4项任务的得分均超过了4分.同时,针对表中的两个问题,4位专家均给与了积极的评价.交通规划领域的专家表示,此前对于公交站点调整往往依靠居民建议信与实地调研考察,不仅处理效率较低,而且缺乏可靠的调整依据.
表3 专家评分Table 3 Expert rating
根据专家反馈,本方法对公交站点的人流量和POI分布进行了多粒度展示,而且提供了不同站点的比较概览,对理解公交站点周围的环境与选择公交站点的调整位置有较大帮助.专家表示本系统中站点优化流程清晰易懂,在使用一次之后能很快熟悉操作.此外,专家建议增加快照功能,将备选站点的视图快照放在同一区域,便于使用者进行比较分析.
本文提出了一种新颖的可视分析方法,将传统公交站距模型与可视分析手段结合,融合多源数据集,从多个粒度上对公交站点环境进行分析与理解,辅助交通规划人员对公交站点进行优化与调整.本方法为交通规划提供了新的思路与解决方案,有助于缓解公交拥堵、提高公交运输效率.
在未来的工作中,可以考虑与交通部门合作,融入道路车辆流速数据来对公交站点周围环境进行更全面的分析.此外,根据领域专家建议,可以引入自动化方法检测疑似异常的站点,提高分析效率.