基于时空相似系数的环形交叉口车辆轨迹聚类

2020-12-24 07:46任柏寒丁雪梅孙士龙

吉林大学学报(信息科学版) 2020年6期

任柏寒, 丁雪梅, 孙士龙

(1. 吉林建筑科技学院交通工程学院, 长春 130114； 2. 白山市互联网信息中心舆情科, 吉林白山 134300)

0 引言

随着社会生活水平的发展, 汽车保有量不断攀升, 造成道路资源服务增长与车辆增长之间严重失衡, 从而使交通拥堵等交通问题变得越来越严重。而随着信息化的发展, 使实时记录车辆的轨迹信息变为可能, 为解决交通问题提供了新的契机。例如可以利用手机基站位置、公交数据形成的交通轨迹数据, 分析城市职住关系和通勤出行[1-2]、个体活动规律[3]和城市空间结构[4]等。

聚类是一种将数据归类划分的技术方法[5], 可以广泛应用于交通数据处理等方面。陈继东等[6]将道路网络的边和结点信息作为特征数据对象进行聚类。袁冠等[7]根据转角分割得到轨迹段, 然后计算轨迹段结构相似系数, 完成轨迹聚类。王金凤等[8]基于道路网络的移动对象聚类算法 MOBORN(Moving Objects Based on Road Network), 考虑了不同时刻对象的移动速度、方向和位置参数, 在此基础上计算网络距离和不同时刻的空间相似度, 确定时空相似系数, 当移动对象间的时空相似系数达到给定阈值时, 将其分到同一类。Won等[9]提出一种计算运动物体之间轨迹相似性的方法, 将运动物体轨迹间的相似性定义为两个轨迹间非重叠部分长度与两个轨迹的总长度之比。该计算方法仅考虑了轨迹间的空间相似性, 并未考虑两轨迹之间的时间相似性。Chen等[10]基于Hausdorff距离思想, 根据路网中路段距离计算两轨迹之间的距离, 虽在计算轨迹间空间方面上更有效, 但该方法未考虑轨迹间的时间信息。Hwang等[11]首先通过过滤阶段在道路路网中发现路网距离, 然后根据时间距离细化前一阶段对数据进行预处理, 然后进行轨迹聚类从而发现相似的轨迹。Chang等[12]利用道路网中移动物体轨迹之间的时间相似性和空间相似性的均值和乘积度量轨迹间的时空相似性。Abraham等[13]找出并根据轨迹中的兴趣位置点和时间点, 计算出移动对象轨迹间的时空相似性。

基于以往的研究可得知轨迹相似性不仅依赖于形状, 而且还依赖于时间。为实现区域车辆轨迹聚类, 笔者通过分析交叉口车辆轨迹时空信息并计算时空相似系数, 由于文中的车辆数据有较多的空值, 部分信息丢失或不完全, 这属于稀疏数据, 所以采用谱聚类将相似的数据聚集在一个类簇中, 继而可视化展示车辆轨迹在环形交叉口区域一段时间内的轨迹聚类情况。根据聚类情况继而发现车辆轨迹之间共同特征, 从而为实现车辆管控、轨迹异常检测、交通拥堵的发现等应用奠定基础。

1 时空相似系数

轨迹相似系数是聚类的基础, 通过相似系数确定轨迹之间的关系, 再利用轨迹相似系数对轨迹进行聚类。因此, 笔者从时间维度和空间维度两方面入手, 利用杰卡德相似系数(Jaccard Similarity Coefficient)计算两条轨迹上的时间相似系数；以两条轨迹上的车辆在任意相同时间点上的平均距离为标准获取两条轨迹的距离, 继而用高斯过程求出距离相似系数。然后用时间相似系数乘以距离相似系数求得两条轨迹间的时空相似系数, 以实现轨迹聚类。

1.1 时间相似系数

结合在环形交叉口区域经纬度范围, 定义任意在区域内的车辆k的轨迹如下

(1)

(2)

根据式(2)可得到环形交叉口区域任意两车辆轨迹之间的时间相似系数

(3)

1.2 距离相似系数

根据环形交叉口区域两车辆轨迹所处的时间交集段, 以采样时间间隔Δt划分轨迹子段, 计算各个划分轨迹子段的距离。然后求得时间交集段各个划分轨迹子段的距离的平均值, 作为计算的轨迹距离, 再采用高斯过程转化得到环形交叉口区域两车辆轨迹的距离相似系数。

1.2.1 轨迹子段距离

通过假设环形交叉口区域两车辆轨迹在采样时间间隔Δt内, 两车辆的速度稳定, 不发生突变, 即认为两车辆在采样时间间隔Δt内匀速运行。采样时间间隔Δt内两车辆的轨迹子段分别记为L1:p(1)→p(1)′, L2:p(2)→p(2)′, 相对运动轨迹记为ΔL: Δp→Δp′, 其中Δp=p(2)-p(1); Δp′=p(2)′-p(1)′。令d=Δp+α(Δp′-Δp), 其中d为相对运动轨迹ΔL上的位置点,α的范围是： 0≤α≤1。综上, 轨迹子段L1,L2的距离如下