基于低频轨迹数据的分时租赁驾驶人驾驶风格分析

2019-10-29 07:55余荣杰龙晓捷涂颖菲
同济大学学报(自然科学版) 2019年10期
关键词:违章轨迹聚类

余荣杰,龙晓捷,涂颖菲,李 健

(1.同济大学 道路与交通工程教育部重点实验室,上海 201804;2.上海国际汽车城(集团)有限公司,上海 201805)

近年来,在国务院《关于积极推进“互联网+ ”行动的指导意见》推动下,共享经济在我国蓬勃发展,成为经济发展的新动力.2017年我国共享经济市场规模达51 365亿,参与共享经济活动总人数达7亿[1],交通运输是共享经济发展最活跃的领域之一.以汽车分时租赁为例,该共享经济理念于2010年起在中国发展[2].分时租赁为驾驶人提供了更为经济、灵活的用车可行性,降低了机动化出行门槛.

当前我国汽车分时租赁用户以年轻驾驶人为主,其中高校学生群体约占20%[2].由于分时租赁用户驾驶经验不足,驾驶习惯具有相当大的不确定性,增加了道路交通的运行风险,也对运营企业的系统风险管理提出了挑战,因此亟需对分时租赁用户的驾驶行为进行深入研究.通过对驾驶群体进行风格分类来识别潜在高风险驾驶人,并利用驾驶安全辅助系统(ADAS)、UBI(usage based insurance)等方式进行风险管理,可降低分时租赁企业运营风险.

驾驶风格是表征驾驶人固有驾驶方式的整体性评价指标[3].相关研究主要从节能驾驶、交通安全等角度,将驾驶人划分为两类(激进、温和[4-8])或三类(激进、温和、谨慎[9-11]).既有研究表明,驾驶人的驾驶风格与交通安全密切关联,激进驾驶风格驾驶人存在频繁换道、急加减速、近距离跟驰等不良驾驶行为,易增加事故发生概率[12].

驾驶风格研究主要基于主观问卷调查[13]、驾驶模拟[8,10]、自然驾驶[4-5,8,13-17]等方法获取数据,并以高精度驾驶行为数据为主,如采集频率为1 Hz[4,13]、10 Hz[5,15-16]的高频卫星定位(GPS)轨迹数据.然而,汽车分时租赁企业采集的轨迹数据以车辆定位为目的,主要是低频轨迹数据(GPS采集间隔为30~120 s).如何基于低频轨迹数据特征,构建驾驶风格评估指标并开展驾驶风格分类仍待研究.

本研究基于汽车分时租赁企业的低频轨迹数据进行驾驶行为的辨识与特征提取,采用聚类算法对分时租赁用户的驾驶风格进行划分,并开展不同驾驶风格驾驶人的特征分析.

1 研究综述

驾驶风格评估的核心在于驾驶行为多维特征提取和分类模型的应用.本节将从驾驶风格特征指标与评估归类方法两方面对既有研究进行探讨.

1.1 驾驶风格特征指标

既有研究的驾驶风格特征指标可归类为宏、中、微观驾驶行为特征,常用指标如表1所示.

表1 常用驾驶风格特征指标

由表1可知,多数研究基于加减速、跟驰等微观驾驶行为进行驾驶风格评估.然而,微观驾驶行为特征指标的获取依赖高精度轨迹数据或视频数据.面向海量用户,汽车分时租赁企业采集的低频轨迹数据不适用于此类微观驾驶行为特征提取的开展.

在宏、中观层面开展的驾驶风格特征研究主要采用速度相关指标.宏观层面主要关注平均速度和速度标准差,常以加速度、急加减速次数等微观特征和超速行驶时间比例等中观特征共同作为驾驶风格评估依据[14,18].中观层面的驾驶风格特征研究常采用高速行驶或超速行为特征.Constantinescu等[14]、孙川等[18]认为车速超过60 km·h-1和限速的80%时驾驶人具备超速倾向,并将超过上述速度阈值的行驶时间比例作为驾驶风格评估指标.高岩[19]将速度80~120 km·h-1和大于120 km·h-1的行驶时间比例纳入驾驶风格评估指标体系.Feng等[5]定义相对超速时间比例为速度大于所有样本驾驶人运行速度99分位的行驶时间与交通通畅状态下正常速度行驶时间的比值,以此为依据划分驾驶人驾驶风格,此方法排除了路况等因素造成相对低速行驶而无法反映驾驶人真实风格的情况,可更准确地判断驾驶行为是否激进.

综上,针对低频轨迹数据特点,本研究将关注租赁用户的超速行为及其特征指标.

1.2 驾驶风格评估方法

驾驶风格评估方法可分为四类:基于规则的分类模型、监督学习模型、非监督学习模型和半监督学习模型[26].

基于规则的分类模型通过指定阈值对驾驶风格进行判定[5,10,17],其难点为特征指标阈值的确定.监督学习模型在驾驶风格评估时应用广泛,主要包括随机森林[27]、神经网络[11,27]、支持向量机[19]等,该类方法难点在于训练数据中驾驶人风格的标定.

由于驾驶风格是一个相对的概念,通常情况下缺乏先验知识,难以进行人工标注类别.因此,非监督学习模型的类别自动划分功能对于驾驶风格分析更为适用,研究人员常通过对模型结果的解读实现对各风格类别的标注.常用非监督学习方法包括聚类算法[14,18,20]、隐狄利克雷(LDA)模型[15]等.其中,由于K-means聚类算法具有简单、快速的特点,而且在处理大数据集时具有可伸缩性和高效性,因此在驾驶风格研究中应用广泛.

2 数据准备

本研究基于某分时租赁企业在上海市的运营数据开展驾驶风格评估.研究数据包括用户特征、订单信息、车辆GPS轨迹、总线通讯信息(CAN)四个数据集.分时租赁车辆为纯电动汽车,数据采集时段为2017年6月12日—18日,采样间隔为30 s.

对采样间隔30 s的低频轨迹数据开展实际行车路径还原可行性研究.由于篇幅限制,分析过程不做赘述.结果表明,低频轨迹数据具有以下特点:①对于城市快速路等高等级道路路径识别准确性高,而对于城市道路,尤其路网密集区域轨迹还原精度低;②对宏观路径识别效果较好,结合地理信息数据可获取道路类型等宏观出行信息和限速遵守情况、运行稳定性等中观运行特征;③对微观轨迹识别精度较低,无法支撑变道、基于加速度等微观驾驶行为的研究.

因此,基于驾驶人在快速路上的行驶轨迹数据提取运行特征以开展驾驶风格评估.

2.1 轨迹数据与地理信息图层数据匹配

开源路线规划引擎[28](OSRM)是支持OpenStreetMap(OSM)的第三方库,将路线规划算法与OSM的开放道路网络数据相结合,可将坐标捕捉到街道网络,实现地图匹配.利用如图1所示基于OSRM的地图匹配工具实现GPS数据与地理信息图层数据的匹配.

图1 OSRM地图匹配分析工具

2.2 驾驶行为特征提取

驾驶风格是个体习惯性的驾驶方式,可靠的驾驶风格分析需要建立在一定里程基础上[12].结合出行特征,借鉴既有研究的驾驶里程筛选条件[5],对城市快速路行驶里程大于80 km的驾驶人的行为数据开展分析,分析样本包含235位驾驶人、累计19 347.69 km的城市快速路驾驶数据.

2.2.1驾驶风格评估特征指标说明

基于相对超速时间比例评估驾驶人驾驶风格.相对超速时间比例(T)定义为特定驾驶情境(指定道路类型和交通运行通畅状态)下速度高于v1行驶时长和速度高于v2行驶时长的比值,即:

式中:T为相对超速时间比例;tv1为速度高于v1行驶时长;v1为样本驾驶人城市快速路的99分位车速;tv2为速度高于v2行驶时长;v2为城市快速路自由流车速[29].v1、v2取值参考图2和表2,v1=90 km·h-1,v2=73 km·h-1.

图2 城市快速路速度累积频率分布

运行特征指标取值/(km·h-1)限速80自由流车速[29]7399分位车速90

基于相对超速时间比例,提出以下两个驾驶风格评估变量:

(1)Tl.驾驶人l在城市快速路行驶的相对超速时间比例,表征驾驶人的超速倾向,计算式如下所示:

式中:tv1,q、tv2,q分别为第q次出行速度高于v1、v2行驶时长;n为出行次数;

(2)QTl.驾驶人l在城市快速路行驶的相对超速时间比例的变异系数(标准差与平均数的比值),表征驾驶人相对超速行为的稳定性,即对于特定驾驶人,相对超速是习惯性或偶发行为,计算式如下所示:

式中:Tlq为第q次出行的相对超速时间比例.

2.2.2驾驶风格评估数据集形成

基于第2.1节中GPS数据与地图匹配结果,完成对各驾驶人城市快速路出行和驾驶操作信息的计算和整理,形成如表3所示评价数据集.

表3 驾驶行为评价数据集说明

3 分析方法

MacQueen[30]提出的K-means算法是聚类技术中最简单且有效的方法之一,工作机理为:设有k个类,根据目标函数最小化原则,计算各样本和聚类中心之间的最小距离,将样本分配给距离它最近的聚类中心,如此反复迭代至满足目标函数最小或保持不变.K-means聚类算法最小化目标函数为

应用K-means进行聚类分析时,聚类数需要事先给定.由Kaufman等[31]提出的轮廓系数可作为聚类有效性评价指标,以优选聚类数.某样本点xj的轮廓系数定义为

式中:a(xj)是xj与同类其他样本的平均距离,即内聚度;b(xj)是xj与最近类中所有样本的平均距离,即分离度.最近类的定义为

式中:p是某个类Ck中的样本.利用xj到某个类所有样本平均距离作为衡量该点到该类的距离后,选择离xj最近的一个类作为最近类.

对于样本数据的某次聚类,求出所有样本的轮廓系数后取均值得到平均轮廓系数sk,sk∈[-1,1].类内样本距离越近,类间样本距离越远,则sk越大,聚类效果越好,sk最大时k即为最佳聚类数.

4 驾驶风格评估结果及特征分析

4.1 基于K-means聚类的驾驶风格评估

采用K-means方法划分驾驶风格类别,基于轮廓系数计算结果得到最佳聚类数为3,s3=0.43.聚类结果如图3、4及表4所示,依据相对超速时间比例和单次出行相对超速时间比例的变异系数将驾驶风格划分为谨慎、温和、激进三类,各风格分别占样本驾驶人的54.04%、36.60%、9.36%.各风格的特点为:

(1) 谨慎.相对超速时间比例最低且单次出行相对超速时间比例变异系数较高,即超速倾向低,相对超速为偶发行为.

(2) 温和.相对超速时间比例较低且单次出行相对超速时间比例变异系数较高,即超速倾向较低,相对超速为偶发行为.

(3) 激进.相对超速时间比例最高且单次出行相对超速时间比例变异系数较低,即超速倾向较高,相对超速在各次出行中较为稳定地出现.

图3 聚类结果

图4 各风格驾驶人相对超速行为特征箱图

Fig.4 Boxplots of relative speeding characteristics for different driving styles

表4 各风格驾驶人相对超速行为特征描述统计

4.2 驾驶风格特征分析

为进一步探究各驾驶风格的差异性,从个体特征、出行特征、车辆运行特征(速度、车辆能耗)和违章记录角度开展了各驾驶风格的特征差异分析.如表5所示的方差分析结果表明,不同驾驶风格的租赁用户在个体、违章特征无显著差异,但在车辆运行特征和出行特征方面存在显著差异.

表5 各风格驾驶人特征方差分析结果

Tab.5 ANOVA analysis of driver’s characteristics for different driving styles

驾驶人特征特征变量F值P值个体特征性别0.860.42年龄(分组)0.380.69出行特征单次出行平均行驶里程26.570.00∗单次出行平均时长28.890.00∗高峰行驶时间比例7.420.00∗夜间行驶时间比例1.960.14运行特征平均速度26.880.00∗速度变异系数3.150.04∗车辆能耗效率90.280.00∗违章特征违章次数0.160.86安全相关违章比例0.210.82

注:*表示在0.05水平下显著.

个体特征方面,不同驾驶风格在年龄和性别方面无显著差异,但存在一定的趋势,如表6、7所示.18~25岁年轻驾驶人中仅2.86%驾驶风格激进,这可能与驾龄、驾驶经验、技能等相关,新手或驾驶经验相对不足的年轻驾驶人更为谨慎;与其他年龄组相比,46~60岁谨慎驾驶人比例最低,激进驾驶人比例最高.不同性别驾驶风格构成如表7所示.

表6 各年龄分组驾驶风格构成

表7 不同性别驾驶风格构成

违章特征方面,将违章分为与安全无关(违章停车)和与安全相关(超速、违反标志标线指示等)两类.基于方差分析结果,不同驾驶风格间近半年违章次数、安全相关违章比例均无显著差异,然而具有一定趋势,即激进驾驶人违章次数高于温和及谨慎驾驶人,如表8所示.三种风格驾驶人的安全相关违章比例均高于上海市总体的69%[32].

表8 三种风格驾驶人违章特征

出行特征方面,不同驾驶风格的单次出行里程、单次出行时长和高峰行驶时间比例有显著差异,由高到低依次为谨慎、温和、激进,如图5和表9所示.夜间行驶时间比例由高到低依次为激进、温和、谨慎,但三种风格驾驶人间不存在显著差异.

表9 三种风格驾驶人出行特征

车辆运行特征方面,三种驾驶风格间速度差异显著.如图6和表10所示,谨慎、温和、激进驾驶人快速路行驶平均速度依次增大,这与聚类变量所表征的超速倾向是一致的,而激进驾驶人速度变异系数更低,保持速度稳定的能力更强.此处速度稳定是相对驾驶人自身速度水平而言,如在相同的速度波动(速度标准差)情况下,平均速度更高的驾驶人具有变异系数更低、速度稳定性更高的特点.既有研究中,Chen等[33]发现速度中等或较高的驾驶人纵向速度波动性更低,与本文结论相似.

车辆能耗特征方面,不同风格驾驶人对应的车辆平均能耗效率(即单位电量行驶里程均值)也存在显著差异,如表11所示,谨慎、温和、激进驾驶人的平均能耗效率依次升高.表12表征了不同风格驾驶人的特征对比.

图6 速度特征箱图

驾驶风格平均速度/(km·h-1)速度变异系数/%谨慎58.2541.33温和63.6142.40激进78.4331.64

表11 三种风格驾驶人车辆能耗特征

表12 不同风格驾驶人特征对比

Tab.12 Comparison of driver characteristics between three driving styles

项目驾驶人特征占比谨慎54.04%,温和36.60%,激进9.36%个人特征①年龄、性别无显著差异;②18~25岁年轻驾驶人激进风格比例最低违章特征①租赁用户安全相关违章比例高于上海市总体;②激进驾驶人违章更多,但违章次数、安全相关违章比例无显著差异出行特征①单次出行平均行驶里程和平均时长由高到低依次为谨慎、温和、激进;②高峰行驶时间比例由高到低依次为谨慎、温和、激进;③夜间行驶时间比例由高到低依次为激进、温和、谨慎,但各风格间无显著差异车辆运行特征①超速倾向和平均速度由高到低依次为激进、温和、谨慎;②激进驾驶人保持速度稳定能力最强;③车辆能耗效率由高到低依次为激进、温和、谨慎

5 结语

相对超速行为特征可作为驾驶风格识别依据,基于驾驶人相对超速时间比例和各次出行相对超速时间比例两个特征变量,将驾驶风格聚为谨慎、温和、激进三类,其中激进驾驶人占样本总体的9.36%.

不同驾驶风格在出行及运行特征方面也具有差异性.对于出行特征,谨慎、温和、激进驾驶人单次出行平均行驶里程、单次出行平均时长和高峰行驶时间比例依次减少.对于车辆运行特征,谨慎、温和、激进驾驶人的超速倾向、运行速度及车辆能耗效率依次升高.然而,驾驶风格间个人特征(年龄、性别)及违章方面无统计上的显著差异.

本研究仅针对城市快速路驾驶行为,后续可考虑引入其他道路类型(高速公路、城市道路等)的运行特征、出行特征等对驾驶风格及风险进行更全面的评价.此外,当前对驾驶行为的研究仍停留在分析阶段,对于驾驶风格激进的驾驶人群体,可针对性制定安全教育项目或UBI方案等风险管理措施,以降低分时租赁企业运营风险.

猜你喜欢
违章轨迹聚类
解析几何中的轨迹方程的常用求法
打 车
轨迹
轨迹
拷问 涂改号牌扣12分,重吗? 它可能是违章、违法的前提!
基于K-means聚类的车-地无线通信场强研究
基于高斯混合聚类的阵列干涉SAR三维成像
基于在线轨迹迭代的自适应再入制导
基于Spark平台的K-means聚类算法改进及并行化实现
广州交警使用无人机抓拍违章车辆