刘宇, 黄俊革, 卢思同, 宋雨晴
(上海应用技术大学, 上海 201418)
汽车行驶工况是描述车辆行驶的速度-时间曲线,能体现汽车行驶的运动学特征,是车辆燃油消耗和污染物排放测试方法、限制标准和汽车性能指标标定优化的基准,对新车型开发、认证及道路风险水平评估都有重要作用。起初,欧洲的NEDC行驶工况对中国汽车节能减排技术的发展提供了有力支持,但随着中国科学技术的发展及人们物质生活条件的提高,NEDC行驶工况与中国实际情况的偏差越来越大。中国地域辽阔,自然地理环境差异明显,城市发展程度也不同,各地区、各城市间的汽车行驶工况存在明显差异。近年来,研究人员主要基于主成分分析和聚类分析进行汽车行驶工况构建,有的还结合神经网络算法进行分析,以提高聚类的精确性和所构建行驶工况的精度。
随着中国大学城建设的蓬勃发展,大学城所在区域社会经济迅速发展,区域建设和规划日益加深,其中交通建设和规划是一项重点。为评估大学城的交通状况,预防安全事故的发生,该文以上海海湾大学城为例,选取周边教职工、学生乘用车辆为研究对象,使用GPS设备采集汽车行驶数据,基于数据挖掘技术与运动学片段法进行汽车行驶工况构建,为该区域交通风险控制提供研究依据。
汽车行驶工况构建的数据采集方式主要有车辆追踪、平均车流统计和自主行驶法。考虑到该文研究区域范围小且基本固定,选取大学城教职工、学生使用的小型车为研究对象,采用自主行驶法进行数据采集。
基础数据属性包含时间、GPS车速和经纬度,同时增加间隔时间、加速度、是否停车(bool型)、是否怠速可能(bool型)、累计怠速时长、是否怠速及怠速起止标志(bool型)等扩展属性。图1为数据表E-R模型。
图1 数据表E-R模型
(1) 记录缺失。GPS信号丢失造成的数据记录时间不连续,可理解为数据记录中断,称作记录缺失。另外,因预处理删除的部分不良数据,也归为记录缺失。一般认为怠速时长超过180 s为异常情况,故对缺失时间间隔在180 s以内的按步长为10 s进行均值处理,缺失时间间隔在180 s以上的则分为两个独立的运动学片段。
(2) 加、减速度异常数据。按照普通小型车的加减速约束,从零加速至100 km/h的加速时间需大于7 s,即加速度不能大于3.97 m/s2;紧急刹车的最大减速度为7.5~8 m/s2。对于孤立的不满足约束的数据记录(记录速度的改变不会引起下一个单位时间的加速度指标异常)进行GPS车速修正处理,对于连续的不满足约束的多条数据记录进行删除处理,删除后归为记录缺失异常,作进一步处理。
(3) 长期停车。对于停车不熄火,即车速为零、GPS定位经纬度无变化但发动机转速不为零的长时间过程,及停车熄火但仍有采集记录,即车速为零、GPS定位经纬度无变化且发动机转速、瞬时油耗等机动车属性指标为零的记录,作删除处理。
(4) 长时间怠速。对长时间堵车、断断续续低于10 km/h行驶的情况,按怠速情况处理,标记为怠速可能。由于怠速时间最长可按180 s处理,超过则可能存在行驶异常,将大于180 s的怠速部分划为下一个运动学片段。若整个运动学片段只有180 s的怠速状态,则作删除处理。
(5) 原始数据中GPS定位偏离等不良数据。对于时间连续周期内经纬度瞬时偏离的情况,对数据作定位修复处理。若不仅定位偏离,速度也不在上述加减速约束范围内,则按上述不良数据的情况进行预处理。
通过算法编程处理,从496 464条数据中剔除不良数据22 799条,剩余有效数据473 665条。
运动学片段是指汽车从怠速状态开始至下一个怠速状态开始之间的车速区间。经过数据预处理后,选取时间、间隔时间、GPS车速、间隔加速度4个属性进行运动学片段提取和划分。虽然已对不良数据进行了预处理,为保证运动学片段提取的有效性,在进行片段划分时进行迭代处理和无效片段数据再处理。设置中间变量为是否怠速(bool型标志),当GPS车速等于零时,视为怠速。通过怠速标志,可得到怠速起始、结束标志,一个怠速起始点到下一个怠速起始点即为一个运动学片段。考虑到长时间停车、断断续续低速行驶的情况,计算各运动学片段的最大速度,最大速度小于10 km/h的运动学片段按与相邻记录的时间间隔大小归为前后的运动学片段。共提取有效运动学片段2 880个。
车辆行驶过程中,工况非常复杂,从各种特征综合考虑,大致可分为加速工况、减速工况、怠速工况和匀速工况。其中怠速工况是指汽车停止运动但发动机保持最低转速运转的状态或最高车速低于10 km/h的长时间堵车、断断续续低速行驶的情况。
划分运动学片段后,不难发现采集到的数据形成运动学片段具有一定的特征关系,大量运动学片段里一定数量的片段可组成汽车行驶工况。各有效运动学片段的特征值见表1。
表1 各运动学片段的特征值
构建汽车行驶工况时,若选用13个特征参数展开分析,数据量大且重复性高,需选取具有代表性的参数。主成分分析法通过对大量变量进行线性重组,组合成新的等量变量,或者说将大量成分信息重组为新的等量成分,然后通过每个原本变量(成分)与新变量(成分)之间的相关性程度,在新变量(成分)里确定主要信息,即确定主成分,从而实现降维和简化。
设共有n条数据作为待处理项目,每条数据有m个特征参数作为评价指标,构成相应的n×m维矩阵。使用MATLAB对已划分好的2 880个运动学片段的13个特征进行主成分分析,结果见表2。
由表2可知:M1、M2、M3的主成分方差大于1,累计贡献率达73.39%,故选取M1、M2、M3作为主成分进行进一步分析。表3为主成分载荷矩阵。
表2 各主成分的贡献率和累积贡献率
由表3可知:主成分M1主要反映平均行驶速度、平均速度、最大速度、怠速时间比和速度标准差等特征,主成分M2主要反映加速度标准差和平均减速度等特征,主成分M3主要反映最大加速度等特征。荷载系数的绝对值越大,特征参数与主成分的相关系数越高。3个主成分在各运动学片段中的得分见表4。
表3 主成分载荷矩阵
表4 主成分的得分
基于以上主成分分析结果进行聚类分析。采用K-means聚类法,该方法是一种动态聚类算法,在选取聚类中心后,不断迭代,逐渐使聚类集中每一样本点到该类中心的距离平方和最小。设置迭代次数为100,将2 880个片段分成3类,其中第一类共685个片段,第二类共1 221个片段,第三类共974个片段。每类运动学片段的特征值及总体特征值见表5。其中:第一类运动学片段的平均速度、平均行驶速度和最大速度最大,怠速时间比最小,符合高速路况特征;第二类运动学片段的平均速度、平均行驶速度、最大速度和怠速时间比介于其他两类之间,其为中速路况;第三类运动学片段的平均速度、平均行驶速度和最大速度最小,怠速时间比远大于其他两类,其为低速路况。
表5 各类片段的特征值
为选取更具代表性的运动学片段,按式(1)计算各类运动学片段的总特征参数与该类片段中各片段的特征参数的皮尔逊相关系数,计算结果见表6。该系数接近于1,说明该运动学片段在该类片段中更具代表性。
(1)
式中:G表示每个类别总片段;H表示每个类别里的单独片段。
表6 运动学片段与所属类别相关系数
各类别运动学片段在最终拟合工况里的持续时间计算公式如下:
(2)
式中:ti为类别i在工况中的持续时间;tdrivingcycle为工况的总持续时间;toverall为所有记录数据的总时间;ti,j为类别i中运动学片段j的时间;ni为类别i中的运动学片段数。
按照式(2)计算,得t1、t2、t3分别占tdrivingcycle的34.39%、52.13%和13.48%。按照该比例从第一类运动学片段中选取序号为938、1138、561的片段,从第二类中选取序号为121、893、972、1192的片段,从第三类中选取667和1097片段组成1 941 s的代表性工况(见图2)。结合表5中各类运动学片段的特征及上述所占比例与其他典型汽车行驶工况进行对比,结果见表7。
图2 汽车行驶工况(GPS车速)
由表7可知:大学城汽车行驶的匀速行驶比例较大、加速和减速比例及怠速比例小,说明大学城交通状况较好;平均速度虽不及NEDC地区,但也较高,与主城区汽车行驶工况和欧洲NEDC工况存在较大差异,但符合地处市郊的大学城交通现状。虽然大学城地处城市郊区,但在特定时段大学城生活区内的人口活动密度与频率堪比城市。根据《道路交通安全法》及其实施条例,没有限速标志、标线的普通城市道路的最高速度为70 km/h,而大学城道路行驶最大速度为111.5 km/h,远超过城市郊区道路的限制,拟合的代表性工况中车速大于70 km/h的超速行驶占21.74%。超速行驶会使驾驶人的反应能力降低,增加交通事故发生概率,加大事故的严重程度,暗示着大学城的交通存在一定安全隐患。另外,虽然大学城工况的加、减速比例较低,但两者之和占到整个行驶过程的1/3,高速行驶与加、减速相结合会大大增加交通安全风险。此外,大学城的公交、大巴也存在速度较快和频繁加、减速的现象。加上大学城行人和车辆活动的时间较集中,随着师生出行活动的频繁,周边的交通开始混乱,而且近年来外卖配送规模与日俱增,骑手“飞速”穿梭于大学城的大街小巷,超速、闯红灯、闯机动车道,甚至一边开车一边打电话,更是增加了大学城的交通安全隐患。目前已有不少大大小小的交通事故发生,部分学校已对进入校园的外来车辆进行了管控,但校园外围公路的管制措施、设备和设施还有待进一步加强。如在道路上增设限速标志、在路口增设测速设备,必要时在行人活动高峰期设置志愿者及交通管理人员,相关部门还可以和高校联合进行宣传教育活动,从而减少交通事故的发生。
表7 与其他典型汽车行驶工况的比较
该文以上海海湾大学城为对象,采用自主行驶法采集到496 464条数据,经过处理得到有效数据473 665条,从中提取2 880个有效运动学片段,将各片段特征值通过主成分分析、K-means聚类分析和皮尔逊相关系数法比较得到1 941 s的汽车行驶工况。上海海湾大学城私人用车具有平均速度高且匀速行驶比例大、加速和减速比例及怠速比例相对较小等特点,与主城区的汽车行驶工况和欧洲NEDC标准有较大差异。结合工况特征与交通安全法分析,大学城的交通存有一定安全隐患,建议除学校以外的交通管理部门加强对大学城周边道路的交通管制,预防交通事故的发生。