龙会游 严杰 袁正 余明明
摘 要:通过采集大量的高温地区乘用车道路行驶数据,应用主成分分析和聚类算法等数理统计方法,解析出每个运动学片段的特征参数和所属类别,随机选择并重组选取的运动学片段构建出相应的行驶工况,最后计算所构建的高温地区行驶工况与原始数据样本的相关系数,得出两者之间相关系数大于0.95的结论。
关键词:运动学片段;主成分分析;聚类算法;相关系数
1 前言
车辆行驶工况,即汽车运行工况,是指汽车运输行驶过程中的工作状况。行驶工况主要目的是用于确定车辆污染物排放量和燃油消耗量、新车型的技术开发和评估、以及测定交通控制方面的风险等,是汽车工业一项共性核心技术[1]。目前,中国工况项目历时三年时间,在全国41个代表性城市采集了5050辆车共计5500万公里的车辆行驶数据,完成了更加符合我国实际道路行驶状况[2]。但是,由于高温地区的气候、环境、人口密度等不同,会影响汽车行驶时的加减速、怠速等工况特征的分布,导致高温地区的行驶工况具有一定的独特性。因此,本文以高温地区的乘用车为研究对象,采集了大量的实际道路数据,应用数理统计、主成分分析和聚类分析等理论分析构建出相应的行驶工况,对乘用车在高温地区的汽车性能评价具有一定的指导意义。
2 数据采集和工况构建
2.1 数据采集
本文的高温地区指全年最高气温高于40℃的地区。为了采集到有效的道路行驶数据,以全国各省市1整年的气象温度数据为基础,绘制全国温度分布图。如图1所示,高温地区的分布范围主要在重庆和新疆地区,因此选择重庆和吐鲁番进行实际道路数据的采集,完成道路数据的搜集。
2.2 工况构建
2.2.1 运动学片段
运动学片段是构成整车行驶工况的基本组成部分[3]。一个运动学片段可以看作一个具有周期性的运动学速度-时间曲线图。如图2所示,运动学片段由怠速段和运动段组成,其中怠速段指的是速度一直保持为0的曲线,运动段指的是速度始终大于0的曲线。
将运动学片段库按速度区域划分为城市区、市郊区和高速区,相应的划分标准如下:
式中,表示每个运动学片段的最大速度。
2.2.2 特征参数
特征参数是表征每个运动学片段自身特点的一系列统计值[4]。本文主要从速度、加速度等方面进行了统计,特征参数的统计结果如表1所示。
2.2.3 主成分分析
主成分分析就是用來分离识别出影响运动学片段的主要变量和次要变量,化繁为简进行数据处理分析[5]。主成分分析法将多个变量转换出少数几个不相关的变量来,但转换后的变量能比较全面地反映整个数据集。这是因为数据集中的原始变量之间存在一定的相关关系,可用较少的综合变量来表达各原始变量之间的信息。
2.2.4 聚类分析
聚类分析的基本思想是算法首先随机的选择一些对象,对最靠近他们的对象进行归类,通过迭代的方法,逐次更新各聚类中心的值,直至得到最好的聚类结果[6]。本文使用的K-Means是聚类算法中的最常用的一种,算法最大的特点是简单,好理解,运算速度快,但是只能应用于连续型的数据,并且一定要在聚类前需要手工指定要分成几类。
3 数据分析结果
3.1 总体样本的特征参数
总体样本的特征参数统计结果如表2所示,其中城市区的平均速度低,行驶时间短,怠速比例高达23%;高速区的行驶特征则相反,平均速度高,行驶时间较长,怠速比例仅6%。
3.2 主成分分析结果
应用主成分分析技术,分别对城市区、市郊区和高速区的运动学片段特征参数进行统计分析,得到各个特征参数的成分计算值如表3、表4和表5所示。
各速度区的主成分贡献率如图3所示,其中城市区和市郊区的前6个主成分的贡献率大于90%,而高速区的前7个主成分的贡献率大于90%。
3.3 聚类结果
本文使用MATLAB自带的K-Means 聚类函数,对采集的大量运动学片段数据进行不同分类结果的比较后,最后将城市区的所有片段分成5类,市郊区的所有片段分成3类,高速区的所有片段分成3类。
3.4 类间特征参数对比
根据K-Means 聚类函数计算的结果,对每一类的特征参数进行统计,可以得到不同类别数据之间的差异。以城市区的聚类结果为例,对每一类计算相应的特征参数,得到的结果如表6所示,不同类别之间的特征参数差异很大,这些差异也是路面状况与交通环境不同的反映[7]。
4 工况曲线构建
行驶工况按相应类的比例提取运动学片段,随机重组选取的运动学片段,构建出相应的高温地区乘用车行驶工况。工况构建的基准如表7所示,行驶工况的总时间为5400s,每个速度区的时间长度和怠速时间根据原始数据统计的结果计算得到。
最终构成的行驶工况表现为时间-速度曲线,逐秒表示,1s对应一个车速,组合成完整的低温城市行驶工况如图4所示。
5 相关系数判定
相关系数是研究变量之间线性相关程度的量,一般用字母 r 表示。由于研究对象的不同,相关系数有多种定义方式,较为常用的是皮尔逊相关系数。依据相关现象之间的不同特征,其统计指标的名称有所不同,本文使用的是简单相关系数,反映了两变量之间的线性相关关系。
将城市、市郊和高速行驶工况与采集的原始数据样本的特征参数值进行相关系数分析,结果如表8所示,各总体样本和对应的工况曲线之间的相关系数均大于0.95,验证了高温地区乘用车行驶工况的有效性。
6 结论
本文在高温地区大量乘用车用户试验的基础上,提取不同速度区的运动学片段特征,依据主成分分析和K-means聚类算法将大量的运动学片段进行了分类,最后按类别比例随机选取运动学片段构建出高温地区乘用车行驶工况,工况由城市区、市郊区和高速区三个部分组成,总时长5400s。通过对比分析原始数据和所构建工况之间的相关系数,得出两者之间的特征参数值的相关系数大于0.95的结论,从而验证了所构建工况的合理性。
参考文献:
[1]李孟良,朱西产,张建伟,等.典型城市车辆行驶工况构成的研究[J].汽车工程,2005,27:557-560.
[2]杨延相,蔡晓林,杜青,刘昌文,刘杰.天津市道路汽车行驶工况的研究[J].汽车工程,2002(03):200-204.
[3]赵强. 商用车快运行驶工况的构建与研究[C]. 中国汽车工程学会.第19届亚太汽车工程年会暨2017中国汽车工程学会年会论文集.中国汽车工程学会:中国汽车工程学会,2017:1554-1561.
[4]周汽一,张艳辉,邓阳庆,等.重型普通载货汽车典型用户的整车行驶循环工况研究[J].汽车技术,2012(03):39-42.
[5]Long Peng,Guoqing Han,Arnold Landjobo Pagou,Jin Shu. Electric submersible pump broken shaft fault diagnosis based on principal component analysis[J]. Journal of Petroleum Science and Engineering,2020,191.
[6]王骏,王士同,邓赵红.聚类分析研究中的若干问题[J].控制与决策,2012,27(03):321-328.
[7]朱西产,李孟良,马志雄,张富兴,艾国和.车辆行驶工况开发方法[J].江苏大学学报(自然科学版),2005(02):110-113.