基于机器学习的柴油机碳烟颗粒质量排放预测模型

2022-04-15 05:47陈文凯凌建群乔信起
汽车工程学报 2022年2期
关键词:转矩工况柴油机

陈文凯,庄 健,,凌建群,乔信起

(1.上海交通大学动力机械及工程教育部重点实验室,上海 200240;2.上海柴油机股份有限公司,上海 200090)

截止2020年,中国拥有超过3.5亿台机动车,其中一部分为重型柴油车,约占4.8%。尽管目前我国重载柴油车数量相对较低,但是它们产生的污染排放物占全部机动车污染物排放量的84%。特别是对于碳烟颗粒物排放,最新的国VI排放标准不仅要求颗粒物的总质量排放继续大幅减少,还严格限制了颗粒物排放个数。因此,一个准确的柴油机碳烟质量排放预测模型对于柴油机以及后处理系统的开发设计具有十分重要的作用。

目前,针对柴油机碳烟排放质量的预测方法主要是基于试验脉谱的标定。这类方法较为简单,在特定的工况下准确率较高,但通常它们试验的次数较少,很难模拟出实际车辆路载中的排放规律。此外,脉谱标定法每次试验时考虑的发动机工况数据也较少,常以发动机转速和转矩为主。但实际影响发动机排放的因素非常复杂,仅由两个变量主导的脉谱数据的简单插值拟合必然对最终的碳烟颗粒质量预测造成误差。因此,本文将以最符合实际路载工况的非道路瞬态循环NRTC为测试基础,基于数据驱动构建高准确度的碳烟质量预测模型。

1 试验系统及模型构建

1.1 试验系统

本研究采用的试验柴油机为上海柴油机股份有限公司生产的直列、电控高压共轨、增压中冷柴油机SC7H260G4,其技术参数见表1。

表1 SC7H260G4柴油机技术参数

试验仪器设备包括测功机、进气管、油耗仪、空气流量计、缸内压力采集系统等,能测量发动机转速、转矩、进气流量、排气温度压力等参数。为实现碳烟颗粒排放质量的测量,采用李斯特公司生产的AVL483光学声波传感器实时采集DPF入口的碳烟质量浓度,其原理如图1所示。

图1 AVL 483光学声波测量原理

AVL 483测量室的一端发出调制后的黑体红外光波,此时发动机尾气中存在黑体效应的碳烟颗粒会吸收特定波长的调制光子,处于激发态;碳烟颗粒吸收光子能量后,受热膨胀会以热的方式向外释放能量;这种周期性的调制加热过程会使碳烟颗粒产生周期性的压力波,从而能被声波检测器检测,之后通过解调制、放大和滤波等信号处理,记录碳烟粒子的存在。最终得到的传感器信号的幅度与尾气中碳烟的质量浓度呈正相关的关系。

1.2 试验循环

随着国VI排放法规的推出,为了更好地控制机动车污染物排放,针对柴油机排放测试循环,一方面要保证广泛的发动机输出,另一方面要保证CO、HC、NO 和颗粒物排放都严格控制在排放标准内。本文选用非道路瞬态试验循环NRTC(Non-Road Transient Cycle)作为试验系统模拟路载工况的测试条件。

NRTC测试循环是由美国EPA与欧盟委员会合作开发的移动式非道路柴油发动机的瞬态行驶测试循环。目前非道路用发动机的许多排放标准都须进行NRTC测试,包括欧盟Stage III/IV法规和美国EPA Tier 4法规。随着行驶时间的变化,NRTC测试循环中发动机基准转速和基准转矩的变化如图2所示。整个测试循环的总持续时间为1 238 s,交流测功机的使用保证了发动机工况可以每1 s调整1次,每一个工况的发动机转速和转矩可通过除以最大转速和最大转矩分别获得其基准转速和基准转矩。通过实时改变每一工况点的状态,NRTC测试循环可最大程度地模拟实际道路工况中加速、减速和怠速等一系列路载工况。

图2 NRTC循环中发动机的基准转速和基准转矩

1.3 模型构建流程

为获得碳烟排放质量的预测模型,本文在NRTC测试循环中采集了大量与碳烟质量浓度相关的各种传感器数据,如发动机转矩、转速、喷油量、喷油压力等,并构建了一个大型的碳烟排放质量数据集。以发动机转矩、转速、喷油量、喷油压力等为输入,以柴油机碳烟排放的质量浓度作为预测目标,构建了机器学习预测模型,模型的评价指标采用平均绝对误差(MAE),均方误差(MSE)和均方根误差(RMSE)。

式中:y为每个工况的预测数据;̂为每个工况的实测数据;为所有工况的总数。

模型的构建流程如图3所示,分为7个步骤:(1)从各种传感数据源中获取碳烟排放质量数据。(2)数据预处理,解决碳烟排放质量数据集中存在的数据丢失、数据离异和长尾数据等问题,保证数据集样本的准确性和均衡性。(3)数据转换,实现数据扩展和数据归一化。(4)模型训练,将经处理后的碳烟排放质量数据集分为训练集和测试集,用训练集数据对预测模型进行训练,得到模型超参数。(5)超参数微调,对模型里面的超参数进行手动微调,保证模型训练过程尽快收敛并且训练出来的模型不会出现过拟合的现象。(6)批处理(batch reference),与训练过程类似,测试过程中每次迭代时每一批数据集都进行归一化,以保证与训练集数据格式相同。(7)模型评估,利用测试集数据对预测模型进行准确度评估。

图3 机器学习模型构建流程

柴油机排放具有工况复杂和强非线性的特点,基于数据驱动的训练策略对数据集具有较大的依赖性,且训练好的模型容易出现过拟合和陷入局部最优的情况,导致单一预测模型无法保证全局范围的预测精度,使模型稳定性不强。因此,本文首先选用机器学习算法中的LGB梯度树算法和循环神经网络算法分别实现模型构建和分析。不同于常规梯度树算法GBDT和XGBoost的节点分裂和数据存储方式,LGB算法采用直方图来构建数据节点的离散分割方式,其思想是将连续的浮点特征分割成个离散值,并构造个直方图,对所有的训练数据进行遍历后,统计出每个离散值在直方图中的累计统计量。因此,当算法模型对每个标签特征进行选择评分时,只需要根据离散的直方图,就可以找到最佳的分割点。这种方法可以显著降低模型训练时对硬件内存的消耗量并且减少算力,十分适用于中大型的数据集。图4描述了基于碳烟排放质量数据集的循环神经网络结构。为了充分利用碳烟排放质量数据集内部的时序关系,循环神经网络结构引入了长短期记忆模块(LSTM)去连接不同的神经元。不同于常规神经网络利用多层结构去获取更准确的结果,循环神经网络内部的单个LSTM更新模块存在4个不同的层相互作用,能够实现遗忘、获取现有输入、更新上一个神经元的输出状态和根据现有的状态输出预测值等一系列复杂功能。

图4 基于LSTM的循环神经网络结构

为了进一步利用各子模型的预测特性,可以将子模型的预测值进行拼接耦合形成新的数据特征,然后将此数据特征加入原始的碳烟排放质量数据集。基于此数据增强后的碳烟排放质量数据集,逻辑回归算法被运用于学习训练并实现自动赋予子模型不同的权重。图5描述了自学习策略构建最终融合模型的流程,以此来提高模型的预测精度和泛化性。

图5 基于自学习策略的模型融合流程

2 试验结果与分析

2.1 NRTC循环期间碳烟排放质量分析

试验系统在NRTC测试循环下获得的转速和转矩变化如图6所示。试验中柴油机转矩的变化范围为0~1 000 Nm,转速变化范围为600~2 400 r/min,基本上能覆盖柴油机的怠速转速到最大转速间的所有变化工况。此外,柴油机在NRTC测试循环中大多数工况的转速都大于1 200 r/min,表明基于NRTC循环的试验系统能较好地模拟整车实际的运行路载工况。

图6 试验柴油机NRTC循环中转矩与转速的变化

图7给出了试验系统在一个NRTC循环周期期间产生的碳烟瞬时质量浓度,以及在这个周期的不同时间段内碳烟质量浓度与转矩之间的变化关系。由图7a可知,发动机碳烟排放的质量浓度并不是有规律地波动在一个固定范围内。由于NRTC测试循环中存在大量发动机转速和转矩瞬时巨大跳动的工况,导致碳烟的排放也会经常出现突然的峰值。为进一步分析柴油机启动与怠速、中速运行及加速运行这3种工况下碳烟排放量与转矩之间的关系,结合图6b中的转速变化,可用0~200 s、200~400 s、600~800 s这3个时段分别粗略代表这3类工况。

如图7b所示,在柴油机怠速启动阶段,当转矩逐渐增大时,碳烟的瞬态排放量也会逐渐增大。这是由于柴油机启动过程中,转矩和转速都会经历一个逐渐上升的过程,但是发动机的负荷仍然是以小负荷为主。而小负荷时发动机的燃空比和温度均较低,气缸内稀薄混合气区较大导致大多数的燃油颗粒处于燃烧界限以外而不能充分氧化燃烧,从而形成颗粒聚合的有利条件,导致较多颗粒物(主要为未燃的燃油组分和部分氧化产物)的产生。

当柴油机处于中速运行工况,由图7c可知,柴油机在不同转矩下产生的碳烟排放基本一样。这是因为NRTC循环中200~400 s内转矩和转速都呈现出剧烈的上下变化,负荷的突然增大和减小都会造成碳烟颗粒的增加。比如:当低速大负荷时,燃空比和温度都较高,使柴油分子大量裂解和脱氢,但较低的转速不利于燃烧速度的加快,造成了柴油颗粒(主要成分为碳烟)的大量增加。因此,这种转速和转矩的上下突然变化会使碳烟颗粒的排放在这个阶段数量大致相同。

当柴油机处于加速运行状态时,由图6b可知,试验系统在600~800 s内除了两端的突变区域,中间区域为稳定的转速上升过程。由图7d可知,此时碳烟颗粒物的整体趋势是随着转矩的增大而逐渐减小。这是由于柴油机在大负荷低转速区产生的碳烟颗粒较多,随着转速的增大,碳烟颗粒与氧气充分进行燃烧,导致颗粒物的数量会逐渐下降。但是当转矩为700 Nm时,其碳烟的颗粒物会出现明显增大的情况,对比图6a可知,此时(700 s处)转矩出现突然下降的变化,会使颗粒物的燃烧情况变恶劣,导致颗粒物排放突然增加。

图7 试验系统NRTC循环在不同时间段内碳烟质量浓度与转矩之间的关系

2.2 柴油机碳烟排放质量数据集与数据分析

本文在进行超过100组NRTC循环试验后,构建了一个柴油机碳烟排放质量数据集。表2列出了数据集中所有与碳烟质量相关的传感器数据标签,此数据集一共由153 106组数据组成。所有的数据在模型训练前需要进行数据处理和分析,图8给出了第90 000~110 000个工况点部分传感器参数的变化情况。由图可知,在某一个时间段内碳烟的测量值为0,且在这个时间段前后,碳烟质量浓度的测量值明显高于正常碳烟的数据波动范围。通过观察转速、喷油量和进气量在不同状态点的变化情况可知,此时柴油机转速较低且喷油量和进气量都接近0,表明此时传感器采集到的发动机运行数据异常。因此,数据处理的手段分为3步:(1)剔除在90 000~110 000个工况点内碳烟质量浓度为0的所有数据。(2)对较大的碳烟质量异常值进行阈值处理。(3)对数值型数据进行归一化和标准化处理。此外,为了保证碳烟质量这一列数据的分布均匀,避免出现“长尾效应”,也采用了对数变换来保持数据的敏感性。

表2 试验系统NRTC循环内收集到的与碳烟质量相关的所有传感器数据标签

图8 第90 000~11000个工况点传感器参数的变化情况

图9描述了经过数据处理后传感器数据的相关性热力图,可以发现在所有的传感器标签中,CEXREAL(DPF入口氧浓度)对碳烟排放质量浓度的影响最大,其值为-0.61。由NRTC循环测试结果可知,DPF入口氧浓度越大,碳烟颗粒被氧化清除的概率越大,这表明氧浓度与碳烟排放质量呈明显的负相关关系,与热力图分析的结果一致。

图9 原始传感器数据相关性热力图

2.3 柴油机碳烟排放质量预测模型

图10a描述了LGB梯度树模型的训练流程。将处理好的碳烟排放质量数据集分为训练集和测试集后,折交叉验证的思想被应用于对数据集进行分层,这意味着预测模型的输出值是由初始设定的个训练模型输出值的平均值组成,有利于提高预测精度,在本试验中值设置为5,模型中其余参数被设置为:{’num_leaves’:120,’learning_rate’:0.0 1,’objective’:’regression’,’min_child_samples’:30,’metric’:’mse’,’lambda_l1’:0.1,’n_splits’=5}。通过再次进行5次NRTC循环测试试验,收集与原始的碳烟排放质量数据集数据标签相同的6 475组数据作为测试集,来对交叉验证后训练完成的预测模型进行进一步验证比较,试验结果如图10b所示。可以观察到LGB梯度树模型对于测试集中碳烟排放质量的预测结果与实际碳烟排放质量试验数据的状态分布都保持良好的一致性,并且数据的分布范围整体在0~40 mg/m之间。两类数据的演化形态十分相似,表明了训练好的LGB梯度树模型能够较为准确地预测实时碳烟排放质量。

图10 LGB梯度树模型训练流程及最终预测模型与试验结果比较

基于LSTM的循环神经网络模型结构如图11a所示。模型一共分为3层,且第1层的LSTM单元数设置为30,每一层网络的激活函数设置为Relu函数,Batch Normalization(BN)位于网络的第3层。由于模型输入数据量较大,每次模型训练的数据块(batch)数设置为1 200。通过再次进行5次NRTC循环测试试验,收集到的与原始的碳烟排放质量数据集标签相同的6 475组数据作为测试集,与LGB梯度树模型类似,对训练完成的循环神经网络模型进行验证比较,试验结果如图11b所示。可以观察到,当瞬时排放量在0~25 mg/m之间时,预测结果与试验数据的状态分布都保持一致,但是当碳烟瞬时排放量在25 mg/m以上时,预测结果与试验数据中的一些离异值仍存在不匹配的现象,这表明了神经网络结构对于数据的离异值不能起到很好的预测作用。

图11 循环神经网络模型结构及最终模型预测结果与试验结果比较

尽管LGB梯度树模型在当前数据集上能获得优异的预测精度,但它是基于决策树算法的延展,当训练集数据量较大时,模型的预测准确度很容易出现下降。此外,循环神经网络模型由于考虑碳烟排放质量数据集中的时序关系,以及引入LSTM单元模型,导致模型训练的参数较多,容易出现过拟合现象。因此,为了进一步提高模型预测的准确度并分散模型过拟合的风险,模型融合的方法可以集成各子模型的输出差异。试验结果见表3,可以发现经过自学习策略训练后的融合模型在6 475组数据的测试集上的预测精度明显高于单模型预测结果。

表3 不同模型的实时碳烟排放质量预测结果与试验结果比较及硬件资源对比

3 结论

通过开展柴油机试验系统在非道路瞬态循环(NRTC)下的排放试验研究,得到了柴油机碳烟排放质量在不同时间段随着转矩变化的规律。

通过收集试验柴油机在大量NRTC循环中的碳烟排放质量数据,以及反映发动机运行状态的多种传感器标签数据,构建了一个超过150 000组数据工况的柴油机碳烟排放质量数据集。基于此数据集,构建了LGB梯度树模型和基于LSTM的循环神经网络模型,并实现了碳烟排放质量的实时准确预测。考虑到预测精度和模型稳定性等因素的影响,模型融合的方法被用于进一步改善模型的预测效果。将融合模型的预测结果与试验数据进行对比,结果表明,融合模型对于不同非道路瞬态循环的工况点,其预测的碳烟排放质量的MAE和RMSE误差都能控制在2.5 mg/m以内,表明了最终的融合模型对碳烟排放质量预测的高准确度,可以为柴油机后处理过程中碳载量的准确计算以及控制策略的开发提供参考。

猜你喜欢
转矩工况柴油机
基于MCTS-HM的重型汽车多参数运行工况高效构建方法
热网异常工况的辨识
基于变滞环阈值DITC 的转矩脉动抑制研究
基于单极性PWM的开关磁阻电机转矩控制策略*
论工况环境温度对风压传感器精度的影响
西安市公交线路模态行驶工况构建
低速范围内的异步电动机直接转矩控制方法探究
基于霍尔位置信号的无刷直流电机直接转矩控制
南京尚德柴油机有限公司
柴油机三种滤清器常见问题及保养要点