刘宝利 郑春芳 郭 勇 刘保献 杨妍妍 甄 凯
(1-中汽研汽车检验中心(天津)有限公司 天津 300300 2-北京市生态环境监测中心 3-清华大学环境学院 4-大气颗粒物监测技术北京市重点实验室)
2019 年,柴油车的氮氧化物(NOx)和颗粒物(PM)排放量分别超过汽车排放总量的80%和90%,而柴油货车的NOx和PM 排放量分别占汽车排放总量的78.0%和89.9%[1],NOx和PM 是我国大中城市空气污染的重要来源。由于柴油车存在排放超标、不添加车用尿素等问题[2-3],污染防治面临的形势十分严峻。GB 17691-2018 《重型柴油车污染物排放限值及测量方法(中国第六阶段)》规定采用远程排放监测平台对柴油车车载终端所发送的远程排放数据进行收集、处理、展示和管理[4],利用排放在线监管技术,建立在用柴油车排放监测—管控—溯源—评估全链条的技术防控体系,已成为科学、精准治理柴油车污染的重要手段和技术发展趋势[5-7]。
然而,某些数据异常以及其他因素导致远程排放监测数据质量出现问题,造成上传远程排放监测平台的被监测柴油车数据与实际物理值出现严重偏差,影响远程排放监测的准确性,甚至导致远程监测平台无法达到预期的监管效果[8]。因此,对车辆异常数据做到有效甄别极其重要。本文基于某重型车排放远程监测管理平台,以某一型号国六标准的重型柴油车为研究对象,抽取100 台联网在用车,对其上传的发动机排放相关数据项间Pearson 相关系数进行统计分析,探究上传远程排放监测平台的柴油车发动机排放相关数据项间的相关性特征,为远程排放监测平台识别柴油车排放相关数据上传质量提供一种监管算法和依据。
样车为监测平台上选取的某N3 类国六柴油车,共100 台,整车及发动机技术参数/特性见表1。
表1 整车及发动机技术参数/特性
样车搭载中汽研(天津)汽车工程研究院有限公司研制的远程排放管理车载终端,用于将整车排放控制信息体传输给远程排放管理平台[4],远程排放管理车载终端的技术参数见表2。
表2 远程排放管理车载终端技术参数
GB7691-2018 附录Q 的表Q1 规定了车载终端上传的发动机排放相关数据流及其采集频率[4],本文为简化研究对象,剔除了GB7691-2018 附录Q 的表Q1 中变化率小以及与发动机本身运行相关极弱的数据项,最终确定本文研究的车载终端上传的发动机数据项见表3。
表3 本文研究的车载终端上传的发动机数据项
本文研究的数据项内容是由车载终端发送到柴油车远程排放监测平台的与发动机排放相关的秒级数据构成的,相同时间内,不同数据项采集的数据数量相同。为了描述数据项间的关系特征,本文采用Pearson 相关系数来描述不同数据项两两之间的相关性。
Pearson 相关系数用于研究变量之间的关系和关联强度,可以定量地衡量不同量纲单位变量之间的线性相关关系[9-13],其计算公式如下:
式中:N 代表被分析的数据相关时间共有N s(i,j=1,2,…,N);xi、yi分别代表一组数据项;ρ 代表两组数据项的相关方向以及两组数据项间相互关系的紧密程度,ρ 的取值范围为:-1≤ρ≤1。ρ 的正负代表两组数据项的相关方向,当ρ >0 时,两组数据项正相关;ρ <0 时,两组数据项负相关。两组数据项间相互关系的紧密程度体现在ρ 的数值上,|ρ|值越大,相关性越强。当0.8 <|ρ|<1 时,两组数据项强相关;当0.3 <|ρ|<0.8 时,两组数据项中等相关;当|ρ|<0.3 时,两组数据项弱相关或相互独立。
表4 为100 台联网在用车发动机数据项两两之间Pearson 相关系数的平均值、标准差和极差统计结果,其中,平均值表征100 台联网在用车数据项两两之间Pearson 相关系数的集中趋势,是被研究车型数据项之间相关系数的抽象;标准差和极差表征数据项两两之间Pearson 相关系数的离散程度,标准差和极差越大,代表数据项两两之间Pearson 相关系数的离散程度越高,相应被对比的数据项之间Pearson 相关系数的平均值越不能表征被研究车型;标准差和极差越小,相应被对比的数据项之间Pearson 相关系数的平均值越能表征被研究车型。
表4 100 台联网在用车发动机数据项两两之间Pearson 相关系数统计结果
对表4 的统计结果进一步数据拟合,得出数据项间Pearson 相关系数的标准差与平均值之间的拟合公式为:
式中:y 为标准差;x 为平均值;R 为拟合度。
由此可得出数据项间Pearson 相关系数的标准差与平均值之间的关系如图1 所示。
图1 数据项间Pearson 相关系数的平均值与标准差之间的关系
同时得出数据项间Pearson 相关系数的极差与平均值之间的拟合公式为:
式中:y 为极差;x 为平均值;R 为拟合度。
由此可得出数据项间Pearson 相关系数的极差与平均值之间的关系如图2 所示。
图2 数据项间Pearson 相关系数的平均值与极差之间的关系
从图1 和图2 可以看出,随着数据项间Pearson相关系数的平均值在[-1,1]区间变化,其对应的标准差、极差均呈先升高后下降趋势,而极差的变化趋势更为明显。该趋势表明,数据项间Pearson 相关系数平均值的绝对值较大时,其集中趋势较为显著,即Pearson 相关系数的平均值达到了强相关标准,两个Pearson 相关数据项具有强相关的特征。
从表4 可知,具有强相关的数据项主要有发动机净输出转矩分别与发动机燃料流量、发动机进气流量、DPF 压差之间,发动机转速分别与发动机进气流量、DPF 压差之间,发动机燃料流量分别与发动机进气流量、DPF 压差之间,发动机进气流量与DPF 压差之间,SCR 入口温度与SCR 出口温度之间。图3~图11 分别为100 台联网在用车各强相关数据项之间Pearson 相关系数的实际分布及正态拟合情况,其中,μ、σ、skew、kurtosis 分别代表数据分布的均值、方差、偏态系数以及峰度系数。
图3 发动机净输出转矩与发动机燃料流量的Pearson相关系数分布
图4 发动机净输出转矩与发动机进气流量的Pearson相关系数分布
图5 发动机净输出转矩与DPF 压差的Pearson相关系数分布
图6 发动机转速与发动机进气流量的Pearson相关系数分布
图7 发动机转速与DPF 压差的Pearson相关系数分布
图8 发动机燃料流量与发动机进气流量的Pearson相关系数分布
图9 发动机燃料流量与DPF 压差的Pearson相关系数分布
图10 发动机进气流量与DPF 压差的Pearson相关系数分布
从图3~图11 可以看出,各强相关数据项之间的Pearson 相关系数分布较为集中,且存在Pearson相关系数下边界。
Pearson 相关系数不能反映两组数据之间的因果关系,但国六柴油车的强相关数据项之间有其工程机理(运行机制及工程原理)。这是因为国六柴油车的主要排放控制技术路线基本一致,主要以高低压EGR、两级增压、高效油气混合、新型燃烧模式等缸内清洁燃烧技术控制原机排放,配合采用DOC+DPF+SCR+ASC 高效后处理组合技术降低原机排放中的PM(PN)、NOx等主要污染物[14-16]。
对强相关数据项进行梳理可以发现,发动机转速、发动机净输出转矩、发动机燃料流量以及发动机进气流量均为柴油机本体数据,与燃烧与动力输出机理有关,燃料与进气的混合气燃烧后输出动力(发动机功率、转矩)。DPF 压差、SCR 入口温度、SCR 出口温度均为后处理参数,受柴油机本体影响。在DPF的物理结构和内部碳载量确定的情况下,DPF 压差主要受排气体积流量的影响[17-18],而排气流量的构成主要为发动机进气流量和排气流量之和[19];SCR 入口温度和SCR 出口温度协同监测SCR 温度,主要受来自于柴油机本体的排气温度影响,因而具有强相关特征。
1)对上传远程监测平台的同一型号国六柴油车发动机排放相关数据进行分析表明,数据项间的Pearson 相关系数平均值的绝对值越小,该数据项间的Pearson 相关系数的分布越离散;数据项间的Pearson 相关系数平均值的绝对值越大,该数据项间的Pearson 相关系数的分布越集中。
2)上传远程监测平台的同一型号国六柴油车发动机排放相关数据项中,强相关数据项之间的Pearson 相关系数分布较为集中,且存在Pearson 相关系数下边界,该特征可用于开发上传远程监测平台的国六柴油车数据项的数据合理性监测算法。
3)上传远程监测平台的国六柴油车发动机排放相关数据中,具有强相关的数据项符合国六柴油车排放控制技术路线的工程机理。
要强化研究型大学建设同国家战略目标、战略任务的对接,加强基础前沿探索和关键技术突破,努力构建中国特色、中国风格、中国气派的学科体系、学术体系、话语体系,为培养更多杰出人才作出贡献。
——习近平总书记在中国科学院第二十次院士大会、中国工程院第十五次院士大会、中国科协第十次全国代表大会上的讲话