吴铭淞
(上汽集团商用车技术中心,上海 200438)
车联网是指车辆上的车载设备通过无线通信技术,对信息网络平台中的所有车辆动态信息进行有效利用,在车辆运行中提供不同的功能服务。从车联网的定义可以看出,车联网必须具备车载无线通讯的硬件、对信息平台数据的有效利用和最终提供的功能服务。
车联网正从车企主导的功能型车载信息服务阶段,向“智能网联”为特征的3个新型阶段演进,即从智能网联服务阶段,到多方参与的车路网云协同服务阶段,再到未来的智慧出行服务阶段[1]。车载无线通讯硬件已经全面升级为第四代移动通信技术(4G),甚至部分已经达到第五代移动通信技术(5G),数据上传速率得到大幅提升。作为车联网最基础功能的车端数据上传的硬件瓶颈已经消除,但如何有效利用突然增加的大量数据却成为新的问题。从车端数据上传内容来看,一般分为实时性数据和事件型数据两大类。实时性数据如车辆控制器局域网络(CAN)总线相关信号数据、全球定位系统(GPS)数据和时间戳数据等,被要求按照固定的时间间隔进行上报。一般而言,在第三代移动通信技术(3G)阶段,要求5~10 s间隔上报数十个参数;在升级到4G阶段后,常用要求为1 s间隔上报几百个参数。对于事件型数据,如诊断故障信息、车辆控制信息等数据,上传要求按照实际事件发生或控制信号询问时进行上报。可以看出,随着车联网迈入4G时代,实时性数据上传需求的硬件限制被释放,大量的车端数据被上传至后台服务器进行记录。但是,随着大量数据的上传,信息平台数据的有效利用问题已暴露出来。首先,分析后台数据需要先下载大量的数据进行回放,工作量大、效率低;其次,由于车端控制的特点,尤其是底盘和动力控制,以1 s为间隔的数据上报速度还是太慢,并不能反映出车端的实时状态;再次,如果采用最低满足车端数据分析的时间间隔上传,比如以0.1 s间隔上传数据,则会导致后台数据量大大增加,形成通信流量阻滞。所以,当前车联网数据信息的有效利用方式,面临着高速、大数据量、高实时性的上传需求,与当前主要以车身和诊断为基础功能的车联网数据上传方式之间存在矛盾。
新一代车联网数据上传方式,一方面须做到对车端高速数据具备可辨识性,另一方面又要求不对上传带宽占有和后台服务器产生压力,同时上传数据又要具有一定的直观性。因此,设计合理的数据轻量化上传方法是解决该问题的方案之一。
本文通过数学分析并搭建系统试验的方法,通过规律统计的数据上传方式来实现对一些动力系统高速数据变量的轻量化上传,使数据具备可辨识性和功能利用。
本文研究目的是通过使用车端控制器将实时性变量进行计算并完成初步的规律统计再上传,以实现车联网对高速数据变量的辨识和功能利用。规律性统计的数学方法非常多,本文采用最基础的正态分布和趋势线分析模型,并拓展至抽样分布、密度函数和卡方分布等更为复杂的数学模型,以应对需要更为精确的应用场景[2]。计算正态分布均值u和样本方差σ的基本公式如下:
(1)
(2)
式中:u为样本的均值;xi为样本值;n为采集的样本数;σ为样本方差。
正态分布特性曲线如图1所示,图中u为均值,σ为样本方差。
图1 正态分布特性曲线
以正态分布模型为例,在数据采集时,车端控制器对采集数据的均值和样本方差进行统计计算,周期性地选取一小段时间的数据,并将计算结果进行上传。例如,车端控制器采用100 ms间隔的数据采样方式对发动机负荷数据进行模型统计,每隔3 min对统计结果进行上传。通过对采用直接上传和统计后上传的数据上传量进行比较,发现在3 min内,数据量由1 800个浮点数降低为2个浮点数,数据传输量大幅下降。但是,由于采用这种计算方式的数据运算工作量大、浮点数运算多,同时上传量仅为统计的最终结果而丢失了所有数据细节,无法保留原始数据的信息支持扩展分析[3]。因此,需要在具体实施技术方案中对该数学方法进行模型转化,在达到数据轻量化的同时降低计算量,并保留数据细节。
为了对上述问题点进行优化,本文通过转化数学模型的方式,采用了块权重化分配的模型方案。首先,基于每个不同的实测物理量的实际数值范围,将其物理量范围分块并转化为比较容易统一的单位,并在1个统计周期内对实测物理量在每个块内的计数进行累计和记录。通过该过程,系统将实测值的浮点数转化为代表块分布统计值的块权重数据点样本计数的整数型式。然后,系统将当前统计周期的块数据点样本计数记录上传后台或本地控制器。最后,系统在后台或控制器对样本计数进行存储和统计运算,生成当前循环的统计结果。同时,系统将当前的块数据点样本计数数据进行存储,以进一步完成各种后续的扩展统计应用。该算法既保留了足够多的原始数据信息以支持进一步的扩展分析,又大幅缩减了计算工作量,并在上传前将数据直接变为整数,便于后台统一存储和后续运算。同时,后台数据分析的直观性高,对功能利用的控制极为有利。块权重分布的数据点样本计数、块数据点样本计数的正态分布拟合曲线,以及块数据点样本计数的多次项二次曲线拟合如图2所示。
图2 数据分布、正态分布及二次曲线拟合
在数据分布转化为权重分布过程中,研究人员需要引入块权重、块中值、块计数、块均值等参数。最基本的过程是需要对各参数进行分块。分块的要求是对每个采集的物理量在其量程内分为多个区间块,使每个物理量的实际值可以用区间块进行标号。如果采用平均分块,每个块的区间表达式为:
(3)
式中:qi为第i个分块,采用上下区间范围的格式来表示;qmin和qmax为当前参量工作的下限值和上限值;n为分的块的数目;i为n个块中的第i个块。当然,针对物理量的特性,也可以进行不平均的分块方式。
下一步,将分块区间转化为比较容易统一的单位,例如将转速0~6 000 r/min的物理量范围,划分为10个块,将其转化为0~1的范围区间,0.1为分块的最小标准。通过对应正态分布的均值和方差数学模型计算,可转化为块均值Z和块方差σ,正态分布均值和块方差公式如下:
(4)
(5)
式中:Zi为块中值,表示第i个分块的中值;ki为数据点计数,表示第i个分块总共具有的数据点样本数目;m为总有效数据点计数,表示当前参与计算的有效数据样本的计数总数;n为分块的数目。
与1.1节中相同案例的数据上传量进行对比,上述计算方法每3 min会增加10个整数数据量,增加的量用于上传块权重分布的计数。虽然数据上传量略有增加,但权重分布计数包含了当前数据段的真实权重分布,在后续数据处理时,可以通过将各数据段的块权重计数进行累加,以获得各种拓展时间段的统计结果,大大增加了数据模型的精确度,并可以支持后续的扩展分析。例如,当需要对前30 min的数据进行分析时,研究人员只需要将前10组上传数据分别进行累加,对新组数值进行统计即可。
该计算方法也可同步采用基于趋势线的规律统计分析方法,以用于参考和对比。通过对块权重计数进行计算,可求出块权重计数的拟合二次曲线fi和趋势线半径的平方值R2的值:
fi=a2x2+a1x+a0
(6)
(7)
式(6)中:a2为拟合二次曲线的二次项系数;a1为一次项;a0为常数项;x为分块后的以各块中值连接成的轴。式(7)中:fi为第i个分块的块中值作为x值计算出来的值,对应的是第i个分块的块中值在曲线上的y值,其代表拟合后在曲线上对应的样本计数;yi为第i个分块的数据样本计数,其代表拟合前的样本计数;n为分块的数目;y为样本的块均值[4]。
最后,通过获取的块均值、块方差或者趋势线半径,可以指示出当前有效样本数据的物理分布特性特征,并用以后续的判断和控制。
为了应对排放升级,颗粒捕集器逐渐成为必备的后处理系统配置。但是,颗粒捕集器在特殊工况下持续运行会发生不能再生直至颗粒捕集器堵塞的现象。上述现象发生的主要工况包括连续的低温冷起动运行、极高和极低负荷运行、快速交变负荷运行等。这些工况在正常使用中连续出现的可能性尽管非常低,但一旦出现将会使颗粒捕集器堵塞,并诱发发动机限扭或抛锚等严重故障。所以,对运行工况和驾驶习惯进行统计判断作为对颗粒捕集器的状态预测和再生故障预警是非常重要的。由于判断工况的许多数据和参数是高速变化的,实时数据量非常大,所以对其进行数据轻量化应用具有现实意义。
如图3所示,基于自主开发的智能网关控制器(ICGM),搭建后台服务器来对块权重统计上传功能进行测试。系统包含动力系统控制器(ECM)、智能网关控制器(包括网关和远程通讯系统(Tbox)功能的ICGM)或数据实时采集模块(RMU)、车载娱乐显示终端和后台云服务器。
图3 测试方案系统架构简图
通过选取合适的动力系统控制参数作为驾驶行为和工况的分析输入,在块权重统计后的数据再使用、上传,以及后台分析,可以支持发动机颗粒捕集器状态和再生情况的预测和故障预警。
首先,对于颗粒捕集器功能影响较大的数据和参数进行列举和分类。对于发动机负荷上升的速率过快导致产生的颗粒物大幅增加,发动机负荷过低或快速变化导致无法进行颗粒物的模型检测等数据,都需要达到百毫秒级的运算精度。表1为影响颗粒捕集器功能的主要车辆工况参数。
表1 影响颗粒捕集器功能的主要车辆工况参数
其次,如表2所示,采用智能网关控制器对选取参数进行0.1 s为周期的读取和运算,依据以下约定的平均分块方式,对某实时数据参数进行判断,并计入相应的块内,每3 min将块权重的块数据点计数ki上传1次(总有效数据点计数为1 800)。在运算中,将10个块的块中值Zi分别定义为0.05、0.15、0.25、0.35、0.45、0.55、0.65、0.75、0.85、0.95,进一步减少了计算量。其中,负荷-油门变化率使用0.1 s的负荷差值来表达。
表2 工况参数权重分块设定
随后,服务器对块权重计数数据进行实时正态分布参数计算,并采用其结果进行实时判断。图4示出了负荷参数的块权重正态和多项式分布数例,分别为持续低负荷、交变负荷、持续高负荷、稳定中等负荷。结合负荷变化率,可以进一步确认负荷的变化特点。
图4 负荷参数的块权重正态和多项式分布数例
最后,服务器结合各参数的交叉统计结果,设计工况判断条件。如出现颗粒捕集器已经高载且连续工作在过低负荷、快速交变负荷、持续过高负荷等不利于再生工况下,则在用户端和后台进行针对性提醒,保证车辆和用户安全。表3为某工况参数统计结果判断条件举例。
表3 某工况参数统计结果判断条件举例
通过采用分块权重计数的上传方式,在系统将适用的高速信号进行数据处理后,数据的上传量缩减至1%左右,达到了数据高效上传、存储及利用的目的。
试验采用正态分布作为统计方式案例,通过相关参数分析了不同统计结果所对应的工况特点,以支持对工况特点的实时准确判断。
通过提取分块权重计数统计数据,系统在每21 min、当前再生循环、当前非再生循环时间段内,生成新的权重计数数据,并进行正态分布参数计算,实现了对中长期的工况特点进行实时统计分析的目的。图5为对前24 min的原始数据进行处理的结果,表现了发动机负荷数据的转化、规律体现和上传。
图5 发动机负荷数据的转换、规律体现和上传
(1)通过对适用变量进行数据统计后上传的方式,可以使用极少的上传数据量获取车端高速数据的有效特征,达到高速数据轻量化上传的目的。
(2)采用块权重统计的方案,可以大幅减少上传数据,同时又保留了当前数据段的真实权重分布,可以支持后续扩展分析,并使数据模型具有足够的精确度。
(3)通过统计后上传的方式,使高速数据具备一定的统计意义,可以用于控制和目视检查,并大幅减少了下载和分析数据的工作量。
(4)对于统计后上传的数据,其统计结果可以即时参与当前状态的分析和控制,也可以通过存储和累积,实现数据的中长期特征分析。