张 震,郭恩伯,郭恩仲,许成乾
(1.天津平高易电科技有限公司,天津 300000;2.合肥工业大学 管理学院,合肥 230009;3.西交利物浦大学先进技术学院,苏州 215028;4.天津大学 电气自动化与信息工程学院,天津 300072)
当今世界人类正面临日益严重的能源危机和环境危机。发展电动汽车,不仅可以有效缓解传统化石能源不可再生的问题,同时还是治理环境的有效手段。作为能量补给源的充电站是电动汽车的重要配套设施,而充电桩是电动汽车充电站和充电服务网络的核心设备。充电桩长期曝露在自然环境中,风吹日晒雨淋,引起充电桩部件逐渐老化,最终导致充电桩故障发生,给电动汽车充电带来极大的不便。实现充电桩故障的智能检测,对于及时发现有故障的充电桩,以便维护,保持充电桩的可靠运行具有重要意义[1],相关专家学者已展开了大量研究[2-8]。
由于充电桩数据的特点,用于故障诊断的手动特征提取相对困难,复杂的人工智能模型容易产生过拟合问题,完全自动化的方案,例如神经网络,容易陷入局部最优,训练困难[9]。本文以大功率公用充电桩为对象,采用GBDT 与MLP 建立故障诊断模型,结合集成学习领域的新方法,在降低单个模型的复杂度的同时,融合模型的泛化能力,诊断效果得到大幅提升。
作为电动汽车普及化的关键配套设施,充电桩的系统功能和性能特点对电动汽车的发展起着关键作用。本文针对两级式充电桩进行研究分析,前级是输入整流滤波电路,后级是直流变换电路+输出滤波。充电桩的系统结构框架如图1 所示。
图1 充电桩的系统结构Fig.1 System architecture framework of charging pile
直流充电设施控制回路原理如图2 所示。直流充电桩(非车载充电机)与电动汽车通过车辆插头和插座连接。由于充电桩物理硬件结构复杂,因此发生的故障也是种类繁多,充电桩的常见故障类型以及相对应的故障原因如表1 所示。目前公开的百度点石充电桩数据集包含122144 个样本,每个样本数据包含1 个充电桩的特征向量与故障标签,其故障类型涵盖了表1 中的故障情况。
表1 充电桩的常见故障与故障原因Tab.1 Common faults and causes of charging stations
图2 直流充电设施控制回路原理图Fig.2 Schematic diagram of DC charging facility circuit
为描述充电桩故障检测问题,本文使用向量x∈RL×1表示从充电桩上采集的1 组物理量,例如电压的总谐波失真、电流的总谐波失真、电子锁驱动信号等。本文任务是根据向量x 将充电桩分成正常和有故障两类,其类别标签可由变量y∈{0,1}表示。因此,充电桩故障诊断模型可以表示为
映射Det(·)是未知的,将通过数据驱动的方式获得。图3 显示了该模型的基本结构。
图3 问题模型Fig.3 Problem model
考虑到传统机器学习方案解决充电桩状态检测问题的困难,本节提出GBDT 与MLP 的融合模型。
传统机器学习方案的性能很大程度上依赖于特征提取,手动提取特征一直是其难点,该问题对充电桩故障诊断尤其突出[10]。神经网络可以自动提取特征,并且可视为一个完全自动的优化工具,在大规模数据集获得良好的性能。但是文献[11]指出,对于表格数据,因其不具有旋转不变性,会显著降低神经网络的性能。另外,对于表格数据,基于树的分类器相比深度神经网络更有优势。该问题对充电桩故障诊断尤其突出。
基于以上分析,本文提出GBDT[12]与MLP[13]的融合分类模型,其结构如图4 所示。GBDT 模型是一种多项式回归或分类模型,为实现模型拟合,建立多棵分类回归树,并通过最小化损失函数优化每个CART 的参数。MLP 是一种全连接的神经网络,它将神经元按层进行组织,网络层之间以单向无循环的全连接方式进行连接,通过最小化损失函数优化网络权重参数,具有很强的学习能力。本文在集成学习的框架下,将二者结合起来,可以有效地避免二者的不足,联合二者的优势,更好地实现充电桩的故障诊断。
图4 GBDT 与MLP 的融合诊断模型Fig.4 Fault diagnosis fusing model based on GBDT and MLP
根据集成学习的Stacking 框架与理论[14],建立多个独立的GBDT 模型。考虑到充电桩故障的数据量,本方案使用了2 个GBDT 层,如图4 所示。充电桩数据向量x 输入第一个GBDT 层,该层由5 个GBDT模型构成。第二个GBDT 层由3 个GBDT 模型构成,将第一层GBDT 输出的5 个预测值以Stacking方式构成特征向量作为其输入。以xi,j表示第i 层第j 个GBDT(或神经元)的输出,Ni表示第i 层GBDT(或神经元)的个数,xi,j可表示为
如图4 所示,MLP 是一个具有2 个隐层的全连接神经网络。设wi,j表示第i 层全连接层的第j 个输入的权重,则第i 层全连接层中第j 个神经元的输出可表示为式(3),权重wi,j是可训练的。输入层有3 个神经元,接收最后一层GBDT 的输出。第一个隐层由6 个含有ReLU 非线性激活操作的神经元构成,第二个隐层含16 个带有ReLU 激活操作的神经元,输出层由一个全连接层和一个Softmax 层构成。表2 总结了GBDT 和MLP 的超参数设置。
表2 超参数配置Tab.2 Hyperparameter configuration
根据图4 融合模型的网络结构,融合模型是一个含有三阶段学习器的网络,采用的训练过程描述如下。
首先,为充电桩故障评估建立训练和测试数据集。在此步骤中,收集所需的电压、电流等相关数据,构成充电桩输入向量和相应的标签。所有数据样本签按一定比例分为2 组,作为训练和测试数据集。
然后,训练第一层的5 个GBDT 模型。以Bagging 集成学习方案中的bootstrap 采样对训练集采样构造5 个不同的训练集,分别用于训练5 个GBDT 模型,优化模型参数,使其输出结果逼近真实样本标签。因此,第一个GBDT 层也称为Bagging 层。每个GBDT 的训练使用基于Softmax 目标函数和精确贪婪算法,后同。
接着,按照堆叠框架训练第二层的3 个GBDT模型。对于原训练集中每个充电桩输入向量,第一层的5 个GBDT 模型会给出5 个预测值,将其组成一个新的特征向量,联合样本标签,构造一个新的训练集。以交叉验证训练第二层的3 个GBDT。因此,第二个GBDT 层也称为堆叠层。
最后,按照堆叠框架训练第三级学习器MLP。将原训练集中每个充电桩向量输入两级GBDT 网络,输出3 个预测值堆叠成新的特征向量,将其与相应的样本标签一起输入MLP。训练MLP 使用了二元交叉熵损失,随机梯度下降优化器。
为了验证本文方案的性能,在公开的充电桩数据集上对提出的方案进行了训练和测试,并和典型的机器学习算法进行了比较。
本文使用百度点石新能源充电桩数据集。该数据集中的每个样本由1 个6 维的充电桩特征量与1个相应的标签构成,其中包括充电桩的K1K2 驱动信号、电子锁驱动信号、充电桩急停信号、充电桩门禁信号以及充电桩电压和电流的总谐波失真,组合成特征向量(x1,x2,…,x6),故障状态设置为y,按照7∶3 的比例将其分成训练集与测试集,可得85500个训练数据和36644 个测试数据,其中部分训练集如表3 所示。
表3 训练数据Tab.3 Training dataset
利用Python 的Scikit-learn 包在配置AMD Ryzen 9 5950X 16 核CPU 和32 GB 内存的计算机上编程实现提出的模型。模型训练前采用z-score 对充电桩故障数据进行标准化处理。接着,将训练集的特征和标签按照bagging 采样的方式输入到第一层GBDT 模型中。第一层中每个GBDT 的采样为10000个样本,约为数据集的1/7。第二层的GBDT 使用5折交叉验证训练GBDT。训练数据集被划分为5 个大小相同的组,4 组用于模型训练,其余1 组用于模型评估。为训练第三层学习器MLP,采用带有正则项的二元交叉熵损失,正则项系数设置为0.08。随机梯度下降优化器的动量值固定为0.9,批次大小设置为200。学习率初始化为0.01,并且在训练过程中按参数为0.5 的逆比例学习率进行衰减(幂指数衰减率)。
检测方案的性能通过准确度、召回率、准确度及F1 得分多个客观指标进行衡量,并与传统GBDT和MLP 进行比较,以显示本文方案的性能。
在充电桩故障检测测试集上,对所提出的方法进行了测试。表4 列出了本文方案的准确度、召回率、精度和F1 得分,也列出了传统GBDT 和MLP 的结果,以供比较。对比实验中MLP 的隐层层数为6层,每个隐层神经元的个数均为100 个,GBDT 中子树的个数为150,树的最大深度为8。可见这2 个对比模型参数复杂度要远大于本文所搭建模型中用到的参数量。
表4 不同模型在测试集上的量化性能Tab.4 Quantitative comparison on the testing dataset
表4 显示,传统MLP 虽然模型复杂,但是只能获得89%的F1 得分,而单独使用较高深度,较大容量的GBDT 也只能达到近似98%的精度。本文模型的4 个指标都达到了接近99%,优于两个单一模型,说明文本方法在各项指标上均达到了很高的精度,能够有效检测充电桩的故障,保证充电桩稳定安全运行。另外,本文方案在复杂度上做了很多优化,例如,在训练模型的第一层GBDT 时,采样仅用10000条数据,大大节省了计算资源。
进一步进行消融实验,以便分析本文模型结构中每一层的作用。为此,实现完整模型的如下变形:①Bagging 层模型,5 个应用了bootstrap 采样的GBDT 模型;②Bagging 层+堆叠层模型,在Bagging 层模型的基础上以全连接的形式加入3 个GBDT;③完整模型,Bagging 层+堆叠层模型后再接MLP。
消融实验结果如表5 所示,可以看出,在这几个变形中,Bagging 层模型的性能最差。虽然,随着GBDT 模型复杂度的增加,F1 得分随之增加,但是,他们的性能都低于98%。当逐个加入第二层的3 个GBDT 时,性能得到了改善,可以分别获得97.68%,98.92%和98.99%的F1 得分。在使用所有组件时,完整模型表现出最佳性能,其F1 得分达到了99.3%。也就是说,通过增加MLP,完整模型就F1 分数而言可以超过使用GBDT 进行融合的最高性能。这些结果表明,所有的组件都提供了性能增益,并为获得整体性能做出了贡献。
表5 融合模型的多个变体的F1 得分Tab.5 F1-score values for different variants of our fusion method
本文提出了一种GBDT 与MLP 融合的新方法,用于解决充电桩故障诊断问题。该方案以集成学习理论为基础,组建多个全连接的GBDT 层,并与MLP相连,进行特征学习与分类。GBDT 与MLP 融合可以有效避免不足、联合优势,提升充电桩故障诊断的精度。而且,该方案避免了手动提取特征的困难,降低了网络过拟合几率,确保了故障诊断性能得到提升而且更加稳定。在公开数据集上的实验结果表明,本文提出的方案优于典型的独立机器学习方案。