吕新伟,刘江浔,李 婷,刘 辉,李 军,尹 诗,黄家豪
(1.威胜集团有限公司,湖南 长沙 410205;2.中南大学交通运输工程学院人工智能与机器人研究所(IAIR),湖南长沙 410075;3.新加坡国立大学设计与工程学院,新加坡 117583;4.德国CELISCA 重点实验室,德国 罗斯托克18119)
自1997 年开始,我国致力于发展高速列车,经过6 次大提速之后,中国高铁技术已经位于世界前列,展现出大国实力。在第六次大提速中,对CRH系列动车组进行“引进、消化、吸收、再创新”,发挥了极其重要的作用,本文中的高速列车即为CRH 系列动车组[1-2]。近几年,国家更是加大了对高速列车技术的投入,将“高铁”打造成为中国的一道亮丽名片,因此对于高速列车运行时可靠性、稳定性的要求也越来越高。
随着科学技术的快速发展,高速列车已经成为人们中长途出行的首要选择,保证列车运行的安全可靠越来越重要。高速列车的组件故障而影响高速动车组正常行驶的情况越来越普遍,这对高速列车的安全性和稳定性构成了巨大的威胁。高速列车的运行环境复杂多样,随着使用年份的增长,设备的可靠性逐渐降低,出现各种各样的问题,如果不能及时维修,会影响铁路系统的正常功能,甚至引起毁灭性的灾难,为了避免这类情况的出现,需要对高速列车的故障进行实时监控和检测[3-4]。目前大部分的高速列车的故障诊断是基于历史经验或者是通过根据现有的故障数据,利用特征提取、数据清洗、时频变化等技术进行数据处理,最后基于模糊算法等智能算法建立诊断模型[5]。此类方法大多受限于一般情况下故障数据少、类别单一、数据在传输过程中失真等问题,而数字孪生能够在数字空间建立与物理空间一致的实体[6],模拟不同故障情况,提高故障诊断方法的研究效率。
现有研究对于高速列车辅助供电系统的关注较少,辅助供电系统是高速列车的重要组件,不同的高速列车它的辅助供电系统也有差异,但所有辅助供电系统的功能都是为车载设备提供稳定的电能,保证各设备的正常运行[7]。一旦出现故障会导致列车的低压负载失效,乘客的乘坐体验会有所下降,而辅助电路的故障还可能影响到主电路,致使整列高速列车运行受阻,造成经济损失,更甚会危害乘客生命安全,具有极大的隐患。因此,基于数字孪生的高速列车辅助电路故障诊断方法的研究具有极其重要的意义。本文作出的主要贡献如下:
(1)大多数故障诊断方法的研究基于某一特定故障开展,当迁移到其他类型故障时,效率低下。因此,本文使用数字孪生技术,建立与现实空间相同的数字高速列车辅助供电系统,模拟可能发生的多种故障为故障诊断方法的研究提供帮助。
(2)现有的相关研究,需要研究对象长期使用后,收集产生的故障数据,这会产生较高的成本,对传感器等测量技术的要求也更高,并且容易发生数据丢失和传输损耗,导致结果可靠性下降。而数字孪生模型能够产生带有标签的故障数据,便于辨识,训练出的机器学习模型,拥有自主学习的能力,能够识别复杂多样的辅助供电系统故障,并在学习过程中达到更高的准确性与快速性,具有较高的实际运用价值
(3)本文提取高速列车辅助供电系统中电力数据的特征,探索适用于复杂电路系统的最佳故障诊断模型,基于机器学习技术的理论基础,研究不同人工智能算法对于故障诊断模型的影响,同时使用遗传算法改进模型,构建优化混合模型并建立性能评价指标体系,对比设计方法与目前主流故障诊断方法的实验结果,对模型性能进行评估,探索本文所研究的故障诊断方法运用于实际的可行性。
“数字孪生”这一概念早在2003 年就已经出现,由Michael Grieves 教授在课堂中第一次提出[8]。在这个阶段数字孪生仅仅是一个物理空间内对象的数字仿真表示,提供丰富的三维视图。
随着物联网(IOT)的发展,数字空间与物理空间的联系越发紧密,利用计算机技术,根据物理实体的各项参数在数字空间中建立与物理空间一致的精细化仿真模型,能够真实模拟实际运行情况,反映物理实体的状态、性能等特征,这也允许数字孪生模型产生新的智能服务,与物理实体进行连接和交互,实现数据的实时动态传输[9]。
数字孪生概念模型(如图1 所示)能够广泛地运用于各种物理设备和系统。在实际运行过程中,它与物理实体建立联系,获取动态数据,两类数据结合共同更新原模型,并将结果输送回物理实体[10]。数字孪生模型通过无缝衔接物理世界与数字世界能够实现预测性维护、远程监控、人机协作等一系列功能,是工业4.0 时代的重要创新技术[11]。
图1 数字孪生概念模型Fig.1 Digital twin conceptual model
辅助变流器、蓄电池、充电机都是辅助供电系统的主要部件[12]。动力分散式列车的辅助供电系统能够将电能输送到各节车厢,为列车上的低功率设备供电。动力集中式列车为了保障发生故障时的正常供电,会配备多个辅助供电系统,以备不时之需[13]。
CRH5 动车组在TC01,TC08,TP03 和TP06 车上共设置了4 台输出功率为200 kVA 的辅助变流器,总功率为800 kVA。TC01 和TC08 车分别配置了2 台充电机和2 组蓄电池组。车上辅助负载由辅助变流器和三相AC380 V/50 Hz 电源共同供电[14]。
辅助变流器为高速列车的照明系统、空调系统等提供电源,是辅助供电系统的关键部件,保障列车正常行驶。从电路角度来看,辅助变流器包括输入滤波器,斩波器、高频变压器、三相辅助逆变器、隔离开关、辅助变流器控制器等内容[15]。通过查阅资料,结合实际运用状况,对于高速列车辅助变流器进行建模仿真,模拟实际运用过程中的状态以及可能出现的故障,为后续故障诊断方法的研究提供帮助。
将查阅参数与物理模型相结合,在MATLAB/Simulink 中建立高速列车辅助变流器数字模型,如图2 所示。该模型能够仿照物理空间中的辅助变流器电路运行,在保证真实性的情况下,可以直接通过计算机指令控制,方便研究者进行研究分析,减少实验成本[16]。
图2 辅助变流器MATLAB/Simulink 仿真模型Fig.2 MATLAB/Simulink simulation model of auxiliary converter
由于实际数据获取难度较大,考虑到机器学习算法在特定问题上的广泛适用,本文选择开源数据集进行方法研究与效果检验,该数据集与前文设计的仿真模型相适应,能够较为真实地反映辅助变流器的工作特性,因此所设计的模型方法在实际研究中具有通用性。表1 展示了采样数据的最小值、最大值、平均值、标准差总共四类统计特征。
表1 采样数据统计特征Tab.1 Statistical characteristics of sampling data
BP 神经网络是一种具有多神经层,输出信号逐层向前传递的神经网络,back-propagation 为核心算法,其具有模型简单、学习性好、自适应能力强等优点[17]。
神经网络模型是一个非参数的模型,通过调整连接权重来训练神经网络,经过训练的网络能够根据网络参数生成测试数据的响应,无需预先确定输入和输出之间的函数关系式。神经网络依赖于误差校正来微调节点的权重,这是通过使用反向传播算法或梯度下降算法来完成的[18]。典型神经网络结构如图3 所示。
图3 BP 神经网络结构简图Fig.3 Sketch of BP neural network structure
遗传算法(Genetic Algorithm)是一种强大的随机选择算法,被广泛用于人工智能和机器学习领域。遗传算法模拟自然界建立一个种群,通过一系列仿真操作,使其中的个体发生随机概率变化,进行选择,保留优良个体,将信息遗传到下一代,不断循环,直到寻找到问题的最优近似解[19]。
在遗传过程当中,适应度函数也被称为评价函数,通过计算个体的适应度,判断是否保留该个体。适应度计算公式为:
式中F表示适应度,k为系数,yi为实际输出,oi为理论输出。
遗传算法基本操作分为:
(1)选择操作:在当前进化的种群中选择出优秀个体,进行交叉和遗传,将信息传递到下一代。
式中Fi为个体i的适应度,Pi为个体i的选择概率,N为种群个体数目。
(2)交叉操作:种群中的个体之间两两交叉,产生新的个体,选择优秀个体重复操作。
式中akj和alj分别为k和l染色体上的j号位基因,b为0~1 之间的任意值。
(3)变异操作:在生物进化过程中,染色体会以一定概率(通常取值0.001~0.01 之间)发生变异。
式中amax,amin为基因aij的最大值和最小值;;g为完成进化次数;Gmax为终止次数;r为0~1 之间的任意值[20]。
权值阈值是影响BP 神经网络模型故障诊断性能的重要因素,因此引入遗传算法,反复迭代,寻找最优权值阈值,替换模型的初始参数,改善BP 神经网络模型的分类性能,从而建立出更加有效的机器学习模型[21]。遗传算法迭代寻找最优权值阈值的流程如图4 所示。
图4 遗传算法寻优流程图Fig.4 Genetic algorithm optimization flowchart
在建立的种群不断进化的过程中,利用适应度函数进行评估,找到当前类故障数据集下的最优权值阈值,作为GA-BP 神经网络模型的初始参数,最后利用数据集检验模型故障诊断性能。
如图5 所示,随着进化次数的增大,适应度值不断减小,而最佳适应度在进化33 次之后达到最优,基本保持不变,此时继续增加进化次数,平均适应度在靠近最佳适应度的同时变化趋向于平稳,因理论与实际的差异,平均适应度无法与最佳适应度重合,所以将多次进化后接近平稳的平均适应度视为最优,获得当前情况下的最佳权值阈值。设置好GABP 神经网络模型的初始参数进行检验,模型分类的均方误差(MSE)在迭代训练150 次后达到最小值0.040385,呈现逐步减小的趋势,具有良好的收敛性,如图6 所示。
图5 适应度曲线Fig.5 Fitness curve
图6 MSE 曲线Fig.6 MSE curve
分类结果可以归结成 4 种情况:真正类(TP),假正类(FP),真负类(TN),假负类(FN)[22]。对于模型的分类效果有两种评价指标:精确率(Precision)和准确率(Accuracy)。对于这4 个指标的计算全部基于分类结果的混淆矩阵。0 代表无故障,1 代表三相电路A 相和Gnd 之间故障,2 代表三相电路A相和B 相之间故障,3 代表三相电路A、B 相和Gnd之间故障,4 代表三相电路所有三相之间故障,5 代表三相电路三相对称故障。各模型故障诊断性能如表2 所示。
表2 各模型故障诊断性能Tab.2 Fault diagnosis performance of each model
精确率(Precision)表示分类为正类的样本中真正为正类的概率:
准确率(Accuracy)表示对于所有样本分类正确的概率:
BP 神经网络模型的故障诊断效果普遍较好,对于各类故障的诊断均能达到80%以上的准确率。在利用遗传算法对模型进行优化,寻找到最优权值阈值后,GA-BP 神经网络模型的故障诊断能力进一步提升,平均诊断精确率为86.7%,准确率为95.6%,在所有机器学习模型中达到最高值,说明遗传算法提升BP 神经网络性能的效果良好。但是对于三相电路所有三相之间故障,三相电路三相对称故障诊断稳定性较差,并且其分类准确率还有待提高,需要获取更多的样本数据,提升模型的特征提取能力,使模型能够更好地区分各类故障数据,完成高速列车辅助供电系统故障诊断任务。
本文前期通过查阅资料与书籍,了解高速列车辅助供电系统的结构与原理,学习主要组成部件的功能与工作原理,并基于此,利用数字孪生技术在MATLAB Simulink 中建立辅助变流器的数字模型,对于辅助变流器三相输电线路可能出现的故障进行模拟研究,建立相应的机器学习模型,以故障数据集作为训练测试对象,结果证明本文研究的故障诊断方法能够根据电路数据完成高速列车辅助供电系统的故障诊断。主要研究成果如下:
(1)基于数字孪生技术,结合查阅的资料信息,建立了高速列车辅助变流器的数字仿真模型,与物理实体保持一致,建立数字孪生体与实体的映射关系,模拟三相输电线路多种故障情况。收集仿真故障数据,并进行可视化处理,分析数据特征,作为故障诊断方法研究的依据。
(2)建 立Adaboost 模 型、WD-Adaboost 模 型、WPD-Adaboost 模型、BP 神经网络模型、SVM 模型、GA-BP 神经网络模型共6 种类故障诊断模型。其中SVM 的径向基函数的参数γ分别选择0.2 和0.4。针对不同类别故障数据,机器学习模型能够有效进行诊断,保持较高准确率。采用小波包分解方法比小波分解方法对Adaboost 模型的优化效果更好。搭建遗传算法筛选BP 神经网络模型最优权值阈值,能在一定程度上提升模型性能。
(3)统计不同机器学习模型的各项诊断结果评价指标,表明本文所研究的故障诊断方法,具有强适应性、高稳定性和高准确率,适用于高速列车辅助供电系统的实时检测与诊断,以便及时维修。