基于组合决策树的无绝缘轨道电路故障诊断方法研究

2018-07-20 09:05朱文博王小敏
铁道学报 2018年7期
关键词:约简轨道电路决策树

朱文博, 王小敏

(西南交通大学 信息科学与技术学院, 四川 成都 611756)

无绝缘轨道电路是铁路信号控制系统的关键设备,对保障列车安全运行起着至关重要的作用。铁路区间较多使用ZPW-2000A无绝缘轨道电路,该系统设备工作环境恶劣,故障多发,工作状态直接关系到铁路运输的效率和安全[1]。目前主要采用定期检修的方式排查轨道电路故障隐患,维修人员通过仪器测量相关监测量,仅凭经验对设备进行故障诊断[2]。这种方法不仅劳动强度大、效率低,而且诊断效果受人为因素影响较大,有必要引入智能诊断方法辅助现场维修工作人员及时准确地判断故障。

近年来,一些学者将各种智能技术引入轨道电路故障诊断中[3-11],在一定程度上取得了较好的效果。文献[3]利用遗传算法对补偿电容故障和道砟电阻变化情况进行了诊断分析。文献[4]用模糊神经网络方法对相敏轨道电路的4种典型故障进行有效的诊断。文献[5]给出一种基于PSO参数优化的SVM方法对轨道电路分路不良进行预测。由于轨道电路系统设备组成结构复杂,仅依靠单一网络模型对系统进行故障诊断存在较大的局限性。文献[6]提出一种数据驱动的网络分解诊断方法,为轨道电路故障诊断提供了一种新思路。

一些智能方法仅能粗略地诊断出轨道电路的故障范围,难以及时为维修人员提供有效的指导。为进一步指导维修,对轨道电路的多种细分故障模式进行有效诊断,本文结合C4.5算法[12]建立轨道电路组合决策树诊断模型。该模型利用粗糙集属性约简为各级诊断子网络选择合适的特征属性,再将C4.5融入各子网络提取诊断规则,最终得到的规则具有清晰细化的特点。实验仿真测试结果表明,该模型能够对ZPW-2000A轨道电路多种故障模式进行有效诊断。

1 C4.5的基本原理

C4.5作为一种常用的决策树分类算法,对文献[13]提出的ID3算法进行了优化改进,不仅能处理连续性数据分类问题,为不确定性数据[14]和非数值特征的模式识别问题也提供了有效的解决办法。决策树根据属性值划分节点,产生分支,以信息增益率作为选择树节点的指标,挖掘隐含于数据中的真实规则,分类规则对应根节点到叶节点的分支路径,采用适当的剪枝方法[15]可以简化决策树。

在训练样本集T中,每个样本由n个条件属性A共同决策某一类别Di(i=1,2,…,k)。同一类别的样本个数记为|Di|,定义某类样本的概率分布为Pi=|Di|/|T|,C4.5利用训练集形成决策树的步骤如下:

Step1计算训练样本初始熵为

( 1 )

Step2计算任一测试属性A的信息熵为

( 2 )

Step3计算属性A的信息增益为

G(A,T)=I(T)-I(A,T)

( 3 )

Step4依次推导属性A的分割信息熵Split与信息增益率GR

( 4 )

( 5 )

Step5将信息增益率值最大的属性选作当前节点,重复Step2~Step4依次选择各级节点,直到叶节点只有同种类别。

2 特征属性选择策略

智能分类技术应用到故障诊断中的主要任务是采用合适的特征选择策略,提高诊断规则提取效率和分类准确率。对于决策系统中识别不同的目标类,往往会有不同的属性组合方式构成决策表,为给定决策表构造深度尽量小的树状结构,需要简化原始特征属性集,消除冗余,改善分类性能。为此引入粗糙集[16]中属性核(core)与相对约简的概念,说明组合网络模型的特征属性选择策略。

粗糙集中核是用来表示知识的最简条件属性集,核中任意属性的缺失都会造成依赖性程度γC(D)变小。在保持依赖性程度γC(D)不变的前提下,属性约简过程不断删减冗余属性,以获得与识别决策类有关的最小条件属性集为目的,具体算法描述如下。

决策表,C={ci|i=1,2,…,m}为条件属性集,D={di|i=1,2,…,m}为决策属性集,Rred⊆C设为初始约简集,c∈C-Rred为任意属性,给出如下定义。

γC(D)=POSC(D)/U

( 6 )

k(c,Rred,D)=γRred∪{c}(D)-γRred(D)

( 7 )

输入:决策表S=;输出:相对约简集reduct。

Step1计算POSC(D),令coreC(D)=ø;

Step2对于∀ci∈C,若POSC-{ci}(D)≠POSC(D),则coreC(D)=coreC(D)∪{ci};

Step3令reduct=coreC(D),con=C-coreC(D),如果coreC(D)=ø,则转Step4,否则计算POSreduct(D),若POSreduct(D)=POSC(D),则终止,输出约简reduct;

Step5如果POSreduct(D)=POSC(D),则终止,输出约简reduct,否则转Step4。

一般情况下某个决策系统的条件属性集会有多种相对约简组合,选择相对约简集reduct中任一组合,作为构造决策树的特征属性。

3 基于C4.5的组合决策树模型

3.1 模型概述

决策树从根节点依次向下按照实例属性值遍历分支路径,最终由树的叶节点标记实例类别,形成的树状判别网络结构清晰、准确率高且规则解释性强。另一方面,组成无绝缘轨道电路系统的电气设备较多,存在多种直接或间接故障组合因素导致的故障类型,将故障类型逐级划分为多层决策子网构成组合决策诊断模型,使得诊断效果更具针对性。

3.2 确立轨道电路故障模式

ZPW-2000A轨道电路由位于室外、室内、送受端的各种电气设备组成。区段红光带和分路不良为两类常见的由电气设备失效引发的故障现象,为准确细致地划分故障,并尽量便于维护,本文归纳出表1所示的14种故障模式,其中TU1和TU2表示匹配调谐单元。

表1 轨道电路故障模式

3.3 组合决策树模型

基于3.2节划分的故障模式,构建组合决策树网络模型,见图1,在根节点处判断系统状态,系统正常运行用“F0”表示,利用系统监测信息结合专家经验[17],判断系统异常则继续向下遍历分支直到辨别出具体故障模式。粗糙集属性约简分别为组合网络中树节点1~树节点3-2-2选择相应的特征属性,再利用C4.5算法训练各子网样本产生具体诊断规则,F1~F14为表1中的故障模式。

图1 轨道电路故障诊断的组合决策树网络

4 基于组合决策模型的轨道电路故障诊断

4.1 样本集获取

由于现场的轨道电路故障样本难以获取,本文利用实验室轨道电路模拟仿真平台设置各类故障,获取足量样本,该仿真平台结构见图2。

该实验平台除钢轨线路部分用轨道模拟盘替代,其余设备与实际轨道电路所用设备一样,电气特性与实际轨道电路相似,不影响采集数据的可用性,轨道电路模拟仿真平台相关参数见表2。

图2 ZPW-2000A轨道电路结构

表2 轨道电路模拟仿真平台相关参数

结合现场轨道电路各设备故障发生比例的实际情况,在轨道电路仿真平台上模拟设置各种设备故障,采集各节点监测量数据组成样本集,其中训练集由各种故障模式且不重复的样本组成,测试样本从剩余的样本中随机抽取,样本集分布见表3。

将训练样本集随机划分成包含各种故障模式等数量的10份,训练建模数据每次选取其中9份,余下1份数据用于模型检验,如此反复训练和检验诊断模型的正确性。

表3 各类故障模式分布

4.2 选择树节点特征属性

通常,决策系统的条件属性是能反映决策域分类信息的原始特征集C(c1,c2,...,cn),其每一分量ci都隐含了特定的分类信息,原始特征对于组合决策网络各树节点的待辨识类别存在不同的冗余情况,为各树节点保留必要分类信息的前提下,采取特征选择策略降低属性冗余度,可以提高C4.5训练效率和分类准确率。

本文以下列12种监测量组成原始特征集:发送功出电压M1、发送电流M2、电缆侧发送电压M3、主轨入电压M4、发端TU1电流M5、发端SVA电流M6、发端TU2电流M7、受端TU1电流M8、受端SVA电流M9、受端TU2电流M10、电缆侧接收电压M11、主轨接收电压M12。

根据各级C4.5决策子网的故障类别,利用属性约简算法从原始特征集中为各子网分别提取合适的特征向量组合,既可以提高训练效率又使分类过程更具针对性,采用粗糙集属性约简算法计算得到图1中各树节点的特征属性见表4,训练得到各决策树的平均深度为3层,其树形结构的辨识效果较理想。

表4 各树节点的特征属性组成情况

以组合网络的树节点1为例,直接利用属性约简的计算结果,取3个模拟量M1、M3、M11作为决策子网的特征属性,抽取部分故障数据见表5,由C4.5算法训练得到树节点1的诊断决策树,见图3。

表5 树节点1的故障数据表 V

图3 树节点1的诊断决策树

4.3 模型的有效性检验

BP神经网络是一种广泛应用于故障诊断领域的非线性系统辨识工具。一方面按照轨道电路5种粗粒度故障范围的划分模式,每种各选取若干组数据经过归一化处理构成训练集,分别利用BP 神经网络和本文方法进行训练建立诊断模型。采用newff函数创建BP神经网络,选择trainlm函数进行训练,输入层以12个监测模拟量作为节点,隐含层设置10个节点,输出层由5个节点构成诊断结果向量(如线路故障(0,0,1,0,0)),设置BP神经网络最大训练次数为1 000,期望误差为0.000 1,学习率为0.05,训练到第92次时达到期望误差。利用测试数据对训练好的BP神经网络模型和本文属性约简方法建立的单C4.5决策树,进行准确率仿真测试,对比结果见表6,C4.5决策树判断准确率略高于BP神经网络法,达90.3%。轨道电路粗粒度故障范围诊断系统的原始特征较多,BP神经网络训练过程偏向拟合数据的输入输出关系,难以获知特征属性隐含的内部规则,测试过程中不可避免受冗余属性的影响,导致分类效果欠佳。本文所述方法相比BP神经网络法的优势在于,有针对性地采取有效的特征提取策略去除冗余,提高了C4.5训练的效率和准确率,且生成的树状规则清晰直观。

表6 C4.5与BP神经网络测试准确率比较

另一方面利用训练好的组合决策树网络模型逐级对14种细分故障模式进行识别,与单网络C4.5模型的辨识效果做对比,得到两种模型的正判率见表7。对比结果显示,组合决策树模型不仅第一级判别5种故障范围时正判率高达98%,当判别细分的14类故障模式时,准确率也有较明显上升。在实际应用中,通过安装轨道电路室外设备信号采集装置[18],结合信号集中监测系统获取室内外监测信息,为本文方法提供所需故障样本数据,若能获取较完整的监测数据以便划分多种故障模式,对提高诊断及维护效率具有重要意义。

表7 决策树组合网络模型样例检验结果

注:如图1网络层级,其中一级为室内外故障范围判断,二级为送受端故障判断,三级为具体故障模式判断。

5 结束语

本文提出一种基于组合决策树的无绝缘轨道电路故障诊断方法,利用粗糙集理论的属性约简原理为各子网C4.5决策树提供有效的特征属性选择策略,能够从大量样本中自动学习生成规则,实现方法简单,自适应能力强。根据轨道电路故障的逐级划分,以C4.5决策树作为组合网络的基本组成单元,设计了具有针对性的故障判别网络结构,从根本上改善分类器性能,分类效果远优于单决策树网络,克服了单决策树处理属性过多问题时难以收敛及树结构复杂等缺点。模型检验结果表明,该组合决策树网络对ZPW-2000A型轨道电路故障诊断具有较高的准确率。

猜你喜欢
约简轨道电路决策树
基于混合增量式属性约简的中医甲状腺结节诊疗规律分析
基于HHT及LCS的轨道电路传输变化识别探讨
JXG-50S型相敏轨道电路接收器自动测试台
决策树和随机森林方法在管理决策中的应用
ZPW-2000客专轨道电路掉码故障分析
JWXC_2.3型轨道电路故障测试仪
近似边界精度信息熵的属性约简
广义分布保持属性约简研究
决策树多元分类模型预测森林植被覆盖
基于决策树的出租车乘客出行目的识别