BP神经网络模型在无人机系统故障预测中的应用分析

2019-09-13 06:36:18苏续军吕学志
计算机应用与软件 2019年9期
关键词:故障率分类器显著性

苏续军 吕学志

1 (陆军工程大学石家庄校区一系 河北 石家庄 050003)2(陆军炮兵训练基地模拟训练中心 河北 宣化 075100)

0 引 言

目前,无人机由于其自身特点和优越性能在军事、经济等领域得到了广泛应用,地位愈显重要。随着无人机技术越来越先进,无人机构造组成越来越复杂,由于受操控技能的熟练性和各种环境因素的影响,无人机故障时有发生。为了避免故障发生,减少对作战、训练任务的影响,对无人机故障进行预测并分析造成故障的重要因素尤为重要。

国内外相关研究主要集中在大型无人机系统上。大型无人机系统的误操作率往往比有人驾驶飞机大一到两个数量级[1]研究发现人为错误占早期大型无人机事故的21%至80%[2],而最近的研究发现它接近56%~69%[3]。从理论上讲,提高无人机自动化程度和操控人员的经验水平可以减少大型无人机中的人为错误[4]。为了避免大型无人机与其他飞行器碰撞[5],以及避免造成地面人员或财产的伤害[6],研究建议继续开发[7]感知技术、规避技术、自动着陆技术[8]。其他研究认为环境因素对大型无人机和有人驾驶飞机可靠性有很大影响,例如风速和风向[9]。

与载人飞行器相比,可用于无人机系统分析的数据要少得多。因此,大多数无人机可靠性研究倾向于通过指定最小故障率来满足可靠性目标[10-11],或利用故障树分析[12-14]、故障模式和影响分析[15-17]对无人机可靠性进行分析。这些无人机可靠性研究都是基于理论的分析,而不是基于数据的分析。本文将通过BP神经网络技术,建立无人机的故障预测模型,并分析影响无人机可靠性的重要因素,扩展之前的研究概念。

1 研究目标

本文的研究目标是利用已有的无人机飞行数据集进行处理,采用BP神经网络技术建立无人机故障预测模型,并分析影响无人机可靠性的重要因素。

在本文中,使用“故障”这一术语来描述阻止无人机完成任务的任何事件。“故障”这一术语取决于使用无人机执行的任务。用于该分析的数据背景是实验室级测试。本文分析的无人机任务是飞行实验,其产品是飞行报告。因此,出于本文的目的,如果无人机未能收集实验计划收集的数据,则认为无人机飞行实验故障。如果无人机在起飞时坠毁,那显然是故障,因为没有收集数据。如果无人机在飞行中遭遇紧急情况,并自动安全着陆,但是没有收集到所有测试数据,那么尽管系统保持完好无损,但仍然是故障的。如果在收集所有数据后无人机硬着陆,则该飞行不被视为故障,因为尽管在着陆时无人机受损,但完成任务。

2 数 据

2.1 数据提取

相关无人机数据集来自某实验中心2010年到2016年的各种型号无人机飞行记录。飞行记录包括测试的无人机型号、飞行员、飞行过程描述以及测试现场的环境条件。无人机包括成熟的民用无人机和处于试验阶段的军用原型机。无人机可以由操控手(地面站操作员)手动控制飞行,或者完全自动飞行,或者同时采用两种飞行模式。通常操控手(地面站操作员)地面飞行员提供方位,而自动飞行仪负责确保无人机的飞行速度和高度。出于分析的需要,仅当操控手负责控制无人机所有飞行参数时,无人机才被认为是在手动模式下飞行。无人机数据集包括1 054次飞行的20个特征因素,以及每次飞行的结果(故障/无故障)。有关变量如表1所示。

表1 原始属性

续表1

2.2 数据预处理

并非每次无人机飞行都有完整的数据。例如,一些飞行缺少风速和温度,而另一些飞行缺少过程描述,因此没有飞行故障记录。如果发现在飞行记录中缺少重要特征值,则从数据集中删除该条飞行记录。前954次飞行数据(来自总共1 104次的飞行数据,涵盖2010年1月到2016年9月)用于建模,而剩余的99次飞行(2016年10月至12月)用于数据验证。

3 构建模型

3.1 神经网络结构

神经网络长期以来一直用于分类目的。典型的前馈神经网络包括输入层、隐藏层和输出层,通过将输入向量逐层加权非线性处理最终得到输出向量,从而产生分类。本文使用的前馈人工神经网络结构如图1所示,它具有1个隐藏层和1个分类器节点。

图1 神经网络结构

首先,对数据集进行归一化,每个特征输入值减去该特征的平均值并除以其标准差来归一化。

图2 隐藏层节点内部工作原理示意图

3.2 BP算法

BP算法的学习过程由信号的正向传播与误差的逆向传播两个过程组成。正向传播时,输入信号经过隐层的处理后,传向输出层。若输出层节点未能得到期望的输出,则转入误差的逆向传播阶段,将输出误差按某种形式,通过隐层向输入层返回,并“分摊”给隐层节点与输入层节点,从而获得各层单元的参考误差或称误差信号,作为修改各单元权值的依据。这种信号正向传播与误差逆向传播修改着各单元权值,是周而复始进行的。权值不断修改的过程,也就是网络学习的过程(或称训练过程)。此过程一直进行到网络输出的误差逐渐减少到可接受的程度或达到设定的学习次数为止,BP算法学习过程的流程图如图3所示。

图3 隐藏层节点内部工作原理

只有一部分数据(通常为60%~70%)进行网络训练,而剩余数据被用于验证和测试。反向传播用于仅调整训练数据子集的网络权重。验证数据通过网络前馈以确定它们的映射错误。通常,当验证数据错误最小时,网络被认为是最优化的。因为具有足够节点的神经网络可以映射任意复杂的表面,所以验证数据集用于防止过度拟合。

3.3 特征变量筛选与显著性

本文的无人机故障建模采用信噪比(SNR)显著性指标[20]。此度量是基于权重的,并使用注入的噪声输入作为所有候选特征的比较。通过采用候选特征i权重的平方和与注入噪声的比率(并转换为分贝尺度)来计算显著性度量:

(1)

神经网络是随机初始化的,通常可以为相同的输入产生不同的结果。为了解释这种随机性,针对若干神经网络计算每个特征的信噪比显著性指标。信噪比显著性指标用于对特征变量进行排序,之后删除最不显著的特征(排名最低的)并再计算神经网络对测试数据集的平均分类准确度,当删除特征变量后的分类精度显著下降时,删除的最后一个特征变量将保留在神经网络模型中。如果没有明显的下降,分析人员可以自行决定分类准确度可接受的截止点。模型中保留下来的特征变量被认为是重要的。

3.4 ROC曲线和混淆矩阵

模型性能评价主要使用受试者工作特征(Receiver Operating Characteristic, ROC)曲线和混淆矩阵。

ROC曲线是一种非常有效的模型评价方法,可为选定临界值给出定量提示。ROC曲线是根据一系列不同的二分类方式(临界值或者阈值),将真阳性率(Sensitivity,灵敏度)为纵坐标,假阳性(1-Specificity,1-特异性)为横坐标绘制的曲线。该曲线下的积分面积(Area Under Curve, AUC)大小与每种方法的优劣密切相关,反映分类器正确分类的统计概率,其值越接近1说明该算法的效果越好。

混淆矩阵(Confusion Matrix)是模式识别领域中一种常用的表达形式。它描绘样本数据的真实属性与识别结果类型之间的关系。是评价分类器性能的一种常用方法。假设对于N类模式的分类任务,识别数据集D包括T0个样本,每类模式分别含有Ti个数据(i=1,2,…,N)。采用某种识别算法构造分类器C,cmij表示第i类模式被分类器C判断成第j类模式的数据量,则可得到如下N×N维混淆矩阵CM(C,D)。

(2)

混淆矩阵中元素的行下标对应目标的真实属性,列下标对应分类器产生的识别属性。对角线元素表示各模式能够被分类器C正确识别的数据量,而非对角线元素则表示发生错误判断的数据量。

4 模型评价

构建了基于BP神经网络无人机故障预测模型,并进行特征筛选。用于此分析的数据集包含n=1 064次飞行完整数据,并且Pr{FAILURE=0}=0.68和Pr{FAILURE=1}=0.32。因为所有特征变量都存在于基本模型中,通过顺序移除非显著特征变化对模型进行了改进。删除相关性较大的特征变量,例如风差,因为它是另外两个变量的函数。计算输入数据的相关矩阵,得到如表2所示的显著相关性。

表2 人工神经网络(ANN)输入的显著相关性

出于解释原因,“自动飞行次数”被排除在考虑之外。跟“自动飞行次数”相比较,记录和解释“飞行总数”更容易。同样,“最小风速”被排除在考虑范围之外。其决策价值低于“最大风速”,因为大多数法规和安全要求都规定了无人机飞行的最大风力等级。预计“待机间隔天数”和“型号间隔天数”在模型中不显著,所以模型中并不保留这两个特征变量。

选择具有1个隐藏层(18个隐藏节点)、使用反向误差传播的前馈神经模型。统一加入随机噪声变量,数据随机分组,分为训练和测试集(分别为90%、10%)。随机初始化和训练神经网络,并计算每个特征的信噪比显著性。从模型中删除排名最不显著的特征。按表3中给出的顺序移除特征。

表3 BP神经网络故障预测模型的特征移除顺序

将测试集误分类率与神经网络的移除特征的数量作图,以确定在模型中保留的最佳特征数(参见图4)。该图显示错误分类率下降,直到9到11个特征删除后,错误分类率急剧增加。将三个候选模型(分别具有9、10和11个特征的模型)进行相互比较。具有10个特征的模型以最低的平均测试集错误分类率表现最佳。最佳模型的权重是从表现最佳的候选模型中选出的。使用ROC曲线(参见图5)和混淆矩阵(参见图6)验证了最终模型的性能。

该模型保留了以下特征变量:手动驾驶、飞行次数、操控手飞行次数、型号飞行次数、飞行总数、场地飞行次数和原型机。该模型的ROC曲线的AUC表明模型要好于猜测,可以更好地预测无人机飞行故障,并且混淆矩阵表现出87%的准确度。

图4 为BP神经网络故障预测模型测试集误分类率随移除特征变量变化图

图5 BP神经网络故障预测模型的ROC曲线(AUC=0.87)

预测01真0298实1558

图6 BP神经网络故障预测模型的混淆矩阵

对无人机和载人飞机事故的文献回顾表明,人为错误是飞机故障的主要原因,增加飞行员经验有助于降低故障率。 但是,并没有发现操控手经验(“操控手飞行次数”和“操控手间隔天数”)显著影响故障率。同样地,“最大风速”也并未显著影响故障率。这主要是由于测试人员在飞行之前会判断谁应该操控无人机或者哪些风对于给定的测试飞行是安全的,这足以使这两个因素不会影响测试飞行。

无人机的故障率随着所有平台的“飞行总数”(NFTOT)以及“型号飞行次数”的增加而减少,这说明更好的组织经验同样可以降低故障率。

最重要的结论是军用原型机故障率是民用成熟机的6倍,而手动飞行模式下的故障率是自动驾驶模式的2倍。减少故障率的简单方法是尽可能用商用成熟机代替军用原型机,特别是在载荷高价值或执行重要任务时。此外,应尽可能用自动驾驶模式代替手动操控模式,尤其是对于重要的飞行任务。

5 结 语

本文介绍了如何利用神经网络对无人机系统事故进行预测,对利用无人机系统故障数据集预测无人机故障问题进行了描述,给出了建模思路和方法框架,介绍了人工神经网络,并探讨了使用特征变量显著性筛选技术识别故障影响因素。在实例中利用本文提出的方法对无人机故障进行了预测,并量化了统计上显著的故障因素。提出了预防故障的建议,验证了方法的可行性与有效性。该方法可以充分利用故障数据中隐含的信息,以及多种神经网络的优点,具有一定的通用性与实用性。在以后的研究中,可以采用其他特征变量选择方法,如因子分析、主成分分析等;可以采用其他数据建模方法,如Logistics回归、SVM、深度学习网络等;采集无人机的各种性能数据、测试数据等,分析这些因素对无人机故障的影响。

猜你喜欢
故障率分类器显著性
基于显著性权重融合的图像拼接算法
电子制作(2019年24期)2019-02-23 13:22:26
基于视觉显著性的视频差错掩盖算法
BP-GA光照分类器在车道线识别中的应用
电子测试(2018年1期)2018-04-18 11:52:35
探索零故障率的LED智能显示终端
一种基于显著性边缘的运动模糊图像复原方法
论商标固有显著性的认定
知识产权(2016年8期)2016-12-01 07:01:32
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器
基于故障率研究的数字保护最优检修周期
降低空气开关跳闸故障率的措施研究
机电信息(2015年3期)2015-02-27 15:54:43