王朝蓬,李宁坤,汪 涛
(中国飞行试验研究院发动机所,陕西 西安 710089)
用于标记稳态飞行数据异常值的计算方法
王朝蓬,李宁坤,汪 涛
(中国飞行试验研究院发动机所,陕西 西安 710089)
动力装置性能试飞科目中,经常需要飞机稳定平飞,获取稳态飞行数据。但在稳态飞行过程中,由于种种原因,总会出现一些异常值。这些异常值应当被标记,有助于工程师对数据的有效性进行进一步判断。本文主要介绍了用于标记稳态飞行异常值的AEDC(Arnold Engineering Development Center)方法,将AEDC方法与莱茵达准则、肖维勒准则对比,并通过小样本的算例验证,证明AEDC方法对样本数并不敏感,能识别异常点,对稳态数据标记实用且有效。
稳态;异常值;莱茵达准则;AEDC方法
测量系统总会带来异常值(噪点),这些异常值可能是由于瞬时或者间断性的测量系统故障产生的,或者是测量中真实的波动。这种误差类型不能归入测量的不确定性。这些超出预期范围的异常值作为稳态飞行数据,对系统而言是没有意义的,这些值应当被剔除。
由于这些值有时并不容易找到出现的原因,要剔除异常值,应对其进行统计检验,从统计规律上判明数据是否为异常值。如果主观地将本来不是异常值的测量值剔除,表面上测量精度提高了,但实际是虚假的结果。因此,剔除异常值应当遵循严格的准则或方法,通常采用的准则有莱茵达准则、格拉布斯准则、狄克逊准则、肖维勒准则等。
本文通过AEDC方法对稳态飞行数据含有粗大误差的异常值进行剔除,经过对算例的计算,可以看出,无论在小样本还是大样本情况下,AEDC方法都能满足需求。为了便于对比,本文同时采用经常采用的莱茵达准则进行计算,并将计算结果相比对,可以发现,莱茵达准则在样本数较少时,不能满足剔除异常值的需求。
(1)莱茵达准则
莱茵达准则通常又叫三西格玛准则,置信区间为99.9%,其表达式如下:
(1)
(2)肖维勒准则
肖维勒准则的表达式为:
(2)
其中,Cn与测量值的测量次数n有关。
(3)AEDC方法
AEDC方法是阿诺德工程发展中心开发的一种适用于各种样本的标记异常值的方法,表达式如下:
(3)
其中,C是AEDC基于工程判断得到理想数据的期望区间的系数,其公式如下:
(4)
式中,N为样本数。如果N<65,通过式(4)计算C;如果N≥65,则C=3。此时,AEDC方法的表达式与莱茵达准则的表达式相同。
对比莱茵达准则、肖维勒准则和AEDC方法可以发现,其不同在于测量数据和算术平均值的偏差的绝对值大于标准差的倍数,莱茵达准则为3(置信区间为99%),而肖维勒准则和AEDC方法与测量次数(样本数)直接相关。
肖维勒准则和AEDC方法很类似,需要说明的是两者的区别,肖维勒准则的系数根据样本数的多少需查表,与AEDC方法的系数有很大不同。为了便于对比,表1给出肖维勒准则和AEDC方法的系数和样本数的关系。
表1 两种方法样本数和系数关系表
从表中可以看出,样本数大于6以后,肖维勒准则比AEDC方法更为严格,但是肖维勒准则的系数难以拟合,需要查表,对于实际应用有些不方便,故在此并没有采用肖维勒准则。
通过给出一组样本数为15的压力参数样本作为算例来进行计算,样本如表2所示。
表2 压力数据
基于Fortran PowerStation平台,通过编程计算,两种方法计算结果如图1所示。由图1可以明确看出,基于莱茵达准则,未发现异常值,而AEDC方法准确发现异常值并在程序中标记。
对于大样本数据,在某型飞机发动机性能的稳态试验点数据中,AEDC方法已经得到很好的验证,结果令人满意。由于样本数超过65,两种方法一致,故对大样本数据未进行计算对比。
(a)莱茵达准则计算结果
(b)AEDC方法计算结果图1 两种方法计算结果对比
虽然AEDC方法对于样本数没有要求,但是,该方法同样认为样本遵循正态分布。测量数据的分布大多接近正态分布,但是在电子仪器仪表中,均匀分布也是常遇到的一种重要分布。当样本不遵循正态分布而为均匀分布时,以上两种方法均不能奏效。因为对于均匀分布的样本,始终有样本和期望值的绝对值小于3倍的标准差[3]。因此,莱茵达准则和AEDC方法均失效。因此,对于均匀分布的样本,需要重新考虑剔除异常值的准则。
基于以上分析,得到以下结论:
(1)正态分布样本,莱茵达准则对于小样本判断不准确,而AEDC方法无论是小样本或者大样本,均能很好地标识出异常值,而且在发动机性能试飞科目中得到实际应用。
(2)对于样本数大于65,莱茵达准则和AEDC方法一致。
(3)样本如果处于均匀分布,AEDC方法和莱茵达准则均失效。
(4)如果用AEDC方法判断出现异常,应当考虑样本是否为均匀分布,重新挑选合适的准则。
[1]Dr. R. B. Abernethy et al. and J. W. Thompson. Jr, HANDBOOK, UNCERTAINTY IN GAS TURBINE MEASUREMENTS[Z].AEDC-TR-73-5.
[2]叶川,伍川辉,张嘉怡.计量测试中异常数据剔除方法比较[J].计量与测试技术,2007,34(7):26-27.
[3]李丽容,田琛.工程测量中异常数据的剔除[J].石油仪器,1998,12(5):28-29.
Method for Identifying Outliers of Steady State Flight Data
Wang Zhaopeng, Li Ningkun, Wang Tao
(Chinese Flight Test Establishment, Xi′an 710089, Shaanxi, China)
In flight test of power plant performance, the stable level flight of the aircraft is often needed to get steady state flight data. During the flight, due to some reasons there will always be a few outliers which should be identified for further judgment of the data validity. AEDC (Arnold Engineering Development Center) method for identifying outliers of steady state flight data is introduced in the paper, and is compared with Pauta criterion and Chauvenet criterion. Through the example of small sample, it is concluded that AEDC method is not sensitive to the number of samples, and is able to identify the outliers. AEDE method is effective and practical to indentify the steady state flight data.
steady state; outliers; Pauta criterion; AEDC method
2016-09-24
王朝蓬(1984-),男,汉族,陕西合阳人,硕士研究生,研究方向:航空动力装置特性飞行试验。
V217+.1
B
10.3969/j.issn.1674-3407.2016.04.008