基于范例推理的NPD数据支持向量机预测

2014-09-08 03:09蔡良才董豪昊王海服戴圣睿
振动与冲击 2014年16期
关键词:坡度检索噪声

蔡良才,董豪昊,王海服,刘 洲,邵 斌,戴圣睿

(1.93801部队,陕西 咸阳 712201;2.94804部队,上海 200000)

NPD(Noise-Power-Distance)数据为对飞机噪声辐射特性的简化描述,其将噪声数据处理集成为基准条件下噪声级L为垂直噪声传播距离d及功率P的函数[1-3]。该数据为飞机噪声环境影响评价基本资料,飞机噪声计算模型及软件均由其配合修正公式实现任意位置噪声计算[1, 4-6]。NPD 数据由飞机制造商提供,但由于我国至今尚无标准军用飞机NPD曲线资料,会影响军用机场及军民合用机场飞机噪声环境影响评价。

为填补空白,曾有研究通过飞机噪声特性测量建立军用飞机NPD数据[7-8],但实际操作中遇到诸多问题,即①小样本问题。噪声测量所需数据主要为飞行轨迹距测点最短距离及单次飞行事件噪声级。因此在保证测量过程顺利情况下,飞机每飞行1次,测点仅能采集到1组数据样本。为保证数据可靠性,要求对每个测点测量6次以上,并取算术平均值与90%置信区间[9]。即每增加1个测点,测量工作量大大增加,从而产生巨大人力、财力需求。因此,实际测量难以密集布点,所得样本数量有限。②小范围问题。由于机场地形地物限制和背景噪声干扰,实际测量时较难获得2 km以上数据,而为满足评价要求,NPD数据应给出5 km甚至7 km范围内数据,因此面临由小范围数据外推大范围数据的精度问题。③数据真实性问题。实测数据样本虽为6次测量结果平均,但由于机场本身特殊性及计算经验公式的近似性,样本值与真实值间仍存一定偏差,该偏差会在数据外推过程中放大,导致预测值误差更大。

因此,本文据现有条件,基于范例推理(Case-Based Reasoning, CBR)与支持向量机(Support Vector Machines, SVM)等数据处理技术提出经济可行的预测方法。

1 方法设计

1.1 预测模型选择

鉴于测量数据小样本、小范围及失真问题,本文选支持向量机模型进行预测。该方法基于结构风险最小化原则,不仅考虑对渐进性能要求,且追求最优解,在解决小样本、非线性及高维模式识别问题中表现出特有优势。SVM作为新型机器学习算法,通过非线性映射将低维非线性函数映射到高维空间,但求解SVM无需获知非线性映射的具体形式,只需选择适当核函数,通过计算核函数进行优化求解[10]。输入参数为距离lgS,输出参数为噪声级L,选具有普适性的高斯径向基核函数为

(1)

式中:σ2=1为核参数,经反复试验确定;C=10 000为惩罚因子;e=0.005为不敏感系数。

1.2 范例推理监督

范例推理为实际经验或人工智能的推理方法[11-12]。与传统专家系统相比,该方法所用主要知识非规则而为范例,对问题求解并非通过规则链推理建立问题描述与结论间一般性联系,而是基于过去处理类似问题经验及获取的知识进行类比推理,通过修改相似范例以适应当前问题。此独特求解策略,使其具有良好的自学习功能,能有效利用过去的成功案例较好解决知识获取的瓶颈问题,因此较适合一般理论模型、领域知识不完全但经验积累较丰富领域。

图1 范例推理对NPD预测监督流程

因建立军用飞机噪声源辐射物理模型较困难,故噪声特性测试所得NPD数据有限,拟合的NPD曲线精度缺乏足够说服力,使NPD数据预测陷入困境。范例推理可为该问题的解决提供有效手段。已有研究对各种机型进行大量实测,建立NPD数据,且广泛用于各类软件,如INM软件几乎包含所有民用飞机与100多种军用飞机NPD数据,此可构成庞大范例库,为范例推理用于我国军用飞机NPD预测,提供有力数据支撑。

范例推理在军用飞机NPD预测中应用思路为:以有限测试数据为目标范例,通过范例推理在范例库中检索相似机型的NPD数据为相似范例,用相似范例监督NPD数据回归与预测。流程见图1。

2 范例推理监督下NPD数据SVM预测

2.1 范例库建立

飞机噪声影响因素众多,① 飞机声源因素,即发动机类型、数量及安装方式等;② 声音传播因素,即大气条件、地形及地面特征等;③ 飞行状态因素,即操作模式(起飞或着陆)、发动机功率、速度及侧倾角等。诸多因素交织一起,使整个飞机噪声辐射过程非常复杂。NPD算法为对该辐射特性的简化描述,主要表现在给定统一的基准大气条件及参考速度确定飞机沿径直航线平稳飞行的飞行方式、噪声级L与垂直噪声传播距离d之间关系,使在描述各型飞机NPD数据时从气象条件、速度、转弯侧倾、地形地面等影响中脱离。因此,完整描述一条NPD曲线数据需给出飞机类型、评价量类型、操作模式(起飞或着陆)、发动机功率及不同距离的噪声级等信息,而该信息的合并即为完整范例。飞机类型对NPD意义主要在于指定声源类型,而在相似性检索时飞机类型不便直接参与,因此建立范例库时需增加发动机类型及数量作为声源相似性检索指标,飞机类型仅作为标识符使用。为便于国际国内数据融合,噪声级数据按INM样式给出200~25 000 ft范围内噪声距离。完整范例属性见表1。

表1 NPD范例属性表

2.2 范例检索与相似度计算

范例检索极其重要,直接影响范例推理效率及质量,且决定范例复用与修改的难易。为简化检索及相似度计算过程,将NPD范例属性分为两部分,一部分为噪声距离数据序列,仅含不同距离的噪声数据;一部分涵盖除噪声距离数据外的其它属性,称为范例头。将范例检索分两步:先在范例库中检索与目标范例头相似范例,再计算噪声距离数据相似度确定相似范例。可在一定程度上避免将噪声距离数据表面相似视为本质相似,导致错误判断。

2.2.1 范例头相似性检索

范例头属性有字符型与数值型两种。检索时先对字符型进行匹配,发动机类型、评价量类型及操作模式会从本质上导致NPD数据差异,因此对属性检索采用一票否决制,只有全部与目标范例匹配的源范例才能进入数值型检索。发动机数量及其功率会影响飞机噪声大小,对其相似度计算可用近邻法的欧氏距离公式,但考虑其对飞机噪声影响已含在具体噪声距离数据中,因此可跳过直接进行噪声距离数据的相似度计算。

2.2.2 噪声距离数据相似性检索

相似性检索常用近邻法,通过距离(如欧几里德距离,海明距离及切比雪夫距离等)度量目标范例与源范例间相似程度。距离越小两者越相似。该度量方式为模糊度量,只能给出范例所有属性加权后综合结论,较适用于一般分类问题(如边坡稳定性评价),因该类问题各属性间通常相对独立,无需考虑数据间约束关系。NPD数据描述噪声级随距离变化关系,其性质类似时间序列范例,各数据间存在某种制约与关联,共同决定未来数据的变化趋势。即对该类数据考察不仅在于数据本身大小,更重要的对数据背后变化规律的认识。对此类数据进行范例推理目的为找到此规律,运用该规律指导目标数据的外推预测。显然,仅通过计算目标范例与源范例间的欧氏距离无法获得此规律。本文提出基于坡度的相似性搜索算法,通过对目标范例、源范例噪声距离数据分段处理,求出各点间坡度,用一系列坡度衡量各范例变化趋势,考察源范例与目标范例间相似程度。

2.2.2.1 坡度计算

设某范例在距离序列{Si,i=1,2,…,n}的对应噪声级序列为{Li,i=1,2,…,n},则在图2的对数坐标系中NPD曲线从点(lgSi,Li)到(lgSi+1,Li+1)坡度ki可近似为

(2)

按式(2)对所有点依次计算即可得坡度序列{ki,i=1,2,…,n-1}。需注意的是,大数情况下测试所得噪声距离数据其距离向量并非INM样式,需对目标范例、源范例数据在距离上进行统一。将源范例数据回归内插可在不损失精度情况下获得目标范例对应距离的噪声级。

图2 坡度计算示意图

2.2.2.2 相似度计算

求出各范例坡度序列后可利用坡度进行相似性检索,获得与目标范例变化趋势相似的范例。相似度计算式为

(3)

式中:σjT为目标范例T与源范例库中第j个范例间累计坡度差;kj(i)为源范例库中第j个范例第i个坡度值;kT(i)为目标范例第i个坡度值;n-1为坡度总数。

据式(3)的物理意义,σjT越小即目标范例与源范例间累计坡度差越小,表明目标范例与源范例坡度变化趋势越接近,因此可认为目标范例与源范例越相似。计算所有相似范例与目标范例间累计坡度差,按由小到大可得排序结果。

2.3 相似范例对数据预测检验与校正

获得相似范例目的即为对数据预测过程进行监督,对回归、预测结果进行检验、校正。该过程据坡度进行。检验前需获得目标NPD初始回归及预测结果,利用SVM模型对实测数据进行首次回归拟合,计算各INM距离样式噪声级,获得初始预测结果,对相似范例进行检验与校正,步骤为:① 对初始预测结果进行坡度计算,获得待检验坡度序列;② 分别计算该坡度序列与所有相似范例坡度序列间累计坡度差;③ 对累计坡度差按从小到大排序,将排序结果与前相似性检索排序结果对比,若排序不变说明待检验结果良好,预测结果有效;排序改变说明预测结果需校正;④ 由于曲线回归误差主要产生于外推预测部分,故校正仅对较大距离点进行。校正起点在实测数据距离范围内,选取与实测数据吻合最好的点。采用相似度最大范例进行坡度校正,即将相似范例坡度赋给目标范例,计算各点修正值;⑤ 将修正后预测数据与实测数据进行预测并检验;⑥ 输出检验合格的预测结果。

3 实例验证

为确保数据的真实性及权威性,本文利用INM软件中部分飞机NPD数据进行验证[4]。按表1建立范例库,见表2。取第2组数据(F16A-LEPN-D-95)为目标范例,其它为源范例。先进行范例头相似性搜索,主要以字符型属性匹配为主。通过搜索,第4组评级量类型不同,第6组操作模式不同,第9、10组发动机类型不同,因此对这些范例不予考虑。由于B2飞机发动机数目与F16A相差过大,为4:1,故排除该组数据。经范例头检索,与目标范例较接近的为第1组(F16A-LEPN-D-96.3)、第3组(F16A-LEPN-D-90)、第5组(F15A-LEPN-D-92.2)及第7组(U2-LEPN-D-100),对该4组进行相似度计算,确定其相似排序。为更清楚展示范例推理对外推预测的监督作用,对目标范例(F16A-LEPN-D-95)噪声距离序列,对假设当前仅测量的前5个数据进行相似度计算。

表2 范例库部分NPD数据

3.1 坡度计算

利用坡度计算公式,对目标范例及1、3、5、7组源范例噪声距离数据序列进行坡度计算,获得各范例坡度序列,见表3。目标范例因只有5个数据,故其坡度序列只4个数据,其它范例坡度序列均有9个数据。

表3 各范例坡度序列

3.2 相似度计算

利用相似度公式计算各源范例与目标范例间累计坡度差,结果见表4。

表4 相似度计算结果

累计坡度差越小,相似度越大。由表4看出,范例(F16A-LEPN-D-96.3)与目标范例相似度最大,各范例相似度排序为1>5>7>3。

3.3 目标数据预测检验与校正

检验前需获得目标范例的初始回归与预测结果,利用SVM模型对实测数据进行首次回归拟合,预测结果见表5。

对初始预测结果进行坡度计算,获得待检验的坡度序列为

{ki,i=1,2,…,9}={-1.83,-2.16,-2.36,-3.06,

-4.63,-6.19,-7.17,-7.62,-7.40}

(4)

表5 目标范例首次回归预测结果

计算该坡度序列与所有相似范例坡度序列间累计坡度差,结果见表6。由表6看出,初始回归结果与相似范例间累计坡度差均明显增大,说明初始回归曲线发展趋势与相似范例均出现较大差别;由相似度排序知,初始回归结果相似度排序(3>7> 5>1)与目标范例(1>5>7>3)截然相反,说明初始回归结果改变了目标范例本来的数据发展规律,须对其进行校正。

表6 相似度计算结果

采用相似度最大范例进行坡度校正,以第5组测量数据即2000 ft处为起点。将范例(F16A-LEPN-D-96.3)的坡度赋给目标范例计算各点较正值,并与实测数据一起再次进行SVM回归与预测,结果见表7。

表7 校正后目标范例预测结果

将校正后预测结果进行再检验,其坡度序列为

{ki,i=1,2,…,9}={-1.83,-2.23,-2.52,-2.81,

-2.85,-2.54,-2.11,-1.65,-1.34}

(5)

计算该坡度序列与所有相似范例坡度序列间累计坡度差,结果见表8。由表8看出,校正后其与相似范例间相似性关系明显改善,检验合格。由此所得目标范例为最终预测结果。

图3为对目标范例(F16A-LEPN-D-95)的SVM回归预测结果、范例推理监督下SVM回归预测结果及实测值对比。由图3看出,范例推理已使数据回归与预测精度极大提高。

表8 相似度计算结果

图3 范例推理对预测结果影响对比

4 结 论

(1) 本文针对缺乏军用飞机标准NPD曲线,影响各种机场飞机噪声环境评价,而飞机噪声辐射理论模型应用尚不成熟及对实测数据回归拟合过程中出现的问题,立足现有条件,给出基于范例推理监督的支持向量机预测模型。该模型充分利用测量数据本身及背后的演变规律降低预测模型对数据样本的敏感性及依赖性,可极大提高回归及预测精度。

(2) 对范例推理在类似时间序列范例预测中如何实现其监督作用缺乏行之有效的方法,相关研究缺乏有效措施[11]。基于坡度的相似性检索、检验、修正方法仍待进一步研究及完善。

[1] 刘洲, 蔡良才, 方华, 等. 飞机噪声计算通用模型研究[J]. 振动与冲击, 2012, 31(17): 124-128.

LIU Zhou, CAI Liang-cai, FANG Hua, et al. Research on the general model for aircraft noise calculation[J]. Journal of Vibration and Shock, 2010, 31(17): 124-128.

[2] 徐志胜, 曾庆华, 白红元, 等. 机场周围飞机噪声预测辅助系统[J]. 交通运输工程学报, 2007, 7(6): 123-126.

XU Zhi-sheng, ZENG Qing-hua, BAI Hong-yuan,et al. Aided system of aircraft noise prediction around airport[J]. Journal of Traffic and Transportation Engineering, 2007, 7(6): 123-126.

[3] 沈洪艳, 刘劲松. 机场噪声预测模型及应用实例[J]. 河北师范大学学报(自然科学版), 2000, 24(1): 137-140.

SHEN Hong-yan, LIU Jin-song. Airport noise prediction model and applied example[J]. Journal of Hebei Normal University (Natural Science), 2000, 24(1): 137-140.

[4] 国家环境保护总局. 环境影响评价技术导则-民用机场建设工程[S]. 2002.

[5] Dinges, Hemann, Rickel, et al. Integrated noise model (INM) version 7.0 user’s guide[R]. Washington, D.C.: Federal Aviation Administration, 2007.

[6] Horonjeff R D.Noisemap 5.1 computer program update, operator’s manual[R].AMRL-TR-78-109 Addendum 2, 1986.

[7] SAE Committee A-21, Procedure for the calculation of airport noise in the vicinity of airports[S]. SAE AIR-1845, 1986.

[8] 王治. 某型飞机噪声距离特性曲线测试与研究[D]. 西安:空军工程大学,2002.

[9] 中国民用航空总局. CCAR-36-R1,航空器型号和适航合格审定噪声规定 [S]. 2007.

[10] 李应红, 尉询楷, 刘建勋. 支持向量机的工程应用[M]. 北京: 兵器工业出版社, 2004.

[11] Barletta R. An introduction to case based reasoning[J]. Computer Science, 1993, 20(1): 10-14.

[12] 董辉, 侯俊敏, 傅鹤林, 等. 基于范例推理的公路隧道拱顶变形时序支持向量机外延预测[J]. 岩土力学, 2011, 32(7): 2099-2105.

DONG Hui, HOU Jun-min, FU He-lin,et al. Support vector machine extrapolation prediction of tunnel arch-top deformation time series based on case-based reasoning[J]. Rock and Soil Mechanics, 2011, 32(7): 2099-2105.

猜你喜欢
坡度检索噪声
Aqueducts
放缓坡度 因势利导 激发潜能——第二学段自主习作教学的有效尝试
瑞典专利数据库的检索技巧
一种基于Python的音乐检索方法的研究
大坡度滑索牵引索失效分析及解决措施研究
汽车制造企业噪声综合治理实践
关于场车规程中坡度检验要求的几点思考
浅议专利检索质量的提升
一种基于白噪声响应的随机载荷谱识别方法
车内噪声传递率建模及计算