基于Earley算法的多功能雷达文法概率快速学习算法

2016-11-01 19:06曹帅王布宏刘新波沈海鸥
计算机应用 2016年9期
关键词:文法剖析概率

曹帅 王布宏 刘新波 沈海鸥

摘要:

针对基于随机上下文无关文法(SCFG)建模的多功能雷达(MFR)概率学习问题,在传统InsideOutside(IO)算法和ViterbiScore(VS)算法的基础上,提出一种基于Earley算法的多功能雷达文法概率快速学习算法。该算法通过对截获的雷达数据进行预处理,构造可以反映派生过程的Earley剖析表,并且基于最大子树概率原则从剖析表中提取出最优剖析树,利用改进的IO算法和改进的VS算法对文法概率进行学习,实现MFR参数估计,得到文法参数后,再利用Viterbi算法对MFR状态进行估计。理论分析和实验仿真表明,与IO算法和VS算法相比,改进算法在保持估计精度的同时,可以有效降低计算复杂度和减少运行时间,验证了Earley算法能够提高文法概率的学习速度。

关键词:

随机上下文无关文法;多功能雷达;文法概率快速学习算法【只是本文提出的算法吧;Earley算法;参数估计;状态估计

中图分类号:

U416.216

文献标志码:A

Abstract:

To deal with the probability learning problem in MultiFunction Radar (MFR) based on Stochastic ContextFree Grammar (SCFG) model, a new fast learning algorithm of grammatical probabilities in MFR based on Earley algorithm was presented on the basis of traditional InsideOutside (IO) algorithm and ViterbiScore (VS) algorithm. The intercepted radar data was preprocessed to construct an Earley parsing chart which can describe the derivation process. Furthermore, the best parsing tree was extracted from the parsing chart based on the criterion of maximum subtree probabilities. The modified IO algorithm and modified VS algorithm were utilized to realize the learning of grammatical probabilities and MFR parameter estimation. After getting the grammatical parameters, the state of MFR was estimated by Viterbi algorithm. Theoretical analysis and simulation results show that compared to the conventional IO algorithm and VS algorithm, the modified algorithm can effectively reduce the computation complexity and running time while keeping the same level of estimation accuracy, which validates that the grammatical probability learning speed can be improved with the proposed method.

英文關键词Key words:

Stochastic ContextFree Grammar (SCFG); MultiFunction Radar (MFR); grammatical probabilities fast learning algorithm; Earley algorithm; parameter estimation; state estimation

0引言

雷达告警接收机(Radar Warning Receiver, RWR)系统通过测量与分析照射到载机上的雷达信号,对截获雷达数据与雷达威胁数据库中的数据进行匹配来确定威胁雷达辐射源的类型、工作状态、方位、威胁等级等信息,从而对飞行员提供有效建议,采取有效措施[1]。对于常规体制雷达,采用基于参数的雷达告警技术[2]便可对雷达辐射源型号和工作状态进行有效识别。多功能雷达(MultiFunction Radar, MFR)为新体制雷达,是一种有源相控阵火控雷达[3],采用电子扫描技术和复杂的软件算法对波束进行控制,极大地提高了目标探测和跟踪能力;但这也导致雷达信号参数空间成指数增长,对RWR系统的数据存储和处理能力有着极高的要求,而且常规体制雷达的5大参数,即射频(Radio Frequency, RF)、到达方向(Direction Of Arrival, DOA)、到达时间(Time Of Arrival, TOA)、脉冲宽度(Pulse Width, PW)以及脉冲幅度(Pulse Amplitude, PA),无法描述MFR工作模式的快速变化,使得RWR系统的工作性能急剧下降[4]。为了克服MFR的动态性问题,Visnevski[5]利用形式语言中的随机上下文无关文法(Stochastic ContextFree Grammar, SCFG)对MFR信号产生机制和工作模式进行动态分析和数学建模,提出了模式类的雷达告警技术。

在MFR文法建模的基础上,利用截获的雷达数据对文法产生式概率进行学习[6],对MFR参数和状态进行估计是模式类雷达告警技术中的核心问题。IO(InsideOutside)算法[7]和VS(ViterbiScore)算法[8]是两种常见的参数估计方法,文献[9]将期望最大化(ExpectationMaximization, EM)算法应用到IO算法和VS算法中对文法产生式概率进行学习,实现对

MFR参数的估计,在得到文法参数后,再利用Viterbi算法实现对MFR状态的

估计[10]。IO算法通过寻求训练数据集的全局最大似然对文法产生式概率进行学习,计算量较大;而VS算法只寻求训练数据集的全局最优解的最大似然对文法产生式概率进行学习,相对于IO算法,虽然减小了计算量,但却牺牲了精度,所以这两种算法都无法满足RWR系统的实用需要。

针对上述问题,本文提出基于Earley算法[11]的MFR文法概率快速学习算法,在原有IO算法和VS算法的基础上得到两种新的算法,即E(IO)算法和E(VS)算法。E(IO)算法通过对截获雷达数据进行预处理,构造Earley剖析表;加入点规则减少匹配中的冗余操作,以及能够反映规则匹配的状态;剖析表中的文法产生式都参与重估过程;E(VS)算法在E(IO)算法的基础上,基于最大子树概率原则从剖析表提取出最优剖析树,只有最优剖析树上的文法产生式参与重估过程。通过构造剖析表和加入点规则,可以解决有歧义文法产生式重复剖析、无效文法产生式重复剖析以及排除未参与派生过程的产生式等问题,从而对MFR参数和状态进行估计。通过理论分析和实验仿真,与IO算法和VS算法在计算复杂度、运行时间和状态估计精度等方面进行比较可知,E(IO)算法和E(VS)算法在保持估计精度的同时可以有效减少计算复杂度和运行时间,验证了Earley算法可以提高文法概率的学习速度。

1MFR文法建模

对MFR进行文法建模,需要引入雷达脉冲信号、雷达字、雷达短语3个层级的雷达信号结构的概念。雷达字是MFR的最小辐射单元[12],为有限个数的雷达脉冲信号的固定排列,能够反映MFR的工作状态和威胁等级;而雷达短语是有限个数的雷达字的固定排列,每个短语对应一个雷达功能状态。因此可将MFR信号当成依据某种特定文法产生的形式语言,从而利用文法分析技术对MFR参数和状态进行估计。

其中上下文无关文法(ContextFree Grammar, CFG)结构简单、表达能力强、描述性好[13],因此可以利用CFG对MFR进行建模。一个CFG是一个四元组G={V,N,R,S},其中:V为非终结符的非空有穷集,表示雷达短语集合;N是终结符的非空有穷集,即雷达字集合,且N∩V=;R为产生式的非空有穷集,R中的元素具有形式A→λ,其中A∈V,λ∈(V∪N)+, A→λ被称为产生式;S∈V,为文法G的开始符号。SCFG为CFG的扩展,它是一个五元组GS={V,N,R,S,P},P为CFG文法产生式的概率,且P必须满足∑λP(A→λ)=1的约束条件[14]。

基于SCFG建模的RWR系统如图1所示。基于SCFG建模的RWR系统首先利用MFR信号模拟器模拟多部交错的雷达脉冲信号,通过接收机对雷达脉冲信号进行截获,脉冲序列中的脉冲描述字通过脉冲串分析器去交错后,利用TOA模板库进行雷达字提取[15]。每一路雷达字通过序列识别模块进行MFR辐射源识别,每个SCFG模板对应一部特定的MFR。在确定MFR类型之后,再进行MFR文法概率快速学习,從而进行MFR参数和状态估计,最后进行威胁估计和态势分析,判定威胁等级,本文研究MFR文法概率快速学习的内容。

2Earley算法描述

由文献[15]可知,一个随机文法GS从初始符S开始产生序列η∈Lg(Gs)的最左导出称为η的派生过程。文法产生式序列的派生过程仅与文法结构有关,而与文法概率参数无关,所以本文利用Earley算法对每个雷达数据进行预处理,构造能描述派生过程的剖析表,并从中提取出最优剖析树,以降低计算复杂度和减少运行时间。

Earley算法是一种基于线图的、兼具自顶向下和自底向上优势的句法剖析方法,可以在O(n3)时间内处理任何上下文无关文法。它在剖析过程中加入了点规则[16],所谓点规则,是在规则的右部的终结符或非终结符之间的某一位置上加上一个圆点,表示右部被匹配的程度,可以反映规则匹配的状态,进一步减少了规则匹配中的冗余操作。

约定下文中使用以下记号[17]:A,B,C,…代表任意非终结符;a,b,c,…代表任意终结符;α, β,γ,…代表由非终结符或终结符组成的任意序列。算法运算过程中输入符号串从左向右扫描,每读入输入符aj,分析器产生一个状态集Sj。状态集由形如[A→α·β,i]的分析项目组成,表示:

1)当前参与匹配的产生式是A→αβ;

2)产生式右部的α已匹配,而β将被匹配;

3)已匹配部分在输入串中的位置是i。

在构造剖析表时,为了能正确地列出所有项目,要完成Earley算法的三个操作:首先进行扫描运算,再进行完成运算,最后进行预测运算,直到剖析表稳定为止,这样就可以不遗漏所有的状态集[18]。

则A→BC两种形式的产生式,A,B,C∈V,wj∈N,还是文法产生式结构为任意形式的产生式,通过构造Earley剖析表、加入点规则和反映规则匹配的状态,能有效减少冗余操作,解决迭代过程中歧义产生式重复剖析、无效产生式重复剖析以及排除未参与派生过程的产生式等问题。所以将Earley算法应用到MFR文法概率快速学习中,可以大大降低计算复杂度和减少运行时间。

3MFR文法概率快速学习方法

由式(29)可得,E(IO)算法和E(VS)算法通过对截获的雷达数据进行预处理,分别构造剖析表和最优剖析树,可以有效解决迭代过程中有歧义产生式重复剖析、无效产生式重复剖析以及排除未参与派生过程的产生式等问题,能够大幅度降低IO算法和VS算法的计算复杂度。

4.2算法性能分析

為了验证Earley剖析算法的正确性,本文利用上述“水星”MFR部分产生式进行分析[20],设计了两个实验。

4.2.1实验一

实验一通过改变训练序列个数和迭代次数,对算法的运行时间进行比较。假设“水星”MFR有两个状态,对应随机上下文无关文法G1和G2,根据上述“水星”MFR部分文法产生式,令非终结符V={S,ACQ,RR,NAT,S1,TM,RRP,W1,W2,W3,W4,W5},终结符N=(w1,w2,w3,w4,w5),S为初始符。设状态转移矩阵A′=(0.8,0.2;0.3,0.7),先令A′的Markov链随机产生一系列雷达状态,再对文法参数进行估计,最后经过100次蒙特卡洛实验,得到结果如图4、5所示。

由图4、5可知,随着序列数和迭代次数的增加,算法的运行时间逐渐增加,其中IO算法的运行时间最长,VS算法相对于IO算法只对训练数据集最优解进行训练,运行时间大大减少。E(IO)算法和E(VS)算法的运行时间相比VS算法减小

了1/10以上,大大降低了算法的时间复杂度,实验所得的MFR参数估计值符合理论分析。

4.2.2实验二

实验二通过对比四种算法在序列数和迭代次数增加时状态估计精度的变化情况来判别算法性能。当第n+1次迭代结果与第n次迭代结果的均方误差和小于0.1%时结束迭代,完成概率参数估计,得到文法参数后,利用Viterbi算法对MFR状态进行估计。设状态转移初始概率矩阵为A′0=(0.9,0.1;0.1,0.9),经过100次蒙特卡洛实验,结果如图6、7所示。

由图6、7可以看出,随着序列数和迭代次数的增加,状态估计精度会越来越高,IO算法和E(IO)算法的状态估计概率相同,而VS与E(VS)算法的状态估计精度相同。这说明E(IO)和E(VS)算法在有效降低计算复杂度和减少运行时间的前提下,始终可以保持状态估计精度,验证了Earley算法可以提高文法概率学习速度。

5结语

本文针对基于SCFG建模的MFR参数和状态估计方法进行研究,在原有IO算法和VS算法的基础上,提出了E(IO)算法和E(VS)算法两种MFR文法概率快速学习算法。E(IO)算法通过对截获的雷达数据集进行预处理,在派生过程中加入点规则,构造Earley剖析表;E(VS)算法基于最大子树概率准则从剖析表中提取出最优剖析树。通过构造剖析表和最优剖析树,E(IO)算法和E(VS)算法可以解决迭代过程中有歧义产生式重复剖析、无效产生式重复剖析以及能排除未参与派生过程的产生式等问题,有效进行MFR参数估计。在得到文法参数后,利用Viterbi算法对MFR状态进行估计。通过理论分析和建模仿真表明,E(IO)算法和E(VS)算法在降低计算复杂度和减少运行时间的同时,可以有效保持状态估计精度,验证了Earley算法可以提高文法概率学习速度。

参考文献:

[1]

周帆,陈兴凯,韩壮志,等.机载雷达告警接收机的现状及技术发展趋势[J].飞航导弹,2014(2):41-46.(ZHOU F, CHEN X K, HAN Z Z, et al. Status and trends of the airborne radar warning receiver [J]. Aerodynamic Missile Journal, 2014(2): 41-46.)

[2]

刘海军.雷达辐射源识别关键技术研究[D].长沙:国防科学技术大学,2010:3-5. (LIU H J. Researches on identification key technology for radar emitter [D]. Changsha: National University of Defense Technology, 2010: 3-5.)

[3]

李健伟,刘璘,吴宏超,等.机载有源相控阵雷达给告警器带来的威胁[J].雷达与对抗,2014,34(2):14-17.(LI J W, LIU L, WU H C, et al. Threats to radar warning receiver that airborne active phased array radars bring [J]. Radar & ECM, 2014, 34(2): 14-17.)

[4]

WANG A, KRISHNAMURTHY V. Signal interpretation of multifunction radars: modeling and statistical signal processing with stochastic context free grammar [J]. IEEE Transactions on Signal Processing, 2008, 56(3): 1106-1119.

[5]

VISNEVSKI N A. Syntactic modeling of muftifunction radars [D]. Hamilton: McMaster University, 2005: 8-10.

[6]

代鹂鹏,王布宏,沈海鸥,等.基于文法派生解析表的多功能雷达快速参数估计方法[J].电子学报,2016,44(2):392-397.(DAI L P, WANG B H, SHEN H O, et al. Fast parameter estimation of multifunction radar based on syntactic of parse chart [J]. Chinese Journal of ElectronicsActa Electronica Sinica, 2016, 44(2): 392-397.)

[7]

LARI K, YOUNG S J. The estimation of stochastic contextfree grammars using the insideoutside algorithm [J]. Computer Speech and Language, 1990, 4(1): 35-56.

[8]

NEY H. Stochastic grammars and pattern recognition [M]// LAFACE P, DE MORI R. Speech Recognition and Understanding. Berlin: Springer, 1992, 75: 319-344.

[9]

LATOMBE G, GRANGER E, DILKES F A. Fast learning of grammar production probabilities in radar electronic support [J]. IEEE Transactions on Aerospace and Electronic Systems, 2010, 46(3): 1262-1289.

[10]

代鹂鹏,王布宏,蔡斌,等.基于SCFG建模的多功能雷达状态估计算法[J].空军工程大学学报(自然科学版),2014,15(3):24-28.(DAI L P, WANG B H, CAI B, et al. A method for states estimation of multifunction radar based on stochastic contextfree grammar [J]. Journal of Air Force Engineering University (Natural Science Edition), 2014, 15(3): 24-28.)

[11]

EARLEY J. An efficient contextfree parsing algorithm [J]. Communications of the ACM, 1970, 13(2): 94-102.

[12]

馬爽,柳征,姜文利.基于幅度变化点检测的多功能雷达脉冲列解析方法[J].电子学报,2013,41(7):1436-1441.(MA S, LIU Z, JIANG W L. A method for multifunction radar pulse train analysis based on amplitude change point detection [J]. Acta Electronica Sinica, 2013, 41(7): 1436-1441.)

[13]

陆玲,周书民.形式语言与自动机及程序设计[M].哈尔滨:哈尔滨工业大学出版社,2014:11-16.(LU L, ZHOU S M. Formal Language, Automaton and Program Design [M]. Harbin: Harbin Institute of Technology Press, 2014: 11-16.)

[14]

GONZALEZ R C, MANNING G T. 句法模式识别[M].濮群,译.北京:清华大学出版社,1984:84-88.(GONZALEZ R C, MANNING G T. Syntactic Pattern Recognition [M]. PU Q, translated. Beijing: Tsinghua University Press, 1984: 84-88.)

[15]

刘海军,樊昀,李悦,等.多功能雷达建模中的雷达字提取技术研究[J].国防科技大学学报,2010,32(2):91-96.(LIU H J, FAN S, LI Y, et al. Research on extracting of radar words in modeling of multifunction radar [J]. Journal of National University of Defense Technology, 2010, 32(2): 91-96.)

[16]

韩习武,HAUSSER R.基于扩展Viterbi路径的概率Earley算法[J].计算机科学,2011,38(1):207-209.(HAN X W, HAUSSER R. Probabilistic Earley algorithm based on extended Viterbi path [J]. Computer Science, 2011, 38(1): 207-209.)

[17]

张磊. 基于关系代数的语法语义分析单元设计[D].大连:大连交通大学,2012:5-6.(ZHANG L. Syntactic analysis and syntaxdirected translation based on extended relational model [D]. Dalian: Dalian Jiaotong University, 2012: 5-6.)

[18]

唐建,赵川.基于Earley算法的英语句法剖析系统[J].数字通信,2013,40(1):84-87.(TANG J, ZHAO C. English grammar parsing system based on Earley algorithm [J]. Digital Communication, 2013, 40(1): 84-87.)

[19]

傅京孙.模式识别应用[M].北京:北京大学出版社,1990:68-69.(FU J S. Application of Pattern Recognition [M]. Beijing: Beijing University Press, 1990: 68-69.)

[20]

吴晓降,李云鹏,李娜.基于SCFG的雷达信号处理中概率学习算法的研究[J].火控雷达技术,2015,44(2):32-36.(WU X J, LI Y P, LI N. Study on algorithm of probabilities learning in radar signal processing based on SCFG [J]. Fire Control Radar Technology, 2015, 44(2):32-36.)

猜你喜欢
文法剖析概率
概率与统计(1)
概率与统计(2)
基于Java的递归下降语法分析器的实现
创作剖析
“角”的常见错解剖析
概率与统计解答题集锦
教育精英化还是平等化
文法学校见证英国两党争斗
二义性文法的SLR(1)分析器的直接构造方法浅析