谭龙辉
(华北计算技术研究所,北京 100083)
管制员模拟训练评估规则的建立算法
谭龙辉
(华北计算技术研究所,北京 100083)
空中交通管制员肩负着指挥飞行器飞行、保障空中交通安全的重要职责,由于管制员工作的特殊性,使模拟训练成为培训管制员的重要手段,但在评估模拟训练结果时,往往以人力评估为主,较为主观且工作量大,难以准确反映管制员的训练情况,为此,本文基于免疫算法设计了一种评估规则的建立算法,使训练系统可s根据建立的评估规则对管制员训练结果进行自动评估,得出比较客观、公正的评估结果。
模拟训练;遗传算法;评估规则;自动评估
管制员是空中交通管制的重要组成部分,他肩负着保障飞机飞行安全的重任,由于工作的特殊性,管制员不能依靠实际飞行管制进行训练,因此,为了达到训练的目的,模拟训练系统已经被广泛使用在管制员训练中,现有的管制员模拟训练系统已经具有很高的仿真能力,基本能够覆盖到管制员日常工作的方方面面,确保了管制员训练的质量。
但是已有的管制员训练系统评估方式主要依赖于教员的评价,教员现场观察管制员的表现,对管制员进行评分,这样的评估方式存在着主观性强、工作量大等问题,难以完全客观反映管制员的训练情况,而且很多对管制员训练评估起指导作用的训练数据存储在系统中没有使用,未能完全发挥出数据的潜力[3]。
为了使评估结果更加客观,本文将着重研究模拟训练中评估规则的建立方法,基于大量已有的评估数据, 借鉴免疫算法中的一些思想,设计评估规则建立算法,让系统能够根据评估规则对管制员训练情况进行评估,实现评估的自动化、客观化。
在管制员的训练过程中,涉及到的指标有100多个,但不是所有的指标都能够非常直接的反映出管制员的训练水平,比如管制员指挥时的语速、语音的清晰程度等,比如下指令的习惯,有的管制员习惯调整方向来达到目的,而有的管制员习惯通过调整高度来达到目的,这类与管制员习惯相关性较强的指标将不纳入评估规则的指标中。
本文所选取的评估指标[6]一般指通过管制员指挥,而造成某种现象或结果的数据,比如告警次数、延误飞机架次、错误指令次数等。
与此同时,对于不同的训练科目,有不同的侧重点,比如训练航线飞行指挥时就不会考虑飞机延误情况、复飞次数等,所以需要根据不同的训练科目划分训练指标集。
综上所述,评估指标的选取必须满足以下三个条件:
第一,评估指标尽量与管制员操作习惯关联性较小;
第二,评估指标须可量化[2],具有可比性,同时能够反映某种现实情况;
第三,评估指标必须与特定训练科目紧密联系,排除无关指标。
由于管制员训练涉及很多科目,不同科目可作为一个独立的体系进行考虑,因此后续将以飞行过程指挥为例讨论评估指标的建立。
在建立评估规则之前,需要将指标分为两类讨论:
1)具有决定性作用的指标,即如果发生或者不发生能够得到确定结果的指标,如发生飞行器相撞情况直接判不及格,这里称为开关指标;
2)具有一定变化区间,不存在固定值的指标,如告警时长等,这里称为变化指标;
对于变化指标,需要进行指标的过滤,因为有的指标在每一次训练中都十分稳定,如果将这些指标纳入评估规则的建立过程中,首先对评估结果影响较小,其次增加了运算的成本,因此在建立评估规则时将过滤这些指标[8]。
为了过滤这些指标,本文将使用比较方差的方法进行过滤[1]:
现有某项训练指标对应的训练数据共N条,分别为:
定义一个阈值δ(可根据需要自定义其大小),先计算这N条数据的平均值:
然后计算方差,为了比较方便,将所有指标的方法做归一化处理,即除以A:
如果计算的方差S<δ时,就认为该指标属于较稳定的指标,将不再考虑。
对于开关指标,由于它能直接决定成绩,建立评估规则时,可以根据专家系统将开关指标提取出来单独考虑。
在飞行过程指挥科目中常见的开关指标如表1所示:
表1 飞行过程指挥开关指标Tab.1 Decisive indicator in the process of flight command
开关指标评估规则建立必须在变化指标的前面,因为在变化指标体系评估规则的建立过程中需要使用到开关指标来对某些样本进行筛选。
变化指标评估规则的建立
在飞行过程指挥训练科目中,经过滤后涉及到的变化指标如下表所示:
表2 飞行过程指挥变化指标Tab.2 Uncertainty indicator in the process of flight command
对于此类指标的评估规则可由以往的训练数据(大量的数据)得出[7],规则生成算法需要设置以下前提条件:
设现有N条实际训练数据,包含对应的训练成绩(δ1,…,δN),其中每条训练数据中有变化指标n个,分别为(a1,…,an),有开关指标m个,分别为(b1,…,bm),可将第x条训练数据表示如下:
(22)经农业部批准,“中国绿色食品’97广州宣传展销会”将于1997年12月13日—16日在广州市中国出口产品交易会馆举行。(1997·《人民日报》)
(ax1,…,axn,bx1,…,bxm,δx)
对于变化指标,每一个变化指标ai对应一个区间:
分别表示该变化指标的下限min(ai)和上限min(ai),在第x条训练数据中,用wxi来表示它的第i个指标axi与区间[min(ai),min(ai)]之间的距离,表达式如下:
对于开关指标,如果发生则使用二进制0表示,反之使用1表示。
在N组训练数据样本中,设定某个分值δ,如果分数大于等于δ则视为正样本,反之为反样本。
免疫算法通过求解抗原(目标函数)和抗体(优化解)之间的亲和度,保留亲和度高的抗体,将亲和度低的抗体进行交叉变异等操作产生新抗体,再次循环求解亲和度,直到产生符合的抗体(优化解)为止[5]。由于在管制员训练评估过程中,会存在效率优先或安全优先等不同考虑方式,单一规则无法满足管制员的评价,所以本文将借鉴免疫算法中求亲和度的思想设计评估规则的生成算法,如下:
(1)将反样本集中的样本逐个取出,对开关指标进行编码,只要有一个开关指标的编码为0,那么将这个样本从反样本集中除去(因为这样的样本无论其它指标如何,一定为不合格)。
(3)对选中的正样本中每一个指标,选取一个μ ,μ∈(0,1),使:
可以得到如下规则:
(4)对所有正样本和反样本的每个变化指标计算距离,得到距离集合,如第x条样本的距离集合为:
然后计算该样本与(3)中建立的规则之间的距离:
(5)计算所有样本与(3)建立规则的距离,得到各正样本的距离和各反样本的距离最小值Dmin,如果Dmin=0(即该反样本完全符合选中的规则),那么取一个更小的μ:
跳转到(3)继续运算。否则选取所有距离比Dmin小的正样本,然后将这些样本从原有正样本集中除去,并将这条规则加入到规则集Ru( x)中,规则集中每条规则的格式如下:Ru( ID)={
如果样本集为空,那么停止运算,否者继续(2)。
(6)得到的规则集中可能存在相互包含的规则,即如果某规则中每一个指标取值都包含另一规则每一个指标的取值,那么合并。
为了验证评估规则建立方法的可行性,以飞行过程指挥科目为例进行验证,使用的指标如下表所示:
表3 飞行过程指挥指标列表Tab.3 List of indicators in the process of flight command
选取训练数据样本50条,其中30条记录用于生成规则集,剩下的20条记录作为对照组用于测试算法的准确率。
依据以往管制员训练采用百分制进行评分的方式,本文算法验证也以百分制为例,为了验证算法,选取分值80分为界,大于等于80分的为正样本,小于80分的为反样本,然后进行以下步骤:
(1)在30条记录中,将不满足开关变量的记录剔除,剩下27条记录;
(2)将剩余的27条记录进行划分,其中正样本18条,反样本9条,然后使用本文中的算法,产生规则集Ru(x),规则集中有规则4条,各包含的样本数和反样本距离最小值如下表所示:
表4 规则表Tab.4 the table of rules
用剩下的20条记录来验证产生的规则集,已知20条记录中除去不满足开关变量的记录,还剩余18条记录,其中正样本13条,反样本5条。
计算各记录与各规则之间的距离,如果求出的距离小于等于对应的Dmin则大于等于80分,否则小于80分。
最终得出大于等于80分的记录有12条,这12条记录中正样本有11条,反样本1条;小于80分的记录有6条,其中正样本2条,反样本4条,结果如下图所示:
图1 对照组试验结果
可以得出判定正样本的准确率为:
而判定反样本的准确率为:
使用本算法得出大于等于80分的记录中,包含一条反样本,并且遗漏两条正样本,将这些数据取出分析。
对于评估错误的反样本,发现这条反样本符合规则Ru(2),将这条反样本和规则Ru(2)中包含的正样本交给空管专家评价,得出两条样本得分都应该小于80分的结论。
分析出现这种情况的原因:
因为生成规则集所使用的样本是人为打分所得,这样就难以避免发生主观判断出现误差的问题。
一般打分出现误差的情况发生可能性较小,所以规则集中,如果出现某规则对应的样本数较少,就将这条规则单独讨论,由教员再次进行评估确认。
对于遗漏的正样本,发现它们与规则Ru( 3)之间的距离最相近,同时发现规则Ru( 3)中告警持续时长指标与这两条正样本中告警持续时长相差十分微小,如果将规则Ru( 3)中的告警时长指标取值范围略微放大,正好包含这两条正样本,可以得出Ru( 3)依然排斥所有反样本,同时包含了被遗漏的正样本。
分析出现这种情况的原因:
由于在产生规则中各指标的范围时,使用的μ值过小且ε值过大导致,可以适当放大μ值来增大初始的指标范围,并减小ε值以降低指标范围的收敛速度,尽管这样会使产生规则时迭代次数增多,但得到的规则会更加准确。
本文所使用的算法是对管制员评估自动化建设的初步尝试,由于外部条件的限制,可能还存在数据取值误差、少量数据不够客观等问题,但是,本文所建立的评估规则已经具有较高的评估准确率。
本文提出的管制员模拟训练评估规则的建立算法借鉴了免疫算法中求亲和度的思想,加以改进,使用到本文评估规则的建立过程中,通过算法的实现和验证,已经达到较高的准确率。
管制员模拟训练评估规则的建立是一个较为复杂的工作,人力难以得出数据之间的规律和关系,并且很难进行定量分析,采用本文设计的算法能够在一定程度上反映出各指标数据之间的关系,可以比较客观的对管制员的训练情况进行评价。
[1] 徐肖豪, 樊伟. 三维塔台管制模拟训练系统的设计与开发[J]. 中国民航学院学报, 2001, 03: 4-8.
[2] 李雪飞, 孙永侃, 熊正祥. 舰艇作战模拟训练评估技术需求研究[J]. 指挥控制与仿真, 2012, 04: 107-111.
[3] 熊正祥, 孙永侃, 王立强. 舰艇模拟训练中指挥员的成绩评估研究[J]. 计算机仿真, 2011, 04: 30-33+42.
[4] 战金玉. 模拟机飞行训练自动评估系统设计与实现[D].南京航空航天大学, 2014.
[5] 赵辰吟, 姚文斌. 基于一种改进免疫算法的云计算任务调度策略研究[J]. 软件, 2015, 36(12): 149-153.
[6] 王尚广, 孙其博, 杨放春. Web服务选择中信誉度评估方法研究. 软件学报, 2012, 23(6): 1350-1367.
[7] 葛春燕. 数据挖掘技术在保险公司客户评估中的应用研究[J]. 软件, 2013, 34(1): 116-118.
[8] 张冉, 杨小军, 孙丹辉, 等. 电子对抗指控系统行进间指挥效能评估方法研究[J]. 软件, 2015, 36(5): 77-80.
An Algorithm for Establishing Evaluation Rules in Air-traffic Controller Simulation Training
Tan Lon-gui
(CETC 15 Institute, Beijing 100083, China)
Air-traffic controller takes the important duties in commanding the aircraft flying and guaranteeing the safety of air traffic. Due to the special features of air-traffic controller, simulation training becomes an important approach in training controllers. However, when it evaluates the simulation training results, manual evaluation always plays the major role, which leads to the relatively subjective result and heavy workload. Therefore, it could hardly reflect the training status of controllers accurately. To improve such a status, this paper designs a setup algorithm based on immune algorithm, which enables the system to automatically evaluate the training results of controller in accordance with the established evaluation standards and thus generate objective and fair evaluation results.
Simulation training; Genetic algorithm; Training results; Automatic evaluation
TP18
A
10.3969/j.issn.1003-6970.2016.10.024
谭龙辉(1991年-),男,硕士研究生,研究方向:航空应用技术研究
本文著录格式:谭龙辉. 管制员模拟训练评估规则的建立算法[J]. 软件,2016,37(10):109-112