程 栋,陈 博,田 辉
(中国电子科学研究院,北京 100041)
随着部队的数字化和战场的信息化两大特点的日益凸显,越来越多的高科技手段被应用在了军事的各个领域。信息的获取和传输随着新作战模式的应运而生变得更加重要,满足特定格式的信息传输报文给各系统间信息交互带来了极大的便利,能够利于计算机自动快速识别,并且给出相应反馈,使其繁杂的信息可以在特定的系统之间进行共享。但是如果想要实现以上的优点,必须对报文进行规定和约束,如组成报文的字段格式、字段内容、字段顺序等都需要进行统一,这样才能够使得收发双方在报文的句法和语义上达成一致性理解,完成报文解析,从而进一步实现信息的传输。如各种国标、国军标,集成标等标准,本质上就是对报文的一种规定和约束。
由于信息系统自身的多样性和复杂性,以及标准和报文的数量巨大,因此很多时候,报文交换格式可能会存在某些与现有标准不一致的地方,这给报文解译、信息共享和交换等带来了困难。而且随着信息报文的日益增长,以及标准数量的增加和逐步细化,有效的监管和促进标准执行的工作量将非常巨大。报文的标准符合性评判作为一种有效地监督手段,可以促进报文规范性,从而提高互联互通的效率和准确率。
目前大部分报文类标准的研究主要集中在对其报文结构和规则的分析方面,如论文[1][2][3]给出了固定格式消息以及VMF(可变格式消息)等报文信息的优缺点以及对比分析;论文[4][5][6]给出了报文编码格式的优缺点对比。但是就符合性评判本身而言,目前还缺少一种通用性较强,并得到广泛认可的固定方法。由于不同标准对应的信息报文格式和检验方式各不相同,结构复杂且种类繁多,因此导致信息报文格式检验方法及系统在灵活性和通用性方面存在较大的困难,现有的实现方案均存在一定的局限性。此外,目前的评判方法通常以定性评判为主,判定出报文哪些部分不符合标准或者直接给出报文整体是否符合标准的结论。如果仅仅给出是否符合或者哪些地方符合的定性结论,会带来的以下两个问题:(1)评判结论的给定较为主观,为什么判定为符合和不符合,缺乏量化的标准和必要的说服力;(2)报文类和标准类型较为多样,给评判方法的通用性和普适性带来了很大的困难。不同标准下的报文或者同一标准下的不同报文,在不同应用领域可能会出现不同的表现形式和结果,如果仅针对错误数量就给出一刀切的结论,判定报文是否和标准符合,这种结论的给出方法较为武断;(3)针对同一标准的多个不同内容报文,难以量化这些报文对标准的符合程度,即无法具体给出这些报文中的哪些报文与标准的符合程度更高。同样,在同一报文中,哪些检测点符合标准而哪些点不符合标准,以及检测点之间的相互关系和其对最终传输结果的影响程度,均无法通过简单的定性评判给出满意的结论。
因此,本文提出了一种信息传输报文类标准符合性量化评判方法。首先,分别从检测科目和错误类型两方面对报文中出现的问题进行分析,并给出了权重和加成因子等概念的定义;再对应给出单类错误的影响程度和检验阈值。将检测项及相应权值代入标准符合性公式得到最终的量化评判结果。本文的方法可以根据具体的公式计算得到数值,并根据计算出的数值再给出符合程度的判定,跟定性的评判方法相比更加科学;而且针对不同的科目,不同类型的报文和标准,可以对权值和阈值进行调整,并不将错误数量作为评判唯一标准,因此可以适用于多种类型的报文和标准,灵活性和通用性更强。最后,实验结果表明本文提出的方法可对信息传输类报文的标准符合性进行科学有效的量化评判。
标准符合性测试,顾名思义就是以标准为准绳检验被测报文是否符合标准中规定的各项要求。从近年来的进展要求来看,标准符合性测试工作确实在报文规范和行业标准化方面起到了重要的作用。作为测试工作的重要环节,报文的标准符合性评判是跟据报文的各个字段(各个检测科目、具体检测项)的检测结果与相关标准中的对应约束点进行对比,以判断是否符合标准的规定和要求,并根据检测结果得出最后符合性评判结果。实际上就是从标准出发,对报文进行严格的、定性或定量的测试后,根据测试结果确定报文是否符合该标准,或在多大的程度上符合标准[7]。报文的标准符合性是实现互联互通的关键要素,关系到信息报文的可扩展性和效益的发挥,而标准符合性评判是监督和提高报文标准符合性的有力工具[8]。
现有标准评判方法多涉及人为主观判断因素,如文献[7]中提到的合格判定法,是将所有的检测点与标准要求相比较,当所有指标符合检测要求时,评价该报文为符合,否则为不符合。这是目前报文检测领域常用的标准符合性评判方法。这种方法的优点是把关严格,缺点是比较粗糙,不能准确反映报文标准符合程度。而且现有的大量的研究方法多是针对于特定的标准,这就造成了标准符合性检测和评判方法的功能单一化、狭窄化。而解决这一问题的方法就是透过具体的标准以及标准的具体内容,抽象出共性的公式,只需根据实际应用中具体的报文和具体标准调整公式中的参数和权重等。
标准符合性量化评判方法是指在报文实际检测结果的基础上采用一定的数学公式或函数,根据具体报文和标准相应的确定出参数,对标准符合程度给出一个确定的、定量的评价结果。本文从检测科目和错误类型两方面对标准符合性评判计算公式进行定义。下面对本文出现的一些专有名词和术语进行简单的定义:
检测科目:针对每个标准,每个标准下有非常多的约束项,为了全面检测,针对每一个约束项开展检测。针对每一个约束项开展的检测工作称为检测科目。
检测点:为了能够对检测科目开展更深入的检测,需要对检测科目进行流程化,模块化的细节拆解,拆解出来的这些模块或者细节项就称为一个检测点。
在同一标准下,共开展N个检测科目的符合性检验和评判。这N个科目相互独立,互不关联。根据每个科目在标准中的重要性不同,赋予每个科目n,n=1,…,N具有不同的权重,记为wn(n=1,…,N),其中,
(1)
单个科目的符合性为pn(n=1,…,N),其具体定义和公式在节2.2中给出。
在同一报文的检验过程中,对不同的检测点开展符合性检测,会存在多种类型错误同时出现的情况。但是这些错误对最终报文解译和理解的影响程度并不相同,即不同错误的重要程度和地位是不等同的。
就单个错误而言,其对符合性检测的结果的影响主要有以下两个因素决定:第一,该种错误出现的次数;第二,该种错误对传输的影响程度,即错误的严重程度。这两个因素之间相互独立,没有正相关关系,即并不是错误出现次数越多,对最终结果影响就越大。某些错误可能出现次数较多,但是依然不会构成对最终信息的传输和解译的严重影响。而另外一类错误,可能仅出现一次就无法完成信息最终的互联互通。因此需要按照错误的严重程度进行错误等级划分,并且根据严重程度以及对最终解译和信息交换的影响程度,给予不同的错误等级不同的影响权重。
针对单个标准中的所有科目,以及单个科目中所有检测点的检测结果进行分析,共存在M类具体错误。然后根据这M类错误对最终报文解译以及对整个系统造成影响的大小不同,将这M种错误共分成1到K级分成K个级别,其中K≤M。1级错误为极轻微错误,举例来说,如某些极端情况下全部检测点均存在1级错误,才将报文判定不符。随着数字的变大,错误严重程度也逐渐增大,第K级错误定义为致命错误,如某些极端情况下一旦有一个检测点存在K级错误,则报文判定不符。每一级错误对最终结果的影响程度由具体报文和具体实际应用来确定。在这里,对每种错误等级赋予一个加成因子记为Bj,j=1,…,K。表1给出了错误等级和加成因子的具体对应关系。
表1 错误等级及其对应的加成因子
基于上述错误等级和加成因子的定义,下面进一步给出具体的计算公式。针对被测报文,设定报文中的检测点总数为S总,其中出现第x种错误的检测点数为Sx,x=1,…,K(因为不同类型错误的相互独立性,此时假定在整个报文中只出现第x种错误这一种错误,其余检测点均为正确的)。Bx为第x种错误的加成因子,则根据上述描述,我们可以给出和阈值相关的公式:
(2)
设定检测点总数为S总,如上述极端情况,当全部检测点均出现1类错误,判定报文为不符合,即S总=S1,且T的取值为0。由此可得到下式:
(3)
B1=0
(4)
B1=0说明1级错误的严重程度较小。
(5)
(6)
由式(4)和式(6)可以看出,B2>B1。而在设定情况下,错误2比错误1要更为严重,这和加成因子的大小关系是相符合的。可以看到,加成因子Bj能够准确的反映该类错误对是否能够通过检验的影响程度。
定义了加成因子之后,就可以进一步对单个科目的符合性进行定义。在每一个科目的检测中,符合性主要由其中检测点的错误数量和错误类型来共同决定,Bx为第x种错误的加成因子,定义Nx为第x种错误的出现次数,则单个科目n,n=1,…,N的符合性pn可定义如下:
(7)
最终,一个报文的整体标准符合性是由它包含的所有N个科目的符合性共同决定,所以单个标准所有科目检测结果最终的标准符合性为:
(8)
其中pn是单个科目的符合性,wn是单个科目的权重,N是科目总数。
针对信息传输类报文的检测,首先要进行科目的设定。在本文实验中,标准下的每个报文都是互相独立的,不同的报文检测过程就是不同的科目,同一个科目中的每个字段就是上述的检测点。为了证明本文方法的有效性和通用性,这里选取实际信息传输类报文作为待测报文,来进行相应的量化评判分析,并给出最后的结论。详细的数据描述见表2。
表2 数据描述
表3中给出了其中1个科目报文检测结果中部分错误的详细描述,因篇幅原因,这里仅给出部分错误进行示例。
表3 报文检测结果
对检测的3个报文所出现的所有错误类型进行检测和统计,并按照严重程度对错误进行等级划分。具体错误类型和对应的错误等级如表4所示。表4中第一行表示具体的错误类型,第二行表示每种错误类型所归属的错误等级数,如字段内容类型不符属于3级错误。
表4 错误类型及错误字段数
表5 错误字段数与总字段数比值
图1 错误字段数与总字段数比值
由表5和图1可以看出,第1种错误的严重程度最低,当全部字段均出现第1种错误时,报文判定为不符合。而第6种错误最为严重,只要一半字段出现第6种错误时,报文即判定为不符合。
下面根据公式和具体数值,可对符合性进行判定。由公式(2)可计算得出6种错误的加成因子,具体结果在表6中给出。
表6 错误等级及其对应的加成因子
由加成因子和公式(7)可得每个检测科目的符合性:
由公式(8)可得所有科目检测结果最终的标准符合性为:
由上式可得,最终的标准符合性量化结果为0.9159。本文提出的方法可以根据公式由检测科目、错误类型等数值计算得出具体的量化符合性结果。
为了提高信息准符合性评判方法的科学性和有效性,并且能够适用于多种类型的信息报文和标准,提出了一种信息传输报文类标准的符合性量化评判方法。在该方法中,从检测科目和错误类型两个方面对科目权值、错误类型加成因子和符合性阈值等概念和公式进行定义,并相应给出检测项符合性计算公式,得到最终的量化评判结果。基于多组不同格式的实际信息传输类报文的评判结果表明,本文所提出的标准符合性量化评判方法具有有效性、科学性、灵活性和普适性。
:
[1] 韩媛萍. 可变报文格式VMF及应用研究[J]. 现代导航,2012, 8(4): 295-297.
[2] 徐大超. 一种VMF报文编解码工具设计[J]. 信息通信,2016, 2: 48-49.
[3] 毕学军,徐大超,肖庆,刘海宁,石长爱,高飞. 可变消息格式式报文编解码工具设计[J]. 兵器装备工程学报,2016, 37(7): 94-101.
[4] 许文馨,左昕,安琪,信春华. 标准符合性测试的国内外比较及对策分析[J]. 现代商贸工业,2013, 1: 155-157.
[5] 何永君. 基于动态二进制分析平台的协议逆向解析技术研究[D]. 河南:解放军信息工程大学, 2010.4.
[6] 范国梅. 标准符合性测试平台的研究与实现[D]. 北京:北方工业大学, 2012.5.
[7] 吴洁明,范国梅. 基于XML的标准符合性测试方案[J]. 计算机应用,2012, 32(2): 551-553.
[8] 齐新战,冯林平,孙姝. 建模仿真标准符合性检测评价指标与方法[J]. 信息系统工程,2013.8.20.