作战数据质量模型构建与质量评估

2017-09-29 05:35刘立军
火炮发射与控制学报 2017年3期
关键词:约简粗糙集阈值

刘立军

(武警工程大学 信息工程系,陕西 西安 710086)

作战数据质量模型构建与质量评估

刘立军

(武警工程大学 信息工程系,陕西 西安710086)

采用粗糙集与BP神经网络理论相结合的方法对作战数据质量进行了评估。在评估模型构建上,分析了影响作战数据质量的多种因素,确定了评估指标体系,组建了作战数据质量评估元及评估网络,构建了六元组评估模型。在作战数据质量评估上,利用粗糙集理论对评估指标信息进行了约简,利用BP神经网络理论对作战数据质量进行了评估。通过数据分析,结果显示该方法评估误差小,方法简单、实用。

粗糙集;BP神经网络;作战数据质量

作战数据质量评估是作战数据工程建设与实践应用的重要组成部分。作战数据质量的评估方法与评估指标较多,笔者在作战数据质量定性分析的基础上,选择合适的评估指标,构建合理的评估模型,采用粗糙集与神经网络理论相结合的方法,对作战数据质量进行了评估。

1 基本理论

粗糙集理论是波兰华沙大学Z.Pawlak教授于1952年提出的一种处理模糊性和不确定性的数学理论。该理论以不可分辨关系为基础,将一个数据集合用上近似集与下近似集来描述。通过该理论,能够有效对不精确、不一致和不完整信息进行处理,发现其内部存在的知识及规律[1]。

BP神经网络是1986年由以Rumelhart和McCelland为首的科学家小组提出的,是一种按误差逆传播算法训练的多层前馈网络。BP神经网络由信息的正向传播和误差的反向传播两个过程组成。输入层通过与外界环境接触而获取信息,将信息传递给隐含层。经隐含层处理变换后传递给输出层,完成一次正向学习;当输出与期望值不符时,进入误差的反向传播阶段。误差通过输出层对各层的权值进行修正,直到误差小于所设定范围为止[2]。

将粗糙集与BP神经网络理论相结合对作战数据质量进行综合评估,流程如下[3]:

1)提出评估问题,构建评估模型。

2)量化评估指标,生成评估信息表。

3)约简信息表,形成输入向量。

4)确定输入层、隐含层与输出层各层神经元个数,形成评估网络。

5)训练评估网络,确定各层权值。

6)输入新样本数据,进行评估。

2 构建评估模型

2.1确定评估指标

由于作战数据来源于不同系统间作战数据的有效集成,各子系统在数据存储、传输与集成过程中,必须符合某种评估指标,形成统一标准,再经过数据清洗剔除无关数据或坏数据,确保作战数据的有效性与可靠性。静态作战数据质量主要是作战数据质量本身所固有的、本征指标,即上述所提到的评估标准;而动态作战数据质量主要是从作战数据的整个生命周期来展开研究的,是作战数据在实际应用中数据质量的价值体现,包括作战数据的采集、传输、存储、处理、集成、使用和开发质量,每一个环节的质量高低都直接关系着整个作战数据质量的好坏,都会直接或间接的影响着整个作战的结果。作战数据质量评估指标体系如图1所示。

2.2组建评估网络

2.2.1作战数据质量评估元

作战数据质量评估指标体系可划分为多种标准属性,根据图1,着重从静态作战数据质量属性和动态作战数据质量属性出发,组建评估网络。分别用X=(x1,x2,…,xn)表示静态作战数据质量评估属性,Y=(y1,y2,…,yn)表示动态作战数据质量评估属性,Ω=(ω1,ω2,…,ωn)、M=(m1,m2,…,mn)分别表示两者评估属性的属性权重,静态与动态权重比例分别通过α,β反映,μ表示相关系数,δ表示外部影响因子。对于单一作战数据质量评估元而言,X、Y分别表示评估元的输入向量,Z表示评估元的输出向量,单一作战数据质量评估元如图2所示,评估元数学表达式为

z=f[μ(αΩ·X+βM·Y)+δ]=

(1)

作战数据质量的每一个属性对X、Y影响均不同,体现在Ω=(ω1,ω2,…,ωn)与M=(m1,m2,…,mn)的属性权重上。如在信息化作战中,对敌整体态势感知的侦察情报预警系统而言,作战数据的预警探测、侦察监视等各种传感器,集成各类战场环境和保障信息,既强调了静态作战数据的完整性、准确性、可信性等属性,也强调了作战数据采集、传输和处理等属性;而在空中进攻作战中,预警机对敌机进行侦察与预警探测,实时与战斗机保持数据交互,此时强调静态作战数据属性的准确性、时效性和可理解性的同时,也强调了动态作战数据的采集、传输、处理和使用等属性。

2.2.2作战数据质量评估网络

作战数据质量评估仅仅靠单一作战数据质量评估元,必然会产生很大误差,因此需要多个作战数据质量评估元来相互交错,构成多层交互式作战数据质量评估网络,才能够使评估精度大大提高。一般用3层评估网络即可满足任意精度的逼近,而非评估层级越多越好[4]。

图3为3层作战数据质量评估网络,它由输入层、中间层和输出层3层构成。对于任意输入X=(x1,x2,…,xn),Y=(y1,y2,…,yn),都可得出相应的输出Z=(z1,z2,…,zn),其中,输出单一分量zi仍表示为

zi=f[μ(αΩ·X+βM·Y)+δ]

2.3构建评估模型

由于动态作战数据质量评估指标的影响因素较大,不易把控,故笔者着重从作战数据质量静态评估指标出发构建评估模型,构建了六元组作战数据质量评估模型[5]:

M={S,Z0,G,Y0,J,I}

(2)

式中:S表示需要评估的数据集;Z0表示数据集S上需要进行评估的指标集;G表示与指标集Z0对应的规则集;Y0表示与指标集Z0对应的判断阈值,依据阈值能够判断指标值是否达到标准;J表示规则集G对应的指标得分结果;I表示指标得分与阈值Y0进行比较后得到的信息集合。

2.4模型参数说明

对作战数据质量进行模型构建并对其进行评估,步骤为:

1)明确对象:即明确需要评估的作战数据集。

2)筛选指标:根据作战数据质量评估需求,筛选出具有代表性的评估指标。文中根据评估需求,确定了评估指标有完整性、准确性、一致性、唯一性、时效性、可理解性等。

手中握着一颗玻璃球让人感觉很舒服,透过玻璃球看去,物体是上下颠倒的,里面有一个微缩天地。我们拍照时用的是标准尺寸的Lensball,我们发现这个非常好用,也有其他更便宜的替代品。

3)制定规则:在评估对象数据集中,依据评估指标需求与用户需求,制定规则。

4)确定阈值:对数据集S中的每一评估指标确定阈值[5]。

5)计算得分:对数据集依据规则集G进行检查,并计算得分。

6)生成信息:指标得分J与阈值Y0进行比较,将评估指标划分为合格与不合格两种,分别对应信息值1与0,形成信息集合I。

作战数据质量评估模型如表1所示。

表1 作战数据质量评估模型[5]

3 评估作战数据质量

3.1评估信息表的约简

在部队实际作战过程中将生成大量的作战数据,影响每一作战数据质量的指标会各有偏重,因而指标得分将会不同,经专家对每一组数据集各指标进行综合,得到表2所示的指标得分。将该指标得分与对应指标阈值进行比较,得出作战数据质量评估信息表,如表3所示。

表2 8组数据集的数据质量评估指标得分

依据粗糙集理论对表3中的评估指标进行约简[5-6]。从表3中数据可知,指标得分Z1与Z4相同,Z2与Z3相同,Z6与Z9相同,因此只需保留一个信息值即可,即Z1、Z2、Z6保留,Z3、Z4、Z9删除,得到表4。

表3 8组数据集的作战数据质量评估信息表

表4 8组数据集的作战数据质量评估约简信息表

由表4可知,S={S1,S2,S3,S4,S5,S6,S7,S8},Z0={Z1,Z2,Z5,Z6,Z7,Z8},则等价关系Z1,Z2,Z5,Z6,Z7,Z8有下列等价类:

S/Z2={{S1,S3,S6,S8}, {S2,S4,S5,S7}}

S/Z5={{S1,S2,S3,S6,S8}, {S4,S5,S7}}

S/Z6={{S1,S3,S4,S6,S7,S8}, {S2,S5}}

S/Z7={{S1,S2,S7}, {S3,S4,S5,S6,S8}}

S/Z8={{S1,S5}, {S2,S3,S4,S6,S7,S8}}

根据粗糙集理论中的不可分辨关系计算,则关系ind(Z0)有下列等价类:

S/ind(Z0)={{S1}, {S2}, {S3,S6}, {S4}, {S5}, {S7}, {S8}}

S/ind(Z0-{Z1})={{S1}, {S2},{S3,S6,S8}, {S4}, {S5}, {S7}}≠S/ind(Z0)

S/ind(Z0-{Z2})={{S1}, {S2}, {S3,S6}, {S4}, {S5}, {S7}, {S8}}=S/ind(Z0)

S/ind(Z0-{Z5})={{S1}, {S2}, {S3,S6}, {S4}, {S5}, {S7}, {S8}}=S/ind(Z0)

S/ind(Z0-{Z6})={{S1}, {S2}, {S3,S6}, {S4,S5}, {S7}, {S8}}≠S/ind(Z0)

S/ind(Z0-{Z7})={{S1}, {S2}, {S3,S6}, {S4,S7}, {S5}, {S8}}≠S/ind(Z0)

S/ind(Z0-{Z8})={{S1}, {S2}, {S3,S6}, {S4}, {S5}, {S7}, {S8}} =S/ind(Z0)

由结果易知,指标Z2,Z5,Z8是可简化掉的,于是得到指标集Z0的约简为Z0={Z1,Z6,Z7},这样将原来的9个评价指标约简为当前的3个核心指标。

3.2BP神经网络的评估预测

采用如图4所示的3层前向神经网络。经过粗糙集约简,神经网络输入神经元数目N为3,输出神经元数目M为1。隐含层神经元的数目P对整个评估模型影响较大,必须合理选择。

参阅相关文献,隐含层神经网络数目P可由经验公式计算得到[4],P应取5。按照BP网络的一般设计原则,隐含层神经元的传递函数为S型正切函数,输出层神经元的传递函数为S型对数函数。简化后的指标集Z1,Z6,Z7分别作为BP网络的3个输入向量,作战数据综合质量F作为BP网络的输出向量,用表2的数据训练该网络。在正向传播过程中,数据样本集从BP网络的输入端Z1,Z6,Z7输入,经过5个神经单元的隐含层从输出端F输出。当实际输出与预期输出不相符时,则进行反向传播。输出误差从输出层经隐含层,向输入层反向传输,不断调整各层权值,周而复始,最终使误差达到所设定误差范围内为止,最终可得到训练好的各层权值与阈值。再通过调用该权值与阈值进行正向传播,就可以得出数据综合质量F,具体如表5所示。

表5 8组数据集作战数据质量BP神经网络评估表

表5(续)

由表5可知,BP神经网络估算值与实际值比较接近,因此,可利用该网络模型对作战数据质量进行评估预测。

4 结束语

采用粗糙集与BP神经网络理论相结合的方法对作战数据质量进行了评估。在评估模型构建上,依次确定评估指标,组建评估网络,构建评估模型;在作战数据质量评估上,利用粗糙集理论进行了信息约简,利用BP神经网络理论进行了质量评估。该方法增强了评估的科学性与客观性,评估误差性较小,评估模型与评估方法简单、实用。

References)

[1] 徐廷学,杜爱国,陈红. 基于粗糙集和BP神经网络的飞航导弹备件消耗规律预测[J]. 海军航空工程学院学报,2012,27(5):570-574. XU Tingxue, DU Aiguo, CHEN Hong. Consumption law forecast of missile spare parts based on rough set theory and BPNN[J]. Journal of Naval Aeronautical & Astronautical University,2012,27(5):570-574. (in Chinese)

[2] 周品. Matlab神经网络设计与应用[M]. 北京:清华大学出版社,2013. ZHOU Pin. Design and application of Matlab neural network[M]. Beijing: Tsinghua University Press,2013. (in Chinese)

[3] 黄晶晶,熊才全. 粗糙集-神经网络在作战效能评估中的应用[J]. 计算机与数字工程,2011,39(5):62-66. HUANG Jingjing, XIONG Caiquan. Combat effectiveness evaluation based on rough set and neural networks[J]. Computer & Digital Engineering,2011,39(5):62-66. (in Chinese)

[4] HAYKIN S.神经网络与机器学习[M].申富饶,徐烨,郑俊,等,译.北京:机械工业出版社,2011. HAYKIN S. Neural network and machine learning[M].SHEN Furao,XU Ye,ZHENG Jun,et al,translated.Beijing:China Machine Press,2011.(in Chinese)

[5] 张西川,杨丽娜,袁大天. 机载C3I系统试飞数据质量评估方法[J].火力与指挥控制,2009,34(6):7-10. ZHANG Xichuan, YANG Lina, YUAN Datian.Research on data quality evaluation methodology on the flight-testing of the plane-carried C3I system[J]. Fire Control & Command Control,2009,34(6):7-10. (in Chinese)

[6] 高尚,房靖. 基于粗糙集和支持向量机的效能评定[J]. 系统工程与电子技术,2008,30(7):1291-1294. GAO Shang, FANG Jing. Assessing the effectiveness of weapon systems based on rough set theroy and support vector machine[J]. Systems Engineering and Electronics,2008,30(7):1291-1294. (in Chinese)

OperationalDataQualityModelandQualityEvaluation

LIU Lijun

(Department of Information Gngineering,Engineering University of CAPF, Xi’an710086,Shaanxi,China)

Operational data quality was evaluated using the method of rough sets and BP neural network theory.In the construction of the evaluation model, it analyzed the factors affecting the Operational data quality, determined the evaluation index system, set up operational data quality evaluation element and evaluating network, established the six-element evaluation model. In the assessment of operational data quality, using rough set theory come to realize information reduction and using BP Neural Network theory come to realize quality assessment. This method could enhance the scientificity and objectivity of evaluation. The results showed that the evaluation method of error was small, simple and practical.

rough set;BP neural network;operational data quality

TP391

: A

:1673-6524(2017)03-0037-05

10.19323/j.issn.1673-6524.2017.03.008

2016-12-28

刘立军(1982—),男,博士研究生,主要从事信息化建设研究。E-mail:cainan2001_paper@163.com

猜你喜欢
约简粗糙集阈值
粗糙集与包络分析下舰船运行数据聚类算法
土石坝坝体失稳破坏降水阈值的确定方法
基于0-1规划的最小属性约简算法
采用红细胞沉降率和C-反应蛋白作为假体周围感染的阈值
面向特定类的三支概率属性约简算法
多粒度犹豫模糊粗糙集*
直觉模糊序决策系统的部分一致约简*
近似边界精度信息熵的属性约简
一种基于粗糙集理论的社交网络潜在路径研究
辽宁强对流天气物理量阈值探索统计分析