张宇 贺长宇
摘要:分析了网络靶场内涵及对网络靶场进行评价面临的问题和解决思路,按照自底向上、分层集成的原则构建了一套完整的、客观的、科学合理的网络靶场评价指标体系,设计了一种多级BP神经网络结构,并采用遗传算法优化神经网络权值阈值,避免了由一个大型神经网络计算带来的计算维度高、易陷入局部极小值、精细度差等问题。实验结果验证该方法的可行性,对未来网络靶场的建设具有重要的指导意义。
关键词:网络靶场;指标体系;神经网络;多级;综合评价
中图分类号:TP391.4 文献标识码:A 文章编号:1009-3044(2018)19-0043-03
网络靶场[1]是为了应对日益严峻的网络空间安全问题,应对军事领域革命性的变化,适应网络化、信息化武器装备发展要求而设计和建设的网络安全试验验证和测试评估环境。网络靶场可以为各种网络技术、攻防手段和装备系统提供网络安全方面的定量和定性评估,支撑开展网络空间攻防对抗演练。建设网络靶场已成为提升我国网络空间攻防能力的重要战略举措,是将我国建设强大信息系统国度的安全保障。网络靶场是一个集各种高新技术于一身的大型、复杂、异构、动态的特殊信息系统,如何构建一个覆盖全面、可度量的网络靶场评价指标体系,如何客观地、有效地对网络靶场进行评价,是在建设网络靶场过程中遇到的一个重要问题。
网络靶场的评价指标涉及诸多方面,为了能对网络靶场进行客观、全面、有效地评价,必须要设计一套相对完备的、系统化的指标体系,采用科学合理的计算方法对网络靶场进行评价。当前,国内外设计并建设了多个网络靶场,由于建设目标不同,致使这些靶场规模不一,功能性能迥异,发挥的作用相差极大,缺乏对这些网络靶场整体情况进行全面、客观评价的指标体系和评价技术,难以对网络靶场的真实情况进行综合评价,难以为用户的选择和比较提供参考依据。通过对该领域的指标体系构建和评价技术研究,有助于提升我们对网络靶场的全面、深层次认识,从而指导靶场的设计和建设。
目前,网络靶场的研究主要集中在如何建设,在网络靶场的评价指标体系构建方面,由于认识不够深入,普遍缺失对指标体系的细致研究。在评价方法方面,对复杂信息系统的评价方法主要有主成分分析法、层次分析法、综合评分分析法、德尔菲法、人工智能分析法等,这些方法在不同程度上均有一定的缺陷,如BP神经网络存在BP算法在学习过程中收敛速度缓慢、训练过程中容易陷入局部极小、具有不稳定性等缺陷[2]。
本文针对当前亟须测评网络靶场的建设水平、指导靶场建设等迫切需求,从网络靶场的定位出发,按照自底向上、分层集成的原则,深入探索靶场的内涵和作用,构建一个网络靶场评价指标体系,并结合网络靶场核心能力及自身特点,设计了一种具有多级BP神经网络的网络靶场评价的方法,采用遗传算法实现对神经网络初始参数的优化。本方法充分有效地利用了各类指标信息,可避免采用一个大型BP神经网络所带来的特征数量多、計算维度高、易陷入局部极小值、精细度差等缺陷,从而可全面、客观、有效地评价网络靶场的综合情况,指导网络靶场的设计与建设。
1 关键技术
1.1 网络靶场评价指标体系设计
网络靶场指标体系是对网络靶场评价的前提和基础。由于网络靶场是一种创新的基础设施,其内部具有高度复杂性、非线性、不确定性等特点,因此,对网络靶场的优劣需要多角度、多层次考虑[3]。随着网络安全技术的不断发展,评价指标也应该具有可扩展性和适应性。
网络靶场指标体系的构建主要是从网络靶场的定位出发,按照自底向上、分层集成的原则,深入探索靶场的内涵和作用,梳理靶场应具备的核心能力,分析得出细粒度、多层次的网络靶场评价指标体系,具体包括40个二级指标、10个一级指标。
网络靶场评价指标体系如图1所示,采用指标比选、耦合分析等方法,构建了网络靶场评价三层指标体系。其中,底层是网络靶场的二级指标,二级指标由网络靶场的基本功能和性能指标组成,包括复现种类、复现规模、数据分析速度、数据采集种类、用户管理能力、攻防过程回放等共40个,这些指标充分描述了网络靶场的各个方面的;二级指标向上是一级指标,由相关的二级指标综合计算得出,包括基础能力、复现能力、数据采集分析能力、资源调度能力、攻防与测试能力、扩展能力、安全保密能力、经济运行能力、评估能力10个方面,这10个方面的指标分别从不同刻面进行描述和抽象,目的是为了更好地反映网络靶场这样一个复杂的信息基础设施;最上层是网络靶场的综合评价,由一级指标按照相应算法计算。
1.2 神经网络评价模型
1.2.1 BP神经网络
BP神经网络也称误差反向传播神经网络,是由非线性变换单元组成的前馈型网络[4]。其采用基于梯度的最速下降法,以误差平方为目标函数进行全局搜索,因而具有较强的非线性映射能力、高度自学习自适应能力和较强非泛化能力。由于其结构简单、可塑性强,得到了非常广泛的应用,是目前发展最为成熟的网络模型。本文采用的BP神经网络结构是具有一个隐含层的多输入单输出的三层BP神经网络基本结构。
1.2.2 多级BP神经网络结构设计
采用多级BP神经网络结构来评价网络靶场的综合能力主要有三方面原因:一是采用单一BP神经网络结构,则BP神经网络的输入特征数量大,特征空间将是一个高维空间,需要大量的训练样本进行训练,增加训练难度;二是BP神经网络特征空间维数高将造成训练样本构造困难,专家很难综合考虑大量特征(即性能指标)来给出一个系统评价值,从而造成训练样本质量难以保证;三是采用单一BP神经网络结构将使网络靶场评价系统完全变成一个黑盒,无法得出各级能力的具体情况,无法对网络靶场进行精细分析。
经上分析,本文构建了多个二级三层BP神经网络的计算结构,如图2所示。其中,每个神经网络具有输入层、隐含层和输出层,第一级由10个独立的BP神经网络组成,这样就可以大大加快网络的学习速度;第二级采用一个10输入1输出的BP神经网络结构。一级神经网络的输出作为二级神经网络的输入,最终实现对网络靶场的综合评价。
第一级BP神经网络主要实现对每个一级指标的初步评价计算,依据指标体系中二级指标和一级指标的对应关系,建立起两者的非线性关系,并且在这一级神经网络中,将二级指标的异常或无效的输入样本进行初步判断,在进行神经网络训练初期,可对异常或无效样本根据剔除或降低该异常或无效样本对后面的影响,为第二级BP神经网络提供可靠数据。
第二级BP神经网络是以第一级BP神经网络输出的有效数值作为网络输入,学习算法与第一级相同,神经网络的输出为目标网络靶场的综合评价等级。
为进一步提高模型的准确度,需要对神经网络模型的参数进行优化:神经网络隐层神经元数采用公式[s=m+n+a]确定(其中,S表示隐含层数目,m表示输入层神经元数,n表示输出层神经元数,a表示范围在1-10之间的常数);激励函数选取Sigmoid函数,函数参数取0.9;学习速率[η]采用一种动态调整的方法,初步设为0.1,随着学习过程逐步减少;学习精度[e]取0.025。为了使网络快速收敛到全局最小,本文在常规BP算法权值修公式中加入动量项[αΔωji(n-1)],即其中[α]是根据理论输出与实际输出的均方差[E]的不同而确定:[α=0.8(E≥1)];[α=0.4(E>0.5)];[α=0.1(E≤0.5)]。鉴于遗传算法具有宏观寻优等特点,本文利用遗传算法来优化神经网络的连接权值和阈值。
1.2.3 算法具体实现
在确定了多级BP神经网络结构后,首先通过遗传算法对其进行优化,使连接权值接近全局最优,然后通过BP改进算法进行学习训练,获得网络的最佳权值等参数,并应用于网络靶场的评价。算法流程如图3所示。
算法流程主要分为两个部分:
1) 执行遗传算法优化权值阈值过程
①随机初始化一组神经网络的连接权值阈值,并将其以实数的形式进行编码。
②輸入训练样本,对神经网络进行训练得到期望输出与实际输出之间的误差平方和倒数作为适应度函数,并计算适应度。并通过适应度的大小来评价权值的优劣,然后对适应度大的权值进行遗传运算,对当前群体进行进化,产生一下代群体。
③不断的重复第②步,通过反复的训练和遗传操作使网络的权值阈值不断的优化,直至最终达到满意的结果为止。
2) 执行BP神经网络的训练过程
①输入训练样本,我们将其对应的归一化指标数据作为第一级BP神经网络模型的输入,分别对应于人工神经网络的输入节点,而该输入样本对应的专家评价结果作为系统的期望输出。
②正向传播,记录此次正向传播的误差[E(0)]。
③反向传播,调整BP神经网络中各层(输入层、隐含层、输出层)之间的连接权值,对误差对权重的梯度小于预设梯度最小值[ε],即[?E?wi<ε],则跳转到步骤⑤。如果梯度大于预设梯度最小值[ε],[?E?wi>ε],则转到步骤④。
④调整连接权值。采用最速梯度下降法,反向调整连接权值及阈值,正向传播计算误差[E(1)],比较[E(0)]与[E(1)],若网络的误差减小,增大学习率;若网络的误差增大,则降低学习率,重现反向计算调整连接值,正向传播计算[E(1)],直到误差不再减少。
⑤用新连接权值继续正向传播,更新误差值[E(1)]。若误差小于预置精度[e],则完成学习并停止传播,进入步骤⑥。若误差大于预置精度[e],令[i=i+1],当[i ⑥完成BP神经网络学习,记录最终各层间连接权值阈值。 第一级BP神经网络按照上述步骤训练结束后,将其连接权值阈值保存,再以一级指标参数为输入,进入第二级BP神经网络模型,按照同样的方式进行学习,训练结束后保存第二级神经网络各层间连接权值阈值。训练好的多级神经网络模型可用于对待评价的网络靶场进行实时评价。 2 结果分析 为减少专家提供训练样本的主观性,保证训练质量,根据所设计的指标体系,采用多位专家同时提供学习样本的方法,形成一个较为完整的知识库,以此作为BP神经网络模型的学习样本,并按照本文提出的神经网络结构和算法进行学习。选用知识库中的1000个样本,1-980个样本作为学习样本, 980-1000样本为测试数据。测试结果如图4所示。 结果表明,采用本文提出的多级BP神经网络对网络靶场评价与测试数据具有较高的拟合度,且收敛速度明显,具有一定的实用价值。 3 结论 本文在构建的网络靶场评价指标体系全面、客观,能够充分体现出网络靶场的综合能力,弥补了此部分研究的空白。在此基础上,本文提出了一种基于多层神经网络算法的网络靶场评价方法,在计算结构上做了调整,将由一个BP神经网络计算分解成多个多级神经网络并行计算,避免了由一个大型神经网络计算带来的训练难度大、耗时、无法做出精细分析等难题,使得网络靶场评价模型的准确性和实用性得以提高。然而,网络靶场的综合评价与很多因素有关,随着信息技术的发展和网络攻防技术的演进,如何梳理出网络靶场内在因素之间的复杂关联关系,以及与网络靶场的应用价值的关系还需要进一步研究。 参考文献: [1] 方滨兴,贾焰,李爱平,等.网络空间靶场技术研究[J].信息安全学报,2016,1(3):1-9. [2] 曹云忠,王超.多神经网络在高维数据分类中的应用研究[J].计算机应用与软件,2007,24(7):146-149. [3] 史军涛,周铭,张振坤.基于BP神经网络的战场网络攻击效能评估[J].空军雷达学院学报,2012,26(2):127-129. [4] 吴川.基于神经网络的目标识别及定位方法的研究[D].中国科学院长春光学精密机械与物理研究所,2005.