何卫华 王宏
摘 要: 為了获得理想的光纤通信系统安全态势预测效果,针对光纤通信系统安全态势预测建模过程中存在的一些问题,设计基于大数据分析技术的光纤通信系统安全态势预测方法。首先,搭建光纤通信系统安全态势预测的Hadoop分布式数据处理平台;然后,收集光纤通信系统安全态势变化的历史样本,并采用多个极限学习机并行对光纤通信系统安全态势数据进行训练,构建光纤通信系统安全态势预测模型;最后,采用Matlab 2017编程实现光纤通信系统安全态势预测仿真对照测试。结果表明,大数据分析技术的光纤通信系统安全态势预测精度超过95%,预测误差远远小于对照方法,降低了预测建模的时间复杂度,光纤通信系统安全态势预测效率得到了明显提升,具有更优的实际应用价值。
关键词: 光纤通信系统; 安全态势; 分布式数据处理技术; Hadoop平台; 预测模型; 仿真测试
中图分类号: TN911?34; TP391 文献标识码: A 文章编号: 1004?373X(2020)07?0006?04
Optical fiber communication systems′ security situational prediction
based on big data analysis technology
HE Weihua1, 2, WANG Hong2
(1. College of Computer Science, Sichuan University, Chengdu 610065, China;
2. Sichuan Electromechanical Institute of Vocation and Technology, Panzhihua 617000, China)
Abstract: In order to obtain an ideal security situation prediction effect of optical fiber communication system, an optical fiber communication systems′ security situation prediction method based on big data analysis technology is designed to solve some problems existing in the process of security situation prediction modeling of optical fiber communication system. Firstly, the Hadoop distributed data processing platform for security situation prediction of optical fiber communication system is built. Then, the historical samples of security situation change of optical fiber communication system are collected, and the security situation data of optical fiber communication system are trained simultaneously in parallel by using multiple extreme learning machines to construct the security situation prediction model of optical fiber communication system. Finally, Matlab 2017 is used to realize the simulation and contrast testing of the security situation prediction of optical fiber communication system. The results indicate that the precision of optical fiber communication systems′ security situation prediction based on big data analysis technology is more than 95%, and the prediction error is much less than that of the contrast methods, which reduces the time complexity of prediction modeling. The efficiency of security situation prediction of optical fiber communication system has been significantly improved, which has an excellent practical application value.
Keywords: optical fiber communication system; security situation; distributed data processing technology; Hadoop platform; prediction model; simulation testing
0 引 言
光纤作为一种常用通信介质,具有抗干扰能力强、数据传输速度快、数据发送可靠性高等优点,同时,微电子技术、移动技术的不断融合,使光纤通信技术得到了前所未有的发展,光纤通信成为企业、单位以及家庭的主要组网方式,出现许多性能优异的光纤通信系统[1?3]。在光纤通信系统的数据传输过程中,一些人通过非法途径对重要的数据进行窃取、篡改,导致一些重要信息被泄露出来,带来了一定的经济损失,同时给人们生活带来一定的困扰,光纤通信系统面临着巨大的安全问题[4]。
当前光纤通信系统安全防范措施有两种类型:一种是被动方式的防范措施;另一种是主动的防范措施。被动防范措施主要包括数据加密、防火墙等,它们的安全性差,无法有效保证光纤通信系统的安全[5]。主动的防范措施包括异常入侵检测、安全态势预测等,其中,安全态势预测可以对将来一段时间的光纤通信系统安全状态进行描述,实际应用价值更高,成为当前一个重要的研究方向[6]。针对光纤通信系统安全态势预测问题,全世界各地的学者投入了大量的时间进行了深入研究,传统方法主要有:模糊C?均值聚类的安全态势评估模型[7]、基于时间序列分析的网络安全态势预测方法[8],它們假设光纤通信系统安全态势变化简单,简化了光纤通信系统安全态势预测问题,导致光纤通信系统安全态势预测结果与实际不相符[9]。现代方法主要包括:BP神经网络、RBF神经网络[10?11]、支持向量机等[12],它们可以比较全面地描述光纤通信系统安全态势变化特点,预测效果要优于传统方法。然而,神经网络和支持向量机自身也存在一些无法克服的难题,如神经网络存在“过拟合”现象,支持向量机训练耗时长[13]。极限学习机(Extreme Learning Machine,ELM)是一种训练速度快、没有迭代过程、参数设置简单的前馈型神经网络,不仅具有支持向量机良好的泛化能力,同时具有神经网络收敛速度快的优点,为此,本文将其引入到光纤通信系统安全态势预测的建模中[14]。由于光纤通信系统安全态势数据朝大数据方向发展,传统单节点处理模式已经无法满足光纤通信系统安全态势在线预测要求。Hadoop分布式数据处理平台可以对一个大任务进行有效分解、并行处理,提高了数据处理的速度。
为了提高光纤通信系统安全态势预测精度,本文设计了大数据分析技术的光纤通信系统安全态势预测方法,并采用仿真实验验证了本文光纤通信系统安全态势预测方法的可行性和优越性。
1 安全态势预测方法
1.1 Hadoop分布式数据处理平台
Hadoop分布式数据处理平台采用并行计算技术解决大型问题,常采用Map/Reduce机制,并行计算被抽象为Map和Reduce函数,执行过程如图1所示[15]。
Map/Reduce具体描述为:
1) Map阶段:将一个大任务划分为多个片,每个片称为Job,一个Job分配给一个节点处理,并将处理结果反馈给主节点。
2) Reduce阶段:主要汇聚Map阶段各节点的处理结果,并将最终结果输出。
1.2 安全态势预测思路
大数据分析技术的光纤通信系统安全态势预测思路为:
1) 收集光纤通信系统安全态势预测历史数据,并对数据进行分片处理;
2) 采用大数据分析技术——Hadoop分布式数据处理平台将分片数据分配到不同节点上进行建模,每一个节点采用ELM建立光纤通信系统安全态势预测模型,具体如图2所示。
1.3 ELM算法
ELM首先随机设置输入层和隐含层间的参数,然后采用最小二乘算法算出输出层权值矩阵,非线性处理能力强。设训练样本集为[{X,Y}={xi,yi}Ni=1],其中,[xi=[xi1,xi2,…,xip]∈Rp]表示输入向量,[yi=][[yi1,yi2,…,yiq]∈Rq],[p]和[q]分别表示输入和输出向量的维数,隐含层节点数为[m],ELM的输出函数为:
式中:[αj=[αj1,αj2,…,αjp]T]表示第[j]个隐含层节点和输入节点的连接权值;[bj]表示第[j]个隐含层节点的阈值;[βj=[βj1,βj2,…,βjp]T]表示输出节点与第[j]个隐节点的连接权值;[g()]表示激活函数。
式(1)采用矩阵方式描述,具体为:
式中:[Y]表示期望输出;[β=[β1,β2,…,βm]Tm×q];[H]表示隐含层的输出矩阵,具体为:
[β]可通过最小二乘解获得,具体为:
[β=H+T] (4)
式中[H+]为[H]的广义逆。
1.4 ELM的光纤通信系统安全态势预测步骤
ELM的光纤通信系统安全态势预测步骤如下:
1) 将光纤通信系统安全态势等级划分为5种,分别为:优、良、中、差、危。
2) 对一个光纤通信系统收集一段时间安全态势的历史数据。
3) 从历史数据中随机选择一部分样本组成训练样本集,余下的样本组成测试样本。
4) 为了提高ELM的收敛效率,对光纤通信系统安全态势等级的值进行如下归一化处理:
[y=(y-ymin)(ymax-ymin)] (5)
式中:[ymax]和[ymin]分别表示光纤通信系统安全态势等级的最大和最小值。
5) 设置ELM的参数,并采用ELM对光纤通信系统安全态势训练样本集进行学习,建立预测模型。
6) 采用测试样本对光纤通信系统安全态势预测模型的性能进行分析。
ELM的光纤通信系统安全态势预测流程如图3所示。
2 光纤通信系统安全态势预测效果测试
2.1 测试环境
为了测试本文提出的光纤通信系统安全态势预测方法的性能,首先构建一个Hadoop分布式数据处理平台,其包括5个节点,每一个节点的参数如表1所示,然后进行仿真模拟实验。为了使本文方法的光纤通信系统安全态势预测结果具有对比性,选择RBF神经网络、BP神经网络在相同环境下进行对照实验。
2.2 光纤通信系统安全态势实验数据
为了增强仿真实验结果的说服力,体现实验的公平性,采用5个光纤通信系统作为测试对象,其安全态势样本数量如表2所示。
2.3 结果与分析
2.3.1 安全态势的预测精度对比
采用RBF神经网络、BP神经网络、ELM分别对表1的光纤通信系统安全态势数据进行建模,预测精度如图4所示。
分析图4的光纤通信系统安全态势预测结果可知:
1) RBF神经网络、BP神经网络光纤通信系统安全态势预测精度低,预测结果的偏差大,因为它们的光纤通信系统安全态势预测结果极不稳定,出现了许多过拟合的光纤通信系统安全态势预测结果。
2) ELM的光纤通信系统安全态势预测精度要高于RBF神经网络、BP神经网络,这是因为ELM能够克服神经网络过拟合的缺陷,更好地描述了光纤通信系統安全态势的变化特点,光纤通信系统安全态势预测误差得到了降低,对照实验结果验证了ELM用于光纤通信系统安全态势预测建模的优越性。
2.3.2 光纤通信系统安全态势预测效率对比
分别计算RBF神经网络、BP神经网络、ELM的训练时间和测试时间,如图5所示。从图5可以发现,RBF神经网络、BP神经网络、ELM的测试时间相差无几,而RBF神经网络、BP神经网络、ELM的光纤通信系统安全态势建模训练时间差异很大,其中,BP神经网络的训练时间最长,RBF神经网络的训练时间次之,ELM的训练时间最短,总体上,ELM缩短了光纤通信系统安全态势预测建模时间,提升了光纤通信系统安全态势预测效率。
2.3.3 Hadoop分布式数据处理平台的优越性测试
为了分析Hadoop分布式数据处理平台的优越性,选择传统单节点数据处理平台进行对比测试,建模方法均采用ELM,不同数据集下,训练样本和测试样本根据5[∶]1进行划分,光纤通信系统安全态势建模时间如图6所示。从图6可以看出,当前数据集规模较小时,Hadoop分布式数据处理平台的建模时间还长于单节点数据处理平台,这主要是因为各节点之间的协调需要一定的时间,随着光纤通信系统安全态势预测数据集规模不断增加,Hadoop分布式数据处理平台和单节点数据处理平台的建模时间不断增加,但是Hadoop分布式数据处理平台增幅小,单节点数据处理平台的建模时间急剧上升,而且数据数量越大,Hadoop分布式数据处理平台优势就更加明显,验证了本文选择Hadoop分布式数据处理平台进行光纤通信系统安全态势预测的优越性。
3 结 语
针对光纤通信系统安全态势预测建模过程中精度低、实时性差等不足,本文提出了基于大数据分析技术的光纤通信系统安全态势预测方法。采用Hadoop分布式数据处理平台对光纤通信系统安全态势进行并行处理,采用ELM作为光纤通信系统安全态势预测算法,测试结果表明,本文方法提升了光纤通信系统安全态势预测精度,改善了光纤通信系统安全态势建模效率,相对于其他光纤通信系统安全态势预测方法,具有更高的实际应用价值。
参考文献
[1] 陶源,黄涛,张墨涵,等.网络安全态势感知关键技术研究及发展趋势分析[J].信息网络安全,2018(8):79?85.
[2] 王健,李可,赵国生.面向感知质量保障的安全态势预测优化模型[J].华中科技大学学报(自然科学版),2018,46(1):22?25.
[3] 刘世文,司成,张红旗.一种细粒度的网络威胁态势评估方法[J].计算机工程与应用,2018,54(10):149?153.
[4] 郭毅,段海新,张连成,等.基于特征融合相似度的域间路由系统安全威胁感知方法[J].中国科学:信息科学,2017,47(7):878?890.
[5] 文志诚,陈志刚,邓晓衡,等.基于多源多层次信息融合的网络安全态势感知方法[J].上海交通大学学报,2015,49(8):1144?1152.
[6] 王法玉,张晓洪.多源事件融合的网络安全态势评估方法[J].计算机工程与设计,2016,37(6):1440?1444.
[7] 张瑞芝,唐湘滟,程杰仁.基于改进模糊C?均值聚类的DDoS攻击安全态势评估模型[J].计算机工程与科学,2018,40(11):1957?1966.
[8] 文志诚,陈志刚,唐军.基于时间序列分析的网络安全态势预测[J].华南理工大学学报(自然科学版),2016,44(5):137?143.
[9] 李玺,卢昱,刘森,刘锋.基于Markov game模型的装备保障信息网络安全态势感知方法研究[J].计算机应用研究,2017,34(11):3441?3445.
[10] 陈维鹏,敖志刚,郭杰,等.基于改进的BP神经网络的网络空间态势感知系统安全评估[J].计算机科学,2018,45(z2):335?337.
[11] 江洋,李成海,魏晓辉,等.改进PSO优化RBF的网络安全态势预测研究[J].测控技术,2018,37(5):56?60.
[12] 孙卫喜.用于网络安全态势预测的粒子群与支持向量机算法研究[J].计算机应用与软件,2019,36(6):308?316.
[13] 李晓宾,李淑珍.模糊动态贝叶斯网络防御态势感知模型[J].探测与控制学报,2017,39(3):124?129.
[14] HUANG G B, ZHU Q Y, SIEW C K. Extreme learning machine: theory and applications [J]. Neurocomputing, 2006, 70(1): 489?501.
[15] 王倩,谭永杰,秦杰,等.基于Hadoop分布式平台的海量图像检索[J].南京理工大学学报,2017,41(4):442?447.
[16] 汤永利,李伟杰,于金霞,等.基于改进D?S证据理论的网络安全态势评估方法[J].南京理工大学学报,2015,39(4):405?411.
[17] 杨豪璞,邱辉,王坤.面向多步攻击的网络安全态势评估方法[J].通信学报,2017,38(1):187?198.