王大蕾
关键词:GRU-LSTM 算法;数据入侵;检测方法;误报率
中图分类号:TN915.08;TP391.44 文献标识码:A
0 引言
当前,物联网技术的广泛应用已经对人们的日常生活以及工业生产过程产生了重要影响,也为各类互联网应用技术的发展提供了可靠的基础[1]。网络通信技术的进步对各行业都产生了明显影响,一旦离开网络,所有行业都将无法正常运行,因此需要进一步提升网络的安全性能,这是许多学者开展互联网研究的重点方向[2-3]。为有效防范网络威胁,提升网络安全性,需要建立可靠的入侵检测方法。除了需要对网络中的计算机进行监测以外,还需在传输过程中对各类数据做好防范,对网络受到的攻击、信息窃取等行为进行严密监控,建立网络非法访问等行为的保护技术[4]。现阶段,防火墙在各类网络系统中已成为一类有效的防护措施,能够对网络受到的各类攻击行为进行精确检测,由此实现网络安全性的大幅提升[5]。利用监测系统实现网络日志的自动收集,并对各项信息动态进行监听与自动处理,从中获取有用的内容,快速判断网络入侵行为[6-7]。本文综合考虑循环神经网络(recurrent neural network,RNN) 和长短期记忆(long short-term memory,LSTM)网络两种网络的各自运行性能,针对其不足之处进行了重新调整,并对LSTM 实施优化得到门控循环单元(gate recurrent unit,GRU)网络,进而获得GRU-LSTM 高效算法,之后将其与传统形式的Softmax(逻辑回归)分类技术进行比较分析,结果发现GRU-LSTM 算法的入侵检测性能更优。
1 GRU-LSTM算法
GRU是循环神经网络的一种,具有很好的长期记忆和反向传播梯度优势。以支持向量机(supportvector machines,SVM)取代Softmax,作为GRU模型输出,并利用交叉熵函数计算出损失[8]。损失函数按照如下进行:
图1 为GRU-LSTM 模型结构示意, 图2 为GRU-LSTM 模型处理流程。将所有数据输入模型内,再利用网络进行处理,实现对权重与偏差的控制。判断损失函数与理想值之间的偏差,并对权值与偏差进行多次迭代,最终获得最佳的网络模型。
2 结果分析
表1 是本实验获得的各项参数结果,可以发现,模型训练精度及其所需的训练时间受储量、训练次数等参数的综合影响。为获得更高的训练效率,进行了多次测试,结果显示在储量为512 B 的条件下表现出了最优状态,能够实现对下降过程的精确控制,震荡幅度显著减小。为消除训练阶段网络出现的过拟合现象,可选择dropout(临时丢弃函数)方法来有效避免以上问题。dropout 进行网络训练时,按照恒定概率不断去除无效的网络神经元,由此实现减弱神經元间的相互作用,形成更简单的结构,有效防止过拟合的问题。根据本实验测试结果可知,GRU-LSTM 和GRU-Softmax 两个模型的dropout 值分别为0.82 与0.79。
表2 是各模型入侵检测得到的参数,按照同样的过程完成模型的训练,总共实施训练次数为10次,网络流量数据都是30 000行,测试次数为10次。由表2 可知,GRU-LSTM 表现出了比GRU-Softmax更高的控制精确度和检测率,通过对比发现,相较于传统的GRU-Softmax 方法,综合运用LSTM 网络与GRU 网络进行处理具有更优二分类优势。
不同攻击类型下测试对比结果如表3 所示。由表3 可知,整体性能上GRU-LSTM 算法优于GRUSoftmax算法。说明GRU-LSTM 算法在检测攻击时将其判断成正常行为的概率较小,减小了入侵概率。
在网络入侵行为被发现时,系统便会把报警信息迅速反馈给用户,从而避免整个系统出现运行异常的情况,并且也能够有效保护系统中的储存数据[9]。考虑到检测网络入侵时需要记录多方面的数据信息,因此形成的数据量很大,从而形成明显的噪声,导致系统算法无法正常运行,出现训练结果存在明显偏差的问题。GRU-LSTM 网络能够满足自主学习以及良好的适应性要求,在入侵检测阶段解决存在的各类潜在问题[10-11]。
为了进一步分析算法的可靠性,在NSL-KDD数据集上进行了各性能测试,检测结果如表4 所示。由表4 可知, 相较于GRU-Softmax 算法,GRULSTM算法下各项性能均表现出优异的状态。可见采用LSTM 替换Softmax 能提高算法整体的运算能力。
3 结论
本文开展基于GRU-LSTM 算法的物联网数据入侵检测分析,取得如下结果。
(1)利用dropout 进行网络训练,实现减弱神经元间的相互作用,有效防止过拟合。本实验测试GRU-LSTM 和GRU-Softmax 两个模型的dropout 值分别为0.82 与0.79。GRU-LSTM 表现出了比GRUSoftmax更高的控制精确度和检测率。
(2)GRU-LSTM 算法在检测攻击时将其判断成正常行为的概率较小,减小了入侵概率,获得了更优的精确度、检测率与误报率。
该研究能够弥补传统机器学习算法在处理数据时的局限性,但在面对海量数据时存在计算冗长的问题,期待后续引入深度学习算法解决这一问题。