张运锋
(广州城建职业学院,广东 广州 510900)
中国电信网2021年报告指出,我国网民规模已经近10亿人,互联网范围已经扩大到72.4%,手机上网规模扩大到9.8亿人[1-2],逐步实现了数字化社会发展,随着新冠疫情的暴发,线上办公、线上授课及线上交易等层出不穷,网络运行保证了企业、社会的正常发展与稳定运行。随着网络数量的复杂程度逐渐增加,网络故障发生概率也逐渐提升,因此,网络故障诊断对于稳定计算机网络的发展具有重要意义[3-4]。
传统的计算机故障诊断方法主要包括专家诊断等人工方式,但是现阶段其已经无法满足大范围计算机网络故障的需求,因此,亟需人工智能网络技术进行计算机故障诊断[5]。BP(Back Propagation)神经网络是目前应用场景最多,较为广泛的人工神经网络之一[6]。基于BP神经网络,可实现对其他行业输出进行预测效果分析,上述研究对于计算机网络故障诊断的预测分析都起到了重要的推动作用。虽然神经网络可以解决一些复杂的、非线性映射问题,但是它也存在一些缺点,如过拟合、容易陷入局部最优解及收敛速度慢等问题,因此,利用遗传算法、粒子群和蚁群算法等用于优化初始权重和阈值,更有利于提高模型学习效率并进行全局优化[7-9]。
本研究基于遗传算法优化建立GA-BP神经网络预测模型,并与传统的BP预测模型训练前后的精度、预测误差进行对比分析,研究结果对于计算机故障诊断的整体管理措施调整及决策具有重要的指导意义。
在进行试验数据采集时,考虑到不同的计算机故障类型与数据本身的均衡性,本研究共进行了24天、共210 h的数据采集,计算机故障采集信息如表1—2所示。
表1 计算机故障信息采集表
表2 计算机数据采集情况
遗传算法优化BP神经网络计算流程如下:
(1)首先导入数据,并对数据进行预处理;(2)其次,初始化种群并计算个体适应度值,进行种群选择、交叉、变异,并进行迭代,(3)最后,满足迭代条件后找到最优位置,计算最优权值阈值,重新带入BP网络种,进行训练和预测分析。
(1)
GA是目前应用最为广泛的一种求解优化问题的自适应启发式的搜索算法,它模仿了自然界的“物竞天择,优胜劣汰”的生物进化机制,算法步骤如下。
(1)确定神经网络拓扑。
(2)获得初始种群:通过对输入层进行数据预处理,设置种群数量,主要包括网络模型的权值及阈值。
(3)适应度函数F的设置公式为:
(2)
(4)选择运算:选择操作是指通过一定概率从原始种群中选出优秀样本,通过繁殖产生下一代样本数据,个体选择的概率为:
(3)
其中Fi为个体I的种群适应度值,N为种群数量。
(5)交叉运算:交叉运算是指从种群中随机选择两个样本,通过交换和组合,产生适应性强的新个体,两个个体ak、al在j处交叉操作如式(4)和(5):
akj=akj(1-b)+alj
(4)
alj=alj(1-b)+akj
(5)
(6)变异运算:通过种群变异可以保持种群的多样性,从种群中随机选取一个个体,选取个体的一部分进行变异操作,从而产生更好的个体。个体ai在j处发生变异,形成一个新的个体aij如式(6):
(6)
其中amax、amin为aij的边界条件,r2为随机数,g是迭代次数,Gmax是最大进化次数。
(7)计算新生成种群中个体的适应度函数。如果适应度函数满足要求或进化次数达到最大值,则进化完成。
(8)通过GA优化,给BP网络初始权重和阈值,满足终止条件后得到预测结果。
为定量评估GA优化的神经网络预测模型的有效性和准确性,采用指标RMSE(均方根误差)、MAE(平均绝对误差)和MAPE(平均绝对百分比误差)评估模型,计算公式如下:
(7)
(8)
(9)
对2种预测模型的预测结果进行量化,并利用模型评价指标对模型进行对比分析(见表3)。与传统的BP预测模型相比,GA-BP模型的误差都有所降低,说明GA-BP模型预测精度提升。
表3 BP神经网络和GA-BP神经网络模型预测性能分析
不同模型的预测误差分布如图1所示,X轴代表实测值与预测值之间的误差值,Y轴表示训练集的预测样本。以分布误差为0的分界线,向两端扩散增大,0轴表示真实值与预测值结果一致,越接近0,代表预测值与实测值的差值越小,模型的预测精度越高。从图1可以看出,与BP模型相比,GA-BP预测模型的误差直方图误差接近0的个数更多且误差更小,其他组合模型在零区间分布数量较小,误差较大,说明模型预测精度较低。
图1 不同神经网络模型预测误差分布
(1)与传统神经网络模型预测相比,利用遗传算法优化后的BP神经网络预测模型,对BP神经网络模型的隐层节点数和学习率进行优化,克服了传统神经网络模型参数选择的盲目性和不确定性,提高了搜索精度、收敛速度和模型的预测稳定性。
(2)将BP预测模型和GA-BP神经网络模型进行计算机网络故障预测分析,GA-BP在计算机网络故障预测比其他神经网络模型表现出更好的预测性能。经过不断迭代训练,GA-BP网络模型的预测精度R2达到0.96;与传统的BP预测模型相比,GA-BP模型的RMSE降低了67.41%,MAPE降低了67.58%,MAE降低了67.73%,预测值与试验值之间的拟合程度价高。这一研究结果为计算机网络故障的预测提供一种新的思路和方法。
(3)在本研究中,通过遗传算法优化的BP神经网络应用于计算机网络故障预测,预测结果更为准确。除遗传算法优化神经网络的外,今后会更加注重不同模型的对比,以便对不同模型之间的预测性能进行对比分析,将更有利于对计算机故障发生实施动态调控与技术决策。