肖志良,汪丽娟,郑雁予
佛山职业技术学院,广东佛山,528137
工业物联网(IIoT)通信系统是当今工业生产中的重要组成部分,该系统通过传感器和设备之间的数据交换实现自动化生产和远程监控。然而,由于环境因素和设备故障等原因,通信系统中的数据往往会出现缺失现象,这给生产调度和监控带来了一定的困难。因此,预测和填补这些缺失数据成为工业物联网通信中的重要问题之一[1]。针对该问题,国内外诸多学者陆续提出了一些解决办法,提出了利用大数据技术的数据分析和预测模型、时间序列分析模型、机器学习模型和实时检测模型等。这些模型技术在一定范围内能够较好地处理通信数据,并给出合理的预测范围和填补方案[2]。但随着工业互联网的用户增加,数据量加大,这些处理模型已经无法满足对高标准和高质量数据的预测及填补需求。随着深度学习技术的崛起,因其普遍具有的高准确率、高自动化、高泛化和灵活性的特点,逐渐在众多科技领域崭露头角。鉴于此,研究创新性地在分析现有工业互联网安全通信架构的基础上,引入了长短时记忆网络(LSTM)进行算法优化,并通过多层感知机(MLP)进行数据校准,最后提出了一种新型数据预测模型,旨在为工业物联网通信缺失数据预测领域的发展提供新的方法和思路。
工业物联网数据安全通信架构是保障工业系统信息传输和处理安全性的关键组成部分。随着工业数字化的推进,越来越多的设备和系统通过互联网进行数据交换,这使得工业物联网的安全性变得尤为重要[3]。一个强大而可靠的数据安全通信架构不仅能够有效防范网络威胁和攻击,还能确保敏感数据在传输过程中得到充分保护,从而维护整个工业生态系统的运行稳定性。一般的工业物联网安全通信架构分为安全链路建立、权限管理、统一通信协议、设备安全管理以及制定安全监管机制等部分。首要考虑的是建立端到端的安全通信链路,通信链路的安全性直接关系到整个系统的安全性。对于工业物联网中的通信数据,采用先进的加密算法进行加密,可以有效防止数据被未经授权的第三方窃取。同时,数字签名技术可用于验证通信数据的完整性,确保数据在传输过程中被篡改。其次,在一个复杂的工业系统中,不同设备和用户可能具备不同的权限,因此,通过建立用户身份验证机制,确保只有授权用户才能够访问系统,可以有效减少潜在的安全风险。在工业物联网中,设备之间的通信可能涉及多种通信协议和标准。制定符合工业物联网通信需求的安全标准协议,有助于规范系统组件的设计和实施,提高系统的整体安全水平。同时,建立可管理的设备安全性是确保工业物联网通信安全的重要一环。通过为每个设备分配唯一的身份标识,可以有效防范设备身份伪造和滥用。最后,建立安全监控和响应机制是确保工业物联网通信安全的最后一道防线。通过实时监控网络流量、设备行为和异常事件,可以及时发现潜在的安全威胁。
由于现有的工业物联网安全通信架构大多采用了单路径路由协议和单一特性访问机制的数据通信,在面对外部电磁干扰或网络渗透攻击时存在较大的安全隐患,例如数据缺失和数据失信。循环神经网络(RNN)易受到短时记忆的影响,当有一组足够长的时间序列数据输入到RNN中时,此神经网络将很难把信息从早期传递到后期,会出现梯度爆炸和消失等问题。在这种情况下,LSTM应运而生。作为一种特殊的RNN,LSTM通过引入了三个门控单元,即输入门、遗忘门和输出门来控制信息的流动和记忆的更新,使得LSTM能够长时间地保留和传递有用的信息,从而更好地处理长序列数据。假设输入层输入为,而时刻的隐含层为ht-1,此时输入门的计算公式如式(1)所示。
式(6)中,所有的代数含义与之前一致,该过程是将归一化映射在[0,1]内的训练结果进行实数映射。在多次重复归一化映射后,为了加强预测模型的精准性,避免预测值的误差增大,研究继续引入了多层感知机进行数据校准,提出了一种数据校准模型,该模型在预测模型的基础上继续增加了6层隐藏层。首先将真实数据与模型预测数据作差,得到预测残差数据。随后将误差输入到校准模型中进行模型训练和参数训练,当训练结果的误差精度达到预设范围内时,使用验证数据对预测模型进行性能测试,并通过校准模型进行不断校准,最终得到高标准的预测结果。联合预测模型和校准模型后,研究针对性地提出了一种新模型,该模型下的工业物联网通信缺失数据预测总共分为7步。首先对工业物联网通信数据进行预处理并建立数据集,其次,将该数据集输入到模型中进行训练得到预测结果,并与初始值作差得到预测残差数据集。然后,将该数据集输入到校准模型中进行训练,并得到通信缺失数据的综合预测效果。若该预测结果达到时序长度则直接输出,若未达到,则重复输入校准模型进行重构,直到满足为止。
为了验证研究提出的新型工业物联网通信缺失数据混合预测模型的性能效果,研究将工业物联网智能化生产系统中的气动压缩机作为测试环境,采用CC3340芯片搭载Z-tack协议的无线感知通信单元作为测试对象,其中感知单元适配了GWD42(A)温度传感、AHE100湿度传感器和TX9310传感器等多种传感器。设定测试工作时长为1小时,测试频率为100Hz,时间预测目标设定为2000个,达到既定时间目标后,随机选择保留感知数据中的300个作为测试集,剩余数据作为模型训练集。完成数据收集后,以压缩机工作温度单周期预测和多周期预测,以及传送带振动幅度数据作为变量方向,将单独的LSTM、MLP和混合模型,即LSTM-MLP与真实感知数据进行对比,测试结果如图1所示。
图1 不同模型下的压缩机感知数据预测结果
图1(a)为三种不同模型下的气动压缩机工作温度感知数据单周期预测结果,图1(b)为三种不同模型下的气动压缩机工作温度感知数据多周期预测结果,图1(c)为三种不同模型下的气动压缩机振动幅度感知数据周期预测结果。由图1可知,不论是单周期还是多周期预测方式,在气动压缩机工作温度感知数据预测中都表现出一般的预测水平,预测结果与真实的感知数据仍存在较大偏差。相对而言,研究提出的LSTM-MLP模型能够适应单周期和多周期的感知数据预测,同时预测值与真实值存在的误差较小。在压缩机振动幅度数据预测中,可直观地发现研究提出的模型对振幅预测误差较小,而单独的LSTM和MLP预测误差较大,预测精度较低。综上所述,研究所提的模型能够满足气动压缩机的数据预测和缺失数据的填补,增强了工业数据传输的完整性。为了量化各模型的指标性能,同时加强研究的全面性,继续引入了3种现有较为流行的数据预测模型,分别为自注意力机制模型(SMM)、门控循环单元(GRU)模型以及随机森林(RF)模型。以平均绝对误差(MAE)、平均绝对百分比误差(MAPE)、均方误差(MSE)、均方根误差(RMSE)、R2以及精准率(Precision)为参考指标,对以上模型进行测试,测试结果如表1所示。
表1 不同预测模型的指标测试结果
由表1可知,在MAE、MAPE、MSE和RMSE四种测试指标中,四种模型从SMM、GRU、RF到LSTM-MLP模型预测数值呈降序排布。而R2和精准度的指标测试中,四种模型又呈逐渐递增的趋势。总而言之,研究提出的LSTM-MLP模型的性能最佳,其MAE、MAPE、MSE和RMSE最低值分别为0.0114、0.0221、0.0204和0.0175,此外,其R2最大为0.8542,精准度值最大为0.9539。
为了提高现有工业物联网通信数据传输的安全性,研究在分析了现有工业物联网安全架构的基础上,引入了LSTM和MLP进行改进,最后提出了一种新型的缺失数据预测模型。实验结果表明,该模型对气动压缩机的温度数据和振幅数据预测准确度明显优于其他模型。综上所述,研究所提的新型预测模型综合性能更优,为解决工业物联网通信数据中的缺失值问题提供了有效的技术支持。然而,此次研究仅针对短距离下的工业物联网通信传输进行了探索,后续研究可着重对远距离数据传输展开相关讨论,以提高该技术领域的全面性。