四川中电启明星信息技术有限公司 余 痴 李 立 王海庆 胡 波
大数据分析、云存储技术的迅速发展为电力系统智能化发展提供了坚实的数据支持,这些数据对维护系统正常运行具有重要的参考和指导意义,维护数据信息的安全至关重要。数据信息存储在网络运设备中,存储设备数量较为庞大,监视存储设备的运行状态,预测存储系统的存储故障显得只管重要。本文对存储设备故障的神经网络预测方法进行了论述,具有一定的参考意义。
随着大数据技术、物联网技术以及网络云技术等网络信息技术的快速发展,人们对大规模存储系统的发展要求也越来越高。互联网系统的数据存储系统变得越来越庞大。大量的重要信息存储在数据中心,这些数据的安全性是人们关注的一个关键问题。硬盘是最常用的数据存储设备,一旦硬盘出现问题,则很容易导致数据的损坏和丢失,从而造成难以估量的损失。并且随着有用数据数量的迅速膨胀,所需的存储系统规模的不断增大,建立一个高安全性的存储系统成为一个亟需解决的问题。最为常见的方式就是针对硬盘的一些运行参数制定相应的健康标准,一旦硬盘运行过程中超出健康范围,系统则发出报警信息并采取相应的应对措施如数据迁移或者数据备份。
如今,副本机制是大型数据存储中心最常见的提高存储设备可靠性的方式。通常可以将需要存储的数据保存数个副本,通过多个备份的手段来提高数据的安全性,一旦数据丢失或损坏可以很快的从副本重新提取数据,这种方式的数据安全性和重塑性好,但是需要的存储空间大,成本投入较高。同时,由于副本机制无需加密解码,且网络资源占用小,具有较强的数据重构性。
此外,纠删码也是常用的数据存储安全技术。纠删码的方式利用一定的计算模型根据数据内容计算出数据校验码,当数据损坏或丢失后,系统可以根据计算模型反向推导出原始数据的内容。纠删码所需的存储空间较小,但在数据恢复过程中的计算量较大,其可靠性也低于副本机制。
另外,磁盘的扇区和块出现故障或者损坏的情况也经常出现,因此,系统应定期对磁盘扇区进行检测,从而及时发现扇区故障,并采取备份等措施保护扇区数据。这一技术被成为扇区清洗。
提高存储系统的可靠性,其关键在于及时发现存储故障。SMART技术是常用的存储故障检测技术,它通过故障检测和报警处理的方式,对存储器的故障进行主动检测处理。从而在故障发生以前,提前发出故障报警,并对危险数据进行备份,提高了数据的安全性,避免了数据丢失的危险。采用SMART法根据硬盘运行参数对硬盘健康程度进行简单的预测分析已经取得了一定的成果,为提高预测的准确性,我们需要建立更加科学完善的数学模型。
神经网络是常用的计算模型,其利用计算机模拟人类的认知过程,通过模型的建立,对研究对象影响因素进行特征值分析提取,并对特征值进行计算分析,最终得到最优解。反向传播算法是神经网络模型的常用算法,这种计算模型通过对系统误差的反向推算,不断减小系统误差。本文采用了输入层、隐含层以及输出层三层结构组成的神经网络模型对存储设备的故障进行预测。其结构如下图1所示。
图1 存储设备故障检测的神经网络模型
神经网络的隐含层可能存在多个,上图中的圆圈表示一个神经元节点,神经元节点是数据处理的基本单元,每个层次都包含若干神经元节点,临近层次的神经元节点通过某种权重关系而相互关联,不同层次之间的连线代表这种权重关系。权重关系在模型计算之前,通过一定算法赋值,通常,权重的数值大小表示了神经元节点之间的作用强度,通常权重的数值越大代表神经元节点间的作用关系越强。如上图所示,神经元节点的信息往往只沿着一个方向传播,不会往复循环。输入层包含了研究对象的样本特征,输出层的计算结果则用来判断硬盘故障是否将要发生。
在分析过程中,我们首先将一个研究样本输入模型的输入层,将关系硬盘健康状况的属性根据一定的算法得出权重和特征值,然后将这些属性综合加权,并建立函数关系,函数的输出就是模型的输出信号。在分析过程中,我们利用误差的反向传播,通过比较目标值和输出值之间的偏差,对神经元节点之间的权重关系进行调整,从而尽可能减小误差。通过不断的往复计算,对神经网络模型的权值不断的进行调整,最终使得神经网络模型计算结果的误差达到允许范围内,求得最优解,通常达到一定的迭代次数即可达到预期效果。在实际运算过程中,迭代的次数越多,往往误差值越小,但迭代次数过多,会导致运算负担过重。因此,迭代计算的次数往往通过人为设定,使得最终误差在允许范围内即可。
随着技术的不断革新,存储设备的故障预测分析技术在不断的发展和完善,存储设备的故障检测工作还有很多工作需要进一步完善。神经网络算法作为存储设备故障点预测模型,还需在实际的云存储系统中,通过不断的实践验证,发现问题并不断的改进。