晋旭博 闫玉波
摘要:本文提出了复杂装备全生命周期健康感知大数据管理的关键技术,主要从复杂装备健康感知大数据的质量、恢复策略、整合集成与统一管理三方面展现研究成果,为后续实现复杂装备的健康管理奠定了技术基础。
[关键词]复杂装备全生命周期健康感知大数据管理
近些年来,随着科学技术的发展和各行各业各种新需求的出现,催生了多种多样复杂装备,这些复杂装备投入各行各业后在社会中发挥着不可估量的作用,由于复杂装备造价昂贵,因此其健康管理就显得尤为重要,而想要实现对复杂装备的健康管理,首先要实现对复杂装备全生命周期健康感知大数据的管理。
复杂装备健康感知大数据是装备健康建模信息的基本载体,健康感知大数据准确真实地反映着复杂装备的运行状态,是实现装备健康建模、评估和预测的基本前提。健康感知大数据来源于复杂装备传感器、复杂装备运行环境和自然环境等多方面,描述了装备运行状态和所处环境特征,因而具有多源的特点。健康感知大数据同时包括连续或者离散的数值型信息,也包括图像、音频、视频等多种非结构化的数据,因而也具备多模和异构的特点。在本文中,复杂装备全生命周期健康感知大数据管理主要从以下方面研究:
(1)研究复杂装备健康感知大数据的质量问题,从数据的准确性、完整性、一致性和及时性这四方面对数据质量进行度量;
(2)研究健康感知大数据的数据恢复策略。
(3)研究健康感知大数据的整合集成与统一管理方案。
1复杂装备全生命周期健康感知大数据质量度量技术
复杂装备全生命周期健康感知大数据质量关系到后续对复杂装备健康评估建模的准确性,因此必须有特定的技术来对复杂装备全生命周期健康感知大数据质量进行评估。在对复杂装备全生命周期健康感知大数据进行质量度量时,本文是从数据使用者的角度采用基于规则库的数据质量评估方法来对数据质量进行评估的。
复杂装备全生命周期健康感知大数据的数据质量评估主要从数据的准确性、完整性、一致性、及时性四方面来进行评估。数据的准确性是指采集的复杂装备全生命周期健康感知大数据是否存在一些异常或错误;数据的完整性是指采集的复杂装备全生命周期健康感知大数据是否存在缺失的状况,数据的一致性是指采集的复杂装备全生命周期健康感知大数据是否跟最初对数据设定的统一规范、格式保持了一直;数据的及时性是指采集的复杂装备全生命周期健康感知大数据距离分析要求的时效性距离有多远。
首先结合复杂装备专家的意见利用层次分析法来确定复杂装备全生命周期健康感知大数据质量的四个评估要素权重,然后通过计算采集的复杂装备全生命周期健康感知大数据与规则库中关于这四个评估要素的规则符合百分比来得到复杂装备全生命周期健康感知大数据在每个数据质量评估要素维度上的得分(每个评估要素满分为100分),最后通过加权平均法来对复杂装备全生命周期健康感知大数据质量进行一个评估,其中四个数据质量评估要素维度的权重取值为0到1之间,权重和为1,具体计算公式如式(1):
其中2、入g、入4分别表示复杂装备全生命周期健康感知大数据在数据质量评估要素中维度准确性、完整性、一致性、及时性上的得分,W、W2、W3、W4分别表示复杂装备全生命周期健康感知大数据质量评估要素中的准确性、完整性、一致性、及时性的权重,GQ表示复杂装备全生命周期健康感知大数据质量评估得分。
结合复杂装备专家的意见经过数据分析后,制定了如表1所示的数据质量得分等级标准。
根据复杂装备全生命周期健康感知大数据质量评估得分对照数据质量得分等级表即可得知采集数据的质量状况。
2复杂装备全生命周期健康感知大数据恢复策略
在复杂装备的实际的生产活动中,会存在一些突发因素造成复杂装备全生命周期健康感知大数据丢失的情况,比如误删、突然断电、自然灾害、软件或者硬件的相关问题。为了在发生这些突发状况后能够及时进行对复杂装备全生命周期健康感知大数据的恢复,保证复杂装备的工作质量从而达到降低企业损失的目的,首先必须在前期做好复杂装备全生命周期健康感知大数据的备份工作。
数据备份就是把需要备份的数据复制到磁带、磁盘等存储设备中的过程。最常用的数据备份有完全备份和增量备份两种方式,由于完全备份虽然在数据恢复时效率高,但是需要大量的存储空间定期对所有的数据进行备份,而增量备份虽然能够节省大量的存储空间,但是在进行数据恢复时效率低下,因此在进行复杂装备全生命周期健康感知大数据的备份时采取将完全备份和增量备份结合的方式,间隔一定的时间进行一次完全备份,完全备份期间采取增量备份,这样既能在进行数据备份时节省存储空间,又能在进行数据恢复时提高恢复效率。
3复杂装备全生命周期健康感知大数据整合集成与统一管理
复杂装备种类繁多、数量巨大,随着时间的推移,复杂装备全生命周期健康感知数据量积累会逐步上升,再加上复杂装备全生命周期健康感知大数据类型复杂,有结构化与非结构化的数据、动态静态数据、历史与实时数据、甚至还有图像、声音等各种类型的数据,因此需要构建覆盖复杂装备全生命周期健康感知大数据管理平台经过对数据进行校验和清洗后将复杂装备结构化与非结构化、动态与静态、设备与业务、实时与历史等健康感知数据进行整合集成与统一管理。
4结束语
本文提出的復杂装备全生命周期健康感知大数据质量评估方法、恢复策略、整合集成与统一管理方法对后续复杂装备全生命周期健康感知大数据管理实践提供了技术路线的可行性分析,在复杂装备全生命周期健康管理领域迈出了一步,具有示范效应。
参考文献
[1]刘芳,李敏,任洪敏,周兆明,基于规则库的数据质量评估方法[J].计算机系统应用,2017,26(11):165-169.
[2]赵薇.数据备份与恢复策略的研究与应用[J].通讯世界,2017(12):270-271.
[3]张地,胡峻洁,李明喜,罗群,雷敏。基于双活数据中心的电商平台网站数据保护及灾备恢复策略研究[J].网络安全技术与应用,2017(06):89-90+100.