大数据条件下卷接机组设备即时健康评价模型

2023-06-15 04:08韦伟胡亮王伟伟张玉
物流科技 2023年9期
关键词:Apriori算法

韦伟 胡亮 王伟伟 张玉

摘  要:在自动化技术愈发成熟的背景下,卷烟工业设备功能复杂、精确度提高、设备之间的关联性增强,目前对设备的风险健康状态评估仅停留在计划性维修,难以保证设备的可靠性水平。文章结合烟厂设备的实际情况,从设备运行积累的大量数据进行挖掘,利用Apriori算法找出与工艺指标存在关联关系的参数,利用熵权法确定权重。建立设备综合健康状态评价模型,计算出综合健康指数来判断设备的健康情况。最后通过案例分析验证了此方法的可用性,为设备维修保养的决策方案提供依据。

关键词:卷烟工业;健康状态评价;Apriori算法;健康指数

中图分类号:TP271    文献标志码:B

DOI:10.13714/j.cnki.1002-3100.2023.09.012

Abstract: In the context of increasingly mature automation technology, the function of cigarette industry equipment is complex, the accuracy is improved, and the correlation between equipment is also enhanced. At present, the risk health status assessment of equipment only stays in the planned maintenance, which is difficult to ensure the reliability level of equipment. In this paper, combined with the actual situation of tobacco factory equipment, a large amount of data accumulated from the operation of equipment is mined, and the Apriori algorithm is used to find out the parameters associated with process indicators, and the entropy weight method is used to determine the weight. The comprehensive health status evaluation model of equipment is established, and the comprehensive health index is calculated to judge the health status of equipment. Finally, the feasibility of this method is verified by case analysis, which provides a basis for the decision-making scheme of equipment maintenance.

Key words: cigarette industry; assessment of health status; Apriori algorithm; health index

0  引  言

随着自动化技术在卷烟工业企业的广泛应用,卷烟工厂在设备运行及产品生产过程中,积累了大量历史数据,在看似杂乱无章的数据中,却记录了设备真实的运行状态。在此背景下,通过对相关数据进行深度研究和挖掘,开展设备健康风险的评价,以确保设备的安全高效运行。

设备健康度普遍用0到1的范围来描述设备的健康状态,其中1代表设备十分健康,0表示设备处于故障状态。目前有很多学者对设备的健康风险进行研究。韦伟等[1]通过卷烟厂设备管理的实际需求,构建TOPSIS模型作为核心算法,引入熵权法确定权重来进行健康状态的评价。杨帆等[2]提出一種基于最优等级数的多位特征量开关柜健康状态评价方法,解决了评价等级数的主观设定问题。刘博元等[3]以系统运行的实时大数据为基础,通过信息熵原理利用大数据分析的方法,对系统的健康度做出实时评估。袁伟中等[4]也有通过BP神经网络对设备参数进行回归估计,获得历史数据和训练数据,构建残差与参数分数的映射关系,计算严重等级和工况运行等级。赵丽琴等[5]提出利用指数函数对各参数的权重动态变化进行研究,来更精确地评价设备的健康度。李鑫等[6]采用基于模糊无量纲处理和改进的层次分析法(AHP),结合综合变权综合原理对设备的健康状态进行评估。

如今烟厂设备的健康评价指标与对应参数的关系是人工预设好固定的,没有对新的数据采集系统中实时采集的1 000多个参数(大数据环境)进行一次挖掘,发现参数之间的关联关系。通过TOPSIS法计算机平台综合评价得分的方法,仅靠最后得分来判断设备健康状态不够严谨。本文通过研究每个关键参数与设备运行过程中设备的各种状态的关联性,通过Apriori算法挖掘参数之间的关联关系,进而确定评价的参数指标。利用熵权法客观地对参数权重进行确定。建立设备综合健康状态评价模型,对各指标数据进行综合健康指数统计,得出设备的健康状态,为设备的保养、维修的决策方案提供建议。

1  基本理论

1.1  基于Apriori算法的关联规则挖掘

Apriori算法步骤的核心是使用一种称为逐层搜索的迭代方法,其中K项集用于探索项K+1项集[7]。关联规则的挖掘是一个两步的过程,即先找出所有的频繁项集,再由频繁项集产生强关联规则。具体步骤如下:

第一步:通过扫描数据库,收集满足最小支持度的项,找出频繁1项集的集合,该集合记为L。最小支持度的计算公式如下:

SupportA=                                          (1)

其中:A表示項集,D表示事务数据库。

第二步:用L找出频繁2项集的集合L,使用L找出L,如此下去,直到不能再找到频繁K项集。每找出一个L需要一次数据库的完整扫描。

第三步:由找出的频繁项集产生强关联规则。根据设定的置信度来判断是否具有关联规则,最小置信度的计算公式如下:

confidenceA∪B=                                     (2)

第四步:根据最小置信度筛选出具有相关性的参数,算法结束。

Apriori算法使用频繁项集的先验性质来压缩搜索空间,在大规模数据中寻找变量之间的有趣性关系,具体操程如图1所示。

1.2  基于熵权法确定权重

熵权法的原理是从各项指标所提供信息量的大小不同而确定其目标权重的一种方法。这是一种客观赋权法,其步骤主要如下:

(1)计算各二级指标对一级指标所占的比重,即第i个一级评价指标第j项指标占所有评价第j项指标之和的比重。

p=                                             (3)

(2)计算第j项指标的熵值E:

E=-plnp                                           (4)

其中:E>0, 若p=0时,则E=0。

(3)计算第j项指标的熵权W:

W=                                             (5)

但在实际处理中,第j项指标差异越大,对评价的结果影响就越大,熵值则越小。因此,这里做进一步处理。得到的熵值之间确定其权重,计算公式为:

W=, 0≤W≤1                                          (6)

W=1                                                (7)

通过构建上述模型可以得到各个指标的熵权W=w,w,…,w。

1.3  设备综合健康状态评价模型

健康指数是一种将设备健康程度进行量化的指标,通过全面分析设备运行中各指标数据的状态信息和实际运作工况情况所得到的介于0和1之间的单一数值,其值越大表示设备的健康程度越高,1代表最优状态,0代表处于完全失效[8]。健康指数的具体计算过程如下:

h=                                       (8)

其中:h为设备特征参数x的健康指数;x为实际测量值,x和x是该参数的最小和最大值;是指该参数的最优值。

基于卷接机组多设备综合健康指数HI的表达式如下:

HI=wρh                                            (9)

其中:HI为基于设备状态的系统综合健康指数,HI∈0,1;w是熵权法获得各参数的权重;ρ是各指标的权值,n是参数的个数,m是指标数目。

根据卷烟工业的实际生产经验,建立设备系统健康指数与运行状况评价等级之间的映射关系,对设备健康状态划分为4个等级,如表1所示。

2  模型计算应用实例

以某卷烟厂设备机组为例,机组中存在大量运行数据,设备健康状态的预估始终只能根據事后数据显示,无法利用运行数据提前预知对设备的维护保养。且对设备的轮保无法做到合理化安排,使设备维护保养更加科学化和明细化。本文提出对设备即时的评价模型步骤主要有以下几步:

首先从各系统中获取大量的设备实时数据,将它们存入格式化的表格中,再将这些大数据进行清洗和数据预处理,获得筛选数据。利用这些数据进行Apriori算法来寻找哪些参数的变动对设定的指标之间存在同步的关系,从而确定评价指标;第二步是利用这些参数的标准值和阈值来对实时收集的参数进行健康度的计算;第三步是利用熵权法计算出评价指标的权重;最后利用健康度和权重对设备综合健康状态进行评估。具体流程如图2所示:

2.1  评级指标的挖掘

设备系统中每2秒采集一次数据,且设置有1 000多个传感器,且数据量巨大,根据卷接机组设备采集的数据形式,无法直接使用Apriori算法进行运行,必须做一次数据处理。具体做法如下:

步骤1:去除重复值,得到数据表。

步骤2:将数据表转化为稀疏矩阵。即每一个参数与本身上一个状态相比,若改变了记为1,若没有变动就记为0。

步骤3:对状态性固定指标数据进行去除,即稀疏矩阵中全为0的列的参数。

步骤4:对累计变化量数据进行去除,即稀疏矩阵中全为1的列的参数。

固定其第一列,因数据巨大,仅展示部分数据预处理的结果,如表2所示。

利用Python语言编程对Apriori算法实现,使用了Pycharm开发调试工具,在Windows10操作系统下进行运行。设置的置信度为80%,支持度为20%,根据控制变量法,每次只改变第一列数据,观察数据变化。以烟支空头平均剔除率为例,如表3所示。

2.2  卷接机组设备评价计算结果

根据选择出来的参数,依据式(3)至式(7)计算出各参数的权值,再根据式(8)对其参数的健康指数进行计算,具体的计算结果如表4所示。

由公式(9)计算得到卷接设备综合健康指数值HI为0.660,可知该卷包设备运行状态处于建议轮保状态。

3  结  论

通过对设备参数大数据的关联关系挖掘,更好地发现参数之间的关系,不预先确定参数进行设备健康的评价,更具有一定的客观性。建立了多特征参数健康状态评价模型,将参数的波动情况集中到整体设备的健康状态评价,并进行量化,进而判断设备的健康情况。从而更接近做到事前维修保养。对设备的维护保养更加精细,更有利于提高生产效率。

参考文献:

[1] 韦伟,戴文静. 基于改进TOPSIS法的健康评价模型研究[J]. 设备管理与维修,2021(13):17-19.

[2] 杨帆,邓一帆,李东东,等. 基于最优等级数的多维特征量开关柜健康状态评价方法[J]. 高电压技术,2020,46(11):3934-3942.

[3] 刘博元,王焕钢,范文慧,等. 基于大数据的复杂生产线系统健康度实时评估方法[J]. 清华大学学报(自然科学版),2014,54(10):1377-1383.

[4] 袁伟中,沈利,郑必君,等. 基于多维参数动态偏差的电厂设备健康评价方法[J]. 信息技术与信息化,2021(11):48-51.

[5] 赵丽琴,刘昶,易发胜. 基于动态权重的设备健康状态评估方法[J]. 计算机系统应用,2020,29(9):198-204.

[6] 李鑫,刘莹莹,李赣华,等. 基于模糊变权原理的卫星健康评估方法[J]. 系统工程与电子技术,2014,36(3):476-480.

[7] 刘文雅,徐永能. 基于改进Apriori算法的地铁故障关联规则挖掘[J]. 兵器装备工程学报,2021,42(12):210-215.

[8] 张彦如,耿梦晓. 基于健康指数的设备运行状态评价与预测[J]. 合肥工业大学学报(自然科学版),2015,38(10):1318-1323.

猜你喜欢
Apriori算法
基于模型的日志合理性分析评价指标
基于Hadoop平台的并行DHP数据分析方法
基于Apriori算法的高校学生成绩数据关联规则挖掘分析
基于云平台MapReduce的Apriori算法研究
关联规则挖掘Apriori算法的一种改进
基于RFID的汽车零件销售策略支持模型
关联规则在高校评教系统中的应用