李春霞 孟凡强
[摘 要] 为了挖掘采煤工作面安全监测数据潜在的价值,应用关联规则数据挖掘技术,构建基于大数据挖掘采煤工作面安全预警管理方法。该方法以工作面多源大数据为基礎,通过挖掘数据间关联关系,实现采煤工作面安全风险的识别与预警,并以山东某矿综采工作面安全监测数据为例,关联规则挖掘结果表明,采用关联规则挖掘的专家系统可对采煤工作面进行安全预警。
[关键词] 采煤工作面;安全预警;专家系统;关联规则;安全管理
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2020. 23. 053
[中图分类号] F270.7 [文献标识码] A [文章编号] 1673 - 0194(2020)23- 0129- 03
0 引 言
采煤工作面作为煤炭的主要生产场所,空间狭窄,环境复杂,设备多,作业人员集中,是一个复杂的社会技术系统[1]。应用系统工程分析方法,全面分析采煤工作面的风险因素,建立采煤工作面安全预警专家系统,可对风险进行预警。
1 一般专家系统
一般传统采煤工作面安全预警专家系统由知识库、数据库、推理机、解释器、知识获取系统与人机接口组成。知识库、推理机作为系统的核心,用来存储采煤安全专家经验知识和已知的事实、产生式规则等[2],系统结构如图1所示。
知识获取是构建知识库的核心,由于受领域专家知识或知识工程师技能局限性影响,所获取的知识存在不完整、片面性或者不准确问题,导致知识库构建过程中推理结论不准确[3]。
数据挖掘(Data Mining,DM)从大量的、不完全的、模糊的数据中,提取隐含的有价值的信息,是从数据中发现模式算法的最好方式[3]。为此,文章主要是研究将数据挖掘技术用于专家系统中,改善采煤工作面安全预警专家系统中的知识获取“瓶颈”问题[4],以便更好地实现采煤工作面安全预警管理。
2 采煤工作面安全预警多元数据源
采煤工作面安全预警需要对测量的参数进行选择和采集,直接测量的参数包括工作面环境参数,如瓦斯浓度、风速、风量、CO浓度等[5-6];此外,还有视频、维护维修管理等大量的非结构化数据[7]。
多元数据来源主要包括:
(1)初始数据库。包括采煤工作面各类知识清单及各项规章制度、资料、文件等。知识清单如采煤作业系统知识、运输系统知识、通风系统知识、供电系统知识、排水系统知识、辅助作业系统知识;顶板管理知识、瓦斯与粉尘治理知识、水灾防治知识、火灾危害知识、机电事故知识、运输事故知识以及放炮事故风险知识[5]。
(2)运行数据库。采煤工作面运行数据库由采煤工作面环境、设备运行、顶板压力等状态信息构成。如前所述,这些信息通过自动化监测传感器收集。
(3)管理数据库。包括工作面日常维护、维修以及相关的维护设备材料、事故处理和管理人员等数据[8]。管理人员数据主要包括维修人员的学历、专业水平、个人技能、工作年限、岗位职责等。
(4)其他相关数据库。与采煤工作面有关但还不能确认的相关联数据。
3 基于关联规则挖掘的采煤工作面安全预警专家系统
文章采用关联规则分析方法。
数据挖掘的技术路线是对工作面全部安全生产数据进行关联性深度挖掘[8],分别取得工作面正常工作模式对应的数据指标及工作面存在风险时对应的数据指标,将收集到的数据进行对比,从而对工作面安全状况作出预测判断。
3.1 数据预处理
海量数据的预处理是采煤工作面安全预警的一个重要步骤,一般包括结构化处理、数据清洗与集成、选择与变换[7,10]。
(1)结构化处理:工作面日常维护、维修以及相关的维护设备材料、事故处理和管理人员等数据多以文本形式存储,数据挖掘模型难以对这些非结构化信息直接处理,需要对这些文本进行结构化处理,形成结构化数据。
(2)数据清洗与集成:在收集到的原始数据通常存在大量的异常数据,如关键指标偏离期望值、关键属性信息缺失、错误类型数据等。采用平滑噪声数据、填补遗漏缺失数据、剔除异常数据进行处理,并将数据结构标准化处理。
(3)数据选择与变换:根据业务需求选择数据信息,然后进行数据格式化处理,统一编码,形成安全预警数据库,以备数据挖掘使用。
3.2 风险预警信息关联规则挖掘
设项集I={i1,i2,…,in};TR是事物的集合;TR?奂I,并且TR是一个{0,1}属性集合。设X是一个项集,且X?哿TR。关联规则是形如X?圯Y的蕴含式,其中X?哿I,Y?哿I,且X∩Y=φ,X—规则的条件(前件),Y—规则的结果(后件)[11]。
(1)支持度:关联规则对事物TR的支持度(support)定义为同时包含有事物X、Y的交易数与所有交易数之比,描述为:
support(XY)=P(X∪Y)(1)
反映了项集X、Y在事物集TR同时出现的概率。
(2)置信度:关联规则对事物TR的支持度(confidence)定义为包含有事物X、Y的交易数与包含X交易数之比,描述为:
confidence(X?圯Y)=P(X|Y)(2)
反映了数据集中出现项集X的同时又出现项集Y的条件概率。
关联规则的支持度和置信度分别反映了所发现规则的有用性和确定性,一般的用户可以定义两个闭值,分别为最小支持度阈值和最小置信度阈值。当挖掘出的关联规则的支持度和置信度都满足这两个闭值时,就可以认为这个规则是有效的,否则就是无效的规则[10]。
3.3 基于关联规则挖掘的专家系统
图2是按照上述方法构成的基于关联规则挖掘的专家系统。从结构上看,该系统同样包含知识库、推理机、解释器等传统专家系统所具有的功能模块,但二者实现方法有很大区别。数据挖掘专家系统的知识获取包括领域专家解决实际问题的案例、安全隐患历史数据等。经过挖掘算法学习训练后的数据,以数据挖掘模型的形式存在于专家系统中。在推理时,由诊断程序和控制知识自动完成整个诊断推理的流程,增强了工作面安全隐患诊断的“智能”性。当诊断完成后,解释系统给出推理的全过程。
4 应用实例
以山东某矿综采工作面安全监测数据为例,利用关联规则挖掘技术,挖掘不同工作时间段与監测数据之间的关联关系。根据该矿地质构造、赋存条件分析,影响工作面安全预警的因素主要是瓦斯、一氧化碳、通风、温度等。所有安全监测数据与重要操作事件参数均存入关系数据库。
截取2017年1-4月部分数据,原始资料如表1所示。
应用数据挖掘算法计算,并对瓦斯、一氧化碳、工作面温度关联规则进行可视化处理,如图3所示。由图可知,早6:00-8:00时间段内,工作面温度高,风速低。原因是该时间段为夜班、早班交接时,夜班工人正在升井,早班工人还没到岗,井下值班领导、安全人员没有到位,工作面无人监管,出现通风机停止或风门没关闭等现象,导致工作面通风不好,这样很可能会导致瓦斯等有害气体浓度升高,容易发生事故。
5 结 论
应用大数据挖掘技术的采煤工作面安全预警专家系统,构建采煤工作面安全预警方法,以工作面安全监测、安全管理数据为基础,通过挖掘数据间的关联关系,实现工作面安全风险的识别与预警,对预防煤矿事故的发生起到积极作用。
主要参考文献
[1]张志建.采煤工作面生产的安全管理与技术措施[J].内蒙古煤炭经济,2014(10):73.
[2]王文杰,叶世伟.人工智能原理与应用[M].北京:人民邮电出版社,2004.
[3]李雄飞,董元方,李军.数据挖掘与知识发现[M].北京:高等教育出版社,2010.
[4]邢平平,施鹏飞.农业专家系统中的数据挖掘及其应用[C]//第四届全国农业知识工程学术会议,1999-01-01.
[5]中国法制出版社.煤矿安全规程[M].2016年修订版.北京:中国法制出版社,2011.
[6]姜福兴.采煤工作面顶板控制设计及其专家系统[M].北京:煤炭工业出版社,2010.
[7]王新浩,罗云,李桐,等.基于大数据的特种设备宏观安全风险预警方法研究[J].中国安全生产科学技术,2018(4).
[8]赵丹,陈帅,潘竞涛.矿井监控预警诊断系统研究[J].中国安全科学学报,2015,25(4):63-69.
[9]程翔,甘拯.基于大数据挖掘的安全监测资料分析模型技术研究[J].低碳世界,2016(28):101-102.
[10]郭宇栋,李生林.大数据关键技术在基建营房综合管理系统中的应用[J].物流技术,2016,35(5):169-175.
[11]Bahn S. Workplace Hazard Identification and Management:The Case of an Underground Mining Operation[J].Safety Science, 2013,57(8):129-137.
[12]戴红,常子冠,于宁.数据挖掘导论[M].北京:清华大学出版社,2015.
[13]赵长明.智能分拣技术在公安应急物资仓储智能化建设中的运用[J].中国管理信息化,2020(9):187-188.