郭 淼 潘 锋 李 斌 欧阳惠卿 王 博 王会方
(1.中国合格评定国家认可中心 北京 100062)
(2.上海市特种设备监督检验技术研究院 上海 200062)
(3.南京市特种设备安全监督检验研究院 南京 210000)
截至2022 年底,全国电梯总量已达964.46 万台[1],我国是全球电梯保有量最多的国家。电梯检验检测机构、型式试验机构作为电梯制造、安装、维保质量的技术检验机构,对确保电梯安全、减少电梯事故、服务政府监管发挥着重要作用。
2021 年2 月24 日,市场监管总局发布《市场监管总局关于同意开展电梯智慧监管试点的批复》(国市监特设函〔2021〕72 号)文件,批复上海市、南京市、杭州市、广州市市场监管部门按照相应试点方案开展电梯智慧监管试点,电梯的监管模式逐渐向智慧化方式转换,其中,基于大数据的电梯检验检测活动也成为智慧监管的重要内容之一。
从事电梯相关检验检测活动的机构主要包括型式试验机构、电梯综合性检验机构和电梯检测机构。截至2022 年底,共有7 家电梯型式试验机构。全国共有特种设备综合性检验机构568 个,其中,系统内检验机构278 个,行业和企业自检机构190 个,电梯检测机构59 个。各省、市和自治区均由省级特种设备检验机构从事电梯的监督检验,除西藏等省份以外绝大部分地级市均由当地地市级特种设备检验机构或者省级特种设备检验机构的地市级分支机构从事电梯的监督检验。电梯定期检验通常由取得电梯监督检验资格的综合性检验机构进行,但部分行业也成立了对其所使用的电梯进行定期检验的自检机构。近几年,随着电梯检验检测工作改革,也有部分第三方检测机构承担电梯的检测工作。
截至2021 年4 月,共有164 家电梯有关实验室获得CNAS 认可,上述7 家电梯型式试验机构均获得了CNAS 实验室认可;另外共有31 家电梯有关检验机构获得了CNAS 检验机构认可,其中20 家是从事电梯监督检验和定期检验的综合性检验机构,其余11 家为电梯建筑结构、矿用电梯、消防员电梯的检验机构。
电梯数据表主要包括基本信息、检验信息、维保信息、运行信息、故障信息、事故信息、使用管理信息、改造修理信息等数据表[2]。将数据表规范与特种设备检验管理信息系统数据库中的表名及字段名进行了一一对应,对特种设备检验管理信息系统的数据进行了筛选。在故障数据采集中,对数据表规范进行了微调和补充;实现了企业故障编码规则、物联网故障编码规则、大数据故障数据表规范三者之间的转换与统一。
本文研究的电梯全生命周期大数据库包含超过10万台(套)电梯的设备基本信息、历史检验信息以及约11 万条电梯故障数据,具有共享性、统一性、可靠性和动态性特征需求。通过数据库的物理结构设计、内容设计、功能模块设计、数据库信息语言编辑以及数据库的存储备份物理结构设计等,开展数据库建设。
传统的大数据分析往往只关注某一个环节,无法将电梯的生产(包括制造及维保)、检验和使用多个环节串联起来进行数据挖掘和分析,单个环节的脱节数据采集将导致后期无法有效地预测。本文采集电梯的生产(包括制造及维保)、检验和使用等全生命周期的数据,对海量的多源异构数据进行不同方式的采集和提取,对结构化和非结构化数据进行不同方式的处理和存储,实现了电梯全生命周期各环节数据的采集,并对电梯故障数据进行分析。
随着电梯相关企业信息化水平和质量管理水平的不断提升,电梯相关主体包括制造单位、维保单位、使用单位和检验单位都将其作业过程和管理流程通过数据形式予以记录,制造和维保单位还将电梯的运行状态和故障等信息进行实时物联网采集,产生了大量的数据信息,为行业的数据分析和挖掘提供了丰富的数据基础。从目前行业现状看,数据来源有以下几方面:制造数据、维保数据、使用数据、检验数据、检测数据和监管数据等。
这些数据从形式上看,包括结构化和非结构化数据;从数据的实时性来看,包括实时数据、准实时数据和静态数据。
结构化数据主要是行业内各种信息化系统中,通过关系型数据库进行存储的数据,目前制造单位的ERP 系统、维保管理系统、检验管理系统和监察系统等系统中,形成了大量的以设备唯一编码(包括设备代码和注册代码等)为主键的关系型数据库,包括了设备的基本信息、主机及部件的参数信息、相关单位信息等静态信息和安装记录信息、维保记录信息、检验记录信息、监管记录信息等准动态信息。
非结构化数据主要是随着信息化系统的建设和完善而补录原始记录的图片和随着新规则要求而对作业现场和过程进行图像和音视频记录的数据,这些数据无法通过关系数据库直接获取有效信息,需要经过二次处理后进行类结构化处理。主要包括纸质维保记录、检验记录、检验机构的催检单、检验机构与使用单位的检验告知单等纸质信息录入的数据、现场维保和检验的音视频信息,word、excel 等文档记录信息。
从数据的实时性来看。设备初始化的数据均为静态数据,包括设备的基本信息、主机及部件的参数信息、相关单位信息等静态信息。设备在运行过程中产生的作业信息一般定期或不定期更新,例如维保记录半月1 次,检验记录1 年1 次,监督检查记录不定期更新等,这些数据的历史数据保持一定周期,按频率更新相应的数据,是一种准实时信息。对电梯运行状态和故障进行实时检测的物联网信息则是一种动态信息,数据更新频率高,除一些重要信息外(例如故障记录等)保存周期较少。
●2.4.1 数据采集架构
考虑到数据的不同来源、不同形式、不同分析要求,采用不同的数据采集方式。图1 给出了数据采集的框架。
图1 多源异构数据的采集框架
数据来源主要包括使用数据、维保数据、检验数据、监管数据、制造数据。每种数据均有不同的载体形式。由于使用单位的信息化系统建设较晚,很多关于电梯的数据均是通过纸质记录和照片等记录形式保存。较多的维保单位针对电梯运行和维护保养开展了信息化系统建设,同时也保留了大量的现场维保记录,这些记录也是通过纸质和图片的形式保存。对于维保的设备、人员和机构等管理、部分维保单位的维保过程管理等采用信息化系统,形成了维保数据库。检验机构和监管部门较早地建立和应用了信息化系统,形成了较为完善的检验数据库和监察数据库。
●2.4.2 SQL 脚本提取和XML 格式转换的传输方式
对于形成结构化数据库的制造、维保、检验和监察数据等,可以通过SQL 脚本提取的方式进行访问传输,目前已经有非常成熟的数据交换机制,考虑到不同数据库的转换,一般采用支撑跨平台、跨数据库的JSON 语言实现。对于如word、excel 文档等具有一定编码格式的电子文本信息,通过XML 转换,形成统一的编码格式和展示形式,也可以进行较好的数据交换和传输。
●2.4.3 手动录入及转换方式
对于如纸质的生产日志、维保记录、使用记录等和现场工作图片、音视频等信息,则是一种非结构化数据,需要人工录入,通过计算机识别转换为可识别格式的数据,再进行编码和传输处理。
●2.4.4 物联网数据
对于维保单位和制造单位,通过电梯物联网监测手段,实现对电梯的运行状态和故障信息进行检测,检测的数据也是通过固定的格式传输至制造及维保单位的数据库平台,这些数据实时性较强,结构化较好。
●2.5.1 数据处理
在利用大数据进行数据分析的过程中,会出现很多不符合要求的数据,例如重复录入、错误录入、部分信息缺失以及异常数据等[3]。数据预处理主要是将原始输入数据中的无关数据进行删除,包括一些重复数据和平滑噪声数据等,同时筛选掉与后期数据建模无关的无效数据,以及处理原始输入数据中的缺失值和异常值等。本文主要采用Python 进行数据预处理。
1)缺失值处理。在数据预处理过程中,往往会碰到电梯制造、维保、检验、评估数据的缺失问题。缺失值是数据预处理阶段比较常见的问题。在进行数据分析前,需要了解数据的缺失情况,需要根据具体的实际情况来处理缺失值。例如,在电梯基础数据中电梯的地理信息会存在很大的缺失值,一般是利用地图软件的API 提供的地理/逆地理编码功能,补全和完善相关信息。
2)重复值处理。在数据的采集过程中,由于数据来源多样化,录入和数据的整合可能产生重复数据,采用删除处理。例如,在电梯基础数据录入和传输后,因中文字符编码的问题,出现某某电梯(中国)有限公司,受半角和全角等影响,呈现出数据的不同,需要进行统一化处理。
3)异常值处理。在数据预处理过程中,数据中有时会出现一个或几个数值与其他数值的差异比较大,称之为异常值,会对后期的数据模型造成干扰,导致建模结果差异较大,需要根据实际情况来判断删除或用其他值替换。例如,电梯速度明显大于10 m/s,这些需要通过遍历查找出异常值,然后根据规则进行调整。
●2.5.2 数据分析
数据分析是利用现代统计技术和大数据分析技术,对数据和物理机理对应的关系进行深入分析或对数据与数据之间的关联关系进行挖掘,以找出相应的关系。常用的分析方式有两大类:多元统计分析和数据挖掘方法。
1)多元统计分析包括:(1)因子分析。通过分析确认变量的共线性,提取共性因子,例如,在电梯中,分析多个数据项对电梯故障的影响,寻找影响电梯故障的影响因子。(2)回归分析。确定不同变量之间的影响程度和依赖程度的分析方法,例如,在电梯数据中,分析不同故障类型之间的依赖关系,寻找故障背后的机理。(3)离散分析。通过测量数据分散程度的方法来评估数据的一致性,例如,对品牌电梯的故障数据进行分析,寻找品牌故障的离散程度,离散程度越高,越能体现故障的不均一性。
2)数据挖掘方法包括:(1)聚类分析。大数据分析技术本质就是一种分类技术,聚类分析是通过挖掘数据中的电梯对象及各个属性数据的关系的信息,将电梯数据进行分组,常用的分析方法是K 均值聚类。(2)分类分析。与聚类分析不同,分类分析需要预定义类别,一般通过人工标注的分类训练库进行自动分类定义,对于电梯故障类别可以通过这种方式实现。(3)关联分析。即找出电梯不同属性之间的关联,例如,对于电梯故障的多种影响因素,通过数据分析得到关联关系和各影响因素的关联影响因子。
电梯在用量持续稳定增长,故障时有发生,产生各种安全隐患。本文电梯实验数据库中存储了约10 万台(套)电梯设备基本信息、历史检验信息以及约11 万条电梯故障数据。笔者在对以上数据进行清洗和预处理之后,针对有效数据,进行了层门系统故障、停梯故障、电气控制系统故障及其他典型故障分析,根据故障产生的原因,阐述了一些建议和措施,为消除安全隐患提供帮助。
在所有的电梯故障中,电梯门系统故障约占70%。主要情况见表1。
表1 总故障汇总表
电梯异常停梯是影响乘客最直观感受的主要故障之一,也是造成电梯“关人”的重要原因。通过对上述110 629 条故障信息的分析,其中停梯相关故障共有4 390 条,占3.968 2%,造成电梯非正常停梯的故障类型见表2。
表2 停梯故障类型
由表2 可知,按照故障数据显示,非平层停梯报警故障占40.41%,非平层停梯故障占0.25%,非正常停梯占2.18%。对于非平层停梯,主要由于平层感应器、旋转编码器等楼层识别装置以及层门、轿厢和电气安全装置等出现故障。
由表2 可知,故障统计数据中的制动器故障中,制动器铁芯卡阻占56.68%,制动器铁芯磨损占0.05%,制动器闸瓦磨损占0.07%,抱闸检测开关故障占0.11%,抱闸接触器故障占0.25%。制动器铁芯卡阻占比相对较高,考虑到故障检测的错误概率,这些铁芯卡阻的故障现象很多是因为检测开关故障,因此这2 个故障比例有待进一步验证。基于如上数据,在平时维护保养中,要重点针对制动器开展检查,必要时要进行相关的功能试验。
电气控制系统发生故障也是电梯整机设备故障的主要原因之一。经过对本文所述的11 万条数据分析,直接由控制系统导致的整机故障有2 331 次,电气控制系统故障往往导致电梯无法运行,电气控制系统的主要故障有继电器故障、变频器故障等,见表3。
表3 电梯电气和控制系统故障类型
电梯召唤系统和轿厢是乘客最直接接触的电梯部件,在11 万条故障数据中,召唤系统故障337 起,占0.304 6%;轿厢系统故障10 486 起,故障率为9.478 5%;异响故障109 起,故障率为0.098 5%。
呼梯按钮是电梯整机部件中使用次数最多的零部件。通过对故障数据的分析,其中共发生337 次召唤系统故障,见表4,其中楼层按钮损坏占比最大,尤其是1 层按钮和关门按钮,其他按钮故障主要表现为某个楼层按钮灯不亮,按钮不灵敏、松动等;其次占比最大的是显示故障[4]。
表4 召唤系统故障类型
轿厢系统故障主要表现为轿厢在开锁区域外停止、轿厢意外移动、轿厢照明失效、乘梯危险行为。轿厢在开锁区域外停止故障占比最大,占轿厢系统故障的93.24%。
本文研究分析了电梯相关机构认可现状,对采集的11 万条电梯故障数据通过大数据方法进行了预处理,并基于电梯物理知识对这些故障类型和原因进行了进一步分析,并给出了一些针对性的预防措施。通过智慧电梯建设,提升监管效能,将是电梯行业发展的趋势。本文在智慧电梯的大数据方面做出了初步探索,有以下思考:
1)目前智慧监管技术在电梯中的应用主要体现在多源异构数据感知及获取、数据分析方法研究和电梯智慧监管平台应用等方面,其中数据感知及获取是基础,数据分析方法是应用支撑,平台是智慧监管技术的最终应用形式。
2)在电梯运行数据感知及获取方面,已经有了较为成熟的开关量获取方式和应用,但运行状态的模拟量的感知和监测还处于试验研究阶段,较少在实际的监控中得到应用。
3)在电梯业务数据获取及应用方面,已经有了较多的业务应用系统,但数据的有效富集和整合还有待进一步加强。同时也缺乏对电梯应用的日志、文本、表格、图片、视频等数据结构化抽取和统一表示方法,尤其缺乏对电梯多源异构、超高维、不完全数据的多维知识提取、图谱构建等大数据分析基础理论与方法研究,难以解决多源复杂数据的有效挖掘难题。