安 俊,王家玮
(陕西省特种设备检验检测研究院,陕西 西安710048)
随着中国经济的快速发展,电梯数量也在快速增加,电梯事故率居高不下,而且呈现出千奇百怪的发展趋势[1]。本文基于陕西特种设备检验检测研究院研发的电梯视频监控系统,引入使用单位、电梯厂家、电梯型号、实时时间、运行时间、运行位置、气温、维保单位、维保质量、维修部件、维修时间等参数,对比国内外先进的数据处理方法,寻找适合电梯数据处理的新方法,利用大数据管理解决电梯维保、检验、评估等一系列问题。如记录导靴、抱闸等运行次数及厂家型号,提醒维保人员及时更换导靴、抱闸等易损消耗件。
由于中国电梯管理模式不成熟,电梯的制造、维保等标准大多照搬国外发达资本主义国家,造成理论与实际脱节。如电梯市场恶意竞争,电梯维保质量无法有效保障;电梯不分新旧一月维保2次,能否保障老旧电梯安全运行;维保人员维修技术水平参差不齐,能否保障所换电梯配件符合电梯正常要求。如在西安某小区,维保人员将汽车抱闸安装在了电梯抱闸上,造成了人员的重大伤亡。诸如以上问题在实际维保中还有很多问题需要解决,中国也慢慢也意识到问题的复杂性与严重性,随即提出了电梯按需维保,但是怎么去按需维保,本文将提出一些新的看法与解决方案。
随着中国电梯台数的逐年增加,人机矛盾日益凸显,怎么去更好地检验,一直是人们关心的问题。在实际检验中,电梯检验人员不仅承担电梯检验工作,而且大多数也承担其他特种设备的检验检测工作,造成了在检验中的熟悉起重机机械的不一定熟悉电梯机械,熟悉起重机电路的不一定熟悉电梯电路等,即使电气、机械都非常的专业,熟悉三菱电梯公司某电梯型号的电气电路,未必熟悉日立电梯的电气电路,因此无法在规定时间内准确对电梯进行检验。基于以上问题,应该借助大数据,将电梯设计、制造、维保、检验等众多数据及参数引入到视频分析中,为检验提高更有效的参考依据。
使用单位作为电梯管理的第一负责人,对电梯的质量维护负有重大责任。在实际管理中,大多数物业管理人员缺乏相应的电梯管理知识,缺乏对市场竞争模式的了解,造成了部分物业公司只图维保合同价格,对维保公司平时的维保、维修缺乏有效监督,导致电梯管理形同虚设。在以往的物业管理中,物业往往是由于维保公司未能按照合同例行义务,造成事故后又去换另外一家,循环往复事故高发。维保可以更换,一旦出现事故,人的生命无法挽回,怎么去寻找好的维保公司、怎么去对电梯的有效的监控、怎么更有效地对电梯管理,将是后面分析的重要一部分。
电梯的数据分为4大部分,即整体外观数据、信号数据、外参数数据、电梯相关的其他参数。
整体外观数据包括电梯外观、声音、震动,可用本院研发的电梯视频监控装置采集[2]。
信号数据包括电梯主回路、控制回路、安全回路电流值,主板反馈的参数值等[3]。
外参数数据包括电梯的设计参数、零部件规格、使用说明、法律法规等。为了实时采集电梯信号,设置一套独立的客户端服务器,并配件相应的信号采集装置,收集电梯运行信号以及各个部件整体的外观视频信号。如在机房收集各个部件运行的电信号以及从视频传输过来的控制柜、曳引机、导轨、轿厢、限速器、安全钳、钢丝绳、缓冲器等图形信号[4]。在服务端服务器中建立数据库,利用爬虫技术收集电梯的法律法规、市场中常见的电梯的基本信息、市场中常见的电梯部件的基本信息,利用视频辅助系统记录电梯日常维护保养记录、维修记录、维保人员维修情况及使用单位人巡查情况等。
电梯相关的其他参数包括温度、湿度、纬度、海平面高度、电磁辐射强调、电梯使用强度、维保次数、维保质量、维保价格、维保公司、维保人员技能水平等能影响电梯运行质量的数据,这些都在采集范围内。
由于设备采集的数据存在误差或者个别数据由于测量仪器、方法错误导致测量结果与真实数据出入过大,因此就必须对数据进行预处理。数据预处理一般分为均值移除、范围缩放、归一化、二值化、标记编码等。
均值移除是指把每个特征的平均值移除,保证处理后的特征均值为0,且标准差为1,关注不同样本同一个特征的偏差。如一个两种品牌的产品动作平均次数都为1 000次,其中一种产品前半部分动作次数都为0,后面部分为2 000,另外一种产品刚好在平均值1 000上下波动,平均值也在1 000,这样利用均值移除的方法可以判断哪种产品是所需要的。
范围缩放是指将每个特征的最大值和最小值线性缩放到一个给定范围。如在比较产品好坏的时候,就不能用100万的蒂森电梯和20万的日立电梯做比较,而是分别找出100万的蒂森电梯和20万的日立电梯的使用寿命、舒适度、故障率等,找出它们之间的线性关系再进行比较。
归一化是指将每个样本的各个特征值按照一定的比例缩放到[0,1]区间,且该特征值的绝对值之和为1。这样单个样本在整体样本中的比重更加清楚,数据统计更加简洁。
二值化是指根据事先给定阈值,将样本矩阵中高于阈值的元素设置为1,否则设置为0,得到一个完全由1和0组成的二值矩阵。这样将所有样本置为0和1更有利于对数据进行筛选和过滤。独热编码是指用一个只包含一个1和若干个0的序列来表达每个特征值的编码方式,这样借此既保留了样本矩阵的所有细节,同时又得到一个只含有1和0的稀疏矩阵,既可以提高模型的容错性,同时还能节省内存空间。
标记编码是指样本的特征值如果已经是数字,则直接使用它们,如果是字符串,则可以通过标记编码得到与之对应的唯一数字,以方便后续处理。
数据分析就是利用自己已经建立好的各种数据模型,对需要进行处理的数据进行分析,提取所需要的信息。数据模型大致分为回归模型、分类模型、聚类模型、降维模型。
回归模型分一元线性回归、岭回归、决策树等来发现数据之间的线性关系。如电梯使用寿命与时间的关系、电梯安全系数与电梯速度和载重量的关系等,它们之间基本属于线性关系就可以选择回归问题的其中一种模型对数据进行预测。
分类模型又分人工分类、逻辑分类、朴素贝叶斯分类、决策树分类、支持向量机(SVM)分类。人工分类,即人可以直接分辨的分类方式,如电梯是否运行、报告是否合格等简单的分类。逻辑分类、朴素贝叶斯分类、决策树分类、支持向量机(SVM)分类由于数据过于复杂,人为已经无法对其分类,此时就要借助数据之间的逻辑关系、线性非线性关系对数据进行分类。如对电梯质量进行评价,就需要综合电梯厂家、型号、载重量、轿门数、用户评价、专家意见等信息对电梯进行评价,此时就需要借助以上方法,对所有参数特征值进行对比分析,综合给出电梯是好是坏。再如电梯使用率的统计,某公司的电梯07:00—08:00使用频率高,每月5日15:00电梯拥堵,周六周日16:00拥堵等,收集到以上信息后可以用以上方法对电梯拥堵时间进行预判,合理调配人员乘坐电梯。
聚类模型一般通过样本相似性算法、K均值算法、均值漂移算法、凝聚层次算法、轮廓系数对样本进行分类。
相似性算法即用两个样本对应特征值之差的平方和之平方根,即欧氏距离,来表示这两个样本的相似性。这种方法给出电梯的地图坐标位置就可以合理划分电梯的所在区域,让电梯的区域划分更加简便、清晰。
K均值算法即随机选择k个样本作为k个聚类的中心,计算每个样本到各个聚类中心的欧氏距离,将该样本分配到与之距离最近的聚类中心所在的类别中。这种方面可以应用在紧急救援中,如某电梯困人,此时系统自动以电梯为中心向电梯四周的维保人员发出救援信号,没有工作的维保人员就可以尽快赶到救援现场对被困人员进行救援。
均值漂移算法即首先假定样本空间中的每个聚类均服从某种已知的概率分布规则,然后用不同的概率密度函数拟合样本中的统计直方图,不断移动密度函数的中心(均值)的位置,直到获得最佳拟合效果为止。这些概率密度函数的峰值点就是聚类的中心,再根据每个样本距离各个中心的距离,选择最近聚类中心所属的类别作为该样本的类别。此类方法可以发现无规律的数据之间可能存在的分布方式,如正态分布、某三角函数分布、指数函数分布等。
凝聚层次算法即首先假定每个样本都是一个独立的聚类,如果统计出来的聚类数大于期望的聚类数,则从每个样本出发寻找离自己最近的另一个样本,与之聚集,形成更大的聚类,同时令总聚类数减少,不断重复以上过程,直到统计出来的聚类数达到期望值为止。此方法在确定被凝聚的样本时,除了以距离作为条件以外,还可以根据连续性来确定被聚集的样本,如在一定区域内,可以根据电梯的生产日期,将一部分电梯划分为重点区域的老旧电梯。
轮廓系数分类即同一个聚类内部的样本要足够密集,不同聚类之间样本要足够疏远。如在轿厢视频监控中,可以将采集的图像分为人、动物、物品、电动车等,当发现电动车进入轿厢时可设置报警装置。
降维模型一般应用在语音识别、人脸识别、机器视觉、摄影测量、遥感技术等领域。语音识别即通过记录震动位移关于时间的函数,通过傅里叶变换,可以将时间域的声音函数分解为一系列不同频率的正弦函数的叠加,通过频率谱线的特殊分布,建立音频内容和文本的对应关系,以此作为模型训练的基础,利用此技术可以发现电梯曳引机、曳引轮、限速器、钢丝绳等重要部件异常响声,及时通知相关人员对电梯进行维修。人脸识别、机器视觉及其摄影测量与遥感技术是利用摄影机和电脑替代人眼对目标进行识别、跟踪和测量,通过对采集的图形或视频进行处理以获得相应场景的三维信息,即三维重建,并实现了深度学习功能[5]。其在应用机器人、城市地图、智能交通和自动驾驶汽车中都有广泛的应用。利用机器的深度学习功能以及测绘遥感技术,通过人脸识别技术将传输的电梯的电信号以及视频信号进行处理分析并给出结论。如在对控制柜检测过程中,可以将信号传输来的控制柜图片以及井道布置图、机房布置图、电气安装图等进行收集,再利用人脸识别技术结合测绘遥感技术分析控制柜布置、线路布置、插件安装等是否正确。在处理的过程中,如果遇见新型号的电梯或者部件,系统可以利用自身的深度学习功能,从云端下载相关的资料,结合大数据分析以及自己的数据库,对电梯进行综合判定。
大数据分析一般可以解决4类问题,即回归问题、分类问题、聚类问题、降维问题。
回归问题:由已知的分布于连续域中的输入和输出,通过不断地模型训练,找到输入和输出之间的联系,通常这种联系可以通过一个函数方程被形式化,如y=w0+w1x+w2x2…,当提供未知输出的输入时,就可以根据以上函数方程,预测出与之对应的连续域输出。通过这种方法,可以解决一般的使用寿命问题,如零部件在不同使用环境、使用强度下的疲劳强度问题,为提醒客户更换零件及对电梯的寿命评估提出指导意见。
分类问题:如果将回归问题中的输出从连续域变为离散域,那么该问题就是一个分类问题。这样可以通过视频采集的数据结合前面数据库中设计文件、设计标准、法律法规,初步给出电梯设计是否合理、更换的零件是否与电梯匹配、维保是否按照规则制度进行维保等。
聚类问题:从已知的输入中寻找某种模式,比如相似性,根据该模式将输入划分为不同的集群,并对新的输入应用同样的划分方式,以确定其归属的集群。这类方法可以将看似不相关的参数联系起来,寻找不同参数之间的关联。如空气温度、湿度过大,导致电梯死机、门锁短路的概率,维保质量与每月维保时间、维保次数之间的关系等,当参数数量不断增加,人力已将无法预判事件发展趋势的时候,计算机会通过此类方法给出相应的预判及参考意见。比如某段时间电梯使用频率过高、空气湿度过大、维保人员检查力度不足、电梯零部件处在正常使用的临界点等,系统会通过维保价格、维保次数、维保记录、维保公司人员的文化技能水平、维保公司的管理模式等给出物业公司相应的指导意见,如要求维保公司加强相应的维保或更换维保公司等建议[6]。
降维问题:从大量的特征中选择那些对模型预测最关键的少量特征,以降低输入样本的维度,提高模型的性能。此种方法主要针对自己关心的问题,如日立电梯公司的电梯电路是否设计合理,计算机可以过滤其他公司的电梯电路,对照日立公司以往成熟的电路图纸,找出对应更改部分的电路,参考国家的电路设计原则迅速给出相应的指导意见。再如电梯检验,不同年限、不同电梯的检验情况肯定不同,如何判定电梯是否合格,制造单位和检验单位也肯定不相同,这就需要通过模型过滤掉多余的部分,如检验单位更关心电梯的法律、法规、技术标准,对电梯产品所用工艺、材料正确性资料确认符合即可。
本文通过陕西省特种设备检验检测研究院研发的电梯视频监控装置,结合大数据分析,展望后期的电梯视频及数据的分析方法,为视频监控及计算机进一步的辅助电梯检验、检测及使用、维保单位提供了粗浅的方案。