罗昌俊, 郑 娟, 马永一, 王小飞, 杜有翔
(中国空气动力研究与发展中心 计算空气动力研究所,四川 绵阳 621000)
风洞群中低速、高速、超高速风洞试验所需的动力资源包括纯水、电力、高压空气、中压空气、高真空、低真空、氢气、氧气、氮气等[1],而风洞群动力资源的集中保障依赖于动力资源生产、存储、配送相关的设备,阀门、罐群和管线等系统(以下统称“动力系统”)。动力系统是风洞群试验的“引擎”,其运行效率和稳定性直接关系到风洞试验能否顺利开展。系统具有分布分散、结构复杂、集成度高、保障任务重的特点,当前对于设备性能分析、故障预判、维修策略建议、危险源监测等主要采用人工检查和故障后维修方式,缺乏必要的手段对设备故障进行自动化预警,难以实现自动化、规范化的维修经验和知识的积累。目前,国内很多大中型工业行业均采用了针对设备检修的故障管理系统[2-5],但缺乏对于设备健康状况的评估和故障的自动预判[6-7]。为此,需要通过开展动力系统信息化建设,引入信息物理系统(Cyber-Physical System,CPS)思想,构建覆盖“状态感知、实时分析、科学决策和精确执行”[8]4个环节的全闭环保障体系架构,以维修/保养工单为中心,形成一体化的动力系统综合保障方案,提升风洞群动力系统的运行保障效率,满足型号气动试验的动力保障需求。
以人工智能AI、区块链Block Chain、云计算Cloud Computing、大数据Big Data、边缘计算Edge Computing、物联网IoT为代表的信息技术高速发展,推动了CPS技术体系的出现,成为国内外工业经济发展的新增长极。
CPS这一概念是2006年由美国科学家Helen Gill在美国国家科学基金会上提出的。由于领域和着眼点的不同,研究人员对CPS信息物理系统这一概念包括中文翻译都有着不同的理解,但都体现了数据从采集、传输、存储、分析到应用的全过程,是贯穿全链路的高度数字化、网络化、智能化的融合,是信息化3.0时代的重要特征。
《信息物理系统白皮书》给出的定义:CPS通过集成先进的感知、计算、通信、控制等信息技术和自动控制技术,构建了物理空间与信息空间中人、机、物、环境、信息等要素相互映射、适时交互、高效协同的复杂系统,实现系统内资源配置和运行的按需响应、快速迭代、动态优化[8]。
CPS的关键环节包括4个循环往复的环节,如图1所示,即状态感知、实时分析、科学决策和精确执行,同时系统执行的结果又重新被感知,从而进入新一轮循环。
图1 CPS数据闭环图
在状态感知环节,将物理空间中的隐形数据经过状态感知形成显性数据,并传递到信息空间,为后续的实时分析提供数据来源;在实时分析环节,利用聚类分析、机器学习、专家系统等相关数据处理分析技术对显性数据进行再加工,挖掘其内在的关系,成为可认知的信息;在科学决策阶段,对直观的可理解信息进行综合,根据对现实的评估和对未来的预测,作出最佳的决策;在精确执行阶段,将信息空间的决策转化为物理空间中实体装备的可执行的命令,以数据的形式作用于实体装备上,真正实现科学决策。
单元级CPS是CPS层级结构中最小的、不可分割的基本单元,单元级CPS的实质是通过物理硬件、自身嵌入式软件及通信模块对物理实体进行状态感知、计算分析、科学决策并最终控制该物理实体,从而构建最基本的数据自动流动的闭环,实现了物理世界(实体)和信息世界(虚体)的交互。
图2给出了装备故障诊断与健康单元级CPS体系架构,主要包括物理装置和信息壳。物理实体包括设备、人和传感器、执行器以及其与外部交互的接口,是物理过程的实际操作部分。传感器用于监测、感知物理实体的信号、状态;执行器实施对决策的反馈响应;信息壳主要包括感知、计算、控制和通信等功能。动力设备的本地监控系统软件可类比为信息壳,通过监控系统可以进行设备使用情况日志采集、分析与控制,同时通过与中心管理系统通信,实现数据的传递。
图2 单元级CPS体系架构
一体化保障系统要实现对动力系统的精确保障,要解决动力设备何时修(合理确定维修时机)、如何修(快速进行故障诊断和维修方案的制定与生成)、精益修(合理安排人员和备件)的“三修”问题,而这些需求正是CPS系统状态感知、实时分析、科学决策和精确执行的核心功能,基于这一认识,本文开展了基于CPS的风洞群动力系统一体化保障研究。
遵循CPS数据流动和实体虚体交互的核心理念,开展风洞群动力系统的一体化保障体系架构设计,主要思路如下:① 实时获取动力设备现场运行数据,评估设备运行状态;② 进行数据的实时分析,对故障进行预判和定位;③ 科学地制订维修维护策略;④ 通过信息化辅助手段,支撑现场精确执行维修维护;⑤ 实现物理空间到网络空间的转换,将现场的维修维护经验积累为知识(规则表、事实表和故障表),对设备故障模型进行不断迭代,并对下一次故障处理进行指导。
风洞群动力系统一体化保障系统主要数据流程概述如图3所示。
图3 风洞群动力系统一体化保障主要流程
① 状态监测与CPS数据上传分系统实时监测设备测点实时数据和历史数据,基于健康诊断规则得出设备健康状态。
② 设备健康管理与维修分系统向设备信息管理分系统发送设备运行记录、故障记录、保养记录、巡检记录,形成设备履历信息,便于用户查询;并发送备件需求清单给设备信息管理分系统,便于合理安排出库计划。
③ 当状态监测发出设备报警后,在风洞群动力系统一体化保障系统中,通过人机交互方式获取知识库中的故障知识库和诊断规则,定位故障原因;当生成维修工单时,会自动获取该分系统维修知识库中维修内容、工具、工时、工种等信息,并获取设备信息管理分系统备件库存量和工机具信息,为制定维修方案提供数据支撑,以实现CPS系统实时分析、科学决策的核心功能。
④ 设备健康管理与维修效果评估模块获取现场维修记录、运行状态等数据,进行量化统计分析,同时将统计分析结果发送给维修知识库,使维修知识库不断更新,实现设备故障模型的不断迭代。
⑤ 风洞群动力系统一体化保障系统支持向便携式维修辅助终端发送维修工单、保养工单、巡检工单,同时可接收便携式维修辅助终端上的维修记录、保养记录、巡检记录,以支持形成CPS的数据闭环。
风洞群动力系统一体化保障系统包括6大功能模块,分别为设备健康评估模块、故障诊断模块、维修维护模块、维修效果评估模块、设备健康管理知识库和便携式维修辅助终端,每个模块又包括若干子模块,具体组成如图4所示。
图4 风洞群动力系统一体化保障系统功能模块
状态监测与CPS数据上传分系统主要负责水、电、气等动力系统本地监控系统中数据的采集、传输和存储,为整个CPS信息系统提供数据服务。
风洞群动力系统一体化保障系统终端数据上行传输路径如图5所示。
图5 终端数据上行数据流设计
设备健康管理数据分为两类:振动量数据和工艺量数据,其中振动量数据由数据器采集振动传感器数据后发送至装置级中间件处理,并通过数据同步助手发送至中心级;工艺量数据由动力系统已有的相应传感器及PLC进行采集并经通信PLC发送至OPCServer,然后OPCServer对外提供OPC协议数据,经OPC客户端进行读取转发。氢气系统由本地测控系统WinCC提供OPC协议数据。
设备健康状态评估根据传感器测量的数据、故障和运行历史数据等进行综合分析,利用评估算法对设备健康状态进行评估,并对设备部件剩余寿命进行预测,包括实时预测与报警和设备健康状态统计分析两个子模块。状态评估阈值设定如图6所示。
图6 状态评估阈值设定
(1)动态阈值报警。
通过对设备在不同负荷下的振动和工艺量参数进行自动学习,针对监测设备在某一特定负荷下的振动和工艺量参数特征,完成智能动态阈值报警。
(2)智能快变报警。
在一定时间内,某一参数(如振动等)出现一定幅度变化,及时报警。当出现报警情况,一旦被判定为关键数据,系统自动加密数据保存间隔。
(3)具备筛选或减少反复穿越引起的误报功能。
具备报警事件识别功能,防止针对同一报警事件进行重复报警。
防止反复穿越技术是在定值报警基础上做出的优化。定值报警:通过系统设置报警方式后,正常未报警设备中任意一个测点超过报警线,设备报警,设备处于报警状态时,根据报警时间长短,开始密集保存,之后保存间隔加长。反复穿越报警,但总体平稳时,设备报警只有一次。反复报警的测点,只有报警值比上一次报警值大15%以上时,设备才再次产生新的报警事件。
故障诊断的本质是专家系统,其基本的技术架构通常包括设备结构树、故障状态数据库、诊断知识库、诊断推理机和人机交互界面或接口。通过对设备结构的分解、设备参数的分析、故障现象的研究和历史故障与维修数据的梳理,利用已有的理论知识和专家经验,通过数学模型的定量分析和历史数据的对比分析进行故障点的定位。
如图7所示,故障诊断专家系统的架构主要包括故障特征自动获取模块、故障推理模块、人机交互模块、案例库模块等部分。
图7 故障诊断专家系统的架构
故障推理模块包含知识库(规则库、事实表和故障表)和规则推理引擎。知识库是专家系统的核心,是以机组诊断经验为基础,将专家经验形象化,建立常见故障表、故障特征事实表、故障推理规则表,并结合现场不断更新的故障案例,丰富完善已有的知识库;故障推理引擎是故障诊断专家系统的关键,规则推理过程通过模式匹配完成,由已获得的故障特征匹配事实表中的相应事实属性,最终推出基于该事实的结论。规则表和事实表可通过经验数据进行积累,这也反映了CPS能够不断自我完善的思想。
经故障诊断确定故障源,发出维修请求后,系统会自动生成维修工单,触发维修请求,这时系统会自动调用设备健康管理知识库中关于该故障的维修信息,包括维修内容、维修工种、维修工时、所需备件,系统会自动关联设备信息管理中该备件的库存余量,形成维修方案;同时,将所需备件清单发送给库管,作为维修人员领取备件的依据,然后进行维修活动的调度和维修任务的执行,最终完成完工确认,并填写维修记录,为维修效果评估提供数据源。
维修维护主要包括维修工单(图8、图9)、维护保养(图10)和巡检日志(图11)3部分功能模块。
图8 申请维修工单样例图
图9 工单跟踪示例
图10 上传到系统中的保养记录示例
图11 上传到系统中的巡检记录示例
主要的设计方法和过程如下。
(1) 维修方式的确定。
维修方式的确定可以通过对设备进行故障模式及影响分析(即FMEA)或以可靠性为中心的维修分析(RCM)等技术手段,从安全、环境、经济性等多方面进行评估,确定设备的重要度,从而确定设备的维修方式,一般关键设备建议采用状态维修和定期维修结合的方式,重要设备采取定期维修方式,一般设备可采取事后维修结合的方式。
(2) 维修方案的确定。
当生成维修工单时,系统会优先自动获取设备健康管理知识库中与本次故障相关的维修方案,如检修内容、所需备件、工具、工种、建议维修公式,同时从设备信息管理-库存管理中自动获取所需备件的库存信息等;如果设备健康管理知识库中没有与本次故障相关的维修方案,则需要人工录入。
(3) 精确保障。
综合考虑备件/工具存量和人员负荷等因素,实现保障物资的“按需供给”和“主动配备”。
备件/工具调度:当维修工单中所需备件/工具确定后,系统会自动将所需的备件/工具清单推送给库房管理员,如果满足要求,维修人员按照清单领取备件/工具;如果不满足要求,库房管理员根据系统提示缺货信息申请采购,进入采购流程;当仓库补货后,再通知维修人员领取。
人员调度:维修方案中给出维修工种需求,调度人员直接将维修任务发送给维修单位负责人,由其根据实际在岗人员和负荷进行任务安排。
维修效果评估主要是通过建立关键指标体系,以及指标体系与业务数据之间的关系,对各类数据进行统计分析与提炼,向各级业务领导提供决策支持报表及分析图表,便于实时了解设备健康状况和维修绩效水平。
(1) 故障统计。
根据不同分类进行故障统计,可按照设备类型、原因归类等进行统计。
(2) 维修费用统计。
对设备维修费用进行统计,按照时间进行查询,可导出。可按照外委费用和单位内部维修费用占用比进行统计。
(3) 维修时间统计。
便携式维修辅助终端提供IETM辅助、动力设备维修保养、现场巡检等功能,包括PMA现场巡检终端和IETM终端两种类型,以信息化辅助手段,支撑动力系统现场维修维护策略人机融合的精确执行。
系统以IETM数据系统为基础,将其作为便携式辅助维修终端PMA的系统服务;同时与健康管理分系统PHM、设备信息管理分系统、仓库管理分系统进行集成;PHM系统实现故障诊断和维修工单下发;设备信息管理系统提供设备全寿命周期的动态履历;仓库系统提供备品备件的精细化和规范化管理;IETM数据系统为最终用户提供一个无纸化、向导型的交互式信息化保障环境;PMA负责维修任务的接受、执行与记录,IETM手册的浏览查询。
(1) PMA巡检终端。
主要用于现场巡检时便携应用,包括开机巡检和运行巡检。采用带5~7 in电容式触摸屏幕的手持式设备,便于携带和单手操作,具有较强的防震、防水、防尘等防护措施及较长的移动续航时间(连续使用不低于6 h),采用带有OTG功能的USB网卡实现接入。USB网卡通过交换机与现场工作机连接,再通过工作机访问应用服务器,进行数据交换。
PMA终端将部署便携式维修终端程序,包括IETM浏览模块、维修工单管理模块、巡检工单管理模块、设备履历管理模块、设备二维码识别模块等。
PC端部署数据交换程序,用于同步设备健康管理下发的工单到PMA终端和上传巡检、维修和保养结果。
PMA终端开机巡检功能通过新增开机巡检任务,保存巡检记录表,上传巡检报告完成巡检操作;运行巡检功能通过获取巡检规则,根据开启设备与巡检规则,进行半点、整点任务巡检,提交巡检报告,完成巡检操作,如图12所示。
图12 PMA终端-维修保养工单
(2) IETM终端。
IETM终端不仅具有PMA终端的全部功能,还安装了交互式电子手册(IETM),可实现离线资料查询及维护检修辅助,如图13所示。
图13 IETM终端-现场IETM浏览
设备健康管理知识库主要是建立故障诊断模型库、维修规则库、维修方案库、设备健康与维修关键指标体系等,并在数据积累中对过程进行不断优化,为持续提升设备的精确保障能力提供技术和数据支撑。
故障推理模块包含知识库(规则表、事实表和故障表)和规则推理引擎。知识库是专家系统的核心,以机组诊断经验为基础,将专家经验形象化,建立常见故障表、故障特征事实表、故障推理规则表,并结合现场不断更新的故障案例,丰富完善已有的知识库。规则推理引擎是故障诊断专家系统的关键,规则推理过程通过模式匹配完成,由已获得的故障特征匹配事实表中的相应事实属性最终推出基于该事实的结论。规则表与事实表可通过经验数据累积进行丰富。目前专家系统内置40个故障诊断规则,主要涉及离心式压缩机、罗茨真空泵、活塞机、螺杆式压缩机、干燥器等设备。
前端故障诊断规则文件采用Drools格式。规则文件按照规则引擎的规范和语法,记录处理逻辑和操作,并按引擎的算法来触发符合规则的故障处理,支持对故障诊断规则的前端在线编辑与更新;同时支持故障诊断逻辑图(JPG或PNG格式)的上传或下载,便于用户修改诊断逻辑或阈值,如图14、图15所示。
图14 故障诊断逻辑图示例
图15 故障诊断规则文件
风洞群动力系统一体化保障系统接收状态感知与监测管理模块采集的设备状态信息,进行必要的信号处理和特征提取后,基于建立的设备健康诊断规则定性诊断或定量识别设备当前的健康状况,并进一步预测设备状态趋势及剩余寿命;如果设备的健康状况达到需要维修的临界值,将利用诊断工具进行故障点定位并制定维修方案,生成维修工单与计划,同时触发维修请求,然后进行维修活动的调度与维修过程的准备和执行监督,最终完成完工确认和维修后效果评估。该模块在运行过程中需要不断积累任务数据,持续更新各种知识库和健康诊断规则,实现事后维修向基于状态的预测性维修的转变。
开展基于CPS的风洞群动力系统一体化保障建设,提升动力保障系统自身信息化及智能化水平,实现系统与试验及计算任务管理信息系统的深度融合,逐步形成以科研任务计划及需求为导向、以动力设备状态监控及健康诊断为基础、以高效管理及精准保障为目标的现代动力保障模式,达到提高动力保障效率、提升试验质量效益的建设目标。