基于日志分析的大型医疗设备远程实时监测系统的设计与实现

2021-06-25 03:03朱伟严郁方舸刘健于宁李永刚
中国医疗设备 2021年6期
关键词:日志工程师解析

朱伟,严郁,方舸,刘健,于宁,李永刚

1.南京中医药大学附属医院(江苏省中医院)a.设备处;b.招标办公室;c.重点项目办公室,江苏 南京 210029;2.北京绪水互联科技有限公司 技术部,北京 100000

引言

引进大型医疗设备是医院发展的重要标志,不仅可提高医院知名度,增强核心竞争力,还会带来巨大的经济及社会效益[1]。然而,与其他医疗设备不同,大型医疗设备由于配置审批复杂及单价高等原因,很难有备用设备[2]。以我院放射科为例,10台CT/MR承担着全院影像检查及相关科研教学任务。因此,有效保障这些设备正常运行,对医院具有重要意义。

当前设备管理部门对于大型医疗设备的维修管理多采用人工值守的方式[3],然而在大型设备数量不断增长的现状下,工程师常处于流动维修状态,很难同时兼顾多个报修[4],导致设备停机,从而降低了设备使用率。尤其是因小故障导致的停机,工程师如提前知道设备情况,则可电话指导技师操作快速修复设备。此外,节假日期间大部分设备处于待机状态,而磁共振冷却系统24 h不间断工作,一旦水冷机故障导致氦气压缩机停机,轻则液氦挥发,重则失超,医院损失巨大。因此,通过智能化手段实时监测大型医疗设备势在必行。目前部分医院是通过电流传感器监测电流大小判断设备运行状态[4],还有医院通过监测液位、压力、通断、温度、湿度等数据实现实时监测设备运行[5-8]。上述方法虽然有一定的实用价值,但大型医疗设备非常复杂,任何模块异常都可能导致设备故障,想全方位监测需要部署大量传感器,不仅成本高还实施困难,不利于广泛推广。医疗设备日志包含设备状态及故障等所有信息[9],工程师便是通过阅读日志快速判断故障所在,因此实时分析设备日志则意味着可实现设备状态实时监测[10]。基于此,本研究以设备原理为指导,基于日志分析技术[11-12]建立大型医疗设备实时监测系统,全面监测设备运行状态,并对于异常情况实时提醒。

1 大型医疗设备日志分析系统原理

日志分析是收集海量日志,将其根据字段(关键词)分割,并进行统计分析,快速查看重要指标趋势及定位故障,从而指导工程师及时采取措施纠正问题[13]。大型医疗设备日志分析系统是参考设备原理并基于日志分析技术建立的,包括采集、传输、存储、分析和展示(可视化、报表和监控)等5个部分,具体分析流程如图1所示。

图1 日志分析系统流程

1.1 采集日志

一般日志采集是通过文件传输协议(File Transfer Protocol,FTP)方式从设备根目录抓取并存储日志(log)[14-15]。考虑到需要24 h实时监测,因此必须连续且完整采集当天日志。设备日志的生成规则是实时产生日志并存储在文本文档里,一旦文件大小超过一定容量(如30 Mb),则创建新文档继续存储日志。为提高采集及解析效率,采用定时采集和检测文件标志位的方法[16-17]:第一次采集日志时,创建日志文件log001并上传至云端解析。15 s后再次采集,检测日志文件变化标志位,创建log002存储最新日志,依此类推。

1.2 基于设备原理划分模块

大型设备通常具有完善的诊断系统,当设备发生异常时,诊断系统会提示故障代码。以磁共振为例,图2是西门子磁共振报错信息,包括时间、故障位置、详情等。设备模块划分便以此为基础,如MRI_RFP、MRI_GAP、MRI_ICS分别代表射频放大器、梯度放大器及内部冷却系统。模块划分有利于在关键词匹配时提高遍历效率,对于实时监测日志有重要意义。

图2 西门子磁共振报错信息

1.3 建立关键词数据库

设备日志包括提示性信息(Information,包括设备概况、患者资料、检查部位、设备操作等),警告(Warning,设备风险等)及故障(Error,设备异常等)等信息[12]。关键词来源于日志,分为两类:① 参数关键词,用于设备关键部件参数监测,来源于提示性信息。获取此类关键词较为容易,因为对设备来说,关键部件参数本身就需要实时监测,一次日志采集即可获得所需参数关键词[13]。以磁共振为例,参数关键词为液氦压力(Magnet Pressure)、液氦水平(Helium Level)、冷头温度(Cold-Head Temperature)、冷屏温度(Bore Temperature)、次级水温(Supply Temperature)及次级水压(Return Pressure)等参数;② 故障关键词,用于设备故障监测,包括风险关键词和异常关键词两类,分别来源于警告和故障信息。日志(图2)经过分析后建立关键词数据库(表1),包括设备ID、设备模块、故障类型、关键词,同一模块相同故障关键词只在数据库里存储1次,关键词是下一步日志解析的关键。与参数关键词不同,故障关键词主要用于监测设备故障,而故障是小概率事件,因此建立该关键词数据库主要来源于维修手册以及资深工程师维修经验。此外,为提高监测精度,需要不定期更新故障关键词数据库。

表1 磁共振关键词数据库

1.4 构建解析规则

遍历新采集的日志,根据建立的关键词数据库采用基于正则表达式的特征匹配算法解析日志,提取所有与关键词字段匹配的日志,用于统计及展示[14]。以解析图2为例,根据表1先提取所有与“ICS Warning”匹配的日志详情存储在数据库,再匹配下一个关键词,直至遍历结束。参数信息解析以表2形式存储,故障信息解析以表3形式存储。然后根据建立的阈值及故障优先提醒规则,实时监测设备参数及故障情况。

表2 解析的磁共振参数信息

表3 解析的磁共振故障信息

1.5 展示及优化

统计上一步获取的数据,工程师对展示结果进行多次测试,根据反馈结果进一步优化关键词及解析规则,从而建立完善的日志分析系统。

2 架构设计与功能实现

2.1 系统架构

本系统基于日志分析和物联网技术实现设备状态的实时监测,网络架构如图3所示。为保护医院内网及医疗数据安全,系统采用三段式隔离设计,具有很高的安全性:① 内网区域:日志采集盒通过FTP方式抓取并存储日志。日志采集盒是基于树莓派的工控机,每个采集盒采集一台设备,共同组成采集集群,最终通过NAT网关将数据传输出去[18];② 隔离区域:内外网之间采用单向网闸,再经前置机物理隔离,保证数据只从内网流向外网。最后使用4G通讯模块将数据传输到云端服务器存储[19];③ 公网区域:系统采用B/S(Browser/Server,浏览器/服务器模式)架构,日志经过模块化解析后,统计结果以数据库形式存储在Web服务器,用户通过浏览器访问Web服务器查看解析后可视化展示[20]。

图3 大型医疗设备实时监测系统网络架构

2.2 功能模块实现

本系统是基于日志分析建立的实时监测平台,主要功能包括参数监测和故障提醒,以实现设备状态精确远程监控,具体描述如图4所示。

图4 大型设备远程实时监测系统功能模块体系图

2.2.1 参数监测模块

参数监测模块主要用来实时监测设备关键部件参数,主要包括三个功能:① 参数详情:工程师可通过微信/PC端查询设备参数;② 阈值设置:工程师可根据设备实际状况自定义各参数的阈值,用于异常提醒。例如某台磁共振当前液氦压力为15.3 pisa,所设阈值上下限为15.7 pisa及14.9 pisa,一旦监测到该参数超出阈值,则立即提醒工程师;③ 异常提醒:系统采用双重预警机制以保证异常提醒的精准度,即获取当前关键部件参数,同时比较预设阈值上下限以及当日截至当前该参数的最大最小值,无论超出哪一个值,均代表该参数异常,设备可能出现异常。

2.2.2 故障提醒模块

故障监测模块主要用来实时监测设备关键部件参数,主要包括三个功能:① 报错查询:系统建立基于优先级的实时报错预警规则,详见表4。优先级是根据工程师经验数据和大数据分析进行定义的,1、2级属于风险报错,隔日汇总提醒;对于3、4级属于异常报错,实时提醒,以便工程师及时检修设备;② 日志查询:工程师接到报错提醒后,可在微信/PC端查询故障前后的所有日志,以便快速做出诊断;③ 预警设置:工程师可根据日常维修实际情况,对预设的报错优先级规进行自定义修改,以便系统发出更准确的故障提醒。

表4 设备故障优先提醒规则

2.2.3 临床运行模块

临床运行模块主要用来实时监测临床对设备的使用情况,来自设备日志的提示性信息,并以报表形式展示,主要包括三个功能:① 运行简报:包括前1 d的所有被实时监测设备的临床使用情况,包括扫描人数、部位数等,方便使用科室及院领导了解设备运行情况;② 设备月报:以月报形式全方位展示每台设备当月的运营状况,包括每天开关机时间、扫描人数(部位数)、扫描量分布、扫描时间分布、使用率及扫描部位等综合分析。临床可根据设备使用情况进行科学调整;③ 单机效益:根据扫描部位数及收费明细,展示设备月营收,以及扣除运营成本的月收益,其中包括运营成本水电、人员工资、维保、折旧及耗材等,上述数据根据实际情况自定义。

2.2.4 远程终端模块

远程监测终端以PC为基础,微信为主要监测手段,并实现微信及PC的信息同步。微信端用来查看设备状态、设备异常、设备使用情况的实时推送;PC端用来更详细查看日志、阈值设置及数据报表下载等。

3 应用效果

监测系统初期(2018年6月至2019年10月)在1台CT和1台磁共振试运行,经工程师和临床的共同测试及长期运行,显示鲁棒性较强,目前已在我院10台大型设备(5台CT、5台MR)上全面展开。该系统可实现设备核心部件实时监测(图5),在故障预警方面具有极高的时效性(图6)。一旦设备状态异常,工程师会第一时间收到报警信息和故障代码,避免诸如液氦挥发等不良事件发生。与传统的科室报修后工程师到现场检修相比,不仅简化了报修流程,同时大大节约工程师的时间和精力,维修效率得到显著提升,减少设备停机时间。

图5 参数监测模块

图6 故障提醒模块

此外,还给临床科室实时推送设备运行简报(图7)等,方便临床及时了解设备使用情况;给院领导和设备管理部门推送全院大型设备运行情况(图8)和单机效益,为医院科学配置CT/MR等设备提供数据支持。与传统的手工统计及繁琐计算相比,该系统通过日志分析技术,不仅使采集检查数据等更加简便且准确,帮助临床实现精细化管理;而且在系统预设收费明细、水电、人员工资、维保、折旧及耗材等参数后,系统自动生成设备收益、投资回收期等数据,从而提供更为精确的单机效益分析报告。目前,单机效益模块在如何合理预设各种成本参数方面仍在完善及优化中,近期开始联合临床科室共同测试。

图7 每日运行简报

图8 10台CT/MR运行情况汇总

4 讨论

本文介绍了一种基于日志分析技术的大型医疗设备远程实时监测系统,实现了设备状态的实时监测,并将响应式维修转变为预见式维护,保障设备的开机率和使用率,降低医院设备使用成本,间接提升经济效益。同时日志分析技术还可用来监测设备使用详情,如扫描部位、扫描剂量、扫描人数、扫描等待时间等信息,帮助临床实现精细化管理,为下一步大型医疗设备全面信息化管理做好铺垫。此外,大型设备单机效益分析一直是医院设备管理方面的重点与难点,该系统提供了一种新颖、方便且准确的大型设备扫描数据采集方法,通过合理预设成本参数精确计算设备净收益和投资回收期等效益指标,为给医院科学配置大型设备提供决策支持。

猜你喜欢
日志工程师解析
《机械工程师》征订启事
一名老党员的工作日志
Kenoteq的工程师研发环保砖块
三角函数解析式中ω的几种求法
扶贫日志
青年工程师
睡梦解析仪
游学日志
电竞初解析
对称巧用解析妙解