崔 璨
(安徽工贸职业技术学院 电气与电子工程系,安徽 淮南 232007)
当前医院医疗设备的结构复杂度与数量日渐增加,医疗器械行业的高速发展使设备检测维护的需求不断攀升,采用人工检修的弊端逐步凸显出来,即检查速度慢、成本高、维修效果受个人专业能力影响大等[1]。
行业内有不少专家学者针对医疗设备的故障检测与维修智能化问题提出过应对方案。向思伟[2]对N-560型脉搏血氧饱和度仪的多例常见故障进行分析,总结出多项维修检测该型设备的规则,有效降低了该型设备的检修难度。张诗慧等[3]为解决现代医疗设备维修中无图纸等技术资料带来的维修困难问题,研发出一种基于LabVIEW的医疗设备故障智能诊断系统,经验证此系统故障诊断性能良好。刘礼全[4]发现医疗设备检测中采用的医用电子直线加速器在使用过程中不够稳定,可能出现因虚焊导致剂量计时器模块报警和冷却系统循环不畅现象,导致检测结果不够准确。向逾等[5]针对医用监护仪运行大数据挖掘设备故障和运行状态困难的问题,采用MapReduce架构和Apriori算法,构建了一种医用监护仪使用故障大数据挖掘模型。
综前所述,针对医疗设备故障检测与维修问题的研究虽然已具备一定基础,但现有技术方案集中存在智能化程度不足或诊断系统性能对大规模训练数据集依赖性强等问题。因此尝试研究运算相对简单的推荐系统算法,将其应用于医疗设备检修中势在必行。
本算法针对前述这类故障现象进行分析和排除,总结出医用电子直线加速器日常维护和保养工作的改进方法,有助于降低医用电子直线加速器的故障率,保证加速器工作的长期稳定性,延长加速器的使用寿命。在多个真实大数据集上的测试试验结果表明,设计出的挖掘模型比人工识别方法和传统识别方法的故障识别率更高,且识别速度明显快于人工方式。
医疗设备检修较为复杂,且难度较高,因此在检修过程中融入一些约束,可以缩减呈现给用户的检修信息,简化检修流程,所以此次采用约束求解器的方式来形成设备检测的推荐方案。先通过有限状态机获得医疗设备的运行相关数据,再使用CSP(Constraint Satisfaction Problem)约束生成满足要求的推荐方案。
医疗设备故障检测任务中,需要系统与用户交互来获取设备的运行信息,这里选择使用有限状态机来完成。因为医学设备故障检测步骤较多,通常不能一次回答完成,使用有限状态机,用户能更好地表达需求[6]。基于知识信息构建的推荐系统对项目数据的相关知识依赖较强,且故障参数并不直观,所以有必要将检修系统中的专家知识转换为系统可处理的知识库,才能进行后续计算,以远红外电磁波辐射治疗仪(缩写YDB)为例进行说明(表1)。
表1 简化后的远红外电磁波辐射治疗仪设备检修方案的属性
表1中方案编号用于表示不同的故障应对方案,其他具体仪器部件如“显示屏”的某方案对应数值代表该项是否存在故障。这样通过检修方案的属性列表可以描述出设备的各种故障类型,并将其与对应的维修方案对应起来,形成知识领域[7]。然后再具体阐述约束求解器如何将所需领域知识转化到经典的基于知识的推荐系统。经典CSP可通过参数组(V,D,C)描述,其中V、D、C分别代表变量向量、变量的有限域、变量对应的约束条件。求解CSP等价于对应参数组中变量向量赋予满足约束条件的值[8]。通过这种方式结合推荐知识库即可构建出基于约束的推荐系统[9]。推荐知识库V一般由两组不同变量集构成,如式(1)所示:
V=Vc∪Vp,
(1)
式中Vc、Vp分别代表描述仪器故障状态的变量集合和描述检测项目特征的变量集合。
同时,采用约束条件C=CR∪CF∪CP即可确定在某种情况下,具体应该推荐哪种维修方案,CR、CF、CP分别代表定义故障情况对应属性的一致性约束条件、定义故障情况的过滤条件和每种维修方案对应的约束条件。
由于仪器故障状况数据(简称REQ)的约束限制了部分变量的取值范围,导致Vc可能出现无对应实例的情况,为应对这种情况采用基于约束和基于关联规则的推荐算法进行协同推荐。使用基于约束的推荐算法时,基本方法是结合模型诊断与检修服务原则对故障状况进行确认,并使用QuickXPlain算法(该算法内容较为简单,不进行详细描述)[10]对当前的可配置论域DP进行计算,寻找出最小冲突集合,然后以最小冲突集对故障状态信息进行调整,重新寻找推荐方案,若计算结果显示存在多个解决方案时,应视各方案可信度(用于量化各方案的推荐价值)相同[11],且所有方案可信度之和为100%。而使用基于关联规则的推荐算法时,先根据有限状态机获取用户需求的末节点,然后应用关联规则计算各方案可信度。如果基于关联规则的推荐系统采用初始推荐机制,初始置信度设为100%,再根据有限状态机尾节点逆序搜索出最近的可行解,并根据各关联规则的置信度来计算尾节点的可信度[12],计算公式为
(2)
式中Ta为状态a的对应可信度,Ri代表关联规则R1,2,…,i-1->i的置信度。以推荐排序中的TOP2(排序中的第二)方案举例说明,在推荐系统中融入关联规则的推荐流程,有限状态机示意图如图1所示。
图1 融合关联规则后的有限状态机工作流程示意图
图1中A、B、C、E、F为用户给出的需求,其中D、H、I为冲突集、G、J为不同的解决方案,设推荐系统通过数据挖掘发现新规则ABCEF->J,且可信度计算为80%,则流程中新添加的J对应的解决方案的可信度按照式(2)计算得出结果为28.5%,同理G点对应方案的可信度的计算出结果为35.7%。
混合推荐系统的最后一步是将两种推荐方式结合起来,并最终将推荐度最高的方案推荐给用户。推荐度Rf的计算方法为
(3)
式中Rci、Rri分别为方案i的基于约束和基于关联规则推荐系统输出的推荐检修方案可信度。
完成混合推荐系统的设计后,再对整个基于混合推荐系统的医疗设备故障检测系统工作流程进行设计和布置,以YDB-Ⅲ设备为例,其故障检测与维修方案推荐流程如图2所示。
从图2可知,系统先通过人机对话的方式获取用户需求信息,具体来说即是用户登录YDB-Ⅲ治疗仪设备检修推荐系统后,通过对话式交互界面给系统输入待检测YDB-Ⅲ治疗仪设备的故障数据,系统将收到的反馈信息输入有限状态机中判断出待检测设备的故障原因[13],并输出CSP问题的REQ格式故障信息。比如输入交互信息“显示屏工作正常,晶振正常振动,EPROM读取正常”会生成标准化的医疗设备故障检测结果数据REQ=“SCREEN=Y,OCX=Y,EPROM=Y”。而且用户回答得越完整全面,系统分析出的设备故障原因越准确。然后将REQ信息结合推荐任务实例表信息计算判断是否能查找出与REQ完全对应的推荐维修方案,如果存在这种方案则直接输出推荐结果,若不存在完全对应的推荐维修方案,则需要启动混合推荐系统[14],同时计算基于约束的推荐系统和基于关联规则的推荐系统的各维修方案的可信度数值。一方面计算基于约束的推荐系统可信度时,需要先使用QuickXPlain 算法算出最小冲突集,并以最小冲突集查询REQ中的对应参数,以这个参数为准,确定最优解决方案及其可信度。另一方面,在基于关联规则的推荐系统中,使用有限状态自由机获取用户需求的末节点的信任度,并根据关联规则计算出各解决方案的可信度。再将基于约束的推荐系统与基于关联规则的推荐系统计算得到的各种解决方案的推荐度按照式(3)计算得出最终各方案的推荐度数值,并将各方案的推荐度数值大小作为判断最优故障检测与维修方案的依据,方案的推荐数值越大,代表该方案越适合推荐给用户。比如若设置为输出3个推荐方案,则系统针对每个输入需求都会输出推荐度数值最大的TOP3(排序的第三)解决方案提供给用户参考。
由于医疗设备的不同,故障类型也会有所不同,导致故障的检测特征与推荐方案的产生也会明显不同,所以此次仿真试验中医疗设备固定为YDB-Ⅲ治疗仪,选择国内多所医院近1年YDB-Ⅲ治疗仪设备运行日志为数据集,数据集共含样本574个,对样本进行数据清洗,去掉其中的错误样本、存在缺失数据的样本,还剩余样本546个,并将数据形式转换为适合混合推荐系统输入的形式。另外,为更好地评价该研究设计的混合推荐系统的运行性能,引入基于关联规则、基于协同过滤、基于内容和基于知识的推荐系统模型作为对比方法。仿真试验的相关参数设置见表2。
另外,数据集中每个设备故障样本都带有由若干标准检修方案组成的集合作为标签,规定若推荐系统给出的推荐方案不存在于标准检修方案集合中,则认为推荐失误,反之则认为推荐成功。
表2 仿真试验参数与环境选择
试验完成后,统计各推荐算法的推荐准确率数据如图3所示。观察图3可知,选出的所有推荐系统的推荐准确率随着推荐方案个数的增加,都呈现增长趋势。在推荐方案处于2个左右时,推荐效果较好的是混合推荐系统和基于知识的推荐系统;推荐方案数量增加后,推荐效果最好的系统变为混合推荐系统;当推荐方案数量为8个时,其推荐准确率为91.62%,大于其他各对比系统。这是因为基于知识的推荐系统依赖于项目的特性和详细知识开展计算,这种情况下推荐方案往往具有较强的针对性和相似性,因此在小数量推荐方案中,往往能更为准确地推荐出最适合的维修方案。但当推荐数量增大后,它给出的推荐结果可能仍然属于同一类型,无法为使用者提供很多不同类型的方案,所以随着推荐方案数的增长,基于知识的推荐系统推荐准确率增长明显低于此次研究提出的混合推荐系统。
图3 各算法推荐准确率与推荐方案数量的关系
再固定推荐方案数为5个,统计各推荐系统的推荐情况如图4所示。各推荐算法在描述信息复杂、维修方式多样的“基础参数”与“针脚4-CZ5”两项上的推荐准确率均相对较低。且基于关联规则的推荐系统在各检测项目上的推荐准确率波动最为剧烈,其在所有推荐项目上的准确率标准差为6.37%。混合推荐系统在大多数检测项目上的推荐准确率均为最优,仅在“基础参数”上的推荐准确率低于关联规则推荐系统,为83.62%。
最后分析各推荐系统运算过程的计算机内存消耗情况,统计结果如图5所示。从整体上看,随着设备的待检测项目数量的增加,各推荐系统计算出结果所需消耗的计算机内存呈现增长趋势,但是各推荐模型消耗内存的增长模式有所区别,基于内容的推荐系统内存消耗是线性增长模式,其他推荐系统的内存消耗的增长方式更接近于指数式。且需要大量计算资源用于挖掘关联规则,图5中呈现出基于关联规则推荐系统和混合推荐系统的内存消耗增长速率最高,当待检测项目数量为8个时,混合推荐系统、关联规则推荐系统、知识推荐系统的运算消耗内存最高,分别为232.51 Mb、226.46 Mb、221.57 Mb。可见,一方面融合了约束和关联规则并按照逻辑判断选择两者使用模式的混合推荐系统对计算硬件要求最高,另一方面它的推荐准确率也高于其他传统推荐系统,因此它具有一定实际部署价值,但部署时需要适当提升硬件系统的配置水平。
图4 各推荐系统在各检测项目上的推荐情况统计
图5 各推荐系统的计算消耗内存情况统计
从前述试验数据可以看出,混合约束和关联规则推荐系统是最优的,其避免了单独使用一种推荐方法的缺点,使推荐系统能面对更多不同的数据类型,并给出更为精确的推荐方案集合。因此,研究设计的混合推荐系统在推荐精度和分类问题推荐维修方案两方面均表现优秀,其精度上明显高于其他对比模型。但是正因为混合推荐系统实际上集成了两种推荐方法,这也导致了它比单一推荐模型占用更多的计算机资源,而且计算速度也略慢于其他推荐模型。不过当前市面上绝大多数计算平台的硬件处理性能都足以满足这种等级的计算资源占用,并且即便此次研究设计的混合推荐系统计算效率略慢,但仍然远远快于传统的人工检测方式。说明此次研究设计的自动化医疗设备故障维修方案推荐系统具有一定性能优势与市场应用潜力。
针对医疗设备人工检修复杂,检查故障所耗时间较长的问题,本文融合约束推荐与关联规则的推荐方式,构建出混合推荐系统,用于检测医疗设备故障问题类型并为用户推荐合适的维修方案。最后选取国内YDB-Ⅲ治疗仪设备运行日志为数据对各推荐系统的性能进行对比,计算结果表明,混合推荐系统推荐的检修方案的准确率基本都高于其他系统。
此次研究对于提高我国医疗设备检修自动化水平与检修精度具有一定的参考意义,但是由于研究条件所限,没能选取更多医疗设备故障数据进行性能测试,以充分验证设计方法的可靠性,这也是后续研究所需关注的要点。