基于HIS数据的药物相关肌肉不良反应自动监测模块建立与优化

2023-11-20 11:48赵安琪郭代红石廷永卢京川解放军医学院北京10085解放军总医院医疗保障中心药剂科北京10085北京康联达软件有限公司北京10008重庆医科大学药学院重庆400016
中国药物应用与监测 2023年3期
关键词:决策树报警病例

赵安琪,郭代红,朱 曼,高 奥,石廷永,李 鹏,伏 安,卢京川,4,李 超(1.解放军医学院,北京 10085;.解放军总医院医疗保障中心药剂科,北京 10085;.北京康联达软件有限公司,北京 10008;4.重庆医科大学药学院,重庆 400016)

药物相关肌肉不良反应(drug-associated muscle adverse reaction,DAMAR)是临床中常见的药品不良反应(adverse drug reaction,ADR),一定条件下可发展为横纹肌溶解症(rhabdomyolysis,RM)等严重ADR[1],甚至导致肾衰竭等严重后果[2-3]。对该类ADR 发生特征分析显示,降脂、抗癫痫、抗病毒、抗肿瘤等药物均存在肌肉毒性[4-5],因此有必要对上市后药物进行DAMAR 监测和再评价。医院信息系统(hospital information system,HIS)中记录了海量的真实世界用药信息,是进行大样本药物警戒研究的有效途径。本研究基于团队自主研发的“临床ADE 主动监测与智能评估警示系统-Ⅱ”(adverse drug event active surveillance and assessment system-Ⅱ,ADEASAS-Ⅱ)[6]构建DAMAR模块,综合文本识别技术和触发器技术[7],建立决策树模型对病例资料进行挖掘和分析,为更加高效、精准、快速地开展真实世界研究提供了有力支持。

1 资料与方法

1.1 数据资料

数据来源于某三级甲等医院(简称“某院”)的HIS数据库,纳入监测的对象为2022年9月1日-7日用药的所有住院患者共5441 例。收集信息包括患者人口学资料、诊断记录、病程记录、实验室检验结果和医嘱信息等。

1.2 纳入排除标准和ADR评价标准

纳入标准:用药后出现:①肌肉症状;②肌酸激酶(creatine kinase,CK)升高超过1.5 倍正常值上限(200 IU·L-1)或基值5倍以上[8-9]。

排除标准:①发生实验室检验指标异常但接受手术后不满48 h;②未接受手术但存在基值异常的或无用药前实验室检验;③有心脑血管意外、严重外伤等疾病的患者。

ADR 评价标准:根据Naranjo ADR 概率量表[10]对报警病例进行评价,判断药物与ADR 的因果关联性,判定评分≥1的为阳性病例。

1.3 评价指标

使用阳性预测值(positive predictive value,PPV)[11]和召回率(recall rate,R)[12]对DAMAR 模块进行评价,其中PPV为报警病例中的真阳性病例数占报警病例总数的比值;R为报警病例中的真阳性病例数占阳性病例总数的比值。

1.4 DAMAR自动监测模块规则的构建流程

1.4.1 指标确定基于RM[2]、高肌酸激酶血症[8]和肌肉不良事件[13]的相关指南共识等文献,结合某院患者实验室检验结果,确定主要指标及参考值。

1.4.2 关键词集确定结合WHO-ART、MedDRA 26.0及《药品不良反应术语使用指南》、国内外指南共识[13]和某院HIS电子病历中的相关描述,建立相关关键词集。

1.4.3 决策树模型确定结合上述资料和文献,总结手术、疾病等相关因素的影响,建立决策树模型,针对特殊患者关键时间点的判定和处理,增加迭代挖掘分层预警功能。以PPV和R为评价指标,反复循环监测,并调整优化模块设置,直至准确度提升到较理想的条件。

1.4.4 模块稳定性验证重复进行自动监测,验证模块稳定性后进行数据分析,获得住院患者相关DAMAR的发生情况。

1.5 数据处理

使用Excel 2019和SPSS 26.0对DAMAR发生病例相关数据进行统计描述和分析。使用单样本K-S检验确定连续变量的分布特征,符合正态分布的连续变量用均值±标准差描述,非正态分布数据用中位数和四分位数描述,计数资料用频数和百分比描述。

2 DAMAR模块报警规则的建立与优化

2.1 预实验

参考国内外指南共识等,了解DAMAR发生的原因和特点,大部分DAMAR 发生时均伴有CK 升高。分别使用量化指标和关键词识别功能对住院患者进行监测,验证其各自的发生特点和规律。

2.2 报警关键词的建立与优化

根据DAMAR 的典型临床表现和实验室检验指标,初步确定用于病例信息筛选的关键词共13 个。经自动监测模块运行分析后最终确定的关键词为7个,分别是:横纹肌溶解、肌红蛋白血症、肌红蛋白尿、肌酸激酶升高、CK 升高、肌酶升高、高肌酸激酶血症。

因本文筛选的报警病例与使用量化指标报警的病例重合,导致报警信息丰富,假阴性比例较高而被筛除的为肌肉疼痛、肌痛、肌肉痛、肌肉酸痛和肌肉无力5 个关键词;另一关键词“肌无力”在系统运行中,发现临床用于描述神经系统疾病相关症状,与本研究无关,故去除。

2.3 DAMAR量化指标的选取

发生严重肌肉不良反应如RM,其判断标准为CK 升高超过5 倍正常值上限[2],但以CK ≥1000 IU·L-1为标准进行自动监测,所得阳性病例的样本量及相关信息较为局限。为此结合高肌酸激酶血症的定义,调整标准为CK升高超过正常值上限1.5倍,报警范围扩大至所有较轻微的DAMAR患者,从而得到较为理想的样本量。

2.4 手术等因素对ADR发生的影响及自动排除

自动监测中发现手术后患者CK普遍有一过性升高,通常是术后6 h内迅速达峰,并在48 h内降至正常水平[14-15],基于此调整DAMAR 自动监测模块设置,自动判断并略过对术后48 h内发生指标异常的患者,仅对术后持续异常超过48 h的患者进行报警,以提高模块的PPV。对未进行手术的患者仍按照纳入排除标准进行监测。

2.5 决策树节点的设置

本研究中最终确定的决策树判定顺序为:关键词-量化指标-手术时间-相关患者基值情况。将文本

关键词节点作为父节点,先判定有明显症状的患者,后关注轻症和无症状的患者,量化指标未满足的数据不再进行手术时间的判断,手术时间和基值异常的判断必须按顺序进行。DAMAR模块构建流程详见图1,其最佳设置的决策树流程图见图2。

图1 DAMAR模块构建流程图Fig 1 Flow chart of the DAMAR module construction

图2 决策树流程图Fig 2 Flow chart of decision tree

3 DAMAR自动监测模块的验证

利用优化后的DAMAR模块,自动监测某院2022年9 月1 日-7 日的住院患者共5441 例,系统报警115 例,经人工甄别得到阳性患者64 例。发生率为1.18%,属于常见ADR。阳性报警率55.65%。64 例DAMAR患者的基本情况见表1。手术患者的科室以肝胆胰外科、骨科和神经外科为主,非手术患者以呼吸科、肾脏病科和老年病科为主。第一怀疑药物分布见表2。64例患者中,发生RM的患者共5例,发生率为0.092%,属于罕见ADR,相关药物为利奈唑胺葡萄糖注射液、左氧氟沙星氯化钠注射液、丙泊酚乳状注射液和奥美拉唑碳酸氢钠胶囊。

4 讨论

4.1 DAMAR的自动监测研究

DAMAR的发生较为常见[6],从出现肌痛,到CK异常甚至发展到RM,可分为多个发展阶段,在相关药物的说明书中也有表述[5]。RM为严重ADR,国内外均有大量的分析报道[2,17]。但此类研究的样本量相对较少,且文献老旧,借助信息化技术进行大样本监测,以研究其真实世界发生率和相关危险因素极为必要。ADE-ASAS-Ⅱ已有十余个不同模块,长期大样本研究应用,具备强大的自定义功能设置[18]和个性化决策树结构[19]。本研究基于ADE-ASAS-Ⅱ,将触发器技术和文本识别技术通过决策树模型相结合,最终构建的DAMAR 模块具备100%的R 值,能够高效地提取DAMAR 患者相关信息,灵活开展单药/多药/全药条件下所有住院患者中DAMAR 的真实世界发生率和危险因素,更具参考价值。研究结果显示,5441 例住院患者中DAMAR 发生率为1.18%,属于常见ADR,其中RM 发生率为0.092%,属于罕见ADR。而贺嘉凌等[20]主动监测2 038例洛伐他汀相关DRMAR 的发生率仅有0.28%,可能与其样本纳入标准严格,排除率高达69.77%有关。

4.2 决策树预测模型的应用

DAMAR 自动监测涉及医嘱信息、电子病程、检验记录等多种信息,模块构建是通过决策树模型迭代监测,逐层对病例进行数据挖掘报警。决策树预测模型广泛应用于机器学习的各种场景中,既符合真实逻辑,也可以降低计算量,适于ADR 的自动监测。决策树节点的设置一方面要考虑计算效率和准确性,另一方面要考虑实际的临床意义[21]。本研究将文本关键词节点作为父节点,是因为经该节点判定的报警病例中阳性病例的比例较高,即信息增益较大,且通过该节点判定的报警病例不需要再计算CK升高与手术的时间关系,可以减少树深。另外从临床意义上分析,先判定有明显症状的患者,后关注轻症和无症状的患者也更符合实际工作的需求。研究中通过反复调整关键词和屏蔽语句设置、手术与报警的时间关系和模块参数设置,最终模块的PPV 从15.31%上升至55.65%,而R依然保持为100%,实现模块的智能化机器学习。此外,得益于模块的自定义功能和决策树的灵活性,用于不同医疗机构时仅需对模块的部分文本和参数根据本单位特点进行调整即可。

4.3 病历资料中非结构化信息利用

CK 是肌肉不良事件的敏感指标,但特异性不强,可能受其他因素影响[22]。主要是由于CK的三种亚型中,仅肌肉型(CK-MM)的升高与骨骼肌损伤有关。可能导致CK 升高的因素还包括患者基础疾病、一般状况和手术等因素,且在电子医疗信息中多以非结构化信息形式存在,增加了开展大样本自动监测的难度,成功地提取和智能识别利用此类信息,能有效提升自动监测模块的工作效率,便捷实现大样本人群的自动监测评价。通过触发器技术对实验室检验结果的报警和预测已成功应用[23],本研究基于DAMAR患者群体的个性化分析,将量化指标和文本识别的关键词,以及患者的手术关键信息共同纳入决策树的判断依据,避免阳性病例丢失的同时,显著提高了监测效率和研究结果的可信度,也拓展了电子病历信息的利用。

本研究借助ADE-ASAS-Ⅱ建立了DAMAR自动监测模块,为开展单药/多药/全药条件下DAMAR的真实世界药品安全性评价研究提供了有效工具。自动监测阶段快速排除了97%的病例,有效地降低了人力成本,使开展大样本真实世界DAMAR监测及相关因素研究、进而强化风险预警效能成为可能。

猜你喜欢
决策树报警病例
“病例”和“病历”
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
LKD2-HS型列控中心驱采不一致报警处理
2015款奔驰E180车安全气囊报警
基于决策树的出租车乘客出行目的识别
一例犬中毒急诊病例的诊治
死于密室的租住者
奔驰E260车安全气囊报警
基于肺癌CT的决策树模型在肺癌诊断中的应用