戎毅 王浩阗 李绍烁 於浩 王兰 邵阳
深静脉血栓(Deep vein thrombosis,DVT)是一种常见的外周血管疾病,因静脉血液异常凝结所致,多发生于下肢深部静脉[1]。DVT 是下肢骨折常见的并发症,数据显示约40%~70%的老年患者可并发下肢DVT[2],多发生在受伤后及术后高凝期,可诱发肺栓塞和血栓后综合征等,甚至死亡[3-5]。静脉造影是目前诊断DVT 的“金标准”,但其是有创检测且具有造影剂过敏、肾毒性、对血管壁的损伤以及基层医疗机构标准化硬件设备覆盖不全等缺点。因此寻找易检测且准确性和灵敏度高的生物标志物,对临床预防、早期诊断和治疗DVT 及其预后具有重要意义[6]。
人工智能(Artificial intelligence,AI)是计算机科学的重要分支,被广泛应用于语言识别、图像识别、自然语言处理等多个领域。AI 以机器学习算法为核心,通过在大量数据中不断优化算法来组建合适的数据群组,以提供高效的决策判断。机器学习通过与生物医学诊疗技术相结合,现已成为协助发现、诊断以及治疗疾病的重要技术手段,通过此方法筛选出的生物标志物D-二聚体、纤溶酶原激活物抑制物-1、Stat3、凝血酶原时间、血管细胞黏附蛋白-1 等用于辅助诊断下肢DVT,此法可建立模型及评价治疗方案,为临床诊疗提供参考。
D -二聚体因具有高敏感性,被广泛用于临床评估下肢DVT,但特异性偏低,研究者试图通过机器学习算法进一步完善该项检测方法。Rinde 等[7]通过一项回顾性研究得出结论:D-二聚体作为独立检查对于排除近端DVT 和减少所需超声的比例可能是安全的。Nicoletta 等[8-9]利用PALLADIO 算法,提出年龄相关D-二聚体联合临床预试验概率对疑似DVT 具有高度诊断价值,可以明显减少影像学检查次数。
“威尔斯决策规则”(Wells Rules)是测试和使用最广泛的下肢DVT 临床决策规则,但仍有不足之处。Ashrafi 等[10]对下肢创伤患者在入院后的前24 小时内通过Autar 和Wells 工具进行DVT 风险评估,尽管Autar 量表和修正Wells 标准的DVT 预测结果一致,但Autar DVT 风险评估量表显示出更高的灵敏度。因此,Wells 评分不足以排除DVT 或影响对住院患者的诊断决策。
下肢DVT 的发病与多种因素密切相关,包括年龄、体质量指数、外伤及手术等[11-12],生物标志物因其高灵敏度和准确度,不可忽视。机器学习通过对下肢DVT 病例的临床数据进行综合分析,建立风险预测模型,能够帮助我们准确预测下肢DVT 的发生,进行早期预防治疗。目前用于逻辑回归分析(Logistics Regression,LR)、聚类分析(Cluster Analysis,Clustering)、人工神经网络(Artificial Neural Network,ANN)、决策树(Decision Tree Analysis,DTA)等多种算法已被尝试应用于下肢DVT 的生物标志物的筛选分析中。
LR 是下肢DVT 形成的危险因素分析过程中最常用的机器学习算法。Cheng 等[13-15]运用多元逻辑回归发现D-二聚体、白蛋白、血糖、住院时间、手术方式等是术前DVT 的重要预测因素。Niu 等[16]研究发现慢性肾功能不全、当前吸烟状况、从损伤到超声检查的时间和血小板计数是DVT 的独立因素。许彬彬等[17]发现创伤性骨折患者血浆高密度脂蛋白胆固醇水平低与DVT 的发生高度相关。杨王李等[18]认为发病至入院时间延长、合并3 种以上并发症、ASA 分级Ⅲ~Ⅳ级以及高D-二聚体是其独立危险因素。
基于生物标记物的非监督分级聚类分析可以用来识别在DVT 频率上显著不同的患者亚组。Mosevoll 等[19]采用Luminex 多重分析方法检测血浆介质水平,发现P-选择素、血管细胞黏附蛋白-1等可用于识别可疑的DVT。Abo-Zaid 等[20]利用此法发现有血栓家族病史的患者DVT 发生率比正常人增加约1.3 倍。方晓慧等[21]根据恶性肿瘤合并下肢DVT 患者的主要临床症状及体征聚类分析中医证型,得出气血亏虚证为最常见中医证型的结论。
陈颖[22]探究了危重症患者下肢深静脉血栓形成的影响因素,并基于单因素分析结果建立反向传播人工神经网络模型,模型共纳入19 个输入层神经元,9 个隐藏层神经元,2 个输出层神经元,其中血浆D-二聚体、白细胞和纤维蛋白原的标准化重要性分析均大50%。模型对危重症患者下肢深静脉血栓的发生具有较好的预测能力。
Alper 等[23]收集人口学资料、住院情况、实验室、影像学结果等,使用递归分区算法推导出DVT预测规则,然后进行验证。递归分割产生了四个变量,优化了派生队列中近端深静脉血栓的预测和预后,可预测DVT 的风险,识别出预试概率低的人群,从而安全地避免超声检查。
DVT 治疗的理想目标是迅速恢复静脉血流,预防血栓延伸,维持静脉瓣功能,消除血栓脱落的危险。Ho 等[24]将多因素LR 分析用于识别癌症患者与IVCF 使用相关的变量,最强预测因子是诊断为脑癌、接受大手术和出血,只有7.7%的患者有抗凝的绝对禁忌症。然而,IVCF 的使用是否能改善因DVT 而住院的癌症患者的预后,仍需要进一步的研究来确定。研究发现,患者在家自行运用低分子肝素可能有更好的疗效和生活质量,但一些医生仍然担心DVT 患者在家治疗的安全性。Lozano 等[25]使用RIETE 注册表的数据,采用LR 模型进行倾向性评分匹配分析,发现DVT 患者家庭治疗比在医院治疗效果更好。此外,机器学习算法也可用于预防措施的评估中,Li[26]使用双边界决策树算法(twinbound decision tree algorithm,TBDTA),分析包括生存期和患者满意度在内的临床结果,提示强化护理干预可以降低因胃肠道恶性肿瘤手术的老年患者发生下肢深静脉血栓的风险。
抗凝是治疗的基石,维生素K 拮抗剂(如华法林)是长期抗凝治疗的主要口服药物,其治疗剂量个体差异大,需要临床医师制定个体化的治疗方案。黄智勇[27]用多重LR 分析得出年龄、低密度脂蛋白-胆固醇可增加华法林的抗凝作用,体重和血浆白蛋白可减弱华法林的抗凝作用。Reardon等[28]使用Cox 回归评估华法林治疗的持续性,认为华法林治疗的非持续性与抗精神病药物的使用、痴呆或周围血管疾病密切相关。此外,在中医药治疗上,智猛等[29]基于数据挖掘方法从多个维度对中医药治疗骨科术后DVT 进行数据挖掘及组方配伍规律分析,为临床辨证用药提供一定依据,为治疗骨科术后DVT 提供新思路。
机器学习的进步使临床医生对患者发生DVT的风险评估更具多元化。胡钢等[30]采用单因素及多因素LR 分析,构建了评估老年髋部骨折患者DVT 形成风险的列线图模型,具有良好的诊断效能。Willan 等[31]使用标准的二值分类前馈ANN 模型,该模型能够在不需要超声的情况下排除DVT,同时保持极低的假阴性率。Huang 等[32]采用CNN模型实现了全自动的DVT 病灶分割方法。基于深度学习建立人工神经网络模型并将其应用到下肢DVT 的临床诊断中,可以使复杂的患者信息进行综合汇总,并促进个性化风险档案的发展。
机器学习相较于传统的影像学检查具有简单、易于使用、较高的成本效益等优势。Steer 等[33]通过对急诊科的潜在下肢DVT 患者进行评估,研究发现与机器学习预测相比,临床医生很大程度上依赖于检查报告,临床评估效果较差,这可能会带来成本增加的问题。DVT 的治疗是一个复杂而反复的过程,因此机器学习的成本-效益价值得到凸显。
机器学习需要大量的原始数据,模型算法精准性与数据源的样本量和准确性密切相关。采集数据时提高质量是核心。机器学习训练数据来源于医疗机构的临床患者,其中涉及数据隐私的伦理问题。对于敏感信息的定义和数据应用过程中的监管均有待进一步完善。目前因缺乏标准的公共数据库,可能会导致数据偏差的风险,运算终点的偏差则会造成临床决策的失误。另一方面,机器学习的设计和运算是极其复杂的,临床医生并非专业人员,在数据采集、录入、运算、机器学习、模型建立的各个环节均可能因技术问题造成结果存在一定的偏差。
面对目前医学领域正由传统医学模式向精准医学模式转变的契机,机器学习已成为协助发现、诊断以及治疗疾病的重要技术手段,通过此方法筛选出的生物标志物D-二聚体、纤溶酶原激活物抑制物-1、Stat3、凝血酶原时间、内皮素-1、纤维蛋白原、凝血因子Ⅴ和Ⅷ及血浆高密度脂蛋白胆固醇、P 选择素、血管细胞黏附蛋白-1、基质金属蛋白酶-8 和肝细胞生长因子等用于辅助诊断下肢深静脉血栓,以及使用机器学习算法建立模型选择及评价治疗方案和药物,具有显著优势,可为临床诊疗下肢DVT 提供参考。