赵 静,李康悦,兰怡娜,印 弘,娄 昕*
(1.解放军总医院第一医学中心卫勤部科研处,北京 100853;2.首都医科大学第三临床医学院,北京 100043;3.解放军总医院第一医学中心放射诊断科,北京 100853;4.空军军医大学西京医院放射科,西安 710032)
战创伤在各个国家都是一个重大的公众健康问题。根据WHO 2000年的报道,全球每年约有500万人死于战创伤,占到死亡人口总数的9%[1]。自改革开放以来,随着我国交通和城市化建设的飞速发展,交通事故伤作为战创伤的重要组成部分,已从中国人口死因谱中1990年的第6位上升到2017年的第5位[2]。同时,战创伤还具有“三多”(重伤员多、 多发伤多、 烧冲复合伤多)和“三高”(减员率高、 休克率高、 手术率高)的特点[3]。然而在临床实践中,我国对于战创伤的诊治流程却普遍存在着院前时间过久、院内衔接不流畅及缺乏标准抢救流程的问题[4],进一步影响战创伤患者的预后。
人工智能(Artificial intelligence, AI)是近些年新兴的技术,其通过相应计算机技术使机器模拟人的思想及行为,以得出与人类一致的结论。AI最早于1956年提出,并在近二十年内飞速发展,已广泛应用于各个领域。其在准确性、高效性及灵敏性上的出色表现使其在临床中已逐渐普及,得到临床医师和患者的青睐。文章通过简述AI的基本原理及其在战创伤中的应用现状,为广大医学工作者提供新的诊疗思路,协助改进战创伤的诊治流程,改善患者预后。
当前看来,机器学习(Machine learning, ML)是实现AI最有效的手段之一,指通过向计算机提供数据而不建立显性编程,使其建立输入与输出之间的映射,也即机器在其“工作”过程中自我学习的行为。目前常见的ML实现技术有支持向量机、Logistic回归及人工神经网络(Artificial Neuron Network, ANN)。ANN是指一种类似于人脑神经网络的算法结构,即通过若干个单一神经元的连接而组成庞大的神经网络对数据进行运算,由于ANN具有良好的泛化性,已成为当前主流的AI算法。
深度学习是通过多个处理层的抽象,来提取学习的特征,因此特别适用于复杂的数据,如图像及语音识别。实现深度学习的算法模型有多种,目前占主导的是ANN其中的一种——卷积神经网络。且随着数据训练量的增大,深度学习算法的性能会越来越强大,这一特性使得其在医疗领域尤受青睐[5]。
2.1 创伤事件预测如前所述,即使是当今和平年代,战创伤事件的发生率仍居高不下且难以预测。目前大多数医疗机构对于创伤伤员总是时刻准备着,这样机械的安排很可能造成医疗资源的浪费或缺乏,对医患双方均不利。有研究揭示天气与创伤事件呈相关性,在此基础上David P. Stonko等训练一个ANN用于预测日常创伤事件的发生情况[6]。其输入变量包含日期、气温、降水量;输出变量包括当日创伤人数、穿透伤人数、手术例数、平均ISS(创伤严重程度)评分。训练后的ANN以相当高的准确性通过检验,尤其适用于基层医院及大型急救中心的人员科学配制。类似地,已有学者在设计专用于预测运动损伤的AI算法[7]。
2.2 创伤伤情判断大多数战创伤患者存在着不同程度的体表创伤,全面而准确地识别这些创口对于指导后续的治疗是必要的,而一旦遗漏创口或评估程度不当均可能导致创口愈合不良。但在临床工作中,这一过程需要较大的人力。Fangzhao Li等设计一种用于战创伤创口分级的复合模型,其不仅在灵敏度和特异性上相比既往的研究有所提升,而且可以用于背景相对复杂的照片,这对于战时早期判断伤情有重要意义[8]。
对于需要行影像学检查进一步评估的患者,无论是常见的骨折X线片或脊髓磁共振图像[9-10],适用于图片识别的ANN可快速对多种损伤做出准确诊断,以帮助对大型交通事故的伤员进行伤情评估、轻重分类。
2.3 创伤预后评估创伤的预后可因致伤因素、受伤部位、受伤程度及对其他生理功能的影响而截然不同。目前已有多位学者报道使用ML对创伤患者预后进行预测的方法,Nehemiah T. Liu等对65项研究进行Meta分析,这些研究共包含2 433 180位患者的信息。其算法包含ANN、支持向量机、决策树等。通过输入年龄、格拉斯哥昏迷评分、创伤评分、损伤严重程度评分、各种血压、呼吸频率和心率等患者特征,可评估预后情况,包含死亡生存情况、住院时间、并发症等。尽管大多数研究都证明判断预后时ML的益处,但各个AI系统的性能因算法、训练量不同而有所差异,因此也提示后续的研究应该旨在建立共同的输入特征集,以达到最佳的预测效果及更好的广泛性[11]。
2.4 创伤后康复严重创伤可造成多种残疾,降低患者出院后生活质量,甚至需终身住院治疗。近年来,医疗机器人快速发展,目前已有多种机器人协助的康复方法用于临床,适用于多种创伤后功能缺失。例如,机器人系统通过协助患者进行重复和密集的练习,诱导大脑和脊柱的可塑性,并且以最佳的运动强度促进患者的感觉、运动功能恢复。即使康复工作难以满足日常所需,辅助机器人也可通过感知肢体位置参数甚至脑电波,协助患者完成动作,以尽可能实现功能独立[12-13]。特别地,对于急性脑损伤患儿,Chen K等设计一套搭载游戏的可穿戴机器人设备以提高儿童训练的积极性,并在踝关节康复训练中取得良好的效果,以帮助患儿神经重塑,改善运动功能[14]。
创伤性脑损伤(TBI)是指由头部的撞击、打击、震动或穿透性损伤所致的大脑正常结构和/或功能的破坏。每年创伤性脑损伤导致大量死亡和永久性残疾病例,据统计,由TBI所致的死亡例数占到所有创伤的1/3,尤好发于婴幼儿、青少年和老年人。TBI的严重程度可能从“轻度”(精神状态或意识的短暂变化)到“严重”(受伤后出现长时间的昏迷或健忘)。同时,创伤性脑损伤因其不明显的临床表现又被称作“沉默的流行病”,相比其他肉眼可见的创伤更具危害性[15]。
3.1 预测风险在所有就诊的TBI患者中,约有80%的患者最先前往急诊,而TBI症状本就不明显,这种情况给纷繁复杂的急诊室诊断该病增加难度,且有限的临床资源无法为每个前来就诊的头部受伤患者提供影像学检查。Michael W. Dusenberry 建立一个专门适用于由跌倒所致的老人轻度颅脑损伤的CT阳性的预测模型以帮助医师筛选出高危患者并尽快完善CT检查[16]。在该AI系统中,仅需收集一些临床可直接获取的资料,如从何处跌倒,伤后是否出现痴呆,是否服用抗凝药等,即可预测出该患者的CT阳性率,帮助合理配置医疗资源。这颠覆既往业界广泛认为的大于65岁的纳入条件,而后者一直存在着CT异常阳性率过低的缺陷。
3.2 诊断AI阅片已在多个亚学科发展相当成熟。有学者通过利用AI检测头颅CT平扫中的病变,并具有很高的准确性。在此算法中,Sasank Chilamkurthy等采取深度学习技术,并用23 263例CT平扫影像对算法进行训练,经过训练后的AI系统可以精确地给出病变情况,如出血量及部位、是否有颅骨骨折、是否存在占位效应及中线移位[17]。对于轻度TBI(也常被称作脑震荡),AI也有很高的敏感性。Victor M. Vergara等设计较传统的支持向量机,通过用ML的办法结合dMRI来进行诊断[18]。
与以往影像学方法不同,R.O. Bahado-Singh等通过用AI检测创伤后炎症反应所带来的表观遗传改变及蛋白表达的改变,发现许多与儿童脑震荡相关的生物标记物及基因甲基化改变。经过AI的初筛后,各个标记物的预测价值还需要后续的研究进一步评估[19]。
3.3 神经重症监护对于严重创伤性脑损伤患者,神经重症监护室占据重要地位,在此过程中的监护及治疗直接影响着患者的预后。对于TBI患者,有诸多的参数需要实时监测并依据其变化尽快调整治疗策略。AI的实力已在一般的重症监护室中得到证明[20],并在RICU(呼吸重症监护病房)中逐渐开始进行探索。对于TBI患者,颅内压的监测和管理是首要的,一旦出现急剧的上升很容易导致各种并发症的出现甚至致命。因此,Zhang F等采取一个可预测短期未来的平均颅内压的AI算法,以提前告知医师准备好应对手段[21]。而目前更优化的策略是,当AI监测到颅内压持续上升20 mmHg达医师预设的一定时间后,训练有素的AI决策系统将自动进行甘露醇给药。不仅如此,AI还可同时监测血浆渗透压、尿量改变等其他参数,以达到最合理的给药策略[22]。
对于在神经重症监护中出现癫痫的患者,AI系统的给药似乎更加科学。在对脑电波进行实时读图判断后,一旦监测到癫痫波,AI即时调整抗癫痫药的给药方案,缩短从症状到治疗之间的时间差;而当脑电波波形恢复正常时AI即停止给药,这比目前临床上通过症状来判断何时停止的方案更加精确[23]。
3.4 预后评估现代外科手术方案的制定及术后情况预测需要建立在精准的术前预后评估的基础上。早在2005年,Min-Huei Hsu等[24]就编写ANN用于更细化的预测创伤性脑损伤后的预后。尽管该算法用4 460个病例进行训练,但正确率只能达到75.8%,这可能与其选取的变量预测性不够强有关。Andrew T. Hale等[25]报道通过ANN来评估儿童TBI预后的方法。在该算法中,用于预测预后的变量共有9项,涵盖格拉斯哥昏迷评分、瞳孔对光反射情况、当前血糖、血红蛋白等相关预后不良因素。为了评估TBI后住院患者的死亡率,Kazuya Matsuo等[26]在其设计的ANN中引入更多的参数,这当中还包含CT表现、相关实验室检查结果等,并对各个预测因子的重要性进行计算。该研究发现,FDP(纤维蛋白降解产物)水平可能是实验室检查结果中最重要的预测因素,这与之前其他研究认为最强预测因素血糖相悖,同时也提示后续还需要深入研究去揭示其病理生理机制。
为了让AI更准确地预测预后,在技术层面,Cheng-Shyuan Rau等[27]横向对比Logistic回归、支持向量机、决策树、朴素贝叶斯及ANN各自用于预后评估时的性能,证实ANN具有明显的优势。而Hakseung Kim等[28]运用ML剔除数据的“伪影”,进一步提高AI系统的准确性。
经过若干年的临床考验,AI技术已得到医患双方的信任,并渗透到各个亚学科范畴。但同时,当前市场上存在各式各样的AI算法,即使是用于同一种疾病甚至是同一临床步骤都存在多种AI系统可用,因此亟需出台类似药品监管的政策以保证AI系统的合格性及一致性,并由政府和企业合作牵头,研发出相对整套的AI系统,而不是纯粹的各家AI系统的堆砌,以避免各个算法功能上的重叠和结果上的冲突,给临床使用减负。
其次,性能强劲的ANN有其独特的缺陷,即其推理过程的不透明性。虽然随着隐藏层的增多,其推理模型也更加稳定,但却无法解释其中间各层的计算过程、权重及真实意义。一旦AI发生错误的判断,程序员也无法去追溯错误来源。
最后,AI的伦理问题自其问世以来就一直被反复讨论,当面对更加敏感的医疗领域时更是如此[29]。AI的训练必须建立在充分的数据上,但数据的获取、保存及传输流程并不像传统的临床研究那样完善。而当AI面临患者时,其也只是单纯地运用既往的数据给出结论,并不会考虑任何与输入参数以外的患者情况,即便是最直观的个人信息和经济情况。
随着大数据和5G时代的到来,AI将迎来新的发展浪潮,继续引领医疗水平的提高,帮助解决当下普遍存在的医疗资源分布不均等问题。但如上所述,当前AI应用存在诸多局限性,编写AI的工程师、医疗工作者及监管部门应及早主动寻求多方协助,从源头对AI进行质量控制和监管,以让AI更准确、更人性地服务人类。