陈亚飞,刘 琼,关 双,于亚南,刘 骏,王思村,王 忠
中国中医科学院中医临床基础医学研究所,北京 100007
数字孪生是对物理对象、流程或系统在数字空间的模拟映射,该技术理念脱胎于“信息镜像模型”(information mirroring model),2002年由密歇根大学的 Michael Grieves 教授针对开发产品的全生命周期管理模式提出[1]。事实上,早在1994年,即有学者将计算机构建的动脉模型命名为“数字孪生”[2]。直至2010年,美国宇航局正式在阿波罗计划中应用数字孪生,建立外太空空间航天器的数字孪生体,进行仿真飞行、检测和预测[3]。之后,数字孪生逐渐被应用于制造业、城市规划建设产业、汽车工业和医疗保健等行业,对产品设计、性能测试、功能制造、使用维护等进行全生命周期的仿真分析,以提升生产和管理效率[4]。经过产品设计和工程活动等创建过程的持续改进[5],数字孪生概念逐渐演化为:充分利用物理模型、传感器更新、运行历史等数据,集成多学科、多物理量、多尺度、多概率的仿真过程,在虚拟空间中完成映射,从而反映相对应的物理实体对象(物理孪生)的全生命周期过程[6-7]。
为实现产品的全生命周期管理,数字孪生技术的仿生映射框架由3个基本部分组成:现实空间中的物理孪生体(系统或过程)、虚拟空间中的数字孪生体以及数据和信息的连接[8]。不同于其他技术,数字孪生具有如下5个特性:(1)连接性:即物理孪生体与数字孪生体的数据信息连接,通常是通过物理孪生体上的传感器获取,实现与数字孪生体的实时交感互通;(2)数据均质化:数字孪生技术本身便是数据均质化的结果,同时又推动数据和信息实现均质化的存储和传输;(3)智能化:通过物理对象上的传感器、人工智能技术和预测分析,对数字孪生体进行重新编程,实现物理孪生体的改进和调整;(4)数字迹线:跟随数字迹线探本溯源,可快速精准地查询物理孪生体故障;(5)模块化:对于数字孪生体的模块化构建,可针对性地仿生和模拟,对于物理孪生体进行模块组件的调整和改善[9]。对于医学领域的数字孪生,尽管其物理对象变成了人、器官、医疗器械、手术流程等,但这些优势仍然存在。
随着现代医学的发展,“以疾病为中心”的医学模式逐渐向“以人为中心”转变,旨在为人提供全生命周期的健康管理。数字孪生的出现,填补了宏观表型与微观组学的鸿沟,可真正意义上实现人的全生命周期健康管理,展现出整合多组学数据和环境影响的潜力。目前,数字孪生技术已不仅仅局限于心血管、骨和脑等结构性器官的构建,其已应用于疾病标志物的预测、慢病的长期管理和癌症的预后预测,涉及临床诊疗、药物研发、药理验证等多个方面。然而现阶段,我国医学数字孪生研究尚处于起步阶段,本文通过梳理国内外数字孪生在医学领域中的方法和应用,以期为我国开展医学数字孪生研究提供参考。
数字孪生并无特定的技术和方法,国外有学者表示无论何种建模方式,只要能足够准确地表示正在孪生的物理对象便是数字孪生[10]。因此,无论是人工智能、机器学习、机械建模或是多方法集成应用,只要能将物理对象、流程或系统在信息化平台内精准模拟表达,便认为是数字孪生的方法。
机器学习有着模拟人类思考逻辑的优势,故其常常被用作构建医学数字孪生模型。韩国天主教大学医学院团队使用机器学习方法分析3家医院临床数据库的前列腺癌患者数据,采用信息增益法(information gain,IG)进行特征选择,利用随机森林(random forest,RF)方法建立模型,预测前列腺癌的生化复发[11]。Hussain等[12]采用支持向量机(support vector machine,SVM)算法结合卒中患者的临床数据构建模型,确定了脑卒中的脑电图生物标志物及其阈值测量值,可作为疾病诊断和治疗的临床辅助系统。Chakshu等[13]采用多层感知器(multilayer perceptron,MLP)和递归神经网络(recurrent neural networks,RNN)构建分诊肺炎患者系统的数字孪生,提出了三层策略,对患者是否收入重症监护室、是否使用呼吸机和是否停止重症监护和呼吸机的3种状态进行识别判断、分类及死亡率预测。但机器学习方法存在依赖高质量/大量数据、依赖数学统计模型、无法进行自主选择、存储服务成本过高、可解释性差等局限,这些局限在医学领域应用时更易被放大,尤其是在数据问题(难以保证质量高、数量大的数据源)和可解释性(无法观察学习过程,输出结果难以解释)方面。
计算机建模是应用计算机计算模型、构建物理对象参数并对其进行立体化展示的一种仿真模型技术,可反映系统行为或过程[14]。Baumgartner基于全细胞膜片钳技术实验和文献综述,使用隐马尔可夫模型(hidden markov model,HMM)对A549肺腺癌细胞单通道动力学进行建模,首次模拟通道间相互作用,且可预测细胞周期部分的膜电位变化[15-16]。Hoehme 等[17]采用正弦网络整合细胞间、细胞与血管、细胞与基质等相互作用力公式,建立肝部分切除术后生长的可视化模型,并利用无生物生长机械应力的孪生模型反向证实了生长机械应力的存在,这在动物实验中也得到了验证。Defraeye等[18]通过对患者皮肤建立数字孪生体,模拟药物扩散、储存和分配,从而获得芬太尼透皮药物递送释放和摄取动力学的定量见解,发现透皮芬太尼的摄取与年龄和贴放位置密切相关,这可为不同年龄和疼痛部位的患者量身定制芬太尼贴片的用量和贴放位置。计算机建模的优点在于对时间或空间模拟的可视化,但其缺点也显而易见:由于对计算能力要求极高,制约了其对于整体或部分整体的大规模模拟。
除此之外,很多学者对于医学数字孪生方法还有着其他不同见解。Li等[19]收集季节性过敏性鼻炎患者的0~7 d细胞及差异基因变化,使用IPA(ingenuity pathways analysis)软件构建了随时间变化的多细胞互作网络模型,从而确定用于个性化治疗的生物标志物、新候选药物以及药物组合。Masison等[20]使用可发展的模块化计算框架描述人体数字孪生,将独特的生物过程转化成编程语言,完善了数字孪生框架。这些各具特色的数字孪生方法体现着研究者对于数字孪生的思考,医学数字孪生的发展需要百家争鸣的“声音”。
数字孪生技术在临床诊断中展现出巨大的发展前景。无创的、二维影像技术(X线、CT、MRI等)作为常用诊断手段,需医生具有较强的专业知识储备和三维空间想象能力,不同医生的诊断结果通常会有所不同,因此利用数字孪生技术对二维影像进行三维构建,在保证诊断正确率的同时,可减少对患者的有创伤害和经济负担。在心血管方面,利用三维成像技术结合计算流体动力学(computational fluid dynamics,CFD)可更好地诊断和分析冠状动脉疾病、主动脉瘤、主动脉夹层、瓣膜等心脏结构性疾病,且数字孪生技术在瓣膜假体和支架设计领域也发挥着重要作用[21-25]。Nørgaard等[26]通过对冠状动脉CT血管造影及CT影像进行分析,建立患者心脏的3D立体化模型,以无创影像的方式识别患者的心肌缺血程度,可大大提高诊断准确度,并减轻对患者的有创伤害。在肺疾病方面,有学者提出一种深肺实质增强(deep-lung parenchyma-enhancing,DLPE)计算机辅助检测方法,用于检测和量化胸部 CT 上的肺实质病变,可有效确定COVID-19 关键临床指标并预测COVID-19 肺部后遗症[27]。在脑血管方面,Hussain等[12]利用脑电图数据和机器学习模型为脑卒中患者建立数字孪生模型,结果发现使用SVM比其他机器学习方法能够更好地提升诊断准确度,并发现了脑卒中的潜在脑电图生物标志物,有助于脑卒中的预防、诊断和预后预测。精准的辅助诊断需要合适的统计模型和大量高质量的数据进行训练,否则模糊甚至错误的结果会给临床医生带来误导。
数字孪生可在选择特定治疗之前,通过模拟设备反应或剂量效应来判断医疗设备或药物治疗是否适合患者[28]。在肺炎诊疗过程中,Chakshu等[29]采用1895例肺炎患者的数据训练深度学习模型,以构建肺炎患者的数字孪生体,使用受试者操作特征曲线下面积识别肺炎患者中的危重病例并优先处理,实现了医疗资源的合理应用。在骨科手术中,利用数字孪生技术模拟应用不同长度的螺杆和是否注入聚甲基丙烯酸甲酯水泥对于术后骨愈合的影响,通过在步态期间施加最大负荷来评估机械强度、应力分布、骨间应变和骨骼运动,可有效评估真实手术中的应用状况[30]。在外科手术方面,Ahmed等[28]提出,数字孪生不仅可在外科手术新仪器、新技术或新疗法方面进行尝试和探索,还可增强住院医师的手术培训,在患者特定解剖和生理变化背景下进行模拟手术练习,帮助医生打磨手术流程和细节,优化手术过程并预测手术预后。在脑疾病方面,有学者提出数字孪生可作为受试者大脑的个性化复制品,用于模拟特定功能并预测神经康复或手术干预的结果[31]。
数字孪生技术通过建立患者的数字孪生体,模拟治疗干预条件、生活方式及环境影响等,可预测疾病预后,并随时调整状态,对疾病预后及慢病进行管理。在癌症的预后评价中,Thiong’o等[32]提出数字孪生技术可作为识别儿童癌症神经系统并发症预测因子及其治疗的前沿策略。Kim等[11]利用基于机器学习的数字孪生技术,对于前列腺癌的生化复发预后标志物进行预测,准确率可达96.25%,与传统算法相比性能提高4%,有助于为前列腺癌提供临床决策支持。在老年慢病管理方面,张捷等[33]结合视觉传感器、人工智能芯片和深度学习算法等技术,研发了基于数字孪生技术的老年人实时监测报警系统,以避免或减轻老年人跌倒所造成的损伤。
数字孪生在药物开发中的应用基础是通过解析和重构患者疾病机制相关的所有分子、表型和环境因素,对数字孪生体进行无限复制,用数千种药物计算处理这些数字孪生体,以确定效果最佳的药物。数字孪生相对于机械建模,不同之处在于其虚拟群体应用敏感性分析确定患者间的不同参数,以开发更全面的临床评估模型[34]。在癌症的临床前研究中,Filippo等[35]提出基于数字孪生的单细胞通量平衡分析法,即将单细胞RNA测序技术数据整合至计算群体模型中,以模拟单细胞代谢表型的时刻动态变化以及代谢亚群的无监督识别。通过数字孪生和轻量级深度学习对干细胞图像进行分割、检测和跟踪,不仅可使图像轮廓更加准确、清晰,且其精度、召回率、F1值分别比相差成像法高0.038、0.024、0.043[36]。此外,一些贴敷/贴片治疗,也可根据数字孪生体的最佳模拟位置和剂量进行调整[17]。
由于难以真正意义上实现临床试验的数字孪生,目前研究大多集中于对临床患者检测数据的合成以及临床试验整个过程的模拟。比如,Emmert-Streib等[37]提出的数字孪生数据和数字孪生系统,用以合成临床试验数据和完善临床试验过程,并解释了其在临床上的伦理问题,为数字孪生在临床试验中提供了理论依据。Walsh等[38]提出在多发性硬化症患者管理中创建和实施数字孪生,使用受限玻尔兹曼机(conditional restricted Boltzmann machine,CRBM)模型计算临床试验中受试者的表征与其疾病进展的协变量关系,并生成预测该受试者就诊时潜在结果的临床轨迹,以改善诊断、治疗、管理策略以及患者的依从性等。Greenbaum[39]提出数字孪生可增加研究分析的数据量以补充随机对照试验,开发新的治疗方法。Barbiero等[40]采用生成式对抗网络(generative adversarial networks,GAN)合成临床数据,补充图神经网络(graph neural networks,GNN)构建的人体基因-细胞-组织-器官多层次映射,从而构建患者的数字孪生,实现了临床结局预测。Lin等[41]使用马尔科夫模型构建无过度诊断的结直肠癌随机对照试验的数字孪生,以计算粪便免疫化学测试筛查的过度诊断比例,结果显示基于人群的结直肠癌免疫化学测试服务筛查危害可忽略不计。
Li在瑞典数字孪生联盟网站(https://www.sdtc.se/)上提出这样的观点:随机对照临床试验可以证明药物对于大部分人有效但对少部分人无效,数字孪生将通过构建与个体患者疾病机制相关的所有分子、表型和环境因素的网络模型,用数千种药物模拟治疗目标患者以确定最适合的药物[42],这填补了随机对照临床试验的空白[43]。尽管数字孪生在临床试验方面展现出优于传统试验的优势和潜力,但其仍然存在数据无法完全可靠、难以基于生理学模型扩展以及存在伦理问题等局限。
传统医学将人视为一个整体,其中辨证论治的理论基础来源于中国古代的哲学理论——阴阳、五行、藏象等理论。但在现代医学看来,中医诊断和治疗仍然处于灰箱甚至黑箱之中,尽管通过多组学分析、网络药理学、生物信息学等技术方式逐渐探索出中医药的部分作用机制,但其中药-靶、靶-效关系等定量/定性研究仍需进一步深入探索。目前已有学者将数字孪生应用于穴位贴敷[44]和中药制药[45]的尝试,中医的整体观和复杂性或许能够通过人工智能和数字孪生技术进一步揭示,比如针刺穴位可能涉及神经、内环境、免疫系统甚至肠道菌群等多种作用机制,藏象学说中各器官脏器间相互影响的复杂关系等。
数字孪生的三大步骤包括数据收集、模型建立和模型验证。首先,可靠和客观的数据是模型建立的基础,但医疗数据涉及种族、偏见及隐私等问题,如何妥善处理数据安全问题仍是现阶段面临的难题。其次,技术的可行性和可靠性是保证模型准确性的基础,这需要数学统计、人工智能和临床医学等方面的知识和技术交融。单个器官和系统的静态或动态模拟逐渐能够实现,但人体宏观结构、微观内环境与生活环境的多维动态变化模拟并非易事[46],这一方面取决于对于人类本体的分析和观察,另一方面取决于人工智能技术对于人类的重构和组建。再次,消极的预测结果可能会影响患者病情走向,如何合理且正确地表达预测结果不仅关乎伦理,也关乎道德[47]。
对于流程和系统的数字孪生来说,尽管其在动物实验、临床试验、疾病管理和药物研发等系统性工程中展现出巨大优势,但上述领域仍然是使用人工智能、机器学习、临床试验模拟等方法,且传统的模拟方法并未实现方法和应用上的创新。例如,尽管数字孪生应用中提出了数字孪生数据和合成数据的概念和方法,但其与临床试验模拟中的数字患者(digital patient)相比并无优势。
为实现虚拟空间与现实世界的交感互动,数字孪生、元宇宙和平行系统等概念相继被提出并践行。元宇宙、数字孪生和平行系统皆有着依赖多学科交叉,多技术进步和多复杂建模的技术特性[48],但不同于宏观的“元宇宙”概念,因数字孪生和平行系统更加具象,其在医疗领域的应用更加落地。在王飞跃教授提出的平行系统中,数字孪生被认为是平行系统中的简单例子,且目前数字孪生的基础框架和流程均是平行方法的具体重述[49],但这会低估数字孪生的价值从而无法发挥出全部潜力。作为解决复杂系统智能管理与控制的两种有效手段,数字孪生与平行系统在方法和应用中各具特色和发展[50]。数字孪生对于工程系统的复杂建模和精准控制优势在医学领域依然明显,王飞跃教授在之后的研究中也提出数字孪生可作为对复杂性低而精确度高的系统模拟实现平行系统控制[51]。总之,数字孪生亟需探索出适合个体和系统的医学发展之路。
现阶段数字孪生在医学中的方法主要包括机器学习、计算机建模等,其在医学领域中的应用虽然涉及诊断、治疗、预后、药物研发、临床试验等各个方面,但主要集中于如下领域:(1)对于器官或机体的结构进行数字化建模并实现具象化,包括在心脏、心血管和脑神经疾病等方面的应用;(2)对于人体基因组学、细胞串扰、转录组学和环境影响等微观领域进行建模和应用;(3)对于临床试验、动物实验、疾病管理和药物开发等系统性工程的研究。相比于元宇宙、人工智能等宏观概念和构想,数字孪生的提出更加具象化,但其目前仍然是对于人类仿生模拟的顶层设计和最终目标。虽然现有的科学技术和人工智能无法实现对于人类整体的数字孪生体,似乎距离实时动态交互数字孪生、实现全生命周期管理尚且遥远,但随着计算能力的快速提升、高性能和廉价的智能设备快速迭代、大数据采集/传输/存储技术以及人工智能的进步,医学数字孪生定能突破虚拟与现实的交互限制,统筹宏观与微观的链接,推动医学进一步飞速发展。