李洪峥,杨文文,曲 华,龙霖梓,付长庚
诊断是制约中西医结合医学发展的重要因素。既往中西医结合诊断存在多种模式:西医病名诊断与中医证候诊断相结合,西医病名诊断与中医病证诊断相结合,中医病名诊断与中医证候诊断相结合等[1-3]。而中西医结合诊断结果则囊括了西医、中医双重诊断结论,涉及了症状体征、量表、影像学、血清学、分子生物学等多模态(multi modal)指标综合评判。但对于中西医结合学科的病、证诊断而言,仍遵循各自标准,尚无统一模式,各诊断方法之间也无权重偏颇,为综合诊断的准确性及后续治疗方案设计带来了一定困难,也一定程度制约了中西医结合医学的发展。在过去的半个世纪中,中西医结合学科迎来了史无前例的发展机遇,中西医病证结合模式下的诊断标准、疗效评价标准、风险预测模型相继发布,多组学技术的发展也为病证结合下的生物标志物筛选带来了更多途径,高速发展的计算机技术为中医药标准化、智能化提供了更高的平台。虽然这些研究成果在科研领域得到了广泛关注,但尚未普及临床,是否真正全方位地提高临床诊疗效率,增加病人获益仍有待商榷。有鉴于此,本研究对传统中医诊断模式进行梳理,结合现代计算机科学及生物学技术,以冠状动脉粥样硬化性心脏病(冠心病)为例,提出应全面整合多模态信息,充分利用算法处理复杂多元信息,以提高个体化诊疗效果为出发点,结合临床经验、循证证据,建立起中西医结合多模态诊断模式的思路。
中医处方用药的最早记录可追溯至《黄帝内经》,以内经十三方为代表的中医诊疗是建立在“病、因(病因病机)、色、脉、证(症)、治”体系的基础上[4]。而“方书之祖”《伤寒论》则建立于“病、脉、证、治”的方证体系上,以症状及其组合形式与方药对应[5]。而汉代以后的诊断模式,大多沿袭《内经》《伤寒论》思想,如宋代《三因极一病证方论》循“病、证、治”体例,元代朱丹溪的《脉因证治》同《黄帝内经》相一致,明代张景岳的《景岳全书》在《伤寒论》基础上增加了经义、述古,清代王清任的《医林改错》则以“病、症、治”为体系。而上述“病”“证”的本质均为不同的症状群[6-7],由此可以见得,病、脉、色、证,即症状、体征是传统中医诊断的核心,病名是传统中医诊断的结果。
中医学对疾病的诊断是全面、动态、本质化的,通过“望、闻、问、切”四诊合参的方法,从不同角度收集症状、体征、病史、病因等病情资料,并将其概括为特定的中医疾病病理本质。有学者认为,四诊合参是中医思维指导下的四诊信息综合处理模式,中医学基于整体思维形成疾病判断,认为人体是一个有机整体,四诊信息之间相互关联、互为因果。且表现于外的症状、体征均复杂多变、亦真亦假,只有充分收集四诊信息,才可系统把握疾病现状,对患病的人体有全面的认识,不至于因信息采集不全面而产生误诊、漏诊[8]。可见,四诊合参作为独具中医特色的诊断原则,是中医疾病诊断的主要内容。
采用标准化、可视化技术,采集中医“望、闻、问、切”四诊资料采集,是中医诊断客观化的基础,更是保障病证诊断准确性的基础。随着信息技术的快速发展,利用现代可视化技术将四诊信息进行处理为量化的数据,是中医诊断学领域现代化发展的必经之路。在过去将近半个世纪的中医现代化研究中,研究者们致力于将四诊信息转化为光、电、压力、图像等量化、可识别数据,继而通过数据的标准化处理,形成舌诊仪、脉诊仪、目诊仪等设备,用于中医临床诊断,对于临床诊疗、中医师培养都有较大裨益[9]。但囿于各类设备使用的算法、技术不同,在数据采集的准确性上仍有较大提升空间,鉴于此,试图以设备替代临床医师采集四诊数据仍面临一定挑战。
随着大数据、机器学习算法、自然语言处理、可视化技术等的快速发展,人工智能(artificial intelligence,AI)技术推动了医学的发展[10]。在众多传统中医诊断方法中,望诊、脉诊、问诊受到了现代科学技术的关注与热捧,也成为了中医智能化发展的排头兵。
目前中医诊断智能化、可视化研究大多集中在望诊方面,如望舌、望面、目诊等。研究热点主要集中在AI技术辅助舌诊图片识别及疾病诊断中的应用方面[11-12]。全部过程可分为图像采集、图像信息预处理、模型构建、模型训练与评估4个阶段。由于图像采集的环境各有差异,舌象图像的质量评估和颜色校正等预处理手段异常重要[13]。对此,可通过对分割舌象图片,进行特征学习;基于大数据构建舌象图片数据库,减小图片间差异[14];以人机结合的方式标注舌象特征,提高对特殊舌象、舌苔的识别度[15-17]等。当前许多团队以学科融合发展为契机,开展了舌象采集、诊断设备的研发,如上海中医药大学许家佗教授团队前期研制的TDA-1型舌诊仪即为较好的代表。2017年始许家佗教授依托国家重点研发计划中医药现代化研究重点专项与清华大学、复旦大学、北京中医药大学等10家知名高校及企业联合开展《中医智能舌诊系统研发》工作,为舌诊这一传统中医诊断技术的现代化发展打下了坚实的基础。
类似于舌诊,面部、眼部等望诊方面也因图像处理技术的发展而变得客观化、可视化。在面部望诊方面,则采集面部相关数据,对疾病进行预测、评估。如AI Watcher利用人工智能算法,可通过面部特征预测肿瘤易感性的突变位点[18],即便对于西医疾病也有很强的提示作用。目诊方面则以《灵枢·论疾诊尺》为理论基础,利用了五轮八廓学说,在充分采集眼部图像及被采集者基本情况等信息后,通过AI算法建立关联为疾病诊断、预测服务,清华大学程京院士团队研制的目诊仪为该领域较佳体现。
脉诊是中医四诊中最难以客观化、定量化展示的诊断方式。脉诊方法有很多,如遍诊法、三部脉诊法、寸口诊法,当前因便于数据采集,脉诊客观化研究以寸口诊法为多。不同于面诊、舌诊仪可以直观采集图像,脉诊仪多利用高精度传感器采集压力、光电、声音振动等数据,获取桡动脉搏动信息[19]。而后在对数据预处理阶段,按照脉动节律、力度、频率等维度对数据进拆分处理,并利用算法处理分析不同脉象的频谱规律。为提高运算结果准确性,大多以名老中医、高年资临床中医师对脉象判断作为标准,借助大数据进行机器学习。由此可见,多维脉冲的数据采集是脉诊客观、规范化的核心。此外,仅寸口脉就有浮、沉、迟、数、滑等20余种,还有十怪脉、七绝脉等。因此,当前研究多将复杂脉象通过标准化处理,重新归类,以减少因划分过细导致的结果混乱。例如SM-1A中医四脉脉诊测量仪便是依照全国首批500名老中医药专家学术经验继承人导师之一的刘绍武先生“四脉定证”理论,将脉象整合归类于四大类别[20],有力地提高了脉诊仪的诊断准确性。
传统中医问诊主要是询问病人病史、病情获知症状、体征、发病原因、影响因素等信息,协助疾病诊断。目前的问诊采集系统也以临床医师问诊为模板,参考中医十问歌等信息,以标准化、客观化和规范化采集病人信息。以此标准化信息构建数据库,分别归纳整理出疾病、证候、症状的子数据库,作为问诊系统构建的第一步[21]。可见,标准化的中医术语是问诊系统发展的基础。近年来,随着《国际疾病分类第十一次修订本(International Classification of Diseases 11th Revision,ICD-11)》《中医临床诊疗术语第2部分:证候(2020年修订版)》《中医临床诊疗术语第3部分:治法(2020年修订版)》等标准颁布,中医术语标准化已有据可依,但对于症状这一丰富数据资源仍有待进一步规范。此外,20世纪的专家系统即为问诊采集系统的雏形。但早期专家系统存在缺乏学习能力、迭代更新空间有限、词向量关联度缺乏保障、单线程推理等问题,同样制约了中医问诊系统的开发,这也为今后的问诊系统开发提供了契机。
随着现代生物技术发展及研究层面的深入,分子生物学成为了多种疾病诊断中的重要途径,基因组学、蛋白组学、代谢组学等,对于中西医结合病证诊断有一定的指导意义。
针对同一病证的不同进展阶段,研究借助超高效液相色谱-飞行时间质谱的非靶向代谢组学方法,筛选出了磷脂酰胆碱等5种潜在生物标志物和苯丙氨酸代谢等4条主要差异代谢通路,为鉴别冠心病血瘀证不同进展阶段提供了一定诊断价值[22]。针对同一疾病不同证候,以冠心病不稳定型心绞痛为例,基因组学研究发现小核糖核酸(micro-Ribonucleic Acid,miRNA)中的miR-146b-5p、miR-199a-5p等可作为血瘀证的潜在生物标志物,而miR-363-5p、miR-688等可作为痰浊证的潜在生物标志物[23]。而针对同一证候不同病位,也可通过不同组学方法进行标志物筛选。以中医气虚证为例,早期研究认为三磷酸腺苷为中医“气”的物质基础之一[24],通过自噬等方式改变代谢物质[25],调节免疫功能、能量代谢、抗氧化能力[26]。当气虚病位在脾,可通过肉碱(C8∶0)和分子量341.282的化合物等作为潜在标志物[27];病位在心,则有血浆环磷酸腺苷、去甲肾上腺素等升高作为提示[28];病位在肺,则通过病人呼出气体中2,4,4-三甲基-1,3-双-异丁酸戊酯等含量改变体现[29]。由此可知,现代生物技术为中西医结合医学病证诊断标志物的探索提供了有力支持。
除需找到对中医诊断的充分条件外,还需认识病证诊断中的鉴别条件。在宏观维度,传统中医鉴别诊断通过病人不同症状表现对证候进行鉴别,而在微观层面,则考虑通过突变位点及异常通路等情况等进行鉴别。如多囊卵巢综合征病人的不同证候之间,存在较明显的信号通路差异,如肾虚证以卵巢内甾体激素合成分子信号通路异常为基本病理特点,肾虚血瘀证以生殖器官的慢性炎性因子的信号通路改变为主,脾虚痰湿证以糖脂代谢的胰岛素信号分子传导通路障碍为基本病理特点,肾虚肝郁证以中枢边缘系统海马杏仁核内氨基丁酸类神经递质改变为病理特点[30]。将证候特征与信号通路建立关联,使传统中医诊断在微观层面有了全新意义。
考虑到中西医结合的诊断体系存在多种方法,每种方法准确性不同,也有对应的不同衡量标准。但是通过多模态数据的融合(multimodal fusion),判断好每个模态诊断结果的置信水平,明确被判断模态间的相关性,做好对多模态的特征信息的整理及降维运算,以及处理好非同步采集的多模态数据配准等,是初步实现中西医结合多模态诊断体系构建的前提。
随科学技术发展,基因组测序、图像处理和医疗数据管理等为医疗数据的采集、管理与综合分析提供了支持,有助于研究者们能够更加全面、系统地了解疾病,也有助于临床医师能够更加客观、定量地诊断疾病。但是,统一不同形式的复杂的生物医学数据,并组合分析其各自的特征向量成为医疗数据综合分析的难点[31]。多模态技术,不同于传统的单一生物识别方式,是指通过集多种采集方式为一体的采集器,采集不同的生物特征,经识别后使其融合、结合,已广泛运用于阿尔茨海默病、抑郁症、恶性肿瘤等疾病的现代医学诊断与预测中[32-34]。而对于中西医结合医学而言,中医的“望、闻、问、切”四诊信息与西医的检查检验等诊断信息的融合同样有赖于多模态技术的采集、识别、综合处理,并更加紧密地将病证结合统一,给予病人更加精准、明确的中西医结合治疗方案。
以冠心病血瘀证为例,冠心病血瘀证是典型的中西医病证结合诊断结果,实现这个诊断结果需要进行疾病、证候双重诊断。根据现有指南,依据电子计算机断层扫描技术等,即可获得影像模态的数据,再依据对应诊断标准,明确病名诊断结果。根据现有冠心病证候、证候要素诊断标准,可获得症状、图像(舌、面、皮肤)、脉象、血液等多模态数据。在标准制定的过程中,可明确各模态诊断结果的置信水平及模态间相关性,在对量表赋分时即完成了多模态特征的降维运算及数据配准,从而实现了多模态融合的目的,由此获得了证候诊断结果。但是这样的多模态融合未能实现疾病与证候的充分融合,对于这样两个非同步采集的复合模态数据,如何更好地实现配准成为了新的问题。那么潜在生物标志物等模态数据的增加,或许可以针对性地提高诊断准确性,也为病、证这两个复合模态数据的融合提供了新的思路,详见图1。而结合最新研究结果,实时更新疾病的中西医结合诊断标准、诊疗指南,也可有利于临床诊断准确性的提高,进而有助于精确提供中西医结合治疗方案。
图1 冠心病中西医结合多模态诊断模式思路
自1982年国务院学位委员会将“中西医结合”设置为一级学科起,至1992年“中西医结合医学”正式成为国家标准《学科分类与代码》的学科之一,中西医结合医学快速发展。在将近半个世纪的发展中,中西医结合诊断方法的研究已成为中医客观化、定量化、标准化诊断的重要组成部分。由此,中西医结合诊断出现了西医疾病结合中医证候、西医疾病结合中医病证、中医疾病结合中医证候的多种模式。但无论哪种模式,仍未能将中医、西医两套“体系”的诊断信息完美融合,二者缺一仍可独立诊断,予以治疗方案。有鉴于此,处理、融合传统中医病证诊断及现代医学疾病诊断的复杂多元信息,以提高个体化诊疗效果为出发点,结合临床经验、循证证据[35],探索并建立中西医结合多模态诊断模式,对提高中西医结合医学诊断准确性、治疗规范性有一定意义,对促进中西医结合医学发展有一定意义。