医学知识图谱将知识图谱与医学知识进行结合,定会推进医学数据的自动化与智能化处理,为医疗行业带来新的发展契机。
循证医学(evidence-based medicine,EBM)又称实证医学,其核心思想是医疗决策应在现有的、最好的临床研究基础上作出的一种结合个人的临床经验。循证医学不同于以经验医学为主的传统医学,它只是强调任何医疗决策应建立在最佳科学研究证据基础上。因此,循证医学的出现为客观化、科学化奠定了基础。然而,循证医学也有它的缺陷。例如,药物是通过临床试验的不断验证而获得许可的,但是想进入上市阶段,还需要临床试验后期的不断验证。即使这些药物上市,在大量人群的使用中仍然存在问题,所以很多药物又被退回基地。为此,我们需要对已积累的病情数据进行不断的挖掘,这样才能反映整个诊疗中出现的问题。
随着大数据的发展,越来越多的领域开始从经验走向知识。当经验转化成知识时,整个医学临床决策会更加客观化、智能化和个性化。在知识密集型的医学领域,它经历着从循证医学到一种基于数据的可靠模型的医学转变。在当今智能时代,涵盖三大核心技术体系的临床诊断辅助系统包括知识库(知识应用)、人工智能(数据挖掘)、统计建模(辅助决策)。其中,每一部分都对医学领域的临床诊断决策起着至关重要的作用。
在医学学科发展的过程中,临床路径的更新和规范化的临床指南的应用对临床医生造成越来越大的压力。医生与计算机技术的紧密结合,使得智能临床辅助决策支持变得可行。计算机技术处于发展上升阶段,它的不断发展为今天的智能时代添加了“催化剂”。很多诊断检测步骤都是在计算机的辅助下完成的,包括从整个人群的疾病筛查到真正把它检测出来,形成最终的临床报告。与仅有医生诊断相比,计算机和医生的结合会使医疗效率大大提高。此外,计算机和医生的结合也会使医生误诊率大大降低。为此,我们希望更多的计算机与医生相结合,利用现有的智能技术将医生的误诊率降低至更小乃至为零。当前,计算机的存储与计算能力的大幅度提高会使医学数据愈发丰富,医学信息标准越来越规范,从而减轻医生诊断压力、提高医生的诊断效率和服务质量。
计算机可以辅助医生分割图像、提取特征。但是,病情的分析、影像分类建模的工作还需要医生的临床思维、专业知识做牵引,这样才能接近临床场景,才能解决临床问题。
借助医学知识图谱,临床诊断决策支持系统可以根据患者症状描述及化验数据,给出智能诊断、治疗方案推荐及转诊指南,还可以针对医生的诊疗方案进行分析、查漏补缺,减少甚至避免误诊。
目前,人工智能在语音识别、影像识别方面凸显优势,但以决策诊断为主的医学人工智能在国内几乎是空白。造成这一空白的核心原因是医学人工智能无法拥有人类生活中的逻辑思维和由庞大的知识库形成的知识图谱。近年来,建立知识图谱的工作已成为知识服务领域的一个新热点,并受到国内外学者和工业界的广泛关注。其中,国家重点研发项目“疾病研究精准医学知识库构建”在国内学者的牵头下开始展开。该项目最终形成一个标准——规范标准、系统全面的精准医学本体和语义表示,一个库——面向全疾病谱、可自动更新的精准医学知识库,一个平台——可交互、可更新医学知识的共享平台。该项目不仅能够补充和完善国内全疾病学术方面在临床转化中面临的产品化、可视化、工具应用、数据端接口、数据关联等底层技术问题,还可以通过知识库的关联建立知识图谱,以此辅助医生的决策诊断、制定个性化的诊疗方案。
人们对医学人工智能的认识是用深度学习去看医学影像,实际则不然。首先,医生需要翻阅大量的医学文献和临床指南,做各种各样的知识库。其次,医生需要找到从分子水平到个体水平的关联,形成庞大的知识图谱,这是非常重要的。在建立知识图谱的过程中,我们需要将患者目前的疾病症状与之前已有的相同或者类似的疾病症状连接起来,找到其相似点并进行比较。此外,我们需要深入挖掘隐藏的特征——隐性的知识。然而,想要挖掘那些隐性的知识,又是一个相当复杂且有挑战性的工作。例如,在医学影像领域,医生不仅要将各种病例的医学影像分类,还要将
患者症状与已有的知识库及隐性的知识连接起来,重新推理,形成图像和知识库连接的知识图谱。在这个过程中,医生需要经历一个相当复杂的推理过程去研究一个疾病的症状,不仅要参照医学文献和临床指南,还要在将它们中的知识消化成自己的知识之后再进行深度挖掘,从而形成隐性的知识。
很多针对肺部疾病的筛查公司检测病灶的能力很强,但他们并不能判断病灶的发展程度。这就需要依靠医生的先验知识与机器检测结果的结合才能实现更精准的诊断结果。为此,我们建立了一种叫基于混合专家模型预测知识图谱的肺部电子计算机断层扫描(CT)影像辅助图谱。它包括对病灶的筛查、分割,参数的提取,准确模型的建立,以及含有专家推理报告的肺癌和肺结核影像知识图谱的构建。例如,医生在一名男性艾滋病患者的肺部发现了明显的病灶,但这个病灶是否属于肺癌,医生不能立即给出结论。他们需要将医学影像分析出来的病灶参数与临床指南里的参数比较并整合在一起,在这个基础上,医生再把病灶的特征、发展程度与已有的知识库构建而成的知识图谱进行分析、比较。最后,医生给出准确的结论——良性的结核。基于此种方式,医生能对患者的病灶进行更加精准、全面的分析,得出可解释性较强的结论。在基于混合专家模型预测知识图谱的肺部CT影像辅助图谱中,医学影像处理为前半部分,如何把在医学影像中找到的疾病特征和知识图谱结合起来为后半部分,前后两部分相结合才是完整的知识图谱的构建。这样才能补充和完善临床诊断决策所需的推理能力,全面覆盖临床信息,为临床诊断决策分析提供重要的证据。
罕见疾病又称“孤儿病”,发病率很低,患病人群较分散。目前,罕见疾病的种类超过7 000种,80%具有遗传性,以先天性畸形、内分泌代谢及神经系统疾病为主。部分普通医生无法在第一时间做出正确的医学诊断,往往需要将患者转至三甲医院,且在多学科、跨专业的临床专家协作下进行精准的治疗。此外,罕见疾病在病症指数增长不是特别明显的时候往往容易被漏诊,漏诊率达到99%。一旦漏诊会造成严重的后果,到了一定年龄,它可能会造成患者残疾或者死亡。
基于罕见疾病患者照片中的面部特征(又称人类表型本体,HPO)可以被利用并进行推理,医生可将深度学习识别面部特征技术与已有的知识库相结合,对目前的罕见疾病进行图像和知识库的关联性分析,绘制出一个基于大量数据的、通过面部特征筛查罕见疾病的知识图谱。患者在就诊期间可以依据这个知识图谱询问具体病情。同时,医生可以根据这个知识图谱更加准确地诊断罕见疾病,减少误诊及漏诊的发生,从而大大提高罕见疾病的初诊正确率。
医学知识图谱将知识图谱与医学知识进行结合,定会推进医学数据的自动化与智能化处理,为医疗行业带来新的发展契机。借助医学知识图谱,临床诊断决策支持系统可以根据患者症状描述及化验数据,给出智能诊断、治疗方案推荐及转诊指南,还可以针对医生的诊疗方案进行分析、查漏补缺,减少甚至避免误诊。但是,在实际应用中,医学知识图谱的应用存在两个方面的问题:一是缺少完备的全科医学知识图谱;二是临床诊断决策的可靠性有待提高。对于前者,目前基于知识图谱实际应用的临床诊断决策主要还是针对特定疾病类型,无法广泛应用。对于后者,临床诊断决策直接关系到患者的身体健康问题,需要更加准确、可靠的临床诊断决策推动医疗的发展。目前,国内医学知识库建设刚刚起步,主要是基于单一信息源的医学知识库,以及一些自主构建、结构各异的专病知识库。这些知识库还需要在数据完备、标准共享等方面进行完善,与国际接轨。