孔鸣,何前锋,李兰娟
(1.浙江大学计算机科学与技术学院,杭州310027;2.浙江大学医学院附属第一医院,杭州 310003)
每年我国各类医疗机构诊疗总人次超过70亿次,且存在医疗资源分配不均、布局结构不合理等问题,医疗卫生行业面临巨大的服务需求压力。随着医疗信息化的快速发展,电子病历和健康档案的实行,产生了大量的文档、表格、图像、语音等多媒体信息。利用人工智能技术辅助开展医疗过程,对数据进行整合分析,为提升医疗卫生服务能力,解决医疗资源紧缺带来了新契机。
2017年7月,国务院印发的《新一代人工智能发展规划》中提到,应深化人工智能在智能医疗领域的应用,推广应用人工智能诊疗新模式、新手段,建立快速精准的智能医疗体系。人工智能技术能够对大规模开放式医疗数据的语义进行分析、挖掘和理解,实现对医学语义网络和知识中心的自动构建。通过对海量的医学文献、病例数据和诊疗方案进行快速检索,分析数据之间的隐含关系,能够开展辅助诊疗、药物研发等问题的研究,推动医疗技术的进步。通过对医学影像的智能分析,能够准确提取特征,定位病灶,为疾病预防与诊断提供帮助。此外,语音识别、视频理解、智能问答等技术能够在辅助病历记录、临床护理、康复指导、自动导诊等诸多领域展开应用。
实现医疗信息和健康数据的融合、开放共享,并利用人工智能对碎片化医学信息进行整理分析,对医疗诊断过程提供辅助,可改善医疗健康服务,促进政府决策合理化,解决医疗卫生资源配置不均衡问题,是人工智能与医疗领域的最直接应用,也是医疗人工智能发展的重点。本文选取健康医疗信息人机交互、数据智能中的语义理解与医学影像分析作为切入点,简要阐述了人工智能在辅助诊疗问题上的发展方向与现状,讨论了智能诊疗技术发展与应用的问题与挑战,为相关部门提供决策支持。
目前,利用人工智能技术对疾病进行临床诊断的研究主要围绕两方面展开:一是对海量医学数据进行分析处理,通过推理、分析、对比、归纳、总结和论证,从大量数据中快速提取关键信息,对患者身体状态和患病情况得出认知结论[1,2];二是通过对文字、音频、图像、视频等多媒体形式的诊断数据进行分析与理解,挖掘和区分病情特征,进行诊断和评估[3]。其中,医学信息的标准化表征和结构化整合是实现基于大数据智能手段进行辅助诊断的基础;而医学影像数据作为一种能够准确、直观反映病情表征状态的重要诊断依据,加之深度学习技术在图像特征提取方面的突破性进展,成为当前人工智能与辅助诊断结合最紧密的领域之一。本节将从医疗信息语义理解与医学影像分析两方面的研究现状入手,对人工智能辅助诊疗的发展现状进行分析。
医疗健康信息化的推进积累了海量的医学数据。转化自然语言的原始数据表达方式,整合提炼不同来源的数据,形成标准化信息,建立结构统一的信息化医学档案,不仅方便对医学数据进行存储、整理和查找,也有利于与人工智能技术相结合。
知识图谱作为一种应对互联网当中海量而零散信息的高效检索需求所设计的语义网络结构,对大规模数据及数据实体之间的关系具有很强的表达和管理能力。通过对海量的医学概念、实体、关系及事实进行整合,能够有效表示实体间的语义关系。将医疗机构、医药产品、诊疗病例、健康监测数据、基因数据、健康饮食数据、运动数据等相关数据与图谱进行链接并在时间维度上进行延展,是构建个性化、动态、多模态、可语义理解并用于人工智能辅助决策的健康医疗信息的基础。基于知识图谱既能够进行高效的信息检索、查询,也能够基于已有信息进行推理,挖掘隐含知识,开展科普查询、辅助诊疗、临床决策、药物研发、智能导医等相关应用的研究[4,5],提高医生及医院的工作效率,提供针对分级诊疗的智能辅助。
目前,通用知识图谱的应用已经十分广泛,如Google Knowledge Graph、Yago、DBpedia、搜狗“知立方”等。大型知识图谱的构建是在融合“在线百科全书”等结构化、半结构化数据的基础上,利用实体抽取、实体链接、关系抽取、属性填充等技术,对不断产生的不同来源、不同格式的开放式非结构化信息进行抽取,并通过知识融合、知识验证实现对知识图谱的扩充和更新[6]。
作为知识图谱重要的垂直应用领域,医学知识图谱的发展也早已引起国内外的关注。医学知识图谱构建在对医学知识进行全面整理的基础上,对关键医学知识和基本概念进行严格定义,形成权威、准确的医学本体描述规范,方便对不同学科、不同专业和不同来源的数据进行融合与验证,形成语义网络,为临床数据标引、医疗信息存储、检索和聚合提供便利。耶鲁大学通过整合神经科学知识库SenseLab[7],构建了包含从微观分子层面到宏观行为层面的脑科学知识图谱,帮助人类理解和表示神经科学领域海量信息之间的关联。由国际卫生术语标准制定组织(IHTSDO)维护的医学本体知识库SNOMED CT[8],包含了超过31万个具有独立编号的医学相关的本体,以及超过136万个本体间的相关关系,广泛应用于电子病历、基因数据库、检验结果报告和计算机辅助医嘱录入等多个领域。由美国国立医学图书馆(NLM)建设的一体化医学知识语言UMLS[9],整合了100多部受控词表和分类体系,包含了超过100万个生物医学概念和超过500万个概念名称。UMLS对不同词表在不同领域当中的应用进行联通,具有跨语言、跨领域和工具化的特点,在信息检索、自然语言处理、电子病历和健康数据标准方面得到广泛应用。
我国对临床术语的探索起步较晚,目前还未形成一套完整的、广泛应用的术语标准。中国中医科学院中医药信息研究所研制的中医药学语言系统包含超过12万个概念,60万个术语和127万个语义关系的大型语义网络,构建了中医药知识图谱[10]。但该系统存在构建定位局限、内容不够完善等问题,尚未得到广泛应用。此外,国内医疗卫生领域的相关机构和个人发起成立了开放医疗与健康联盟(OMAHA),通过行业协作、开源开放的方式来实现健康信息技术的标准化。2017年5月,OMAHA启动了医学术语协作项目,致力于通过众包协作的方式构建中文医学术语标准。
传统基于机器学习的医学影像研究围绕医生指定的图像特征展开研究,这使得模型只能围绕指定特征进行判断,导致模型泛化能力弱,且难以对病情发展程度进行分类。而深度学习模型具备良好的图像特征提取能力,能够对人类难以分辨和容易忽略的特征进行准确提取和有效分析,从而取得更高的准确率。
基于人工智能的医学影像研究围绕电子计算机断层扫描(CT)、核磁共振(MRI)、X射线、超声波、内窥镜和病理切片等多种类型的医学图像分析展开,对包括肺、乳腺、皮肤、脑部疾病和眼底病变等展开研究。对于部分疾病,人工智能诊断和分析的准确率已达到专业医生的水准。
视网膜“糖网”病变是糖尿病的一种典型症状。Google DeepMind Health团队将深度学习模型应用到视网膜“糖网”病变分类问题当中,通过准确检测视网膜眼底图像的病变情况对糖尿病黄斑水肿程度进行分级,对测试者进行病情预警和诊断。研究团队利用12.8万张视网膜眼底图像对深度学习模型进行训练,在测试过程中取得了 97.5% 的灵敏性和93.4% 的特异性,判断准确率与人类专业医生相当。
国内利用人工智能技术开展医学影像进行分析的研究也已收获成果。某眼科中心研发的人工智能诊断平台[11]能够利用深度学习模型对先天性白内障进行检测,利用晶状体不透明面积、深浅和位置三大指标对患者的患病几率进行危险评估,并根据诊断结果辅助眼科医师进行治疗决策。通过实验对先天性白内障的诊断准确率达到98.87%,三项指标(不透明面积、深浅和位置)准确率分别为93.98%、95.06%和95.12%。在辅助决策方面,为医师提供建议的准确率达到97.56%。
目前,基于深度学习的医学影像分析主要是利用深度学习模型对图像特征的提取能力,完成病灶区域识别和病情病种分类。尽管这类技术能够取得较高的准确率,但其结果缺乏对判断依据的描述,难以与人类医生的思路相结合,难以投入实际应用。因此,医学影像分析需进一步结合注意力机制等技术[12],寻求得到符合人类思维逻辑的分析结果。
斯坦福大学提出的CheXNet深度卷积神经网络模型,在利用胸部X线片对肺炎患者的患病情况进行判断的基础上,考虑了模型的可解释性。该模型利用DenseNet深度神经网络模型对图像特征进行分析,不仅在利用胸部X线片作为诊断依据的情况下,精度超过人类医生的平均水平,还通过计算模型每个像素点上的各类图像特征的权值之和,衡量图像各位置在分类决策中的重要性,解释决策过程,帮助人类医生对患者病情进行理解。卡耐基梅隆大学邢波教授组近期提出一个多任务协同框架,通过引入协同注意力机制,来对异常区域进行准确定位和概括。不仅通过标签对图像内容进行描述,还利用层级长短期记忆(LSTM)模型生成长文本形式的医学影像分析报告,通过文字描述对分析结果进行描述和解释[13]。
除了直接通过对医学影像图片进行特征提取的方式来进行病情预测与诊断外,还能够通过影像对人体结构进行三维建模,实现对内镜机器人等微型诊疗设备在人体内的定位和识别[14,15],提供更加丰富的医疗数据采集方式。采用无监督学习等方式对医学影像特征进行提取分析,减少对数据标注的依赖,方便医学影像分析过程的开展[16],也是当前医学影像研究的重要内容。此外,目前主要的医学影像研究仅围绕影像数据本身展开。利用海量医学知识,构建多模态数据采集分析与结构化知识推理相结合的智能诊疗模型,将成为医学影像分析的未来发展方向之一。
人工智能技术以数据驱动为主体,构建内容齐全、结构统一的医学健康大数据能够为人工智能在医疗诊疗领域的研究提供有力支持,也有助于智能诊疗技术的应用与推广。
近年来,我国在全面提升医疗信息化水平方面做出了巨大努力。自2010年以来,国家财政多次拨款,加大各地医疗信息化建设力度,推进国家、省级、区域三级卫生信息平台建设。目前,我国的区域医疗信息化覆盖率较高,计算机基础设施基本实现广泛覆盖,省、市级医院已基本实现全面信息化管理。但应对人工智能辅助医疗的新形势,尚存在许多问题:一方面,不同地区、不同机构间的医疗信息化发展程度存在较大差异,利用信息化手段解决医疗卫生问题的技能与思想尚未得到有效普及;另一方面,各机构之间的医疗信息化平台缺乏协同性,不同平台、不同版本之间缺乏标准化信息交换接口,机构之间信息交流不畅,缺乏对医疗数据的统一管理与长期存储。此外,医疗信息的产生过程和质量的控制也制约着人工智能相关技术的应用深度,构建共享、开放、规模化、高质量的面向专业疾病的智能辅助分析决策、新药研发、公共卫生决策的统一医疗健康大数据是重要而长期的工作任务。建立国家级的健康医疗大数据云平台,开放数据市场,制定医院服务中数据还给患者的方式方法,服务流程标准及收费规范,以个体的应用以及交易带动健康医疗数据市场化的发展,从而开辟新的数据和信息整合、知识发现及服务市场。
不论是构建规范统一的医学信息系统和内容准确完备的知识图谱,还是设计实现针对特定疾病的辅助诊疗系统,都需要获取权威的医学知识和丰富的临床经验,经验丰富的医生与医学专家的参与和指导至关重要。但在现阶段,我国存在人口众多,人均优质医疗卫生资源匮乏的问题,一些医生与专家虽期待人工智能能够为诊疗方式带来变革,但往往忙于临床诊疗,难以投入大量精力参与到相关研究工作当中。因此,需要在跨领域协作组织和激励机制上进行改善,成立相应的创新中心,部署新颖的科技计划,实施有效的“产学研”一体化策略,推动该领域快速健康发展。
相比于医疗器械强国,我国医疗器械研发技术的创新能力依然不足,核心技术开发能力不强,原创核心技术较少,低端产品较多,关键零部件依赖进口,高端产品依然以仿制和改进为主[17]。缺乏高端医疗设备的开发能力与自主知识产权,使得人工智能技术难以实现在国产高端医疗设备上的关联与部署,这使得构建信息采集、分析处理与整合存储的一体化信息化医疗系统难度进一步增大。医疗器械自主研发与生产能力不足,导致高端医疗器械与设备依赖进口,价格昂贵,难以在基层医疗机构实现全面部署,也是当前医疗人工智能系统的推广和普及所面临的困难,并制约我国医疗产业的升级转型。有针对性地制定企业在该领域的创新发展策略,鼓励企业跨国并购该领域的优秀国外传统医疗器械制造企业,相应的医疗器械与人工智能相结合的产品在税收、审批、补助以及等级医院在国产人工智能设备采购上给予相关的政策倾斜,助力我国在前沿市场上发力成为新一轮产业的领导者。
人工智能辅助诊疗以大数据智能作为基础,需要解决医疗健康数据碎片化的问题,实现从数据到知识,从知识到智能的跨跃,打穿数据孤岛,建立链接个人和医疗机构的跨领域医疗知识中心,形成开放式、互联互通的医疗信息共享机制。
首先,我国应着手建立一套完备的中文医学本体知识库,对目前主要的医学本体内容制定统一的描述规范,建立完善的分类编码描述方式,对内容进行管理,定期进行修改和补充。
其次,应整合不同来源、不同类型的医疗数据,依照统一标准,开展针对不同医学学科、医疗领域、医疗机构和具体应用的医学知识图谱构建工作,完善数字化中文医学体系,推动信息化医学语义网络的构建,并在此基础上开发医学概念查询、文献检索等工具,为医疗工作者提供权威、准确的医学信息查询渠道。
最后,应构建开放共享的健康医疗大数据云平台。建议对各级医疗机构、各种健康信息数据源、公共医疗健康服务机构的信息进行统一管理,实现对个体健康档案、生物样本、基因序列、医疗保健、行为方式甚至生活环境等数据的高度整合;另一方面,在现有医疗信息化平台的基础上进行标准化改良,统一数据格式和描述规范,实现不同机构、不同来源信息存储与表达的规范化。利用标准化信息接口串联各机构数据,优化健康医疗信息管理结构,实现健康医疗信息系统的实时、同步更新,实现各级、各机构间的健康医疗信息共享网络。
利用人工智能参与诊疗过程,不是让人工智能取代医生,而是应当构建人机协同的新型医疗诊疗体系,将生物智能与人工智能相结合。在利用认知模型实现人工智能系统知识更新的同时,提升人类对医学领域的认知水平。
在医疗设备方面,应加强国产高端医疗器械的研发力度,推动智能化医疗器械和智能可穿戴式设备的研发,实现医疗器械与信息化医疗数据管理平台的数据对接,方便人工智能系统的部署。
在医疗人员方面,应当建立医学信息化人才培养体系,加强医疗工作者利用人工智能辅助医疗流程的思维方式与能力,改变传统的工作流程与习惯[18]。同时,应当鼓励医疗工作者参与人工智能与医疗结合的相关研究,将人工智能作为研究医学、了解医学的新手段,促进医学理论的更新与发展。最后,还应当将人工智能应用到医疗卫生教育与培训过程中,改进传统教育与培训模式,缩短高水平医务人员的培训周期。
智能诊疗系统投入实际应用,需要依照相关规定和标准进行开发、生产和审批。较之发达国家,我国尚未构建医疗信息产业的一些基础行业标准,也未针对智能辅助诊疗系统的开发和应用制定适宜的行业监管制度。应当尽快制定与技术进展相匹配的医疗信息与人工智能系统的行业标准,为相关系统和设备投入市场化运营提供制度与监管上的支持。
[1] Chen Y, Argentinis J E, Weber G. IBM Watson: How cognitive computing can be applied to big data challenges in life sciences research [J]. Clinical Therapeutics, 2016, 38(4): 688–701.
[2] Dilsizian S E, Siegel E L. Artif i cial intelligence in medicine and cardiac imaging: Harnessing big data and advanced computing to provide personalized medical diagnosis and treatment [J]. Current Cardiology Reports, 2014, 16(1): 441.
[3] Stoitsis J, Valavanis I, Mougiakakou S G, et al. Computer aided diagnosis based on medical image processing and artif i cial intelligence methods [J]. Nuclear Instruments & Methods in Physics Research, 2006, 569(2): 591–595.
[4] Rotmensch M, Halpern Y, Tlimat A, et al. Learning a health knowledge graph from electronic medical records [J]. Scientific Reports, 2017, 7(1): 5994.
[5] 袁凯琦,邓扬,陈道源,等.医学知识图谱构建技术与研究进展[J].计算机应用研究, 2018, 35(7): 1–11.Yuan K Q, Deng Y, Chen D Y, et al. Construction techniques and research development of medical knowledge graph [J]. Application Research of Computers, 2018, 35(7): 1–11.
[6] 徐增林, 盛泳潘, 贺丽荣,等. 知识图谱技术综述 [J]. 电子科技大学学报, 2016, 45(4): 589–606.Xu Z L, Sheng Y P, He L R, et al. Review on knowledge graph techniques [J]. Journal of University Electronic Science and Technology of China, 2016, 45(4): 589–606.
[7] Crasto C J, Marenco L N, Liu N, et al. SenseLab: New developments in disseminating neuroscience information [J]. Brief i ngs in Bioinformatics, 2007, 8(3):150–162.
[8] Donnelly K. SNOMED-CT: The advanced terminology and cod-ing system for eHealth [J]. Studies in Health Technology & Informatics, 2006(121): 279–290.
[9] Bodenreider O. The Unif i ed Medical Language System (UMLS):Integrating biomedical terminology [J]. Nucleic Acids Research,2004(32): 267–270.
[10] 阮彤, 孙程琳, 王昊奋,等. 中医药知识图谱构建与应用 [J]. 医学信息学杂志, 2016, 37(4): 8–13.Ruan T, Sun C L, Wang H F, et al. Construction of traditional Chinese medicine knowledge graph and its application [J]. Journal of Medical Intelligence, 2016, 37(4): 8–13.
[11] Long E P, Lin H T, Liu Z Z, et al. An artif i cial intelligence platform for the multihospital collaborative management of congenital cataracts [J]. Nature Biomedical Engineering, 2017, 1(2): 0024.
[12] Xu K, Ba J, Kiros R, et al. Show, attend and tell: Neural image caption generation with visual attention [J]. Computer Science,2015: 2048–2057.
[13] Jing B Y, Xie P T, Xing E. On the automatic generation of medical imaging reports. 2017 November 22. arXiv preprint arX-iv:1711.08195.
[14] Turan M, Pilavci Y Y, Jamiruddin R, et al. A fully dense and globally consistent 3D map reconstruction approach for GI tract to enhance therapeutic relevance of the endoscopic capsule robot. 2017 May 18. arXiv preprint arXiv:1705.06524.
[15] Turan M, Almalioglu Y, Konukoglu E, et al. A deep learning based 6 degree-of-freedom localization method for endoscopic capsule robots. 2017 May 15. arXiv preprint arXiv:1705.05435.
[16] Wu G, Kim M, Wang Q, et al. Scalable high performance image registration framework by unsupervised deep feature representations learning [J]. Deep Learning for Medical Image Analysis,2017, 63(7): 245–269.
[17] 程京, 邢婉丽. 医疗器械与新型穿戴式医疗设备的发展战略研究 [J].中国工程科学, 2017, 19(2): 68–71.Cheng J, Xing W L. Research on the development strategy of medical devices and new wearable devices [J]. Strategic Study of CAE, 2017, 19(2): 68–71.
[18] Jha S, Topol E J. Adapting to artificial intelligence: Radiologists and pathologists as information specialists [J]. Jama, 2016,316(22): 2353.