潘旋 任菁菁 张秋华 刘颖
【摘要】 知识图谱是人工智能技术在医疗领域实现的基石,目前其在卫生服务领域主要应用于信息搜索引擎、智能问答、诊疗决策支持系统、信息可视化分析等方面。结合全科医学的特点,本文同时探讨了知识图谱在慢性病管理、疾病预测和筛查及临床决策支持方面的应用前景,以期为临床研究及应用提供参考。
【关键词】 知识图谱;人工智能;卫生服务;全科医学
The applications and prospects of knowledge graph in health services
Pan Xuan Ren Jingjing Zhang Qiuhua et al.1 The Sir Run Run Shaw Hospital Affiliated Zhejiang University School of Medicine,Hangzhou,Zhejiang 310003;2 The First Affiliated Hospital of Zhejiang University School of Medicine,Hangzhou,Zhejiang 310003
【Abstract】 Medical knowledge graph is the cornerstone of Artificial Intelligence and Smart Healthcare.The main applications of medical knowledge graphs are search engine,question-answering system,decision support system,and visual analysis.Combined with the characteristics of general medicine.This paper discusses the application status of medical knowledge graphs in chronic disease management,screening and prediction of diseases,and auxiliary clinical diagnosis of diseases,so as to provide reference for clinical application and research.
【Key Words】 Medical knowledge graphs;Machine learning;Health service;General medicine
中图分类号:R499;R197.324 文献标识码:A 文章编号:1672-1721(2023)10-0093-04
DOI:10.19435/j.1672-1721.2023.10.030
2022年1月国家卫生健康委印发了《“十四五”卫生健康标准化工作规划》,要求各地区、相关部门要协调推进互联网、大数据、人工智能、区域链、5G、物联网、IPv6(互联网协议第6版)等新兴信息技术与卫生健康行业融合性标准的供给,促进信息技术在医疗领域的研发和应用[1]。随着人工智能技术的发展,特别是其与医学领域的融合,产生了区域卫生信息平台、互联网医疗、临床决策支持系统等医疗信息化产物,在辅助医务人员进行疾病防治和健康管理等过程中发挥了积极的作用。其中,知识图谱(knowledge graph)作为目前国内外人工智能领域研究的热点,受到了学术界和工业界广泛的关注,被视为第三代人工智能研究的基石。本文主要介绍知识图谱在卫生服务领域的应用现状,同时为其在全科医学方向的应用拓宽思路提供参考。
1 知识图谱概述
“知识图谱”这一概念最初是由Google公司在2012年提出,是为支撑语义搜索、改善搜索体验而建立的知识库。发展至今,知识图谱已经成为大数据时代最重要的一种知识表现形式。知识图谱的本质是一种大规模的语义网络,是由节点(实体)和标注的边(实体间的关系)构成的一种图形化的知识表达方式,旨在描述真实世界中存在的各种实体或概念, 及其之间的关系或关联(见图1)[2-3]。
知识图谱的研究价值集中体现在其是实现人工智能的基础。人工智能的目标是让机器具备人类思考和处理问题的能力,机器将问题或数据与知识图谱中的知识相关联,可以完全重现人类理解和推理问题的过程[4]。因此,知识图谱在辅助智能问答、大数据分析、智能推荐、决策支持等多个方面[5-6]都展现出了丰富的应用价值,得到了学术界和工业界的广泛关注。
目前,医学是知识图谱应用最广泛的垂直领域之一。随着医疗信息化的发展,医疗健康数据量剧增,通过人工智能技术,结合医学专家经验,构建医学知识图谱,不仅可帮助开发智能分诊系统和临床决策支持系统,提高医护人员的工作效率、医疗质量和患者的就医满意度;同时,挖掘医学实体之间的潜在关联,有助于创新和改进医学数据统计和分析方法,推进医学科学研究的进步[7]。
2 知识图谱在卫生服务领域的主要应用
2.1 医疗信息搜索引擎 与传统搜索引擎相比,基于知识图谱的搜索引擎精准度更高。这主要是由于传统方式是通过关键词去索引库匹配答案,准确率低,而知识图谱将现实世界的知识点进行关联,形成一个知识网络,结合知识图谱去关联对应的内容,可让机器更智能地理解用户的搜索需求,从而呈现个性而精准的搜索结果[8]。2015年Google公司率先将医学知识图谱应用于搜索引擎上,其内容由专业医疗机构审核,当用户搜索症状、疾病等医学资讯时,通过提供一张医疗信息卡片,给出疾病的典型症状、判断是否危急、具有传染性等参考信息。当时这一举措帮助了大批印度等医疗资源匮乏国家的人群。此外,国外基于知识图谱的搜索引擎还有Healthline,其知识库涵盖超850 000项医疗元数据和50 000条相互关联的概念。国内应用此技术的搜索引擎有百度医疗大脑、搜狗明医、360良医、医知鹿。目前,基于知识图谱的搜索引擎已成為主流形式,但医学领域的较少,主要受限于现存医学知识图谱的数量和质量。
2.2 疾病智能问答 智能医疗问答系统也是知识图谱典型的应用之一。区别于信息搜索,用户需要从检索到的信息文档中自行阅读总结答案。医患用户可以直接表述问题,系统通过将问题映射到知识图谱的实体和关系上,直接准确地返回答案[9]。国外医疗问答系统起步较早,最著名的是 IBM的“沃森医生”[10],其学习了海量的医疗数据,包括领域内的权威文献、诊断检查报告、电子病历等医疗信息,利用自身庞大的知识库为患者提出的医学问题提供最佳答案。国内的“左手医生”APP基于权威医学知识库,涵盖了人民卫生出版社全部医学类书籍内容及药品说明书等,构建了医学知识图谱智能问答系统,可解决患者医疗、健康类咨询需求,同时可模拟医患真实对话流,输出基于概率的诊断,最后根据需要还可以显示诊断对应的检查、化验、用药等信息。再如“慧医大白”,通过机器学习医学数据,构建知识图谱,让机器能够思考用户的意图,并作出推理和解答,充分模拟医生问诊流程,目前可覆盖到80%的常见病。阮彤等[11]与上海曙光医院合作,利用该医院海量中医药数据以及临床诊疗知识库,基于文本数据抽取技术、多策略学习方法、关系数据转换(D2R)、数据融合等技术,自动构建了采用三元组方式存储的中医药知识图谱,并开发了基于模板的智能问答系统和利用知识图谱推理的辅助开药系统。汤人杰等[12]在新冠肺炎期间,通过应用软件采集患者性别、年龄、病情描述等信息,利用Bert+BiLSTM+CRM算法进行症状实体识别,采用概率图模型(Noisy-or)获取疾病和症状之间关系权重,建立了新冠肺炎知识图谱,并使用EM算法进行疾病预测。该智能辅助问诊模型,为用户提供第一时间的咨询结果和就诊建议,可以做到无接触问询,实时响应,快速搜集用户病症,在抗击疫情期间发挥了重要作用。
目前医学智能问答系统的发展仍面临诸多挑战。一方面,由于普通用户医学知识有限,常无法准确描述具体问题,为获取答案造成一定程度的困难;另一方面,由于医学知识的复杂性,IT技术的发展局限,导致医学知识图谱问答的推理能力受限,提高问答系统的准确性仍是目前最主要的难题。
2.3 医疗决策支持系统 医疗决策支持系统可以模拟临床专家诊疗思维,将患者的疾病信息与知识库对照,在医生诊疗的问、检、诊、治等各个环节给予决策支持,预防漏诊、误诊的发生。同时,有别于传统辅助决策系统存在知识更新困难的缺点,基于知识图谱的决策系统能够根据最新临床实践指南和循证依据轻松地完成知识库更新,从而协助医生将最新的指南融入到临床工作中,规范医疗行为,提高医疗服务质量[13]。国外 IBM开发的“沃森肿瘤”[14]是主要面向肿瘤领域的决策支持系统,基于巨大的知识库和强大的认知计算能力,为临床医师提供循证的肿瘤治疗方案。Yesha 等[15]建立的基于电子病历的知识图谱,可根据患者的就诊数据,找出可能的病因,并给出相应的治疗建议。我国庞晓燕等[16]利用自然语言处理算法,建立本体语义网络和医学知识映射关联,构建了医学知识图谱,并借助决策树、随机森林等机器学习算法,实现了人工智能临床辅助决策引擎,为邵逸夫医院急诊科、神经内科、呼吸科等5个专科医生提供辅助决策诊疗,从而快速生成电子病历,缩短了医生诊疗时间,提高了医疗质量。研究表明,83.33%的用户认为辅助决策系统推理准确性在85%以上,90.91%的主治医生及以下职称医生认为使用辅助决策系统可明显防止误诊漏诊。王昊奋等[17]通过将医疗知识图谱应用于医疗质量与患者安全辅助监控系统和处方审核智能系统中,进行抗生素不合理使用的监控、危急值预测,可以快速判断处方为合理、疑似不合理和不规范处方,从而促進用药的合理性。
临床决策系统受到研究者和医院管理者广泛的关注,但实际中仍面临着两项难题:一是缺少完备的全科医学知识图谱,目前基于知识图谱的临床决策系统主要针对特定疾病,无法广泛应用;二是临床决策的精确度有待提高,医学诊断的准确率要求极高, 目前基于知识图谱的的医疗决策只能扮演支持和辅助的角色。
2.4 信息可视化分析 信息可视化是应用分析软件对大量文献数据信息绘制科学知识图谱,从而清晰、准确地揭示知识领域的内在联系,发掘科技研究热点和研究前沿的方法[18]。目前医学领域应用知识图谱进行可视化研究的内容十分丰富,包括基础医学的疾病发生机制、临床医学的热门疾病、合并症、诊断及治疗方法、疾病预防,以及卫生事业管理等多个方面。如Xiaoquan Huang等[19]通过对676篇领域热门引用文章进行可视化分析,发现对胃肠道微生物群与相关疾病之间联系的理解随着时间的推移发生了巨大变化,且新兴治疗方法将成为未来的研究趋势。易巍等[20]通过Web of Science数据库,以coronavirus AND(treatment OR drug)为主题词,检索出1 730条数据,对国内外冠状病毒治疗领域相关文献进行分析,并利用GraphPad Prism 5进行知识图谱绘制及展示,反映出目前的治疗热点集中在阻止病毒吸附、抑制病毒基因的复制和转录翻译,为开发药物提供新的参考靶点。郝宏丽等[21]通过搜集万方数据和中国知网等国内期刊、PubMed生物医学文献数据库,共得到5 425篇中国作者关于分级诊疗的研究文献和84 891篇外文文献,以高频关键词为主要对象,采用社会网络分析、词共性分析、聚类分析及知识图谱可视化技术,系统地分析了各国在分级诊疗体系和制度研究上的关注点和利弊,为我国的分级诊疗研究提供启示。
应用知识图谱进行可视化分析,为更好地展示数据之间的关系,就要保证数据来源的质量,因此制定合理的文献信息检索策略是重要的第一步。同时,对生成图谱进行详尽和深刻的分析,需要有一定的领域知识储备。
3 知识图谱在全科医学方向的应用展望
3.1 慢性病管理 我国慢性病患者基数大,需要长期的治疗和支持,而基层医务人员紧缺,无法充分且及时地满足患者的就医需求[22]。知识图谱的扩展查询和智能问答功能,可以有效帮助解决这一难题。建立特定的网站,发布疾病相关的预防、检查、诊断和自我管理的信息以供患者搜索查阅,不仅能帮助患者更全面地了解自身疾病,同时还能提高慢性病患者的自我管理能力。另外,虽然互联网医疗增加了患者就医的便利性,但由于医生业务繁忙难以实现实时的问答响应。智能问答系统可作为补充,及时解决患者在治疗和康复期间遇到的个体化问题。
3.2 疾病预测和筛查 疾病的发生与发展都有各自的演变规律,疾病的一级预防和二级预防一直是社区工作的重点。之江实验室尚勇等[23]针对浙江大学附属第一医院2007年—2019年非肾病专科的71 679例患者的电子病历(EHR),建立了包含领域知识本体、电子病历知识图谱二级结构的知识图谱系统,并通过语义规则进行推理,以识别EHR数据中的重要临床发现。图形化推理路径展示了推理画面,并解释了临床医生更好地理解被忽略信息的临床意义。结果不仅发现2 774例符合慢性肾脏病诊断标准的患者,同时发现了10 377例慢性肾脏病风险患者,后期随访发现基于知识图谱的预测可将慢性肾脏病风险预警提前1~2年。目前,医院很少提供疾病预测的服务,且大多医院的病历系统只存储患者本院的就诊资料。而社区已基本建成互联互通的居民健康信息平台,可实现居民生命全周期健康数据的采集、存放和共享,在疾病预测和早筛中具有独特的优势。利用知识图谱,构建传染病、慢性病智能预测和筛查模型,能有效识别高危人群和早期患病人群,实现疾病防控和早期治疗。
3.3 临床决策支持 随着全科医生制度和分级诊疗制度的推进,基层医生将承担越来越多的首诊任务和三级医院下转患者,不仅要遇到各个专科疾病的问题,还包括多病共存、未分化疾病、行为管理、社会因素等多方面复杂难题。全科医生需要掌握的知识越来越多,负担越来越重[24]。以常见的未分化疾病消瘦为例,近年来就诊人数逐年增加,但由于其鉴别诊断困难且缺乏规范的指导标准,使全科医生在诊治和管理上面临着巨大的挑战[25]。由于病因诊断不明,患者常游走于不同科室反复检查,造成医疗资源的浪费和病情的延误。利用临床决策支持系统,辅助医生完成疾病推理和诊治,及早明确诊断并采取干预将有效改善患者的预后,可有效增强基层医生的岗位胜任力。
本文综述了知识图谱在卫生服务领域的主要应用,并总结了每项应用面临的挑战。总的来说,知识图谱与医学领域的融合,为医疗行业的发展带来了新的契机。在应用方面,医疗机构和医务人员根据工作需求,善于应用人工智能技术,可以有效减轻工作负荷,提高医疗质量。此外,目前我国医疗知识图谱的发展主要受到数量和质量的制约,这主要是由于目前大部分医学知识图谱研究由计算机或信息类专业完成,多着重于计算机算法,医学研究部分相对薄弱。同时,构建图谱的数据多来自于网络爬虫、文献等质量较低的公开数据。因此,医学专业人员可发挥领域知识优势,基于真实病历数据开展交叉学科研究,构建高质量的疾病知识图谱,为后续计算机领域专家开发应用提供依据,进而促进人工智能技术在医疗卫生事业上的助力。
参考文献
[1] 国家卫生委员会.关于印发“十四五”卫生健康标准化工作规划的通知[EB/OL].(2022-01-11)[2022-01-20].http://www.nhc.gov.cn,.
[2] 赵一鸣.知识图谱是一种知识组织系统吗?[J].图书情报知识,2017(5):2-5.
[3] 修晓蕾.基于中文电子病歷的肿瘤知识图谱构建研究[D].北京协和医学院,2019.
[4] WU X D,CHEN H H,WU G Q,et al.Knowledge Engineering with Big Data[J].IEEE INTELL SYST,2015,30(5):46-55.
[5] LU R Q,JIN X L,ZHANG S M,et al.A Study on Big Knowledge and Its Engineering Issues[J].IEEE T KNOWL DATA EN,2019(9):1630-1644.
[6] CHAI X.Diagnosis Method of Thyroid Disease Combining Knowledge Graph and Deep Learning[J].IEEE Access,2020,PP(99):1-9.
[7] 柴扬帆,孔桂兰,张路霞.医疗大数据在学习型健康医疗系统中的应用[J].大数据,2020,6(5):29-44.
[8] KASSIM J M,RAHMANY M.Introduction to Semantic Search Engine[C]//Electrical Engineering and Informatics,2009.ICEEI'09.International Conference on.IEEE,2009.
[9] VEKARIYA D V,LIMBASIYA N R.A Novel Approach for Semantic Similarity Measurement for High Quality Answer Selection in Question Answering using Deep Learning Methods[C]//2020 6th International Conference on Advanced Computing and Communication Systems(ICACCS).2020.
[10] LEE H.PAGING DR WATSON:IBM's Watson supercomputer now being used in healthcare[J].J AHIMA,2014,85(5):44-47.
[11] 阮彤,孙程琳,王昊奋,等.中医药知识图谱构建与应用[J].医学信息学杂志,2016,37(4):8-13.
[12] 汤人杰,杨巧节.基于医疗知识图谱的智能辅助问诊模型研究[J].中国数字医学,2020,15(10):5-8.
[13] NOGUEIRA M,SANTOS D,TYGESEN H,et al.Clinical decision support system(CDSS)--effects on care quality[J].INT J HEALTH CARE Q,2014,27(8):707-718.
[14] 周娜,李爱芹,刘广伟,等.沃森肿瘤人工智能系统在临床中的应用[J].中国数字医学,2018,13(10):23-25.
[15] YESHA R,GANGOPADHYAY A,SIEGEL E.A Graph-Based Method for Analyzing Electronic Medical Records[C]//the 2015 IEEE/ACM International Conference.ACM,2015.
[16] 庞晓燕,尹思艺,蔡秀军,等.构建基于大数据的人工智能临床辅助决策系统方法与效果研究[J].中国数字医学,2020,15(9):49-52.
[17] 王昊奋,张金康,程小军.中文开放链接医疗数据的构建[J].中国数字医学,2013,8(4):5-8,15.
[18] LIU S X, CUI W W,WU Y C,et al.A survey on information visualization:recent advances and challenges[J].VISUAL COMPUT,2014,30(12):1373-1393.
[19] HUANG X,FAN X,YING J,et al.Emerging trends and research foci in gastrointestinal microbiome[J].J TRANSL MED,2019,17(1):245-260.
[20] 易巍,王雨,汤建桥,等.基于知识图谱的冠状病毒治疗可视化分析[J].中华危重病急救医学,2020,32(3):279-286.
[21] 郝宏丽.基于知识图谱的中外分级诊疗研究比较与分析[D].山西医科大学,2019.
[22] 蔡细旋,王建榜,吴江,等.我国全科医疗持续发展的挑战:社区多重慢性病的管理策略[J].中国全科医学,2020,23(34):4279-4284,4290.
[23] SHANG Y,TIAN Y,ZHOU M,et al.EHR-Oriented Knowledge Graph System:Toward Efficient Utilization of Non-Used Information Buried in Routine Clinical Practice[J].IEEE J BIOMED HEALTH,2021(99):103-108.
[24] 李源杰,徐娜,沙悅,等.全科医生临床实践中知识型临床问题的处理现状研究[J].中国全科医学,2021,24(13):1602-1606.
[25] 马仁杰,陈央央,任菁菁,等.消瘦的全科诊疗思路[J].中国全科医学,2021,24(23):3009-3012.
(收稿日期:2023-01-13)