循证临床决策支持系统概述*

2018-08-09 01:17张寅升李昊旻段会龙
中国卫生质量管理 2018年4期
关键词:决策支持系统知识库循证

—— 张寅升 李昊旻 段会龙

循证医学是指临床决策中对当前最佳科学证据的“严谨、明确和审慎”的使用[1]。其有力地推动了临床医学从传统的经验科学到以科学证据为主要参考的实证科学的转变。虽然循证医学的理念在医学界取得了广泛认同,但其在临床实践中的贯彻和实施仍面临着诸多障碍。2003年,McGlynn等发表在《新英格兰医学杂志》上的调查显示,在美国约一半的患者接受的治疗并非推荐的循证治疗方案[2]。目前,该问题依然存在。2014年,苏格兰的一项调研表明,虽已有充分临床证据证明他汀类药物可以有效降低糖尿病患者罹患冠心病风险,但约1/3的患者仍未应用他汀类药物[3]。2015年的一项研究指出,虽然临床指南规定青蒿素联合疗法(ACT)是单纯性疟疾的一线治疗方案,但研究人员对喀麦隆和尼日利亚两个国家的医疗数据进行分析后发现,很多病例并未接受ACT治疗[4]。类似以上案例在文献中被广泛记载。这表明知识与实践之间存在着鸿沟。如何将基于最佳临床证据的医学知识及时有效地转化为临床实践已成为医学界面临的一个严峻挑战。随着医学信息学的发展,人们发现临床决策支持系统(Clinical Decision Support System,CDSS)能够提高医护人员对临床指南等循证知识的遵从度,具备缩小知识和实践之间鸿沟的潜力[5-7],由此产生了“循证临床决策支持系统”这一概念。本研究将对这一概念的产生和发展进行论述。

1 CDSS综述

自1946年ENIAC作为人类文明史上第一台功能完善的电子计算机问世之后,科学家们就开始探索如何将计算机应用到医学诊断和治疗等领域,从此拉开了CDSS的序幕。根据需求和技术的不同,CDSS可以细分成多个研究分支,主要包括:

1.1 知识检索

知识检索是一项基本的决策支持需求。相关工作包括:(1)数字图书馆和医学知识库的建设。如1964年美国国家医学图书馆(NLM)开发的医学文献分析和检索系统(Medical Literature Analysis and Retrieval System,MedLARS)[8]及后继者MEDLINE。(2)分类主题词和医学概念本体。其相比于纯粹的字符串检索具有更高的召回率,因此在知识检索中得到了广泛应用。相关工作包括医学主题词表(Medical Subject Headings,MeSH)以及一体化医学语言系统(Unified Medical Language System,UMLS)的超级叙词表(Metathesaurus)。(3)上下文相关的知识检索。代表技术为infobutton[9],用以实现与特定情景相关的信息的自动推送,目前已被众多的权威知识源(如BMJ Best Practices、MedlinePlus、Merck Manual、Micromedex等)所支持,为医疗机构集成和使用公共知识源提供了便捷。

1.2 逻辑条件评判

逻辑条件评判是应用最广的一种决策支持形式。逻辑条件的表达形式包括决策表、逻辑表达式、多值逻辑和模糊逻辑等。其中,逻辑表达式应用最为普遍,包括产生式规则(Production Rule),以及“事件-条件-动作”规则(Event-Condition-Action Rule,ECA Rule)。基于逻辑条件评判的提醒提示在早期电子病历系统中已有使用,如HELP[10]、RMRS[11]和BICS[12]。1990年,HELP项目衍生出Arden医学规则语言[13],并被纳入HL7规范。

1.3 基于数据的分类或预测

此类研究以数据为基础,通过机器学习及统计分析的方法构建数学模型或分类器。在医学领域,朴素贝叶斯分类器、贝叶斯信念网络、决策树、人工神经网络和逻辑回归模型是使用较多的模型。1959年,Ledley和Lusted在论文中首先论述了利用贝叶斯公式进行疾病诊断[14],为计算机辅助诊断奠定了基础;此后,贝叶斯信念网络在20世纪70年代被提出,并在80年代应用到医学研究中。1958年,Rosenblatt提出感知机(单层ANN)[15],20世纪70年代ANN后向传播算法的雏形出现,到了80年代,ANN开始在医学研究中大量出现。1958年,Cox提出了逻辑回归分析[16],随后被广泛应用于医学预测模型。在大数据背景下,基于数据的分类或预测在研究领域得到了日益广泛的关注,特别是近些年以深度学习为代表的机器学习研究得到了迅猛发展[17-19]。然而,临床实际应用的CDSS大多数仍然基于规则。主要原因有三[20]:一是大量数据以自由文本或影像图片的非结构化形式存在;二是从数据中学习得到的模式和知识不能及时有效地被科学验证;三是数据方法的解释性和接受度仍不如规则。

1.4 启发式专家系统

启发式专家系统是指模拟专家决策行为的一套简单而有效的规则。在早期的以专家系统为主的CDSS中,启发式是知识库的主要组成部分。启发式专家系统类型分两类:(1)基于规则的系统。这类系统使用产生式规则或ECA规则来模拟专家推理和决策。早期专家系统(如1976年Shortliffe等研制的用于诊断细菌感染及抗生素用药选择的MYCIN)大多采用基于规则的知识表达和推理方法。1985年,美国宇航局(NASA)开发了用于构建专家系统的CLIPS[21],把规则引擎分离成一个独立的模块。(2)基于框架的(Frame-Based)推理系统。1974年,Minsky[22]提出了框架概念。框架是由节点和相互关系组成的网络,描述了目标领域中的典型情景,以及与此情景相关的各种信息,例如形势发展预期和应对方案等。基于框架的知识表达在INTERNIST系统[23]及其后继者QMR[23]中得到了应用。用于鉴别诊断的Isabel系统[24]也采用了基于框架的推理,Isabel根据用户输入的患者特征与知识库中的疾病框架进行匹配,从而给出鉴别诊断意见。

1.5 流程表达和执行

从20世纪90年代中后期开始,医学信息学领域涌现出一大批学者,致力于临床指南和临床路径的建模工作,即计算机可解释的指南(Computer-Interpretable Guideline,CIGs)[25]。其中,流程表达和执行是CIGs最主要的一类方法,相关工作包括EON[26]、GLIF[27]、PRODIGY[28]、PROforma[29]和SAGE[30]等。基于流程表达和执行的CDSS包括:基于Petri-Net的GUIDE[31]系统和基于EON的ATHENA[32]等。

图1 CDSS及相关技术的发展历史(图中列出了其中的代表性工作)

1.6 自然语言处理

1966年,Weizenbaum基于简单的模式匹配研制了模拟精神心理学家的聊天工具ELIZA[33]。1968年-1970年,Winograd开发了SHRDLU[34],在一个虚拟的积木世界中实现了计算机对本体、状态和动作的“理解”,是自然语言处理(Natural Language Processing,NLP)发展的里程碑之一。1968年,Zellig Harris阐述了子语言理论(Sublanguage Theory)[35],并提出了面向特定子领域的自然语言处理思想。此后,面向医学领域的NLP项目相继出现[36]。20世纪80年代是NLP发展的一个分水岭,此前的方法大多基于语言学的语法规则,此后则较多采用机器学习方法。20世纪90年代以来,生物医学领域陆续出现了一批具有影响力的基础性工具和系统,如MetaMap[37]、cTAKES[38]和MedLEE[39]。

以上介绍了CDSS领域的主要几类研究方向,除此之外,CDSS的其他分支研究领域还包括生物医学信号处理、医学图像处理、数据可视化等。

2 循证CDSS的产生背景和相关工作

图 1按照时间先后顺序对CDSS发展过程中的代表性工作进行了可视化呈现,结合前面的综述可知,CDSS在各个历史阶段的主题呈现出明显的时代烙印。20世纪六七十年代,CDSS以专家系统的形式关注如何将专家知识转移到计算机,以实现对专家智能的模拟。到了80年代,人们发现传统的专家系统并不能完全达到人类专家的智能水平,理想中的“看病机”难以实现,因此专家系统的研究一度停滞不前,取而代之的是机器学习方法的兴起。到了90年代后期,面向临床指南的建模工作大量出现,研究人员开始关注如何将指南中的知识有效转化为计算机可处理的形式,为构建循证决策支持系统奠定了基础。

新世纪伊始,美国医学研究院(IOM)发布报告《人非圣贤,孰能无过》(To Err is Human)[40],引起了整个医疗领域的广泛关注。该报告对美国医疗质量进行了分析,并得出关于医疗过失的惊人统计数字:每年约44 000至98 000名美国人因可避免的医疗过失而丧生。报告指出,临床决策支持系统通过提供及时的、现场的诊疗决策支持,可以有效影响临床行为,是减少医疗过失的重要手段。2000年,美国医学

信息学协会(AMIA)召开春季会议,并开辟临床证据与决策支持专场,讨论如何使用CDSS来促进循证医学。2001年,Sim等[41]进一步提出了循证CDSS(Evidence-Adaptive CDSS),并总结了构建循证CDSS的5大关键要素,首当其冲的是“收集临床证据并整理为计算机可解释的格式”。2007年,美国医学信息学协会制定了临床决策支持路线图(CDSS Roadmap)[42],将对知识的访问和应用列为临床决策支持系统发展的3大支柱之一。

由上可知,随着时间的推移和研究的深入,CDSS已经从原始的专家系统扩展到更为广阔的应用场景中。特别是2000年以后,人们更加关注CDSS在应用循证医学知识促进知识向实践的转化、减少医疗过失提高医疗质量方面的实际作用(表 1)。临床决策支持系统在发展轨迹上与循证医学的交集日渐明显,促进循证医学成为临床决策支持系统的重要发展方向之一。

从概念上划分,并非所有的CDSS都可以服务于循证医学。符合条件者首先是一类“基于知识的临床决策支持系统”[43],它可以将临床指南等文献中的医学知识有效转化为规则、框架、流程等计算机可处理的形式,为临床工作者提供决策依据。在系统架构上,这类系统(图 2)主要包含3个模块:(1)知识表达。它将临床诊疗知识表示为计算机可处理的形式,决定了计算机化知识的结构和计算机系统对这种结构的相应处理方式(推理)。(2)知识获取。它将蕴含在文献中的知识及医疗机构本地化后的知识转化成符合知识表达的计算机化内容。(3)知识推理。基于计算机化的知识内容提供循证决策支持,促进临床工作者不断改进临床实践。从知识来源和应用目标看,循证CDSS更加强调以医学文献作为知识来源,其目标是将文献中蕴含的基于最佳临床证据的各类诊疗知识快速且有效地应用到临床实践中。

表1 CDSS发展过程中的目标演变

阶段相关工作主题或目标1960-1970年代早期专家系统,如MYCIN对专家知识的表达和推理;人工智能1980年代专家系统研究陷入低谷,机器学习兴起-1990年代后期临床指南建模;计算机可解释的指南(CIGs)临床指南的知识表达,为构建“循证”的决策支持奠定基础2000年IOM发布报告《人非圣贤,孰能无过》减少医疗过失,保障患者安全,提高医疗质量2000年美国医学信息学协会组织召开春季会议,开辟临床证据与决策支持专场促进循证医学2001年Sim等提出循证CDSS概念促进循证医学2007年美国医学信息学协会制定临床决策支持路线图促进知识在临床中的应用

图2 循证临床决策支持系统的体系架构

从体系结构上看,循证CDSS的核心是一个计算机化的循证医学知识库。这个知识库不同于PubMed等文献库,它是一种高度结构化、可供CDSS高效推理的知识库。构建这样的知识库,涉及两个方面的研究:(1)医学知识的有效表达。医学是一个包含多种不同类型知识的复杂领域,医学中常用的知识表达方法包括规则、框架(Frames)、逻辑回归模型、朴素贝叶斯模型、贝叶斯信念网络、人工神经网络和模糊集等。知识表达是连接人可读知识与计算机可处理知识之间的桥梁,也为知识库的模式(Schema)设计提供了概念模型。如何设计和研究知识表达方法,使之能够有效、全面、无偏差地传达蕴含在医学文献中的各类知识将是一个重要的研究内容。从CDSS的发展过程来看,早期的CDSS多基于规则,受老派人工智能(Good Old-Fashioned AI)的“符号主义”影响较大。符号主义主张知识由表征现实世界的符号以及这些符号间的关系所构成,通过适当地操作这些符号和关系实现智能。直到今天,基于规则的CDSS仍被大量应用,它能够简单且明确地表征临床场景中的多数诊疗知识。然而,对于复杂的医学评判逻辑,特别是涉及到大量异构数据或影像资料时,以规则为主的知识表达方式往往难以有效处理。针对这一问题,近些年涌现出的深度神经网络(Deep Neural Network,DNN)在若干高度复杂的医学领域开始取得比传统方法更优的结果[17-18,44-45],弥补了传统知识表达和推理方法的不足。DNN起源于经典的浅层ANN,它作为“联接主义”的新兴典范,克服了以往机器学习模型表达能力弱的缺点,但同时也带来了模型解释度低的“黑盒”问题。寻求模型的复杂度和可解释度之间的平衡将是知识表达的研究方向之一。(2)医学知识的快速获取。据统计,生物医学领域每天有75项实验结果和11篇综述被发表[46]。知名的生物医学文献检索引擎PubMed每年新增100万篇文献[47]。如何将这些快速增长的医学文献及时转化为计算机可处理的数据结构,将极大地影响CDSS知识库的时效性和循证性。针对这一要求,面向医学文献的自然语言处理技术有望在一定程度上实现从文献提取结构化知识内容的自动化过程,这也是CDSS领域的持续研究热点。IBM Waston系统是NLP技术的一个典型应用案例。2015年,Watson系统收录了肿瘤学研究领域的42种医学期刊、临床试验的60多万条医疗证据和200万页文本资料。基于对海量医学文献的处理,Watson实现了对肿瘤的计算机辅助诊疗,每个决策建议都有相应的科学依据支持。2016年,Waston自动化处理了2 000万份医学文献,并依据提取到的结构化知识,完成了对一名罕见白血病患者的精确诊断。以Waston为代表的NLP技术将进一步推动海量医学文献向循证知识库的快速转化。

3 讨论和展望

与循证临床决策支持系统相关的一个值得探讨的问题是循证医学与个性化医疗的矛盾。以临床指南等文献为载体的循证医学知识通常只能覆盖临床中约80%的情况,剩余的少数案例只能个性化处理。针对这一问题,研究者认为,循证医学与个性化医疗并非对立。“个性化”同样需要遵循科学的证据和严谨的论证,本质上也是“循证”的。两者仅存在知识粒度(Granularity)的差异,可以形象地理解为主干与分支的差别。笔者曾参与过电子化临床路径的研发,临床路径在原则上不能被设计成固定的“套餐”或“菜谱”,而应提供情景相关(Context-Aware)的分支路径和可选项目,以满足路径变异和个性化治疗的需要,这正是循证医学和个性化医疗有机结合的一个典型案例。随着分子和组学研究的开展和高通量检验技术的普及,CDSS在个性化诊治方面具备了更多的科学依据,将这类精准医学的知识纳入CDSS知识库有望实现个性化医疗与循证医学两者的进一步融合。

循证临床决策支持系统还面临着一个严峻挑战,即知识的快速更新问题。据统计,半数的临床指南会在5.8年后过时,10%被统计指南的有效期仅为3.6年[48]。2002年的一项研究统计了1945年-1999年之间发表的474项临床研究,结果发现,285项(60%)研究结论是正确的,而98项(21%)是错误的,91项(19%)是过时的[49]。循证医学知识的这种快速迭代对CDSS知识库的时效性提出了很高的要求。这一问题可以通过自然语言处理来解决,其中的技术难点是如何设计有效的统计模型,对新旧文献及不同来源的研究中相互矛盾的结论进行取舍和整合。

相比其他领域,医学是一个严重依赖统计学证据的领域,其对象是千差万别的复杂人类个体。这为循证CDSS带来了巨大的挑战。现阶段的智能化系统与人类专家相比仍存在局限性,除了医学文献中的循证知识,人类专家在决策中还会综合运用来自个体经验的隐性知识及从其他活动中迁移学习而获得的策略。而这是当前大多数CDSS所不具备的。因此,短期内CDSS的角色依然是辅助决策,为医护工作者提供基于最佳科学证据的决策建议。

猜你喜欢
决策支持系统知识库循证
护理临床决策支持系统的理论基础
汉语近义词辨析知识库构建研究
《循证护理》稿约
循证护理在新生儿静脉采血中的应用
面向知识转化的临床决策支持系统关键技术研究
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
电务维修决策支持系统研究
循证护理在ICU患者中的临床应用观察
高速公路信息系统维护知识库的建立和应用
循证医学的人文精神