【摘" 要】 针对权威的循证医学知识库、规则引擎无法覆盖医院临床实践经验的问题,文章提出利用人工智能技术构建医院临床最佳实践库,以优化临床决策支持系统,使之更贴合医院实际诊疗情况,提升决策支持的精准性。
【关键词】 人工智能;自然语言处理;临床决策支持;临床最佳实践
医疗技术不断发展,医疗工作者遇到疑难病例的时候,难以从海量的信息中快速发现有用的知识。为此,利用大数据技术收集整理数据,并建立起逻辑关系点,关联知识点,通过与医院信息系统结合,采用警告、提醒、文档管理以及相关数据表达形式,为相关的医疗工作者提供实时、权威、有效的临床决策支持的临床决策支持系统显得尤为必要。
阮彤、高炬等人总结了临床医疗大数据挖掘的核心流程。流程包括以临床数据集成、基于知识图谱的临床专病库的构建过程、电子病历数据质量的评估方法以及以临床疗效分析与疾病预测为核心的临床医疗大数据应用等任务,进而对流程中的每个任务提出了解决方案,给出了实验结果。因此,利用临床决策支持系统(Clinical Decision Support System, CDSS)挖掘以医院电子病历为核心的临床数据记录的患者的疾病、诊断和治疗信息,可以辅助医生进行临床科研与临床诊疗。
CDSS不但要有权威的循证医学知识库、规则引擎,还要利用大数据与人工智能技术从真实世界中挖掘出海量临床数据,进行整合、清洗、机器学习等,通过人工智能技术(Artificial Intelligence技术,AI技术),让机器来“读懂”海量的病历数据,构建医院临床最佳实践库。
临床最佳实践库能够充分地总结临床实践经验,最真实地反映临床诊疗行为取得的疗效,以此推荐最佳诊疗活动。临床最佳实践库应用在诊疗过程中,能够充分利用病例中结构化以及非结构化数据,通过多方渠道及时以正确的干预模式向医疗工作者以及患者提供正确的诊疗决策支持信息。
一、自然语言处理
自然语言处理NLP(Natural Language Processing),是对自由文本进行结构化处理,最终实现计算机对人类自然语言的有效翻译。而自然语言处理在医学领域中又产生了医学自然语言处理MLP(Medical Language Processing),把自然语言处理应用到医学领域当中,从自由文本当中得到结构化数据,提取有效信息。NLP技术的发展将有效提高大数据挖掘和分析能力,这些技术对临床智能支持、循证医学研究,构建医院临床最佳实践库,优化临床决策支持系统具有重大意义。
(一)朴素贝叶斯算法
针对电子病历中日常病程记录来说,往往记录着住院患者的每日病情和诊疗情况的具体变化,主要包含当前病情记录和诊疗计划章节信息。但是在病历中,这两个章节的内容往往写在一起,不容易让机器准确地分离出这两个章节的信息。朴素贝叶斯算法主要应用于将当前病情记录和诊疗计划这两个章节的内容准确地从病程记录中分离出来,然后再对每个章节的内容进行信息提取,从而形成更精准的结构化数据。
(二)改进的Jieba分词算法
信息抽取过程中的首要工作就是对文本信息做分词抽取工作。对医疗领域来说,其专业的医学术语十分复杂,开源工具Jieba分词算法直接应用于电子病历数据并不能得到理想的结果,需要根据实际情况进行改进。首先对Jieba分词算法中的自定义字典进行了整理,其次将专业的医学字典加载到Jieba自定义字典中,再对模型进行训练,得到初步改进的Jieba分词算法。最后对Jieba分词算法中进行了二次开发处理,加入一些医学数据抽取规则,将未分出的医学术语进行了二次提取,将分词错误的结果进行修改操作,从而不断提高数据准确性。
二、机器学习
(一)KNN算法
KNN(K-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一,可以计算出预测病例在历史病例中最为相似的K个病例,统计K个病例的疾病标签,从而计算出该病例的疾病概率。该模型适合对稀有疾病进行分类,对于类域的交叉或重叠较多的疾病分类效果与其他模型相比较好。
(二)随机森林算法
随机森林(Random Forest,RF)算法是Leo Breiman提出的一种利用多个树学习器进行分类预测和回归预测的组合算法。将现有的病例放回的随机采样,模拟K个医生,每个医生通过学习等量的不同的随机样本集,使用决策树建立自己的模型,最后当决策一个新的病例时,采用投票法或平均分值法来决定。在当前的很多数据集上,相对其他算法有着很大的优势,能够处理很高维度的数据,并且不用做特征选择。
(三)FM推荐算法
此算法不仅将病例中的特征进行权重学习,而且通过将病例的症状特征和知识库中的疾病症状特征做组合特征学习。通过学习和修正特征权重计,该模型解决稀疏数据下的特征组合问题,能够表示特征与特征之间的关联关系。
(四)深度神经网络
通过构建多层神经网络,输入层为病例特征,输出层为标准化后的疾病,通过迭代训练不断更新修正隐层神经元的权重值,最后训练出一个泛化能力较好的模型,可用于新病例的预测。与传统的神经网络相比,该模型神经网络在大数据量的训练集的多分类问题,往往拥有较高的准确率。
(五)规则引擎
规则引擎是指利用知识库中的已知诊断规则进行诊断,将病人的症状、检查检验异常数据等来匹配诊断规则。应用规则引擎技术,构建疾病分类处理技术平台,有助于临床决策支持系统的不断完善和质量管理知识库的积累与形成,对于不断扩展的业务系统以及更加精细化的质量管理需求有更好的适应性。
(六)模型整合
通过比较以上几种不同算法的优缺点,采用投票、特定模型优先、权值相加等策略整合各个模型的预测结果,以得到最准确的输出。主要优点体现在:1. 可以避免某单个模型的局限性和不完全性;2. 不同模型的思想侧重点不一样,通过结合不同模型的结果,会降低漏诊和误诊的可能性;3. 传统算法和深度学习算法结合,相对于某单个子算法,诊断疾病准确率有所提升。
三、构建医院临床最佳实践库
(一)搭建资源中心
以梅州市人民医院为例,医院数据来源主要由BMJ循证医学知识库和临床数据中心(CDR)构成。BMJ循证医学最佳实践主要为资源中心系统提供要点式、精准化标准逻辑支撑,构建循证医学最佳实践库;临床数据中心能够实现医院不同业务系统的有效集成与实时信息共享,包括医院各业务系统中的历史病例资料,利用大数据与人工智能技术从真实世界中挖掘出海量临床数据,进行整合、清洗、机器学习等,构建医院临床最佳实践库。
(二)建立诊疗模型
在资源中心架构基础上,以临床数据仓库、BMJ循证医学知识库作为数据基础,将清洗后的病历数据与基础数据融合,构建临床、循证医学最佳实践库。利用KNN算法、FM推荐算法等机器学习算法训练模型并持续优化,从而得到临床决策支持模型,辅助临床诊疗方案制订。
(三)辅助临床诊疗决策
从病例数据中提取的数据进行数学方式和计算机建模,形成结构化数据,并构建好知识图谱。可以从病例数据库中获得相关的医学规律,从而探究症状、体征以及疾病之间更加深层次的、不易被发现的潜在关系。
在医生进行决策时,临床决策在资源中心的基础上,将疗效评价模型嵌入医院电子病历,采集患者症状、主诉、病史、处方、检查结果、检验指标等电子病历数据信息,再进行真实世界数据挖掘,从不同角度计算疗效,并以此为依据,然后通过智能推理,形成并自动筛选合适的推荐诊断以及精准化、个性化的治疗方案等临床决策支持知识,帮助医生有效提高初诊正确率,缩短确诊时长,减少误诊误治。
(四)全过程综合预警提醒
在资源中心的基础上,梅州市人民医院将112个异常指标、19523条预警提醒规则通过可配置的方式添加到规则应用平台并嵌入到各个信息系统,在临床医生录入诊断、书写病历、用药、检验报告、检查报告等各环节为其提供实行的预警提醒和病情发展评估,从不同角度计算疗效并自动筛选后推荐多种可供参考的治疗方案。除此之外,根据事件的轻重缓急平台将预警等级化,分为蓝色预警、黄色预警、橙色预警、红色预警,程度依次加重,医生可根据其程度进行决策。
(五)实时统一的病历内涵质量控制
通过数据资源中心搭建了智能化病历内涵质控平台,不仅辅助临床医生在书写病历环节及时发现缺陷、修改缺陷,提高病历书写质量,还借助病历质量监控平台,实现对全院病历质量水平的监管,为病历质控决策提供参考。
(六)知识检索服务
由于有BMJ循证医学知识库强大的支撑,医院共收录疾病知识近4万条,药学知识近3万条,辅助检查近1万条,文献、指南、循证医学证据1000多万条数据,据此完善知识检索语义分析,创建疾病同义词对照16121对,层级关系24881个;药品同义词对照8764对,层级关系8117种;737类3万多种症状体征的同义及层级关系术语集等,改变以往的数据库低效率的搜索逻辑,医生在使用时可根据自身业务进行分类搜索,提升检索质量及效率。
四、预期优化效果
(一)疾病辅助诊断
模拟人类专家决策过程,从电子病历得到的诊断要素,初步判断疾病类型。然后获取检查、检验结果,自动汇总加入患者的病情信息,给出进一步的诊断明确推荐信息或确诊建议,其优势在于能为门诊医生提供丰富的临床经验,结合相关病例,辅助医生鉴别诊断结果,有效提高医生诊断水平。
(二)临床预警提示
临床预警提示贯穿于各个业务系统的诊疗过程当中,通过预先配置的诊疗服务项目互斥、用药禁忌等相关规则,系统根据临床数据中心规则引擎在设定预警点进行必要的预警提示,从而避免临床出现不合理处方、不合理诊疗等情况,从而提升医疗质量,减少医疗事故。
(三)质控管理
系统打通患者整个诊疗过程的质量控制环节,提供全面的、实时的、动态的质量控制,及时预警诊疗过程事件,适时干预诊疗缺陷,实时监测病历质量,实现精细化的质量控制闭环管理,规范诊疗,全方位保证患者安全,维持稳定的医疗救治水平。
五、结语
随着信息技术的发展和医疗信息化建设的不断深入,使用科学合理的人工智能技术对医院临床最佳实践库的数据进行挖掘和利用,在一定程度上能消除不同医疗结构之间的信息壁垒,让海量的医疗数据得以有效互通和共享。人工智能技术的发展和应用让数据挖掘更加快速、精准、可靠地发现更多潜在的有价值的知识,为临床决策支持提供了必要的基础。人工智能技术的运用,为构建更全面的医院临床最佳实践库发挥更大的作用,基于人工智能建立的医院临床最佳实践库使临床决策更加智能化。
医院临床最佳实践库具有深度学习能力,需要全方位、多层次、动态性好的知识库支持。人工智能技术使系统反馈处理实时诊疗数据更加快速,从而提供更加智能的决策支持,真正帮助一线医疗工作者解决疑难病例,减少诊疗失误。
参考文献:
[1] 阮彤,高炬,冯东雷,等. 基于电子病历的临床医疗大数据挖掘流程与方法[J]. 大数据,2017,3(05):83-98
[2] 李昊曼,段会龙,吕旭东,等. 医学语言处理技术及应用[J].中国数字医学,2008,3(11):11-13+30.
[3] 孔晓风,李莹,李昊旻,等. 基于自然语言处理技术的消化科内窥镜检查报告的结构化[J]. 中国医疗器械杂志,2008,32(05):348-351.