基于人工智能技术的医学知识问答系统研究

2019-02-07 05:32陆森徐霄玲陈园园赵逸凡刘婷叶萍韩宝三
软件导刊 2019年12期
关键词:人工智能

陆森 徐霄玲 陈园园 赵逸凡 刘婷 叶萍 韩宝三

摘要:将人工智能技术应用于医学知识问答系统构建,帮助患者更准确性、更有针对性地认识疾病。建立标准化医学知识问答数据库,并通过医院门诊收集患者问题,利用SiameseLSTM获取问题间的相似度,将非标准化问题纳入问答系统,通过小程序完成问答系统与用户之间的交互,并选取100位门诊患者进行程序回答测试。程序实际测试的回答有效率为82%,无效率为18%,对于内容实质相似的问题回答准确。目前为止,程序运行的准确性处于较高水平,有效率达到82%,可以很好地解答实质相似、问法不同的患者提问。今后,有望通过进一步的数据扩充及程序训练,给患者提供正确的相关医学知识,进而提高就医效率,减缓临床压力,缓和医患关系,提高患者就医满意度。

关键词:人工智能;就医效率;知识问答系统

DoI:10.11907/rjd k.191242

中图分类号:TP303 文献标识码:A 文章编号:1672-7800(2019)012-0065-04

0引言

伴随国家政策的推进、互联网技术的普及,以及居民物质、精神生活的日益富足,人们对健康的关注持续增加,我国互联网医疗产业开始高速发展。它以互联网为载体,利用云计算、大数据等现代信息技术手段搭建多种多样的智能化信息应用平台,提供健康教育、电子健康档案、疾病风险评测、远程会诊治疗、在线疾病咨询等多种形式的健康医疗管理服务。其中,人工智能技术(Artificial Intelli-gence,AI)应用于互联网医疗颇具发展前景。其在医疗领域已有诸多应用场景,包括医疗机器人、辅助诊疗、专家系统、医学影像等,已成为医疗领域变革的重要力量之一。以医学影像为例,对一份影像图片的医学诊断,涉及拍摄影像工具的准确度、分辨率,并受讀片医生主观经验影响。在巨大的门诊患者数量面前,影像学专业人员数量缺乏、人工读片时间较长都会严重影响患者就医效率,而将人工智能技术应用于影像学,借助计算机对影像数据的精确判断,迅速辨别影像异常,并进行所摄部位的三维重建,通过设定对应于人工智能的医学判断标准,将极大提高读片效率。配合深度学习算法,将正常人体组织与异常组织加以区分,已有学者将其应用于判断肺部正常组织与肿瘤组织,准确度可达89.2%。

现代医疗环境下,就医效率一直是存在于患者与医生之间的一大矛盾点。人口老龄化问题突出,慢性病患者数量不断增大,而相对的医疗资源始终处于紧缺状态,大医院始终人满为患,不少医院患者的就医效率始终处于较低水平。分析其原因在于:①医疗资源紧缺,为了医生接诊的几分钟时间,患者往往需要花几十倍的时间等待;②在有限时间内,为了诊断的准确性,医生需要了解病人的完整病情,但由于医疗体系的专业性,患者往往无法正确表达医生所需要的病情描述,甚至由于紧张,会有一些失实病情从患者口中叙述出来,造成误诊误判;③就诊过程中,医生详细解答患者疑问,但出于情绪紧张或者医学知识的专业性,患者在就诊时始终无法理解医生所说,内心始终存有疑虑,这就会出现就诊过程中患者反复咨询医生同一个问题,或者就诊结束后患者的种种疑虑依旧存在,严重影响就诊满意度;④医疗信息遍布网络,任何年龄阶段的患者均会在互联网上受各种医疗信息影响,而其中,很多医疗信息是商家为推销产品、服务而编造的,非专业人士无法判别其正确性,带着这些混杂信息的患者到医院就医,面对就诊医生的诊断,难免会不知所措,甚至会发生医患矛盾。这些都是影响就医效率的重要现实因素。

目前,互联网上对于医学的问答主要以谷歌、百度等大型搜索引擎为主,用户只需输入感兴趣疾病的部分关键词,即可得到关于该疾病的大量介绍与应用数据,但通过这种方法,用户往往会“迷失”于茫茫信息中,无法判断相关性与正确性;也有学者以搜索引擎的数据为基础,依照不同检索技术与问题分析方法,设计准确性更佳的程序,但数据量巨大依旧使得非专业用户无法获得最准确的信息。

基于上述分析,笔者所在团队设计了一款基于人工智能技术,以手机APP、微信公众号和小程序为载体的AI医学知识问答程序,通过临床门诊训练,不断扩充数据库,提高问答针对性,对实质相同、问法不同的提问提供准确的回答,旨在帮助患者在医院就诊前后,更准确地了解涉及自身健康状态或疾病的相关医学知识,帮助医生及患者更有针对性地进行医疗就诊,减少不良情绪与矛盾产生,进而提高就医效率。

1相关技术

该AI问答程序当前数据来源于上海交通大学医学院附属新华医院普通外科门诊,以及上海交通大学医学院附属国际和平妇幼保健院乳腺外科门诊。每个数据样本以问答对为形式。问题在患者就诊时收集,医生对患者所提问题加以人工回答并标注。在数据集构建上力求真实准确,为模型训练提供可靠的数据支撑。

技术实现可分为3个阶段:①为已经标准化的问答对建立索引,方便查找;②额外收集非标准问题,通过求取与标准问题的相似度,获取相关标准答案,目前主要使用孪生神经网络(Siamese LSTM)获得两个问题之间的相似度;③依托小程序,最终完成问答系统与患者之间的交互。

Siamese LSTMtm在2016年被提出,由于在计算语义相似度方面表现不错,现已广泛应用于自然语言处理。Sia-mese LSTM神经网络由两个完全相同的LSTM组成,LSTM之间共享权值。其中LSTM(Long Short-Term Memory,长短时记忆网络)是一种时间递归神经网络,能解决时间步长大时梯度消失的问题,捕捉长距离依赖,目前常用于句子和篇章级别的自然语言处理。LSTM通过3个门结构管理记忆单元状态,分别为输入门、遗忘门和输出门。输出门决定哪些信息保留,遗忘门决定遗忘哪些信息,有了输人门和遗忘门就能将单元状态更新,并通过输出门输出,如图1所示。

分别将标准与非标准问题对分词,并通过查表方式将每个中文单词对应到预训练好的词向量Xi;将词向量构成的句子输入到LSTM中,其中左侧代表非标准问题,右侧代表标准问题;将两个LSTM各自最后一个隐藏状态作为输入问题的语义信息,并利用打分函数e-x求出两者语义信息相似程度,取相似度高的标准问题答案作为非标准问题答案。

2使用结果

以当天患者门诊就诊时间为选择顺序,共选取100例门诊患者的问题,对程序进行测试,测试情况如图3所示。其中,图3(a)与图3(b)展示了不同的提问问题,但程序给出了相同的答案,分析原因在于两位病人的提问,实质上均表达了患者需要了解乳腺增生的饮食注意事项,故程序给出的答案均符合所对应的提问,可见程序的识别准确性较好;图3(c)中,患者对乳腺影像学上的“钙化”这一描述进行了提问,程序很详细地解答了前半部分问题:“钙化要紧吗”,而对于后半部分患者的提问,程序未给出详细解答,分析原因可能是程序未能完整识别该提问,或者是由于数据库对“钙化”这一解释的缺失。

以程序回答内容与患者所提问题的相关性进行分类,I类:回答内容完全符合;II类:回答内容大致符合;III类:回答内容仅部分相关;Iv类:回答内容少量相关或不相关。将I、II类判定为有效回答,III、Iv类判定为无效回答。图3(a)、图3(b)均满足I类相关性,图3(c)满足II类相关性。其余测试结果见表1,I类占比62%,II类占比20%,III类占比13%,Iv类占比5%,有效回答率为82%,无效回答率为18%。结合图3与表l,目前为止,程序运行的正确性与准确性均处于较高水平,可以很好地解答内容实质相似问题。

3结语

人工智能技术的迅猛发展,掀起了医疗领域的应用热潮。尽管如此,不少学者逐渐认识到在这股热潮下,诸多问题有待深入思考。一是数据来源问题。人工智能的深度学习等均依托于大量数据,而数据共享是一大难题。无论是利益冲突,抑或技术缺陷,不同医院在数据共享方面存在鸿沟,这一数据壁垒在同一家医院的不同科室间依旧存在。即使双方、多方达成共识,由于医院系统的缺陷,将数据进行联通也存在很大障碍。二是数据的伦理性问题。以人工智能辅助诊疗场景下的应用为例,由人工智能系统对患者信息进行收集,并得出其诊断结果,若人工智能作出了错误诊疗决策,并导致医疗事故发生,此种情况下责任的归结就存在很大问题;同时,人工智能系统在进行诊疗的过程中,会产生大量患者相关数据,这就涉及隐私问题。此情况下,如何保护好患者的隐私将成为巨大挑战。

不同于人工智能在医疗领域的应用场景,本文所设计的AI问答程序,以给患者提供医疗咨询为目的,不涉及诊断决策与患者信息。患者通过该程序所获取的知识服务于患者就医过程,具体方面包括:①帮助患者准确了解与其病情相关的医学知识,提高对自身正确病情的阐述,减少在就诊过程中表达错误病情情况的发生;②提高问诊效率,帮助患者了解医生对其病情的解释与医嘱,减少同一问题反复咨询的情况;③帮助患者降低受互联网错误医疗信息影响,减少医疗诈骗事件发生,指导患者树立正确的健康观。综上,该系统基于人工智能技术,临床收集患者问答相关数据,以手机APP、微信公众号和小程序为载体,能够很好地回答相关疾病患者所关心的问题,为患者在就诊前后提供正确的相关医学知识,提高就医效率。

系统还存在以下问题需改进与解决:①数据库的扩大:目前程序依旧有18%的无效率,分析原因在于,程序设计以“亲患者性”为导向,并未将部分专业词汇录入数据库,而实际情况下,患者在就诊前已从互联网了解到相关疾病的专业词汇,例如“乳腺分叶状肿瘤”,故程序未能進行有效回答;②应用学科限制:目前数据库内容集中于乳腺方面,仅能解答乳腺疾病相关问题。未来将通过与不同学科专业的医生合作,扩充数据库问答对数据,并在医院门诊加强程序训练,进一步提高其有效率。

猜你喜欢
人工智能
我校新增“人工智能”本科专业
用“小AI”解决人工智能的“大”烦恼
当人工智能遇见再制造
AI人工智能解疑答问
人工智能与就业
基于人工智能的电力系统自动化控制
人工智能,来了
人工智能来了