基于知识图谱的医学智能问诊系统的研究与实现

2025-03-05 00:00:00夏钰林胡为张程晨王玮琪
电脑知识与技术 2025年2期
关键词:知识图谱

摘要:为缓解医疗资源紧缺的现状,设计基于知识图谱的医学智能问诊系统。以图结构的形式将医疗病症信息存储到Neo4j图数据库中构建知识图谱,并详细阐述基于知识图谱的医学智能问诊系统设计方案与具体功能实现方案。该系统可通过有效的医疗病症知识抽取,生成医学知识图谱,在医生就诊时提供辅助建议提高医生问诊效率,为用户提供问诊服务方便患者及时疾病咨询治疗意见,并分析用药建议以及医生诊疗结果,为医生对患者疾病诊断后的用药方向奠定基础。

关键词:知识图谱;Neo4j图数据库;智能问诊;医疗病症

中图分类号:TP311 文献标识码:A

文章编号:1009-3044(2025)02-0026-04 开放科学(资源服务) 标识码(OSID) :

0 引言

根据《中国慢性病报告》一文中的预测数据显示,到2030年,我国65岁以上老年人口数量预计将增至2.4亿[1]。面对这一严峻的趋势,我国在卫生资源与健康环境方面仍存在不足,特别是医疗资源分配不均、布局结构不合理等问题尤为突出,严重影响了医疗服务的质量。在此背景下,智能问答系统作为自然语言处理研究中一项十分重要的研究项目,其重要性日益凸显。它能够超越传统搜索引擎的局限,以更加迅速、精炼且精准的方式直接响应并提供用户所需的答案[2],极大地提升了信息获取的效率。

近年来,社会快速发展,科技不断进步,在线智能问诊系统受到了越来越多的关注。系统为患者和医生提供了远程交流的新方式,与传统的线下问诊模式相比,在线问诊能克服许多弊端,比如不受时间地点的限制、减少患者的等待时间、降低了交叉感染风险等,为医疗服务带来了革命性的变革。然而,目前大多数医生在智能问诊平台上工作主要是利用业余时间,导致回复的即时性成为一大瓶颈[3]。

为了更好地满足广大病患需求以及缓和就医过程中的烦琐压力,本文构建了一个基于知识图谱的医学智能问诊系统。该系统采用知识图谱技术,通过构建医学知识图谱数据库,实现对医疗信息的精准匹配与高效检索。这不仅优化了医疗资源的配置,还提高了医疗服务的效率与质量,为患者提供一个更加便捷、高效的在线问诊环境。

1 医学智能问诊系统需求分析

1.1 医学诊疗书籍利用价值低

医学诊疗书籍中蕴含着丰富的医学理论知识、临床经验和科研成果,它们不仅是医学教育的宝贵资源,还是临床实践和科研创新的重要基石。如今信息化和数字化浪潮席卷,医学诊疗书籍的利用方式和方法仍面临诸多挑战,如信息检索不便,使得医生和学者难以快速查询到所需资料;知识更新滞后,导致书中内容可能难以适应目前医学发展;跨领域知识整合难度大,限制了医学知识体系的全面构建与深度挖掘。

充分挖掘并提升医学诊疗书籍的利用价值,通过人工智能技术对其进行智能分析和利用已成为必然趋势[4]。人工智能技术能够对医学诊疗书籍进行知识抽取,为系统的智能问诊功能构建图数据库,以便从数据库中快速检索到相关信息。医学智能问诊系统为临床问诊提供了强有力的智能辅助,助力医生精准制定诊疗方案,极大地提高了医学诊疗书籍的利用价值。

1.2 医学领域知识更新迅速

医学领域的知识和技术日新月异,新的治疗方法不断涌现。传统的医学诊疗书籍面临着显著挑战,因其更新周期较长,往往难以迅速反映最新的医学进展。这种滞后不仅制约了医生在诊断和治疗上的创新能力,还可能对患者的治疗效果和康复进程产生不利的影响。因此,医学智能问诊系统的研发显得尤为关键。

医学智能问诊系统需要具备强大的知识更新能力,它能够实时或定期地接入并整合最新的医学研究成果和临床实践指南。通过自动化的数据收集、整理与分析流程,系统能够迅速将最新的医学数据转化为详尽的知识图谱,才能确保在诊疗过程中为患者提供基于最新医学知识的诊疗建议,从而优化治疗决策,提升医疗质量。

1.3 病患就诊需求大

随着人口老龄化和慢性病发病率的逐步上升,病患就诊需求不断增加,但医疗服务资源有限,导致出现患者等待时间长、就医体验差、排队人数多等问题[5]。传统就诊模式已难以满足患者日益增长的医疗需求。

在此背景下,在线问诊应运而生,病患对在线问诊的意愿大部分都是正向的,人们普遍认为在线问诊系统能提高问诊效率[6]。在线问诊不仅能节省患者的时间和精力,还有效缓解了医院接待患者的压力。通过在线问诊,患者可以随时随地咨询医生,并及时获得治疗建议。同时,在线问诊还能帮助患者更好地了解自己的病情,提前做好相关准备,使实际就诊过程更加顺利。

1.4 医生问诊效率低

当前医疗工作中,面对持续攀升的患者数量和日益复杂的疾病种类,医生们在问诊过程中需要对每位患者进行细致的询问与对病情深入的剖析,因此需要耗费大量的时间和精力。同时,人为因素如医生长时间工作造成的疲劳、信息遗漏等可能导致误诊或漏诊,影响医疗服务质量。

引入智能辅助问诊工具,如智能预问诊系统[7]。通过高度集成的算法与数据分析能力,为医生提供一站式的诊断辅助,确保诊断的精准性与全面性,还能降低误诊率和漏诊率,极大地提高了医生问诊效率。为患者带来更为高效、优质的服务体验,提升了医疗服务质量。

1.5 医疗资源分配不均

我国医疗资源的分配不均一直是一个突出问题,地域和机构间的差异导致一些区域或特定的医疗机构面临资源短缺的困境,这些地区的患者难以获得必要的医疗服务。通过远程医疗的方式,系统能够向资源匮乏的地区或机构提供高质量的医疗服务,有效改善医疗资源的分配不均。此外,智能问诊系统能够依据患者对症状的描述进行精准的智能分诊,不仅能优化了患者就医的流程,还能提高就医的合理性。医学智能问诊系统的应用能极大地提升偏远地区医疗服务的质量和效率,使患者得到更加合理的医疗引导。

2 系统设计

2.1 系统架构

基于知识图谱的医学智能问诊系统包含Web端和App 端。Web 端为后台管理系统,专为管理员设计,支持通过电脑浏览器实现对医生资料、患者档案、病历信息、就诊历史以及核心知识图谱等关键数据的全面管理,提升管理效率,确保医疗信息的准确性与可访问性。App端分别设计医生端与患者端,采取了双界面策略,可精准对接不同用户群体的特定需求,提升双方的使用体验与满意度。通过分离医生和患者的交互界面,增强用户个性化、高效且直观的服务体验感。系统架构如图1所示。

2.2 系统实现

本系统基于真实且权威的医学诊疗记录构建知识图谱模型,利用Neo4j来实现图谱的搭建与存储。Web端调用Neo4j数据库中的数据实现其可视化展示,使管理员能够直观地理解和管理医学知识。App 端集成知识图谱,为用户提供基于现有知识图谱的智能辅助诊断服务。它能够根据用户的症状和病史,快速准确地提供可能的诊断结果,帮助用户更好地理解和管理自己的健康状况。此外,系统还能够根据最新的医学研究更新知识图谱,确保用户始终获得最新、最准确的诊断信息。

2.3 核心模块

1) 医学知识图谱构建模块

通过公开的医疗数据集获取医学临床诊疗记录,如面向中文电子病历的命名实体识别数据集(https://tianchi.aliyun.com/dataset/92085)。此外,利用Python 网络爬虫技术爬取医学文献数据,如万方医学网(https://med.wanfangdata.com.cn/)、中国生物医学文献数据(http://www.sinomed.ac.cn/)。结合《当前医学诊断与治疗手册》《哈里森内科学原理》等医学书籍获取数据。针对结构化数据直接转换,将其标准化为三元组格式;对于非结构化数据,融合命名实体识别与关系抽取技术,将其格式化为统一的三元组格式表示。再利用知识融合技术,清晰界定实体与关系的含义,剔除模糊、冗余及错误信息,有效应对知识图谱中的异构挑战。将处理好的三元组数据导入Neo4j图数据库中,构建全面、准确的知识图谱体系。

2) 医学知识图谱可视化

本研究构建的医学知识图谱中,汇聚了大量的医学内容,通过精细地组织上百个核心节点与上千条复杂关系,构建一个涵盖理论、法则、药物等多维度的综合医学知识框架。该知识图谱以三元组的形式展现医学领域内各元素间的内在联系,有利于人们进一步认识和了解医学知识,为医学知识挖掘与发现开辟一条更为直观、高效的路径。对于知识图谱的可视化展示,系统会根据管理员输入的实体名称展示一个由该实体节点及其直接相连(距离为1) 的所有节点共同构成的知识图谱视图。

3) 医学知识图谱智能问诊模块

在智能问诊模块的应用场景中,医生操作时,系统自动整合患者的病历资料作为查询基础,然后生成辅助诊断建议,直接反馈给医生,提升了诊疗效率。普通用户则通过模拟对话的方式输入问题,系统利用智能问诊模型即时分析并返回个性化解答,增强了用户体验。

智能问诊流程的核心环节如下所示。

(1) 文本预处理:利用Python的jieba分词,对输入的查询语句进行精细化分词处理,将连续文本拆解为具有逻辑关联的词汇序列。

(2) 关键词提取:借助命名实体识别模型,精准识别出用户问题中的核心关键词或短语,后续分析与匹配提供关键信息。

(3) 问题模板匹配:采用模板匹配策略,将预处理后的用户问题与预设的问题模板库进行相似度比对,选取匹配度最高的模板作为处理基准,确保问题能被准确理解和解析。

(4) 数据库查询与结果返回:利用Cypher查询语言,在Neo4j图数据库中精确查询,根据匹配到的问题模板及关键词,检索相关知识图谱,将查询结果呈现给用户或医生。

从用户输入到结果输出的具体流程示意图如图2 所示。

3.1 系统开发工具

基于知识图谱的医学智能问诊系统采用了多种编程语言与技术栈,包括Java、Python和HTML、JavaS⁃cript用于后端逻辑处理和实现前端交互设计,以及Cypher 作为Neo4j图数据库的查询语言。同时利用Android Studio 开发移动端,PyCharm 和IntelliJ IDEA 为Python和Java项目提供开发环境,Neo4j作为知识图谱的存储与查询工具。

3.2 医学知识图谱构建模块

使用医学临床诊疗记录、医学书籍、医学文献数据作为知识来源,收集其中的结构化数据、半结构化数据、非结构化数据作为数据集。对疾病的名称、症状、诊断方法、治疗措施、疾病分类等使用基于BERTBiLSTM-CRF 算法进行文本标注,部分实体类别见表1。

采用基于BiLSTM和ResCNN的实体关系抽取混合模型BiLSTM_SE_ResCNN,可以在已识别的实体基础上从文本中提取实体间关系。首先,对医学实体构造属性列表并对实体进行完整描述,如药品的属性包括功效、服用方法等。然后,对来自不同来源的同一实体的属性进行知识融合。若在不同知识库中存在多个实体表示同一对象,可以将相同的实体对齐合并以完成知识融合。若存在由于数据多源造成的同名异义问题,可通过实体消歧后得到有效的三元组。最后,将这些三元组存储到Neo4j图数据库中,即可构建知识图谱[8]。

3.3 医学知识图谱可视化模块

管理员在系统Web端输入特定的实体标识,如“神经衰弱”。系统会利用Cypher查询语言在预先构建好的知识图谱数据库中搜寻与“神经衰弱”相关的全部信息,信息包括但不限于症状、病因、治疗方法等。检索完成后,系统再通过ECharts可视化工具,将复杂的知识图谱数据用直观、易懂的图形表示,管理员可以快速理解“神经衰弱”在知识图谱中的位置和关联,如图3所示。得到的知识图谱清晰展示了“神经衰弱”与其他医学实体之间的联系,为管理员提供了有效的参考信息。知识图谱可视化工具不仅提高了工作效率,也确保了数据的准确性和完整性。这些操作极大地提高了管理员对知识图谱的理解和掌握能力。

3.4 医学知识图谱智能问诊模块

用户输入“我有点感冒了怎么办?”询问时,问诊系统迅速提取“感冒”作为关键词,并尝试将其与预设的问题模板——“疾病治疗方案”进行匹配。因为“感冒”表述较为宽泛,不足以直接确定疾病的具体名称,问诊系统检测到信息不完整。

为了弥补该缺失,该系统智能地生成一系列补充问题获取患者的个人信息、更详尽的症状描述等关键信息,这有助于系统构建更全面的患者画像,从而提高诊断的准确性。接收到患者的深入回答后,系统运用先进的自然语言处理技术,深入解析新增信息中的关键字。经过综合分析与比对,系统初步判断患者所患疾病为“上呼吸道感染”。基于这一准确诊断,系统自动生成并提供针对性的治疗药物建议,为用户提供了及时、有效的健康指导治疗建议。如图4 所示,呈现了一个具体的智能问诊过程。

4 总结

本文从当前医疗资源的现状入手,探讨了医学问诊过程中存在的挑战,然后再深入到实现医学智能问诊系统的迫切需求,并创新性地利用知识图谱来开发智能问答功能,成功构建了一个基于知识图谱的医学智能问诊系统来解决该问题。该系统通过即时、精确的问题响应机制,加速了医生的问诊流程。同时,依托于丰富可信的医学诊疗记录数据,该系统能够为医生提供智能化诊断的辅助建议,极大地提高了诊断的精准性。此外,该系统还能为患者提供基础健康咨询的功能,且能依据患者对症状的描述进行精准的智能分诊。这有助于有效应对日常轻微疾病问题,减少患者就医频次,使患者得到更加合理和科学的医疗引导与服务,从而减轻医疗系统特别是医生的工作负担,促进医疗资源的合理配置与利用。

参考文献:

[1] 齐小秋,王宇,孙灵芝,等.中国慢性病学报告[R].北京;中华人民共和国卫生部疾病预防控制局,中国疾病预防控制中心,2006:5-6.

[2] 李荣耀,徐倩,吴雨璐,等.基于《本草纲目》的多模态知识图谱的构建研究[J].现代计算机,2022,28(13):10-17,24.

[3] 李梦翔,许扬,陈磊.在线智能预问诊系统构建与应用研究[J].医学信息学杂志,2022,43(11):73-77,88.

[4] 胡红娟,周阳,匡泽民,等.医学知识图谱应用研究进展[J].医学信息学杂志,2022,43(5):30-33,39.

[5] 李红梅,刘新,陈秋霖.手机医院,能消除排队长龙吗?[N].人民日报,2014-11-04(008).

[6] 宋妍锜.在线问诊的用户使用意愿和行为影响因素研究[D].北京邮电大学,2022.

[7] 丁勇,蔡秀军,薛翀,等.基于大模型的智能预问诊系统创新与实践[J].中国信息化,2024(6):68-69.

[8] 唐华,胡为,刘伟,等.基于知识图谱的中医医案智能问诊系统设计与实现[J].现代计算机,2023,29(19):98-101.

【通联编辑:王 力】

基金项目:湖南中医药大学本科生科研创新基金项目(项目编号:2023BKS081) ;湖南中医药大学2024 年省级大学生创新创业训练计划项目(项目编号:S202410541140) ;湖南中医药大学校级自然科学基金项目“融合深度学习的中医医案智能分析与知识发现研究”(项目编号:2022XJZKC016)

猜你喜欢
知识图谱
国内外智库研究态势知识图谱对比分析
现代情报(2016年11期)2016-12-21 23:54:23
国内信息素养研究的知识图谱分析
现代情报(2016年11期)2016-12-21 23:53:46
国内图书馆嵌入式服务研究主题分析
现代情报(2016年10期)2016-12-15 12:32:46
国内外政府信息公开研究的脉络、流派与趋势
现代情报(2016年10期)2016-12-15 12:27:57
近十五年我国小学英语教学研究的热点、问题及对策
基于知识图谱的产业集群创新绩效可视化分析
智富时代(2016年12期)2016-12-01 16:28:41
基于知识图谱的智慧教育研究热点与趋势分析
国内酒店品牌管理研究进展的可视化分析
从《ET&S》与《电化教育研究》对比分析中管窥教育技术发展
专家知识图谱构建研究