卢严砖 孔祥勇 李星星
摘 要: 医疗信息的缺失导致医疗差错频发[1],移动医疗[2]的出现改善了这一现象。本项目通过与专业医生合作,运用机器视觉、自然语言处理等人工智能技术,自动采集患者的健康信息,通过搭建医学知识图谱,实现医疗健康智能问答。另外,使用基于用户兴趣的推荐算法,对患者进行个性化健康资讯推荐。使用血糖仪、血压计等设备对患者进行生命体征监测,然后结合专业随访量表对患者健康进行评估。在项目中,采用AHP层次分析法、KNN等算法,实现对糖尿病等慢性疾病的自动预测,从而搭建起一套促进患者健康的智能医疗服务平台。
关键词: 人工智能;医学知识图谱;自然语言处理;慢病预测
中图分类号: TP311.52 文献标识码: A DOI:10.3969/j.issn.1003-6970.2020.01.051
本文著录格式:卢严砖,孔祥勇,李星星,等. “医路同行”智能医疗服务平台设计与实现[J]. 软件,2020,41(01):234239
【Abstract】: The lack of medical information has led to frequent medical errors, and the emergence of mobile medical care has improved this phenomenon. Through cooperation with professional doctors, this project uses artificial intelligence technology such as machine vision and natural language processing to automatically collect patient's health information, and build medical knowledge map to realize medical health intelligence question and answer. In addition, personalized health information recommendations are made to patients using a recommendation algorithm based on user interest. The patient is monitored for vital signs using equipment such as blood glucose meters and sphygmomanometers, and then the patient's health is assessed in conjunction with a professional follow-up scale. In the project, AHP analytic hierarchy process, KNN and other algorithms are used to realize automatic prediction of chronic diseases such as diabetes, so as to build a set of intelligent medical service platform to promote patient health.
【Key words】: Artificial intelligence; Medical knowledge map; Natural language processing; Chronic disease prediction
0 引言
醫疗服务平台的使用已经在国内外各个医院普及,然而患者和医生、医生与医生之间的信息屏障并没有被打破,不对等的信息导致医疗差错事故率居高不下[3-4]。现有的移动医疗项目虽然实现了轻问诊、远程复诊、家庭医生等模式,却缺乏患者全生命周期的健康信息[5]。为了改善这种现象,我们设计开发了一套包含网页和小程序的智能医疗服务平台,通过可穿戴设备及时获得用户健康数据,并对数据进行智能化分析、展示,通过与专业医生合作,实现以患者为中心的全流程的医疗健康管理。
1 背景
我国去年各级医学会共接到8000多起医疗事故技术鉴定,事故率高达47%[6],医疗差错事故大多来自于错误的流程和错误的环境。2018年以来,国家卫健委等权威部门发布了《互联网诊疗管理办法(试行)》以及《国务院办公厅关于促进“互联网+医疗健康”发展的意见》,积极鼓励采用“互联网+医疗”模式解决医疗资源不足的问题,提高医疗质量与效率。
互联网医疗的目标群体主要为慢病患者、恢复期患者等。据统计,用户使用最多的3个应用类型是健身类(30.9%)、医学资讯类(16.6%)和健康管理类(15.5%)[7]。现今国内移动医疗APP大多用户信息不完整,医疗APP审核缺乏科学合理的评判标准,用户信任度低。
我们以专业医学知识和信息技术为基础,建立了一个专业可信的医患沟通平台,解决医疗数据的“信息孤岛”的问题。使用可穿戴设备,采集生命健康数据,结合专业随访量表对患者健康进行评估,帮助用户随时掌握自身健康情况。搭建基于医学知识图谱的智能问答机器人,将医学人工智能技术广泛应用于用户健康管理,极大节省了医疗资源和用户精力,全流程护航用户健康。
2 智能医疗服务平台
2.1 系统结构图
“医路同行”智能医疗服务平台包括患者档案、健康监测、健康科普和健康商城四个模块。“医路同行”智能医疗服务平台结构如图1所示。
2.2 智能医疗服务流程
基于用户需求,我们设计了如图2的系统逻辑功能和数据流向。
2.3 数据库设计
基于用户的需求分析建立起实体关系模型,根据该模型建立数据库,存储用户基本信息、资讯内容等数据。实体关系模型如图3所示。
3 功能介绍
3.1 患者档案
医疗信息数据庞杂,患者手动录入健康档案操作繁琐。为了解决这个问题,我们使用图像识别[8]、自然语言处理[9]等技术实现了图像录入。基于深度学习实现对自然场景的文字检测和端到端的OCR中文文字识别[10],以达到对文字方向检测0、90、180、270度检测,以及不定长OCR识别。自定义一个专业的医疗信息词典,对得到的结果进行分 词[11],将识别的就医信息进行结构化存储。提高了患者档案录入的效率,增强了健康信息的可用性。自然场景文字识别整个流程如图4所示。
健康档案使用流程如图5所示。患者登陆以后,首先将过往的健康信息录入到小程序当中,让患者可以更加方便的查看自己的过往就诊信息。然后以专业随访量表为标准,为患者的健康状况进行打分和评估。再将患者的健康评分进行解读,让患者能够更加直观的查看自己的健康状态。
运用如图6所示的层次分析法加健康模糊综合评价[12],以生理参数指标为评价因素,建立一个三层人体健康模型,将用户的身体状况评为危险、亚健康和健康等五个级别。健康模糊综合评价实现步骤:(1)建立评价指标集合;(2)建立评判集;(3)确定各评价指标的权重W;(4)构建指标隶属度函数;(5)综合评价,将用户健康状况分成5级。该技术使用专业的体检中心评价指标,将健康分级标准化,帮助用户实现更好地健康管理。
3.2 健康监测[13]
可穿戴健康设备可广泛应用于体征监测和统计运动数据,我们使用蓝牙外接血糖仪、血压仪、健康手环等可穿戴设备时刻监控用户血氧、血压、运动情况等健康数据,并进行健康大数据的处理与分析,绘制慢病预测曲线图。血糖管理如图7所示。
3.3 慢性病预测
慢性病患病率高,患病周期长,一旦治疗不及,易造成生命财产的危害,利用算法对疾病进行提前预测可以减少不必要的损失。以糖尿病为例,运用KNN(k-nearest neighbors)算法,将用户过往血糖、身高、体重、年龄等数据作为参数,划分训练集和测试集,确认模型的复杂度和精确度,并调整近邻点参数,再通过算法模型进行训练后,调用预测函数对测试集进行预测,计算出用户的患病可能性,及时进行疾病预防或治疗。糖尿病智能预测如图5所示。
3.4 医疗智能问答机器人
市场上的医患平台很难实现对患者问题的实时解答且线上答疑水平参差不齐。为了解决这个问题,我们搭建了搭建以疾病为中心的医药领域知识图谱[14-15],并以该知识图谱完成医疗自动问答[16-17]服务。及时解答用户遇到的各种问题,解读健康报告。图谱数据来源于各大百科类网站和医院信息库,并在项目运行中通过问答不断丰富知识存储库,目前實体规模已达11.8万,实体关系规模已达185万。知识图谱关系与实体模型图9所示。
医学自动问答框架[18]如图10所示。第一步是先获取患者提出的自然问句,然后使用classifier组件将问句类型进行分类,第二步是通过parser组件将问句进行解析,第三步是将解析后的结果通过search_ sqler组件Cypher查询语句来对知识图谱进行查询,最后将查询到的结果连接成答案返回给用户。
图11为快速问诊功能,我们使用iView等前端技术将开发的医学自动问答框架封装为智能问答机器人,然后将该机器人添加到快速问诊功能中,实现对患者问题的实时解答。并且以知识图谱中大量的专业医疗数据为基础,保障了智能问答的质量,为患者提供专业的线上答疑。
3.5 预约医生
预约医生功能以用户的病历记录和用药记录为参数,使用基于用户的协同过滤算法[19],为用户推荐同类用户就诊的医院与科室,根据用户的就诊需求精准匹配相应的医生进行预约,节省用户的时间和精力。
3.6 个性化健康资讯
平台邀请专家破解健康谣言[20],实现对必要的医学知识、健康管理理念的科普。使用基于用户兴趣的推荐算法模型[21-22],首先搭建物品-主题概率分布矩阵,再分别构建用户历史兴趣模型、用户行为兴趣模型、用户内容兴趣模型,将此三个兴趣模型的主题词权制进行合并。最后生成推荐列表,将候选资讯内容同目标用户UIM进行相似度计算, 进行TOP-N推荐。个性化推荐医学热点。测评指标为:准确率、召回率和F(主题特征序列)值。基于用户兴趣模型的推荐算法流程如图12所示。
4 总结与展望
“医路同行”项目实现了智能录入、健康评估、慢病预测和健康资讯推荐等功能,打造了一个以用户为中心的健康管理体系,加强医院与患者的沟通。其中智能录入功能使用了图像识别和自然语言处理技术,使信息能够以结构化的方式被利用起来。高危评估功能使用了层次分析法和综合模糊评价,智能评估用户的健康状况。健康评估模块,连接了专业测量硬件,及时获取用户的健康数据,并进行深度挖掘,预测患慢病几率。智能问答搭建了一个基于知识图谱的智能机器人,精准识别并回答用户的问题。整个项目以服务用户为宗旨,提高医疗服务质量。同时减轻医生负担,合理分配医疗资源。
未来移动医疗行业线上线下融合将进一步深入,医疗数据的价值将进一步放大[23]。为了满足用户的需求,在接下来的工作中,我们的目标是:
(1)扩大用户群体,获得更多数据。争取为每个用户建立一个完整、有效的健康档案[24]。
(2)完善专业的医学量表,用以预测更多的慢性病。
(3)完善知识图谱,补充更多临床知识,让智能问答更精准、更专业。
“医路同行”团队致力于体察用户的需求、不断学习新技术。陪伴用户“医路同行,一路健康”!
参考文献
[1] Addressing the Diversity-Validity Dilemma Using Situa-tional Judgment Tests[J]. Juster Fern R, Baum Robin Camhi, Zou Christopher, Risucci Don, Ly Anhphan, Reiter Harold, Miller D Douglas, Dore Kelly L. Academic medicine: journal of the Association of American Medical Colleges. 2019(8).
[2] The medical AI insurgency: what physicians must know about data to practice with intelligent machines[J]. Miller D Douglas. NPJ digital medicine. 2019.
[3] A study on use of the web for automatic answering of remedy finding questions of common users[J]. Prakash Amit, Saha Sujan Kumar. Technology and health care: official journal of the European Society for Engineering and Medicine. 2019(1).
[4] Research on Intelligent Scheduling Optimization Selection Algorithm for Medical Information[J]. Ming Li , Ruo Hu , Hong Xu , Huimin Zhao, Xueri Li. Proceedings of the 3rd International Conference on Mechatronics Engineering and Information Technology (ICMEIT 2019). 10. 2991/icmeit-19. 2019. 74.
[5] 黄堃. 基于计算机网络技术的计算机网络信息安全及其防护策略分析[J]. 软件, 2018, 39(6): 139-141.
[6] 龚政霞, 白春霞. 新医改推动信息化深入发展移动医疗日渐兴起备受关注[J]. 世界电信, 2012, (8): 76-80.
[7] 王露, 姜小艳, 张思容, 何力, & 彭立生. (2016). 我国医疗损害责任纠纷案件统计分析. 中国卫生统计, 33(6), 1051-1053.
[8] [美]埃里克托普. 颠覆医疗——大数据时代的个人健康革命[M]. 1. 北京: 电子工业出版社, 2014. 1: 175-186.
[9] Adaptive reversible image watermarking algorithm based on IWT and level set.[J]. Zhengwei Zhang, Lifa Wu, Shaozhang Xiao. EURASIP Journal on Advances in Signal Processing, 2017, 2017(1).
[10] Facilitating practical knowledge by using ECT[J]. Rita Jentoft. Seminar. net. 2009(1).
[11] 赵健, 冯乔生, 何娟娟. 面向汉字识别的新特征及其提取方法[J]. 软件, 2015, 36(3): 31-36.
[12] 倪宁, 张少泉, 陈晓云, 等. 基于熵权法和模糊层次分析法的审计风险评估[J]. 软件, 2018, 39(10): 254-259.
[13] 吴昱, 黄建明. 一种基于Android 的健康监控预警系统[J]. 软件, 2016, 37(02): 129-133.
[14] Research on the Developments of Business Intelligence and its Enlightenment based on Bibliometric Statistics and Know?ledge Map Analysis[J]. Zongfeng Zou, Jie Cheng, Kugan Huang, Yonghan Gui. Journal of Physics: Conference Series. 2019(4).
[15] 刘家玮, 刘波, 沈岳. 知識图谱在农业信息服务中的应用进展[J]. 软件, 2015, 36(3): 26-30.
[16] The application of block chain technology in spot exch-ange[J]. Ming Zheng Liu, Zongfeng Zou. <, journal- title>, Journal of Intelligent & Fuzzy Systems. 2018(2).
[17] A study on use of the web for automatic answering of remedy finding questions of common users[J]. Prakash Amit, Saha Sujan Kumar. Technology and health care: official journal of the European Society for Engineering and Medicine. 2019(1).
[18] 康准, 王德军. 基于知识图谱的生物学科知识问答系统[J]. 软件, 2018, 39(2): 07-11.
[19] “Similar query was answered earlier”: processing of patient authored text for retrieving relevant contents from health discussion forum[J]. Saha Sujan Kumar, Prakash Amit, Ma?ju??mder Mukta. Health information science and systems. 2019(1)
[20] 王铁刚. 社交媒体数据的获取分析[J]. 软件, 2015, 36(2): 86-91.
[21] Adipokines and macrophage markers during pregnancy— P ossible role for sCD163 in prediction and progression of gestational diabetes mellitus[J]. Annika E. Michelsen, P?l Aukrust, Tore Henriksen, Jens Bollerslev, Tove Lekva. Diabetes/Metabolism Research and Reviews. 2019.
[22] 蔡雄峰, 艾丽华, 丁丁. 一种缓解协同过滤算法数据稀疏性的方法[J]. 软件, 2015, 36(3): 41-47.
[23] 李一凡. 2020年中国移动医疗市场规模超500亿 移动医疗行业未来发展趋势分[J]. 前瞻產业研究院 , 2018. 12. 07.
[24] 陈玉亮, 薛燕平. 基于Web Service 的数字档案资源集成研究与实现[J]. 软件, 2015, 36(9): 39-41.