阿依图尔荪·喀迪尔
摘要:电子病历不仅对门诊、住院患者治疗具有指导与干预作用,更能以数字化形式呈现当前医疗服务内容与记录,为患者提供更为高效的医疗服务。为进一步强化深度学习能力,提取有效医疗信息。基于此,结合深度学习计算方式,对电子病历医疗命名实体的识别工作进行分析,借助BP网络构建基本数据模型,希望借助已标注病历数据进行再次训练与测试,强化电子病历命名实体识别工作开展,为现代医疗服务提供精准服务。
关键词:深度学习;电子病历;命名实体识别
中图分类号:TP393 文献标识码:A
文章编号:1009-3044(2020)16-0195-03
随着科技水准不断攀升,医疗行业获得全新发展契机,在医疗行业中,传统病历模式逐渐被优化为电子病历。电子病历集合计算机技术、智能产品,含有大量患者信息与专业医疗知识。对疾病治疗与疾病分析具有重要关联,对国内医疗水准提升具有积极作用。对命名实体识别进行分析,国外命名实体识别出现较早、相对成熟,具有良好监督与学习效果。对国内命名实体识别进行分析,国内起步相对较晚。但是,在科技迅速发展过程中,命名实体识别取得较好成果。为进一步提升命名实体识别能力,充分发挥电子病历价值,本文结合深度学习中的LSTM与MLP对电子病历进行基本识别,希望能够进一步提升深度学习电子病历识别有效性,为现代医疗服务发展做出重要贡献。
1电子病历医疗命名实体识别以及深度学习基本概述
1.1命名实体识别基本概述
对命名实体识别进行分析,命名实体识别具有信息提取、机器翻译、句法分析作用,是现代应用领域重要部分。将其与电子病历相结合,不仅能容纳大量的人名、时间、地点与日期、百分比等,更能明确实体类别,解决医院传统病历应用存在的问题。相对于英语的识别方式,在国内医疗电子病历识别过程中,汉语识别难度更大。因此,应结合深度学习计算方式,构建专属国内电子病历实体识别方式,应用不同模型,提升电子病历医疗命名实体识别能力,进一步推动现代医疗服务工作开展。
1.2深度学习基本概述
对深度學习进行分析,深度学习为一种机器学习方式,此种学习方式,在实际应用过程中,主要通过神经网络加以实现,对“深度”一词的解释,可以将“深度”理解为不同的神经网络分层,传统的机器学习深度网络多为2-3层,而深度学习网络辐射广,甚至可以达到成百上千层。深度学习方式,相对于单一的计算方式,此种计算方式更为准确、迅速,能够在极短时间内处理大量数据信息,并得到精准数据结果。究其原因,主要源于深度学习集合大数据、强大的计算资源以及训练模式。而CNN[1]作为深度学习中的基本图像处理方式,也是较为常见的神经网络,此种神经网络具有较强的提取与分层能力,能够进行重复提取,从而针对想要解决的问题,进行多次实验。只要具有充分训练时间,就能够解决复杂问题,将逻辑不清晰、关系不明确问题进行分化,最终得到精准数据结果,为结论研究提供强有力数据支持。
2命名实体识别所应用的MLP、LSTM神经网络计算方式
2.1 MLP神经网络计算方式
MLP[2]为多层神经网络简称,亦被称之为人工神经网络。MLP神经网络包含多个节点,其中,以ANN结构为例,每个节点之间相互衔接。在不同阶段的衔接部分,这些节点根据不同关系与全新,对偏置处加以关联,从而解决一些特定问题。在此种应用过程中,应给予偏置开展特定训练,并借助多个输入与输出层,构建完善神经网络,从而对神经网络内部多层信息以及隐藏内容加以识别。
2.2 LMTS神经网络计算方式
对LMTS进行分析,此种方式,更是适合处理间隔时间较长的问题。在短期记忆网络中,R为输入层、输出层以及隐藏层。其中,隐藏层主要借助RNN隐藏处理方式,对不同结构进行计算,并将得到的结果与新的数值一起作用于隐藏层,从而形成最终的输出结构。在此项计算方式中,既能展现基本的RNN结构,又能对RNN结构进行改进。LSTM优化RNN结构,解决RNN依赖的问题,将历史信息作为不同介质进行传递,确保数据传递过程不受任何因素影响,这也是LSTM计算重要内容。
3电子病历医疗实体是被模型构建
对最初序列标注进行分析,最初的序列需要动手进行标注,不仅需要投入大量人力资源、投入较高成本,整体标注效率较低。因此,在不断发展过程中,电子病历中的标注工作逐渐引入神经网络,对不同的特征进行选取,并将其作为输入框架,构建基本识别模型。其中,输入层最主要作用,就是将不同患者名称、疾病名称以及治疗记录输入其中,与此同时,在输入完成后,将每个输入转换为所对应的序号。而查找层可以通过ID转换多为向量,在这一层进行查找工作,将每个索引作为多维向量。为了获得更多上下关联信息,应在字前以及字后,对不同向量进行拼接,从而为网络层输入工作奠定良好基础。对命名实体识别网络层加以分析,在命名实体识别网络层中,主要应用LSTM与MLPS[3]神经网络计算特征,输入相关向量,并在不断转换过程中,对每一个输出的内容进行标准与分类,从而实现电子病历命名实体识别工作,在不同的计算方式与控制网格中,能够根据维特比计算方式,得到最佳识别方式,获得最终明确标注序列,并借助网络层所提供的数据内容,获得更为精准序列过程,获得精准识别方式。
4基于深度学习的命名实体识别实验
4.1训练集
在命名实体识别中,所采取的方式主要为隔准训练方法,为了进一步降低最小化带来的函数损失,因此,在命名实体识别实验中,应当结合最新计算方式,结合优化AdaGrad[4]算法,充分运用minibathc传播方式,对传播算法进行深入研究,获得最终的bathc数值。
4.2实验评价指标
要想更好地发挥命名实体识别效果,在实际工作中,应当以医院内部病历为主,对这些电子病历进行实名标注,将其中的150分电子病历作为训练集,将50分作为测试级,并在实际的测试过程中,选择适合本次测试框架结构,本文选择谷歌提供的TensorFlow为主,选择Python此类开发软件,并选用Windows系统。在此次实验中,以三个指标为衡量标准,分别为准确率、召回率以及F1数值,作为重要的衡量实体识别标志指标,实验公式如下所示: