基于深度学习的智能处方审核系统探讨

2020-11-03 14:04李明娟
药品评价 2020年14期
关键词:病历处方向量

李明娟

郑州市第二人民医院药务科,郑州 450011

处方审核是医院管理系统的重要组成环节,合理的处方合格率有助于医疗系统的高效运转。处方合格率对于医院声誉还有患者生命健康的具有重要保障。国内各家医院也对处方审核高度重视,针对提高处方合格率做出了很多研究成果,目前处方审核都是以药理学和人工审核为基础的审核系统[1-7]。基于人工审核的处方审核受限于医生的水平和精力,而基于规则的处方审核由于样本和地域限制可能不具有较强的可推广性。深度学习近年来在语音和图像识别方面取得很大进展[8],国内的研究人员应用深度学习研究电子病历的数字编码化[9]。

本研究通过深度学习建立处方智能化审核系统,首先将门诊处方的诊断语言进行分类,每一种描述代表一个独立元素,对每个独立元素进行数字化排列,组成诊断矩阵。然后对数字化矩阵图像化,将其转化为像素的数值范围内,利用Hankel 矩阵形成图片数据[10-12],将数据输入Lenet 中对已有的处方进行训练,训练完成后结果和对照组结果对比,进而验证本文研究的有效性。

1 病历数字化

病历是医生根据已有的医学知识对病人做出简洁的语言判断,但对智能审核系统而言,系统无法识别人类语言,所以首要步骤是将病历数字化,目前基于病例读取和理解的研究多是基于自然语言处理的方向进行探索[13-15],但语言系统本身较为复杂,存在多义性和歧义性等多种问题,这里给出的解决方法是根据诊断病例的关键词的有限性,对其作出数字化映射。

以呼吸科病历为例,常见病人症状有:咳嗽、发热,咳嗽、黄痰,白痰、肺有湿罗音、发烧、咽喉肿痛,胸闷、气喘、胸痛、呼吸困难、支气管炎、咽喉炎症、肺炎、咽痛、鼻塞、流鼻涕、打喷嚏、头痛、咽痛、全身肌肉酸痛、食欲不振、鼻痒、声音嘶哑、咽部发痒、咽喉疼痛、发热时间、药物过敏史,将上述症状进行排序,组成一个1×29 的行向量。当病人病历存在咳嗽时,在列向量中标记为1,否则标记为0;若存在发热,在第二个位置标记为2,否则标记为0,依次根据症状进行标记,直至向量位置占满为止。

2 病历图片化过程

本文深度学习采用Lenet 框架,该框架适用于图片和语音识别,无法直接识别向量,所以将需要向量转化为图片,具体过程如下所示:

从图1 可以看出,当病历向量中对应位置中标志有数值时,在对应行中写入对应数量的深灰色方格,当没有数字时,默认为0,该行全部为浅灰色。图1 为行向量的图片例子。

3 病历训练过程

病历训练过程中使用的深度学习框架为Lenet,Lenet 是一种典型的卷积神经网络的结构,由Yann LeCun 发明,因用于MNIST 手写体数据集的数字识别而出名。

与传统的手写字体的Lenet 七层框架不同的是,本人采用的框架只有5 层,因为针对开出的药方种类相对较多,而不是手写字体中只有10 类,所以省略了最后2 个全连接层,Lenet 的主要结构见图2。

数字化病历为输入层,图片大小为29×29×1,其中1 表示为黑白图像,只有一个通道。

卷积层1 的大小为5×5,卷积层1 深度(个数)为6,卷积步长s=1,输出矩阵大小为28×28×6,其中6 表示滤波器的个数。池化层1,池化层1大小2×2(即f=2),步长s=2,输出矩阵大小为14×14×6。卷积层2 大小 5×5,滤波器个数为16,卷积步长s=1,输出矩阵大小为10×10×16,其中16 表示滤波器的个数。池化层2,滤波器大小2×2(即f=2),步长s=2,输出矩阵大小为5×5×16。注意,在该层结束,需要将5×5×16的矩阵压缩成一个400 维的向量。

全连接层直接输出120×1×1 个向量。最后,输出层由欧式径向基函数单元组成,每类一个单元,每个有120 个输入。

Lenet 的训练过程如图3 所示,首先准备标注好的数据和已经被赋予初值的Lenet。定义损失函数loss,常见的损失函数的形式是使用Lenet 输出层的结果与标注好标签差值的平方和形式。通过数值计算求解得出损失函数关于需要优化的参数W的偏导数,第n+1 次参数W 等于第n 次参数值加上偏导数的k 倍。Lenet 省略2 个全连接层,直接输出120 组结果。

4 计算过程

本文选用tensorflow 对数据进行训练和测试,数据选取某医院2017—2018 年呼吸科病历,病历数量为5 325 份。使用Lenet 训练需要将病例分类为测试集和验证集,而对照方法统计法不需要将病例分为两类。其中测试集份数为4 200 份,验证集分数为1 065 份。测试集与验证集的比例为4∶1。

对照方法采用统计学方法,采用SPSS 20.0 软件对数据进行统计分析。计数资料以率(%)表示,采用χ2检验,用P<0.05 表示差异有统计学意义。

下文中两种方法指的是Lenet 方法和统计学方法。

4.1 两种方法的处方不合格率对比统计结果表明,用Lenet 训练的处方不合格率(0.75%)小于对照组的处方不合格率(5.92%),门诊处方开具合格率提高5.17%,见表1。

表1 两种方法不合格情况对比

4.2 两种方法的不合理用药率统计结果表明,用Lenet 训练的不合格用药率(0.66%)小于对照组的不合理用药率(5.73%),见表2。

用Lenet 训练结果包括3 张重复用药门诊处方、3 次用法用量不合理、1 次联合用药不合理和1 次配伍禁忌,对照组的不合理包含17 次重复用药、11 次用法用量不合理、12 次联合用药不合理和12次配伍禁忌。

表2 两种方法的不合理用药率对比

5 结论

本文使用Lenet 用于处方智能审核研究,给处方审核提供一种可行的方法,研究结论主要有:(1)通过和对照组结果对比,本文方法降低了处方不合格率和不合格用药率;(2)本文避免以往电子病历数字化过程的word 转化vector 过程的复杂繁琐和多义现象,直接将症状与数字一一映射,避免了多义现象。

猜你喜欢
病历处方向量
向量的分解
聚焦“向量与三角”创新题
“病例”和“病历”
人间处方
临床表现为心悸的预激综合征B型心电图1例
向量垂直在解析几何中的应用
向量五种“变身” 玩转圆锥曲线
处方
数字化病历档案管理构建与实践
以电子病历为核心的医院信息系统建设研讨会