基于人工智能的数字X线机自助检查系统的设计

2022-03-30 07:13朱昱昊陈丽惠池显辰
计算机测量与控制 2022年3期
关键词:受检者沙漏体位

杨 欣,陈 碧,王 辉,罗 江,曾 轩,朱昱昊,陈丽惠,池显辰

(徐州医科大学 医学影像学院,江苏 徐州 221000)

0 引言

摆位作为影像摄片中的核心环节,一直以来都是医学生学习的重难点,而摆位不当也一直是影响医生诊断、导致误诊漏诊的罪魁祸首[1]。近年来,影像科医学生成长速度慢、临床影像科医生水平良莠不齐、临床诊断对影像摄片的依赖性增高等问题逐渐凸显,摆位不当、医疗资源紧张和影像科技术人员压力大成为传统摆位的三大弊端。因此,研究出一款能实现辅助受检者摆位、提高摄影准确性、缩短摄影时间这三大功能的产品具有十分重要的现实意义。

近年来,新冠肺炎疫情在世界范围内蔓延,发现并控制疫情传染源至关重要,尤其是出现无症状感染者时,利用数字X线机精准筛查可疑人员就成为医院排查的一项重要措施,但由于部分地区防疫物资的不足,医护人员的保护不尽人意。2019年底全球大规模爆发的新型冠状病毒肺炎(NCP)和2003年的非典型肺炎(SARS),对人类生命和健康产生了重大的威胁,医护人员也付出了沉重的代价[2]。此外,临床上摆位不当还是影响X线摄片质量、造成非甲级片出现的主要原因[3],非甲级片往往会干扰影像医师做出准确判断,有时甚至会误导医师,造成耽误患者病情延误治疗时间的严重后果。另一方面,据不完全统计,影像技师每天的工作量平均60~80份磁共振或者120~150个超声检查[4]。由于数字X线机在医院临床任务重,同时又具有射线辐射,不适合用于医学生实践教学。由此造成相关医学专业实践教学效果并不理想,医学生动手机会少,动手能力差,特别是在乡镇医院里低年资医师实际操作的机会较少,专科医师培养周期较长[5]。据悉,每年国内放射科医疗工作量增速达18.8%,而放射科医生增速为4.1%,两者增长速率相差甚远,医疗资源相对不足间接激化医患矛盾[6]。

基于人工智能的医用数字X线机自助检查系统就是针对上述需求,把人工智能应用于在数字X线机检查中,开发了体位识别装置、体位判断装置和语音提示纠正装置,对受检者实现体位自动识别,自主纠错,自我调整。而影像科工作人员只需在监视系统下按下曝光按钮便可完成检查,真正达到了方便、安全、高效的目的。

随着我国积极推进医疗现代化的发展,目前医用数字X线机的发展日趋完善,而人工智能与影像结合正在成为医疗检测和诊断领域的新趋势。AI技术在医疗领域的布局与应用一直受到国内外科技巨头的高度重视,其中“医学影像+AI”是未来人工智能医学发展中最被看好部分,也是最有可能率先实现商业化的领域[7]。人工智能诊断在临床上已有经开始了大面积应用,人工智能辅助摆位将成为下一个热点。美国的五大顶尖医院如梅奥、克里夫兰等都开始与人工智能公司合作,希望人工智能为医学影像技术助力,成为人工智能医疗应用领域的领跑者,实现疾病检查、诊断、治疗和管理的智能化。相比于美国等发达国家,国内企业在医学AI发展上紧跟时代步伐。北京航空航天大学生物医学工程的高精尖创新中心在荧光分子断层成像方面应用了AI技术,研究了一种基于深度学习技术的可以高精度、超快速成像的方法[8]。深度学习技术在辅助诊断方面同样可以发挥重要作用。利用大数据与人工智能的相关技术来辅助放射科医生进行医学图像识别,不仅能提高医学影像数据识别的准确率,还能减轻放射科医生的工作压力,以达到疾病早发现、早治疗的目的[9]。随着信息技术和知识经济的快速发展,人工智能的成果已经得到越来越多的应用。可以预见,在不久的将来人工智能的发展和普及必将势不可挡,未来人工智能将会成为医务工作者的绝佳助手。这些智能化发展也为人类的就医方式带来了巨大的转变,同样,病情诊断和疾病治疗的高效与准确也给人们的生活健康带来前所未有安全感[10]。

1 “自助检查”系统的结构及原理

1.1 “自助检查”系统的结构

“自助检查”系统由图像采集装置、体位识别装置、体位判断装置和语音提示纠正装置4个部分组成。整套系统可以快速准确辅助受检者“自助检查”,减轻影像科工作压力。“自助检查”系统结构如图1所示。

图1 “自助检查”系统结构图

1.2 “自助检查”系统的原理

该系统采用软硬件结合技术,首先利用摄像头对受检者进行图像采集,接着利用基于堆叠沙漏模型的体位识别系统检测受检者姿态关键点,然后通过体位判断装置,将大数据中的正确体位与受检者体位对比,通过语音提示装置提示影像技术人员可以摄片或者提示受检者纠正体位。

2 基于人工智能的数字X线机“自助检查”系统的设计与实现

2.1 “自助检查”系统的设计

“自助检查”系统设计主要有一下几个步骤:1)图像采集:首先令受检者在诊断床上或荧光板前就位,用PC端摄像头对受检者体位进行拍摄采集,最后将得到的图像命名并存储到特定文件夹。2)体位识别:提取采集到的图像,利用添加了可变形卷积和注意力机制的堆叠沙漏模型检测受检者头、颈、胸、腹及四肢等大约20个姿态特征点并反馈坐标信息。3)体位判断:提取受检者姿态关键点及坐标信息后,对比标准体位数据库里的姿态关键点信息,在95%的容错率下,判断受检者体位是否标准。4)语音提示纠正装置将体位判断的结果通过播放器播放,从而对患者的不当体位进行实时纠错或者提示影像技师可以摄片。

2.1.1 图像采集

采用一个正对诊断床或荧光板的PC端摄像头对受检者体位进行拍摄采集,利用OpenCV得到照片的灰度图,以及再对灰度图进行二值化处理和腐蚀处理,最后将得到的图像命名并存储到特定文件夹。

2.1.2 体位识别

人工智能体位识别系统采用添加了可变形卷积和自注意力机制的堆叠沙漏网络(Stacked Hourglass Networks),通过提取采集到的图像,精确检测受检者头、颈、胸、腹及四肢等大约20个X线摄片姿态特征点并反馈坐标信息。

1)堆叠沙漏网络:

堆叠沙漏模型的目标是在推理阶段就尽量在所有尺寸的特征图上捕获信息。首先通过若干个池化层和卷积层执行下采样程序,并通过反卷积进行上采样处理。然后将这两个过程中尺寸相同的特征图相加,正如ResNet中所做的相加一样,重复这种“先下后上”的处理来建立“堆叠沙漏”网络,并且在每个“沙漏”后进行中间监督训练。

传统的堆叠沙漏网络结构如图2所示,其中的每个沙漏形状的结构即代表一个沙漏模块(Hourglass Network),多个这种结构堆叠起来,称作堆叠沙漏(Stacked Hourglass)[11]。单个沙漏模块的网络结构如图3所示,其中每一个方块即代表了一个残差模块,方块的大小代表着输入特征图的尺寸,残差模块网络结构如图4所示。沙漏模块的特点是具有对称的拓扑结构,其体现在下采样使用卷积处理,而上采样使用反卷积处理[12-13]。首先是下采样过程中进行若干次卷积和最大值池化操作得到最小尺寸的特征图。在每次最大值池化操作后网络会产生一个包含着若干卷积的分支,用于下一阶段的特征图融合。此分支的输入是最大值池化操作之前的特征图[14]。得到最小尺寸图之后,网络开始进行上采样和特征融合过程。上采样使用反卷积操作,将上采样后的特征图与网络分支上同尺寸的特征图进行元素级的相加,即可得到融合的特征图。残差模块使得1×1和3×3步长为1的卷积层不改变输入特征图的尺寸[14]。图4表示输出卷积核大小和特征纬度,其中跳层连接用虚线表示。中间监督(intermediate supervision)过程如图5所示,虚线代表跳层连接,沙漏图形代表了一个沙漏模块[14],右侧深色的方块代表着生成的HeatMap,训练阶段,将这些HeatMap和真实HeatMap计算损失MSE,并求和,得到损失;推断阶段,使用的是最后一个Hourglass的HeatMap[11]。

图2 堆叠沙漏网络模型

图3 单个沙漏模块

图4 残差结构

图5 中间监督模块

2)可变形卷积:

可变形卷积(deformable convolution)是指在常规的网格状空间采样中加入2D偏移(offset),即在标准卷积的基础上给每个卷积核的参数添加一个方向向量,使的我们的卷积核可以变为任意形状,从而使采样点分布到我们感兴趣的区域,更好地提取输入的特征,达到增强CNNs对于变形目标的建模能力[15]。

2D卷积包含两个步骤,首先用常规的gridR在输入特征图上x进行采样,接着将这些采样结果以权重w进行归并。gridR定义了空洞率和感受野的大小,如R={(—1,-1),(—1,0),..., (0,1),(1,1)}就定义了一个空洞率为1、感受野尺寸为3×3的核[16]。

在标准卷积中pn是R中有限个位置的枚举,对于输出特征图y中的每一个位置的p0都有:

在可变形卷积中,常规网格R经过了偏移{δpn=n=1,…,N},其中N= |R|后,对于输出特征图y中的每一个位置的p0都有:

(2)

因此采样就在不规则且有偏移的位置pn+δpn上进行,由于存在偏差δpn,故可以通过双线性差值实现,其中p表示任意的位置(公式(2)中p=p0+pn+δpn),q是从特征图x中选择出的:

(3)

因为G(·,·)是二维的双线性插值的核函数,故可以分成两个核,其中g(qx,px)=max(0,1-|qx-px|),g(qy,py)=max(0,1-|qy-py|):

G(q,p)=g(qx,px)·g(qy,py)

(4)

如图6所示,首先输入图像,利用标准卷积核提取特征图,接着把得到的特征图作为输入,对特征图再施加一个卷积层,从而得到可变形卷积的偏差,输出的偏差域和输入特征图的尺寸相同,通道维度的2 N对应N的二维偏移,同时对生成偏移和输出特征的卷积核进行训练,从而实现更准确的姿态估计[16]。

图6 可变形卷积

3)自注意力机制:

自注意力机制(self-attention mechanism)与人类观察外界事物机制很类似,当人类观察外界事物的时候,往往倾向于根据需要选择性地去捕捉被观察事物的某些重要部分,例如当看到图7的大量水果时,人类往往能够迅速找出某种特定的水果,这正是因为人类可以选择性地捕捉信息,并对信息进行筛选[17]。同理,自注意力机制可以对输入特征的不同部分赋予不同的权重,从关键区域中捕捉更重要的信息,从而减少了模型计算与储存的开销,同时使识别结果更为准确[18]。

图7 水果堆

图8 自注意力机制原理

2.1.3 体位判断

体位判断装置在PC端提取受检者姿态关键点及坐标信息后,调用标准体位数据库里的姿态关键点信息,并将二者进行对比,在95%的容错率下,判断受检者体位是否标准以及误差纠正。其中标准体位数据库是以MPII和LSP数据集为基础,与多家医院影像科达成合作、在专家的指导下自主研发。针对关键点信息的对比,本装置利用动作相关关系模型、关键点相对位置模型[20]以及余弦角度模型进行错误姿势判断,整体算法基于改进后的堆叠沙漏模型,可以对照片中受检者姿态进行正误判断以及误差纠正。若姿态正确,则输出“CORRECT”,若不正确,则输出“ERROR”,并根据上述3个模型的判断结果,对错误姿势的纠正进行简单说明。

2.1.4 语音提示纠正装置

语音提示纠正装置将体位判断的结果通过播放器播放,从而在正式摄片前对患者的不当体位进行纠错或者提示影像技术人员可以摄片。

具体过程如下:首先把语音文案转成MP3格式语音文件,接着把语音文件提供给芯片方,定制语音;将焊接到单片机上,然后根据芯片规格书写控制时序程序,每条语音都对应了一个地址;最后将地址数据写入芯片,即可自动播放指定语音。

3 实验结果与分析

3.1 实验步骤

首先征集20名志愿者作为受检者。令受检者在诊断床上或荧光板前就位,摆出摄片体位,接着由图像采集系统采集并储存图像,用堆叠沙漏模型采集受检者姿态关键点,同时有可变形卷积优化关键点识别效果、注意力机制较少模型计算与储存的开销,然后用体位判断装置将受检者姿态关键点与标准体位数据库中姿态关键点进行对比,判断受检者体位是否标准以及误差纠正,若受检者体位不当,则通过语音提示装置对受检者进行纠错指导;若受检者体位正确,则提示影像技术人员可以摄片。图9是自助检查系统流程图。

图9 “自助检查”系统流程图

系统测试实验结果主要包括两部分,一部分是对甲级片出片率、摄片时间和院内感染3个指标定量的测试,另一部分是对诊断错误率、受检者和医生满意度3个指标近似定性的测试。前三者的结果通过比较使用“自助检查”系统前后的医疗数据得出,后三者的结果通过对医生及受检者进行问卷的形式得出。

3.2 实验结果

根据实际情况,该系统只对部分实验数据结果进行了展示。图10展示了在应用数字X线机自助检查系统后,某三甲医院影像科在诊断错误率、甲级片出片和摄片时间等6项指标上的变化以及变化的幅度。

图10 实验结果

3.3 结果分析

实验结果表明,该系统在诊断错误率、摄片时间、院内感染的发生方面较未使用“自助检查”系统时均有减少;甲级片出片率、受检者及医生满意度均有提升。摄片时间缩短了50%左右,将甲级片出片率从不足40%提升到将近80%,进而将误诊率减少了至少30%,同时能够有效地减少医患接触,减低了院内感染的风险,系统实现了缩短摄片时间、提高摄影质量、降低院内感染以及提高医生和受检者满意度的目标。

4 结束语

传统摄片带来的一系列问题随着人们需求的不断增长而日益显现,摆位不当、医疗资源紧张和影像科技术人员压力大是目前亟待解决的问题。基于人工智能的数字X线机体位识别系统,利用自主研发的人工智能体位识别装置、体位轮廓投射控件和贴心的语音提示功能,帮助受检者自助检查,缩短摄片时间,同时提高摄片精确度,减少误诊漏诊,还能避免院内感染,保护一线医务人员。医疗设备的更新换代,可以挽救人们的生命;而医疗模式的智慧化、升级化,则可以改变人们的生活。

猜你喜欢
受检者沙漏体位
基于使用个人防护用品和自动曝光控制降低CT检查中受检者辐射剂量的研究
健康体检的护理质量管理实践及体会
分娩镇痛与体位管理联用于产妇中的效果观察
沙漏
手术室护理应用不同体位摆放配合肛肠手术的效果观察
分析自由体位护理在初产妇阴道分娩中的应用效果
冠状动脉CTA检查前需做哪些准备?
说说健康体检中的沟通技巧
有趣的沙漏
手术体位垫管理中存在的问题及对策