关键词: MobileNetV3; Ghost模块; 量化感知训练; 精准门控机制; 隐匿性房室旁路心电图识别
0 引言
隐匿性房室旁路(Concealed Accessory Pathway,CAP) 属于心脏电活动的一种结构性异常,在特定的病理条件下,隐匿性房室旁路可能被激活,导致心律失常的发生,患者可能会出现心律失常的症状,严重时可能发展为心力衰竭,甚至导致猝死。因此,设计出合适的模型,在心电图上检测出CAP症状,对心电图进行识别成为一种合适的选择。近年来,研究人员提出了基于心电图的心血管疾病检测模型,模型种类包括卷积模型[1-2]、transformer 模型[3]和LSTM 模型[4]。相比之下,卷积模型因其高效的特征提取能力、参数共享以及平移不变性,在心电图识别中展现出更高的适用性。譬如,Tesfai[5]等人基于shufflenet架构,提出了一种一维架构的轻量化卷积神经模型,同时采用Focal损失函数用以解决数据不平衡的问题,实现对六类心律失常数据的有效分类;Chen等人构建了一种基于单导联心电图的多尺度融合轻量化卷积模型,经由3个亚神经网络提取各种缩放心电图的特征并使用带有挤压激励块的通道注意力模块自适应融合不同的缩放特征。实验结果表明,该轻量化卷积模型对睡眠呼吸暂停的检测具有有效性。
由于隐匿性房室旁路难以捉摸的特性,以及为了方便模型直接部署到嵌入式设备中,本文在轻量级MobileNetV3 模型基础上,提出了一种融合qOgzV+/IW33ciQs8a6KbTg==Ghost 模块、量化感知训练以及精准门控机制的改进Mobile⁃NetV3模型。最后在所收集的ECG12数据集上进行实验。实验结果表明,本文所提出的模型在保持较低计算复杂度的同时,达到了较高的识别准确率,可直接部署到嵌入式设备中,识别隐匿性房室旁路的心电图。
1 基本原理
1.1 MobileNetV3模型
MobileNetV3 模型是MobileNetv2 模型的改进版本。MobileNetV3模型优化了每个块,通过使用搜索全局模型技术,找到针对于硬件平台的MobileNetV3 模型;其次,将SE注意力机制应用在MobileNetv3的瓶颈结构中,提取全局信息对每个通道的特征进行加权,来提升MobileNetV3 的特征提取能力。Mobile⁃NetV3的瓶颈结构如图1所示。
其中,BN(Batch Normalization,BN)为数据归一化层,用于加快模型收敛速度,使得模型更加稳定,NL 为激活函数,有两种可供选择的激活函数,分别是Relu激活函数和HardSwish激活函数,Dwise为深度可分离卷积,Pool为池化层,FC为线性层,Relu表示Relu 激活函数,hard - σ 为HardSwish激活函数,1×1表示1×1卷积,用于改变输入特征图的通道数。关于所使用的MobileNetV3的结构框架如表1所示。
其中,输入表示输入的尺寸,框架结构表示模型名称和使用的卷积核大小,Conv表示卷积层,Bneck表示瓶颈结构,Pool表示池化层,扩展表示瓶颈层结构中使用1×1卷积层之后的通道数,输出表示输出通道数,SE表示SE注意力机制,√代表使用,-表示不使用,NL为激活函数,可以是Relu激活函数或HardSwish激活函数,它们的缩写分别为RE和HS。步长表示是否对特征图尺寸进行处理,为1,输出尺寸和输入尺寸一致;为2,输出尺寸的长宽缩减为输入尺寸的一半。
1.2 改进MobileNetV3模型
为了解决MobileNetV3 在心电图识别中计算量大、性能不足的问题,使用Ghost模块、QAT和PG机制,对MobileNetV3进行改进,得到一种改进型Mobile⁃NetV3 模型。本文分别从Ghost 模块、QAT(Quantita⁃tion Aware Training,QAT)、PG(Precision Gate,PG)机制3方面进行阐述。
1.2.1 引入Ghost 模块
在MobileNetV3模型瓶颈结构的第一个卷积处引入Ghost模块,用于增强MobileNetV3模型的浅层特征提取能力。Ghost模块通过卷积运算生成少量内在特征图,然后通过使用简单的线性变化生成高效特征图,最后通过拼接内在特征图和高效特征图获得Ghost特征图。Ghost模块的结构如图2所示。
其中,Conv表示用于生成内在特征图的卷积运算,Φ1,...,Φk 表示线性变换。当Ghost模块与Mobile⁃NetV3 的瓶颈结构相结合时,可以得到改进Mobile⁃NetV3模型的瓶颈结构,通过保留输入特征图,让模型拥有更强的浅层特征提取能力,结构如图3所示。
1.2.2 引入QAT
QAT由Jacob等人提出,是量化模型的一种常用手段,常用于模型压缩。其核心思想是将深度学习模型参数与运算精度从浮点型数据降低至低精度,如8 位整型。本文模型中,在MobileNetV3的卷积层里,使用QAT用于减少MobileNetV3的计算量。在卷积运算中,QAT的训练过程如图4所示。
图4中,float32表示32位浮点型数据,uint8表示8 位整型数据,uint32表示32位整型数据。输入为8位整型数据,将权重从32位浮点型数据转化为8位整型数据,通过8位整型输入和8位整型权重之间的卷积运算代替32位浮点型输入和32位浮点型权重之间的卷积运算,从而减少计算量,可得到的32位整型结果,并通过与32位整型偏置相加,经激活函数,量化转变为8位整型输出,所得到的8位整型输出作为输入,为下一阶段的卷积运算或者全连接运算做准备。
实际部署到嵌入式设备中时,在QAT下,整个卷积的运算过程如图5所示。
在本文中,量化这一过程的计算公式如式(1) 所示。
其中:I 表示32位浮点型权重或32位整型激活输出;A 表示量化后权重或激活输出所对应的8位整型;S 表示权重或激活输出的正负号;M 表示32位浮点型权重或32位整型激活输出中的最大值。
1.2.3 引入PG 机制
为了让本文模型的计算量和参数量进一步减少,同时提升模型的泛化能力和深层特征提取能力,采用PG机制对使用QAT后的卷积进行处理。PG机制可以分成两个阶段,分别是预测阶段和更新阶段。整个PG机制的结构如图6所示。
从图6可以看出,8位整型输入I 被分成高4位整型输入Ihb 和低4位整型输入Ilb。在预测阶段,高4位整型输入Ihb 左移4位后与8位整型权重进行卷积运算,得到结果Ohb。Ohb 经过门控机制,得到二进制决策掩码mask,用于在更新阶段,决定Ilb 中哪些位置参与卷积运算。Ilb 经过更新阶段,得到Olb。将Ohb 与Olb 相加,最终得到卷积的输出结果O。
2 实验结果与分析
2.1 ECG12心电图数据集
本文的ECG12心电数据集来自无锡某医院心电科,共有6 510张,类型为正常心电图和隐匿性房室旁路心电图,其中,训练集3 900张、验证集1 310张、测试集1 010张,隐匿性房室旁路和正常心电图分别占总心电图数目的30%和70%。数据集图像样本如图7 所示。
2.2 实验设置
验证本文模型的实验平台硬件为Intel I7 12600H 处理器、16G内存、RTX3070显卡,使用Python编程语言来实现,版本为3.7,使用深度学习框架Py⁃torch1.11.0、Pycharm开发工具来实现。整个训练过程迭代70个epoch,为了保证模型的稳定,在前10个ep⁃och 采用warmup 预热学习策略,初始学习率设置为0.001,后续采用cosine用于控制学习率衰减,超参数衰减率为0.1,最低学习率为0.00001。计算量用于定量评估不同模型的大小。对于隐匿性房室旁路识别性能的评估,引入灵敏度(Sensitivity,Sen) ,精准率(Precision,Pre) ,Macro-F1分数,它们被广泛应用在分类领域的性能评估,如式(2)-式(5)所示。
其中: TP、FP、FN 分别代表被模型预测为正类的正样本、被模型预测为正类的负样本和被模型预测为负类的正样本;F1 - score1 和F1 - score2 分别代表隐匿性房室旁路为正样本,正常心电图为正样本的F1 分数。
2.3 实验分析
为了验证改进MobileNetV3模型中的Ghost模块、QAT和PG机制在隐匿性房室旁路识别中的有效性,进行消融实验。消融实验结果如表2所示(最优的结果加粗)。
ECG12数据集上的消融实验表明,相较Mobile⁃NetV3 模型,加入Ghost 模块后,除了精准率外,Mo⁃bileNetV3模型对于12导联心电图的各项性能有所增强。这表明,Ghost模块可以增强MobileNetV3模块的浅层特征表示能力并同时压缩模型的计算量;加入QAT后,MobileNetV3模型的各项性能变差。这说明QAT所带来的误差导致MobileNetV3模型的各项性能变差;在加入QAT,再次加入PG机制,MobileNetV3模型的各项性能得到了一定的增强,这表明PG机制可以增强MobileNetV3模型的泛化能力和深层特征提取能力,弥补QAT所带来对于MobileNetV3模型在预测CAP上的误差。融合Ghost模块、QAT和PG机制后,MobileNetV3模型对于CAP病症的预测达到了最佳。图8为消融试验下各模型在测试集的性能曲线,包括灵敏度曲线,精准率曲线和Macro-F1分数曲线。
从图8可以看出,在ECG12数据集上,改进Mo⁃bileNetV3模型在灵敏度和Macro-F1分数上强于其他消融下实验模型,在精准率上也处于优秀的程度。这证实了加入各模块对于提升CAP病症识别的有效性。使用Grad-Cam 对消融实验下各模型进行可视化分析,随机选取一张图片,得到相关模型的热力图,热力图实验结果如图9所示。
从消融实验的热力图可以看出,改进Mobile⁃NetV3 模型的不仅强调了一些深层特征,还增强了对于一些浅特征的提取,所提取的特征范围更广,提取的区域更为合理,对于CAP 病症的预测效果更佳。
3 结束语
针对隐匿性房室旁路心电图识别问题,本文提出了一种基于MobileNetV3的改进心电图识别模型。该模型在MobilenNetV3的基础上,通过引入Ghost模块,提升MobileNetV3 的浅层特征提取能力;通过使用QAT和PG机制,在压缩模型计算量的同时,提升了模型的泛化能力和深层特征提取能力。在ECG心电图数据集上进行实验,结果表明,改进MobileNetV3心电图识别模型在压缩原模型计算量的同时,提升了原模型的性能,这表明MobileNet心电图识别模型可直接部署到嵌入式设备中,用于实现对隐匿性房室旁路心电图的识别。