基于太赫兹及含Inception 块残差网络的北柴胡鉴别

2023-12-14 06:07叶华清蔡圣杰郑成勇
关键词:赫兹柴胡残差

叶华清,蔡圣杰,郑成勇

(五邑大学 数学与计算科学学院,广东 江门 529020)

北柴胡由伞形科植物柴胡的根组织干燥形成,是现代临床常用中药之一[1].藏柴胡和锥叶柴胡都是北柴胡的伪品,它们的性状特征比较相似,给采集和使用过程中的鉴别工作带来了一定的困难.目前市场上时常发生一些用藏柴胡[2]或者锥叶柴胡[3]替代北柴胡的事件,对消费者的利益造成损害.因此,建立有效的北柴胡鉴别方法是必要的[4].传统的柴胡鉴别使用的方法通常是性状鉴别[5]、薄层色谱(TLC)[6]或者是高效液相色谱(HPLC)[7].性状鉴别法容易受主观因素的影响,TLC 及HPLC等方法则通常分析成本较高,分析时间较长.

太赫兹(Terahertz,THz)是一种新兴技术,具有无损检测、穿透性强、光子能量低等优点[8],已被广泛地应用于药材的检测.但经搜索文献发现,近年来将太赫兹技术应用于柴胡鉴别的研究较少,本文提出利用太赫兹技术鉴别北柴胡.

在深度学习领域中[9-10],残差连接解决了深度网络梯度消失的问题.多尺度融合技术则是计算机视觉领域中常被使用且不会损害精度的技术,GoogLeNet 中的单元结构——Inception 块就是其中之一,通过不同尺度提取的信息往往比单一尺度提取的信息更丰富.为了将深度学习方法应用于北柴胡鉴别,并充分利用太赫兹光谱数据的多尺度信息,本文依据太赫兹光谱数据的特点,将Inception块中的二维卷积核收缩为一维卷积核,以此构建一维Inception(1D Inception,1DIn)块结构,然后通过残差连接,构建含1DIn 的残差网络,用于北柴胡鉴别,并将其与传统的机器学习方法作对比.

1 太赫兹光谱技术

太赫兹(THz)是波动频率单位之一,又称太赫,或太拉赫兹,等于1012Hz,通常用于表示电磁波频率.太赫兹辐射是一种频率为0.1~10 THz 的电磁辐射,从频率上看,在无线电波和光波,毫米波和红外线之间;从能量上看,在电子和光子之间.

太赫兹辐射具有以下显著特征[11]:1)指纹图谱.太赫兹辐射的光子能量与分子中旋转跃迁的激发能量相似,因此分子振动和旋转等信息包含在太赫兹光谱中.这就是太赫兹光谱的指纹特征,也是它能够应用于物质检测和识别的重要原因.2)良好的生物安全性.与X 射线相比,太赫兹波在1 THz 下具有约4 meV 的非常低的光子能量,并且是非电离的.因此,太赫兹波不会对生物组织等样品造成电离损伤.3)相干测量.太赫兹波通常是由相干激光脉冲利用非线性光学效应或相干电流驱动的偶极振荡产生的,因此太赫兹波是相干的,可以直接测量电场的振幅和相位信息.4)高空间、时间分辨率.与微波和毫米波相比,太赫兹波具有更短的波长,可以实现更高的分辨率.太赫兹脉冲具有良好的时间分辨率,脉冲宽度在亚皮秒到皮秒的时间尺度上,可以分析分子、电子等的瞬态变化.因此,可以将太赫兹时间分辨光谱用于物质的检测和识别.5)渗透性好.太赫兹波具有良好的穿透性,可以穿透包括塑料、服装和陶瓷在内的一般介电材料.这使得太赫兹光谱法有可能探测危险物品.尽管太赫兹波很容易被水等极性分子吸收和损失,但此时的吸收光谱也可以用来评估样品的含水量.

本文所用的太赫兹光谱数据由江门华讯方舟科技有限公司利用其太赫兹时域光谱仪(型号为CCT-1800)采集而来.由于水对太赫兹波具有较强的吸收力,因此在太赫兹数据采集过程中,需对样品仓持续吹扫氮气,避免空气中的水汽对实验造成干扰[12].

2 1D Inception 块网络模型构建

Inception 块是GoogLeNet 中的单元块,它的出现是卷积神经网络(CNN)发展历程中的一个里程碑[13].在此之前,大部分流行的网络架构主要采取不断堆叠卷积层来获得更深的网络,以获得更好的性能.然而增大网络深度往往会让网络模型显得愈加沉重冗余.针对该问题,谷歌团队提出了Incepetion 块,目前其版本已历经了从v1 到v4[14]的重大飞跃.Inception 网络最大的优点是使用了大量的Inception 块.因为有了这些Inception 块,Inception 网络能够对输入的图像数据并行执行多个卷积运算以及多个池化操作运算,同时该网络可以将所有运算的输出结果拼接为一个特别深的特征图,以提取并融合图像的多尺度特征,获得更好的图像表征[15].

本文构建的是含Inception 块的残差网络架构,它融合了残差网络和Inception 块的优点.无论是Inception 块,还是GoogLeNet,都是面向图像的网络架构,但太赫兹光谱数据只有一维,并不能直接输入其中.为此,本文构建了一种可直接接受太赫兹光谱数据输入的仅含一维卷积核的一维Inception(1D Inception,1DIn)块结构.图1展示了所构建的 1DIn 块结构图.它由输入层、一维卷积层、拼接层、输出层构成,其中的一维卷积层由上至下分别包含32 个尺寸为1、2n+1、4n+1、8n+1(n为正整数)的一维卷积核.输入数据通过 4 个不同尺寸的卷积层后得到4 个通道数为32 的输出,将其在通道维度拼接,然后作为1DIn 块的输出.

图1 1D Inception 块结构图

通过1DIn 块堆叠及残差连接而成的网络结构如图2 所示.整个结构可以分为7 个部分.前6 个部分各是一个1DIn 块,最后1 个部分是输出块.输出块包含一个全局平均池化(GAP)层、一个全连接(FC)层和一个Softmax 层.除了1DIn 块和输出块以外,残差连接也必不可少.每3 个1DIn块,进行一次残差连接,以保证梯度更新的效率.在残差连接中,输入一个尺寸为1 的卷积层调整通道数与深层特征通道数保持一致,最后与深层特征相加后输出.

图2 基于1D Inception 块的网络结构图

3 材料与方法

3.1 材料与仪器

实验所用数据集由北柴胡、藏柴胡、锥叶柴胡的太赫兹光谱数据构成.3 种柴胡的批次数及样本数如表1 所示.所有实验均采用批次留一法[16].

表1 数据集概况统计

图3 给出了3 种柴胡的吸收系数谱的均值曲线.图3 表明,在1.2~1.8 THz 范围内,3 种柴胡的吸收系数谱均值曲线区分明显.

图3 3 种柴胡的吸收系数谱与频率的对应关系图

3.2 光谱数据的采集

将柴胡样品连同特制模具放于已充满氮气的太赫兹检测仪(为保证光谱测量的准确性,样本重复测量100 次,取平均值作为该样品的原始光谱)中获取太赫兹光谱数据.

本太赫兹时域光谱仪的测量范围为0.004 6~10.0021 THz,由于0.004 6~0.100 0 THz 和1.800 0~10.002 1 THz 波段的信噪比较低,故实验使用频率在0.100 0~1.800 0 THz 范围内的吸收系数谱数据作分析.

4 实验对比

为验证残差网络鉴别北柴胡的有效性,首先对残差网络的卷积核尺寸进行消融实验,搜索适合的卷积核尺寸;然后将其与支持向量机(线性核)、逻辑回归(LR)、K 近邻(KNN)、随机森林(RF)、ExtraTree[17]、ExtraTrees[18]、AdaBoost[19]、GBoost[20]、XGBoost[21]等进行对比.网络训练所用损失函数为交叉熵函数,优化器为ADAM.模型的评估指标为总体精度.

4.1 卷积核尺寸对比实验

为了给残差网络中的1DIn 块中4 个卷积核设置合适的尺寸,我们进行了大量的消融实验.实验结果如表2 所示.为了避免实验结果的偶然性,对卷积核的每种组合均进行5 次随机实验.表2 最后一列是5 次实验精度的均值和标准差.

从平均精度可以看出,随着卷积核增大,精度大体是先下降然后上升;当卷积核组合为1、13、25、49 时,5 次实验平均精度最高,达到了88.77%;此后再下降.原因可能是因为在卷积核尺寸较小时,每个Inception 块的感受野也较小,当6 层Inception 块叠加后,模型最后一层中每个特征点仅是附近相邻特征信息的提取结果,并未看到整条光谱的全部信息;而随着卷积核尺寸的增大,模型最后一层中每个特征点的感受野也随之增大,并逐渐覆盖整个光谱,但随之而来的背景噪音也更多,在卷积核组合为1、13、25、49 时刚好达到最佳平衡.

4.2 模型对比实验结果

表3 给出了本文方法与支持向量机(线性核)、LR、KNN、RF、XGBoost、AdaBoost 等分类方法的实验对比结果.所有对比方法均经过了参数优化.表3 表明,本文方法显著优于其他9 种方法.分析其原因可能是 Inception 块中并行的不同大小的卷积层构成了一个感受野各不相同的特征提取器,使得原本特征提取较单一的结构变为了一个多尺度特征提取结构,该结构不仅有偏向注意微小局部信息的卷积层,也有偏向注意较大范围局部信息的卷积层,使得模型的学习能力更全面.

表3 不同模型在柴胡数据集上的实验精度

5 结论

本文针对太赫兹光谱数据构建了一种含一维 Inception 块的残差网络,用于北柴胡鉴别.对比实验结果表明,本文方法显著优于9 种非深度学习方法.所提模型结构相对简单,层数较少,其突出的分类性能表明了基于深度学习的太赫兹光谱数据分类潜力巨大.基于 transformer 架构的太赫兹光谱数据分析将是下一步值得探索的课题.

猜你喜欢
赫兹柴胡残差
基于双向GRU与残差拟合的车辆跟驰建模
核桃柴胡间作技术
基于残差学习的自适应无人机目标跟踪算法
基于递归残差网络的图像超分辨率重建
HPLC法同时测定柴胡桂枝汤中6种成分
基于双频联合处理的太赫兹InISAR成像方法
太赫兹低频段随机粗糙金属板散射特性研究
太赫兹信息超材料与超表面
10 种中药制剂中柴胡的定量测定
柴胡治疗猪感冒症的临床观察