万 薇卜莹雪王 祥栗 超
(1. 江西经济管理干部学院,江西 南昌 330088;2. 江西理工大学,江西 赣州 341000;3. 东华理工大学,江西 抚州 344000)
食品的新鲜度直接关系到人类的健康和生命安全,因此备受关注[1]。在食品深加工中,水果、蔬菜、肉类较为常见,随着贮藏时间的不断延长,这些食品质量有不同程度的变化,现有方法检测时间长且需要专业人员操作[2]。
目前,有关食品新鲜度识别方法的研究主要集中在电子鼻和深度学习等方法上[3-6]。电子鼻通过对食品腐败相关的特征气体进行检测,可以区分食品新鲜度,但无法应用于实时性较强的场合。深度学习方法在自动学习图像特征方面优势较为明显,可以处理大量复杂的数据,其准确率和效率均较高。沈海军等[7]将Fisher判别用于苹果的新鲜度识别,对多个品种的苹果新鲜度进行感官评定、聚类分析及Fisher判别,具有较高的识别精度(95.00%左右)。刘雪等[8]针对蛋类食品新鲜度检测特征差异不明显的问题,将改进的MobileNetV3-Large模型用于蛋类新鲜度识别。所提方法能较快速准确识别蛋类新鲜度,识别精度达97.26%,参数量为4.45 M。焦俊等[9]为提高食品识别的准确性,将改进的残差网络与迁移学习相结合用于食品新鲜度识别。加入迁移学习后,模型收敛速度和识别性能均有一定提高,总体识别精度达94.50%,是一种高效的食品新鲜度识别方法。董鑫鑫等[10]通过便携式拉曼光谱仪快速测定食品新鲜度,建立了全波段PLSR模型。所提方法性能比较理想,有效提高了识别精度,降低了运行时间。上述方法可以实现食品新鲜度的检测,但检测的精度和效率有待进一步加强。
研究拟将改进的残差神经网络(ResNet)模型用于生产线食品新鲜度识别,引入改进的LReLU激活函数提高模型识别性能,引入批量归一化层提高模型训练效率,引入Dropout层丢弃一定比例的神经元降低过拟合的影响,以期为食品新鲜度无损检测技术的发展提供依据。
食品生产线的图像采集系统主要由摄像机、光源、暗箱、计算机、传送带等组成(图1)。摄像机选用DFK23U274型彩色CCD工业相机,光源采用额定电压12 V、额定功率5 W的LED灯,其发光颜色为暖白,色温为3 500 K。为了防止外部环境光线的干扰,图像采集在密闭型暗箱内完成[11]。暗箱为尺寸50 cm×50 cm×40 cm的长方体木箱,内壁全部涂黑,底部也作为背景色涂黑,使图像中的目标和背景具有较大对比度,简化后续图像处理难度[12]。CCD工业相机被固定在暗箱上部的正中间,采集到的食品图像发送至计算机,进行新鲜度识别。采集图像存在一定的干扰,不利于后期识别,需对采集图像进行预处理,试验采用的预处理方法为高斯滤波和对比度拉伸。
图1 图像采集结构
目前,许多领域都采用深度学习技术实现分类检测。当待处理图像尺寸较大时,由于全连接网络的参数较多,所以处理时间冗长及网络过拟合等问题难以满足使用需求。卷积神经网络在处理图像时通过特殊的数据排列方式解决前者的问题,ResNet作为特殊的卷积神经网络在其基础上通过添加Shortcut Connection可进一步提高网络性能[13]。
ResNet是一种卷积神经网络,在ImageNet大型视觉识别竞赛中获得图像分类和物体识别冠军。残差神经网络的特点是易于优化,通过增加相当的深度可以提高准确率[14]。经典ResNet模型结构如图2所示。
图2 经典ResNet模型结构
ResNet结构由卷积1~5和全连接层组成,结构与CNN相似,就是通过在网络中嵌入多个残差块,卷积层间实现残差连接[15]。图3为ResNet残差块结构。
图3 ResNet残差块结构
图3中的原始映射为
H(x)=F(x)+x,
(1)
式中:
x——输入;
H(x)——输出。
其中残差映射为[16]
F(x)=H(x)-x。
(2)
通过残差映射参数的调整幅度更大,通过增加相当的深度可以提高准确率。因此,ResNet模型识别效果优于CNN模型。
2.4 AKT2、CD44、EIF4E、ERBB2在侵袭性乳腺导管癌中mRNA表达升高 与非侵袭性乳腺导管癌相比,在侵袭性乳腺导管癌中AKT2、CD44、EIF4E、ERBB2 mRNA表达量均升高,差异有统计学意义(P<0.05),见图4。即促进乳腺癌转移基因AKT2、CD44、EIF4E、ERBB2在侵袭转移性乳腺癌中表达升高,且与TEX14的表达均呈正相关。
残差神经网络作为一种具有Shortcut Connection的特殊神经网络,该网络在保持卷积神经网络低复杂度的优点下,进一步加深了网络的深度,提高了网络的性能。经典ResNet模型共有152层,但层数较多会增加运行时间且精度不一定提高。试验选择ResNet-34模型,同时引入改进的LReLU激活函数提高模型的识别性能,在卷积层1后加入批量归一化层提高模型训练效率,在全连接层后加入Dropout层丢弃一定比例的神经元以降低过拟合的影响[17]。
(1) 改进的LReLU函数:为了解决ReLU激活函数中的梯度消失问题,LReLU函数对输入数据中的负值赋予非零斜率,LRELU函数解决了ReLU函数梯度消失问题,但函数平滑度不高。Softplus函数具有优异的平滑性,但该函数的输出偏移会影响网络的收敛性。考虑到LRELU和Softplus函数的特点,结合这两个函数特征,试验设计了改进的LRELU激活函数[18]。
(3)
式中:
a——常数,取a=0.25。
(2) 批量归一化层:批量归一化层布置在卷积层1和激活函数层之间,以加快网络训练并防止梯度消失。即在进入下一层之前,对前一层的输入进行归一化。具体如式(4)~式(7)所示[19]。
(4)
(5)
(6)
(7)
式中:
m——每个标准化样本;
μ——输出值平均值;
ε——一个很小的常数;
α、β——学习参数(由CNN训练得到,用来代替偏置)。
(3) Dropout层:将Dropout层置于全连接层后,加入Dropout层丢弃一定比例的神经元,可以有效地降低过拟合现象。通过使神经元的激活值以一定的概率p(伯努利分布)停止,不太依赖于一部分的局部特征,可以提高模型的泛化性[20]。
为了验证所提方法的有效性,以黄鱼为例进行说明,黄鱼重量为(500±50) g,外观完整。该测试基于Python环境中的Pytorch-深度学习框架。根据GB 2733—2015,挥发性盐基氮在每100 g黄鱼肉中含量<13 mg为一级新鲜度,含量在13~30 mg为二级新鲜度,含量>30 mg为腐败。数据集为黄鱼图像1 200张,一级新鲜度400张,二级新鲜度400张,腐败400张,将数据集分为训练集、验证集和测试集,比值为8∶1∶1。系统参数见表1,试验参数见表2。
表1 系统参数
表2 试验参数
采用准确率作为模型识别精度评估指标。
(8)
式中:
P——识别准确率,%;
f(xi)——模型对第i个样本的识别类别;
Yi——样本i的实际类别;
n——样本总数。
为了验证试验模型的训练效果,利用能够度量实际样本分布与识别样本分布差异的交叉熵损失函数,监督试验模型的训练过程,训练时的模型损失率如图4所示,训练时的模型精度变化曲线如图5所示。
图4 训练时模型损失率变化
图5 训练时模型准确率变化
由图4、图5可知,当迭代次数≤35时,试验模型对黄鱼的训练和验证loss值快速降低,loss值有振荡情况,但总体上趋于下降。迭代40次后,loss值逐渐稳定。经过40代的遍历,训练集和验证集的识别准确率趋向于99.50%,说明试验设计的基于改进残差神经网络的食品新鲜度识别模型具有较好的图像识别性能。为了避免模型过度拟合,使用迭代50次训练的模型来识别测试集。
为了验证模型训练后的效果,通过测试集对训练后模型的识别效果进行验证,训练后模型识别结果见表3。
表3 模型训练后测试集识别结果
由表3可知,试验方法在不同等级黄鱼新鲜度识别中精度较高且波动小,一级新鲜度识别差错率为0,二级新鲜度识别差错率为2.50%。腐败新鲜度识别差错率为5.00%,其中一级新鲜度0个,二级新鲜度2个。试验方法的平均错误率为2.50%,总体识别准确率为97.50%,试验样本较少,当样本较多时,准确率可能有一定的提高。综上,试验模型对黄鱼新鲜度图像有较高的识别准确率。
为进一步验证试验方法的优越性,将试验方法与改进前的残差神经网络和文献[21]改进的CNN方法进行比较分析,通过试验训练集对不同模型进行训练,并将训练后模型用于试验测试集识别。不同方法的识别精度和运行时间见表4。
表4 不同方法的识别结果
由表4可知,试验方法的识别准确率为97.50%,平均识别时间为9.80 ms,与改进前的残差神经网络相比,识别准确率提高了5.41%,平均识别时间降低了58.47%。这是因为试验方法在残差神经网络中引入了改进的LRELU激活函数,提高了模型的识别性能,引入批归一化层提高了模型的训练效率,引入Dropout层降低了过拟合现象。与文献[21]改进的CNN相比,试验方法的识别精度提高了4.00%,平均识别时间降低了80.49%。这是因为试验方法解决了退化和梯度消失等问题,通过优化提高了识别精度和降低了识别时间。综上,试验方法的识别精度和平均识别时间较优,能够满足食品生产线食品新鲜度识别要求。
研究提出了一种改进的残差神经网络模型用于生产线食品新鲜度识别,引入改进后的LReLU激活函数提高模型的识别性能,引入批量归一化层提高模型的训练效率,引入Dropout层降低过拟合现象。结果表明,与常规方法相比,试验方法对食品图像新鲜度识别具有较高的识别准确度和较短的识别时间;与残差神经网络和文献[21]相比,试验方法的识别准确度分别提高了5.41%,4.00%,平均识别时间分别下降了58.47%,80.49%。试验方法在识别精度和识别时间方面优势明显,可满足食品生产线对食品新鲜度识别的需要。后续将扩充样本数量和增加食品种类,以进一步优化和完善整个系统。