王润博,韩文凤
(1.河南工业大学 漯河工学院,河南 漯河 462000;2.浙江工业职业技术学院 鉴湖学院,浙江 绍兴 312000)
马铃薯是世界四大粮食作物之一,目前已广泛种植于我国各地区,是投资少、见效快、效益高的作物[1]。然而,油炸马铃薯片中羧甲基赖氨酸(CML)的含量较高,对消费者的健康构成了威胁,成为制约马铃薯类休闲食品发展的瓶颈[2]。CML是结构稳定的一类晚期糖基化终末产物,在体内集聚过量可导致一些慢性疾病的发生,如心血管疾管、糖尿病、动脉粥样硬化等。食品中的CML也可以作为评价食品体系美拉德反应中蛋白质化学修饰、羰基应激和脂质氧化的一个首要指标[3]。因此,实现CML含量的实时在线无损检测十分必要。
目前,计算机视觉[4,5]已应用于食品检测等各方面。高光谱成像技术作为其中一种快速、无损的分析方式,普遍应用于肉类[6]、微生物[7]、农产品[8,9]、坚果[10]、乳制品[11]等众多工业检测中[12]。Arif C M M.等人[13]验证从550~690nm波长范围可以对肌肉类型、颜色稳定性和贮藏期的野牛肌肉样品的新鲜度进行分类和预测。Antonio F等人[14]采集每个橄榄450~1050 nm的高光谱图像建立模型,检测炭疽病病毒非常有效。Lin D等人[15]采集菊苣五个时期350~2500 nm的高光谱图像,利用光谱反射率估算出菊苣Cu含量。
本文采集自制油炸薯片第250~900个波段(即498.48~830.11nm)的高光谱图像,融合BP神经网络预测薯片中CML含量,为探寻CML含量无损检测方法提供依据。
每次称量100 g马铃薯粉、100 g水,揉成面团再做成1 cm厚的面块,熟化,冷却,切片(1.5 mm),油炸。表1为制作薯片不同的油炸温度和时间,共五个等级。
表1 自制薯片所用温度和时间
薯片样本高光谱图像是用高光谱成像采集系统获取(见图1)。高光谱成像采集系统包括高光谱成像仪(Inno-Spec IST50—3810)、4个500瓦的光纤卤素灯(德国ESYLUX 90000420108)、计算机及传送装置。成像仪采集图像数据时,其上的线阵探测器在薯片运行的垂直方向作横向扫描,得到的是所有像素点在1288个波段处的图像数据。同时随着薯片的前进,完成所需区域图像数据的采集。由计算机SICap-STVR V1.0.x软件平台驱动成像仪,实时控制和记录高光谱数据。
图1 高光谱图像采集系统
1.3.1 样品中羧甲基赖氨酸含量的测定
采用液相色谱-质谱法,按照相关文献中液相和质谱检测条件,对油炸薯片中CML含量进行测定[16]。
1.3.2 光谱预处理方法
光谱预处理可以减少非薯片样本信息的干扰,消除噪声,提高模型预测能力及稳健性。本文采用多元散射校正(multiplicative scatter correction,msc)和标准正态变量变换(standard normal variate,snv)两种常用的光谱预处理方式对薯片原始光谱信息进行处理。
多元散射校正[17]是用以消除试验对象的不均匀性所产生的散射,因为在一些条件下由散射引起的光谱差异会比实验对象内部成分引起的差异还要大。
标准正态变量变换[18]也是消除因为散射引起的光谱差异,但跟msc不一样的是,snv只是将原始光谱标准正态化。
1.3.3 高光谱图像的采集
首先采集标准高光谱全白图像和全黑图像,然后称取备好的薯片粉末(45±0.2)g,将其作为待测样本,均匀地平铺在规格为100 mm的培养皿中,放置在传送带上,设置传送装置的速度为1.25 mm/s。成像仪的光谱范围是371.05~1023.82 nm,分辨率为2.8 nm。设定扫描范围是Width 800、Height 800,即图像扫描行数为每幅800行,每行扫描的像素点数为800个,每个样本共1288幅图像。最后,对薯片原始高光谱图像数据块进行黑白标定。
实验中,每类薯片分别有50个样本,五类样品共250个样本。各类薯片样本的可见光图像如图2所示。
图2 薯片的可见光图像
1.3.4 BP神经网络
BP神经网络[19]是一个按照误差向前传播的多层网络,可以计算比较困难的非线性问题,例如基于神经网络预测钛合金的铣削力[20]等。本文运用BP神经网络模型建立光谱与薯片中CML含量之间的映射关系,首先提取第250~900个波段下薯片高光谱图像的平均光谱反射值;然后运用主成分融合,建立稳健可靠的BP神经网络模型。
光谱数据和模型的建立均在软件MATLAB R2014中完成。
采用msc和snv两种常用的光谱预处理方法,消除固体颗粒、表面散射及光程变化对薯片光谱值的影响。图3(a)是250个样品1288个波段的原始平均光谱反射值;图3(b)是选取样品第250到900个波段的原始平均光谱反射值并进行黑白校正得到的;图3(c)是图3(b)经过多元散射校正后的光谱图;图 3(d)是图 3(b)经过标准正态变换后的光谱图。
图3 250个油炸薯片样本的光谱曲线
每种薯片样品进行多次液相色谱-质谱法平行实验测定,并将平均值作为薯片样品的CML含量指标值,具体数据如表2所示。从表2看出,在油炸温度为180℃时,随着时间的延长,CML含量逐渐增多;而在220℃时,油炸时间240 s比80 s时的CML含量减少较多,仅为5.17 μg/g。
表2 五类薯片样本的CML含量测定结果
这说明,薯片中CML含量与温度和时间不符合一般规律。如果采用仪器检测、酶联免疫或荧光传感检测几种方法,各有缺点,即使应用最为广泛的液相色谱-质谱法也耗时耗力,价格昂贵[21]。因此本文采用高光谱图像技术融合BP神经网络,借助液相色谱-质谱法测定的结果建立模型预测CML含量,达到薯片中CML含量的快速无损检测。
分别采用经msc和snv处理后的第250~900个波段的光谱数据,并对这651列光谱数据运用主成分融合,选取代表原始信息99.99%以上的前10个主成分作为神经网络的输入变量部分,设计模型结构,确定传递函数和训练函数,设置学习速率、误差、迭代次数等参数,建立具有稳健性和精确度的BP神经网络预测模型。
(1)基于msc预处理的光谱数据所建立的BP神经网络:预测模型的结构为13-10-1,隐含层和输出层的传递函数分别为tansig和logsig,训练函数为traincgf。迭代595次,运行3 s,预测结果如图4(a)所示。
(2)基于snv预处理的光谱数据所建立的BP神经网络:预测模型的结构为10-6-1,隐含层和输出层的传递函数分别为tansig和logsig,训练函数为traincgf。迭代1282次,运行5 s,预测结果如图4(b)所示。
图4 不同光谱预处理方法建立BP神经网络模型结果对比
预测结果和实测值相对误差不超过5%认为预测正确,表3是两种光谱预处理方式的CML预测结果对比。
表3 不同预处理方式CML预测结果的对比
对比显示,基于第250~900个波段下每个薯片样本高光谱图像的平均光谱反射值,经msc和snv两种光谱预处理方式建立的BP神经网络模型,预测结果没有明显差距,均能较好预测油炸薯片中CML含量。为测试两种模型的稳健性,不改变BP神经网络参数,从薯片样品的高光谱信息中,随机抽取3组训练集,分别对预测模型进行测试,结果对比如表4所示。
表4 不同测试集的预测结果
以不同CML含量的油炸薯片为检测对象,用高光谱成像采集系统采集其在1288个波段下的图像,再经过msc和snv预处理后,提取第250~900波段下图像的平均光谱反射值,最后建立BP神经网络模型。结果显示,高光谱融合BP神经网络建立CML含量预测模型可以预测CML含量;两种光谱预处理方法预测正确率均为99.57%,相关系数为0.9987,均方根误差略有不同。经过验证,该预测模型具有较高的稳健性和可信度。该研究能够实现CML含量的准确预测,可为其快速无损检测提供重要依据。