邵小康 林 颢 王 卓 李益兵 陈全胜
(江苏大学食品与生物工程学院,江苏 镇江 212013)
大米在储运、销售等环节因环境和时间的变化极易引发陈化,营养价值和食用品质等发生改变。其间,大米中不饱和脂肪酸会被逐步氧化为氢过氧化物,然后产生酮、醛、酸类等挥发性有机气体。因此,气味检测对于大米新鲜度的判断具有重要意义。
传统检测手段诸如感官分析[1]和气相色谱质谱联用技术(GC-MS)[2]等,存在主观性强,检测耗时长等缺点。电子鼻等新型气体检测设备通过模仿人类对气味的识别机理,利用多种气敏传感器并通过匹配模式识别技术,可以快速检测大米挥发气体,检测精度相对较低,传感器漂移影响较大,无法满足现场实时检测需求。目前,色敏传感器阵列对挥发性有机物的检测已逐渐得到研究者们的重视[3]。该传感器主要是根据反应前后图像的RGB差值来获取变化信息,仅用R、G、B 3个变量来表征样品,较少的特征信息可能对于大米新鲜度的判别有一定的局限性。可见/近红外光谱作为一种常用的检测手段,具有无损性好、样品消耗少、变量信息丰富等优点,适用于生产实际的实时监测,但无法对气态化合物进行直接检测。因此,Kutsanedzie等[4]将色敏传感器对挥发性有机物检测的潜力与近红外光谱对化学响应染料的快速检测优势结合,对醇类、酸类和酯类等挥发性有机气体进行检测分析。结果表明,可见/近红外光谱联合色敏传感器技术对气态化合物具有良好的检测能力。但此类研究多是在实验室中搭建简易的采集系统,并不能实时检测样品的相关特性或物质成分。
研究针对目前大米挥发性气味检测耗时长、仪器昂贵且体积偏大、操作方法复杂等问题,以氟硼吡咯类化合物作为传感器染料,拟研制一套预测大米新鲜度的便携式色敏传感—可见/近红外光谱检测系统,使用STC89C52型单片机对大米样品与色敏传感器的加热反应及步进电机的传送进行控制,通过Windows桌面软件实时显示反应进程、获取和分析处理光谱数据。
大米新鲜度检测系统整机结构见图1。反应室底部装入大米样品,顶部固定色敏传感器,通过加热使得大米挥发性有机气体与传感器充分接触并反应;反应结束后,由工控触屏电脑下达相关控制指令给传送及检测模块,完成对发生显色变化的色敏传感器进行送样、采集光谱信号,并在线获取其对应大米样品的新鲜度检测结果。
1. 工控触屏电脑 2. 反应室 3. 传送及检测模块 4. 光谱仪 5. 光源 6. 电路板 7. 风扇 8. 蜂鸣器
图2为检测系统的方案设计框图,主要分为两部分:一部分是以STC89C52型单片机、反应室、步进电机及微型近红外光谱仪为核心设计的便携式多功能一体化装置,主要包括温度调控模块、电机传送模块、光谱采集模块。另一部分为下位机控制程序和上位机软件程序,通过在上位机中根据控制需求编写指令及下位机中编写硬件被调用的接口,以实现温控、传送功能;同时,软件还开发了状态信息显示、数据存储与处理、样品在线检测等其他功能。
温度调控模块完成对反应室的反应温度与时间进行设置并实时监控,以保证检测条件的标准化。如图3所示,该模块主要包括温度传感器、继电器和加热膜。选用具有体积小、抗干扰能力强和精度高等优势的DS18B20作为温度传感器,并通过1-Wire协议与单片机进行通信,实时读取反应室的温度信息[5]。微控制器STC89C52在接收到温控开始指令后,DS18B20对反应室进行测温;微控制器将实时温度T与设定温度T0取差值作为输入量进行PID运算,PID运算后的控制量使得SRD-05VDC-SL-C型继电器发生相应通断变化,带来加热膜热量变化,实现对反应温度的调控[6]。
步进电机是一种常用于实现自动化检测的开环控制元件,它将输入的脉冲信号转化为输出轴的角度变化,实现精确定位和控制。图4为电机传送模块的整体结构图。实际检测时,该模块通过串口转USB接口接收到上位机中Windows桌面程序的控制指令进行启动,并在STC89C52型单片机、DM420S步进电机驱动器与光电开关等主要硬件的联动下,完成装载台内色敏传感器送样与归位、传感器中不同染料点精准定位于固定台中的光纤探头下,实现自动化检测。
1. 步进电机 2. 螺旋杆 3. 光电开关 4. 固定架 5. 滑轨 6. 固定台 7. 装载台
光谱采集模块主要对待测色敏传感器进行反射率信号采集,各波长反射信号经由光谱仪接收并传输给上位机进行数据处理、可视化显示光谱。图5即为采集色敏传感器近红外光谱的简易示意图。硬件构成上,该模块主要包括近红外光谱仪(USB2000+型,美国海洋光学公司),其检测波段为350~1 100 nm,适用于可见/近红外光的检测;宽屏光谱输出为350~1 700 nm的卤素灯(LS-HA型,中国台湾超微光学公司);光纤具有两个SMA905接口,分别用于连接光谱仪与光源;选用工控触屏电脑打开上位机软件,在完成参考白板100%反射校正光谱的采集后,进一步完成待测色敏传感器的光谱采集。
1. 色敏传感器 2. 光纤 3. 光源 4. 光谱仪 5. 上位机
下位机控制程序在KEIL C51 Compiler环境下编译调试。图6为下位机控制程序流程图,主要由信号传输、温度采集、PID温度控制、步进电机运动控制等子程序组成。信号传输分为1-wire协议和串口通信协议,1-wire协议用于单片机与DS18B20之间建立通信,以传输温度数据;串口通信协议用于单片机接收上位机发送的电机驱动与反应室控温指令。当控制程序开始运行时,首先进行系统初始化,继而判断串口下达的指令类型。若为温度调控指令,会经历反应室的温度数据收集、数据传递、PID算法运算和实时加热监控操作,并依次循环直至反应室达到预设温度,以保障大米样品稳定进行加热反应。若为步进电机驱动指令,则通过不同的操作信号(前进、后退、复位),使得单片机输出不同脉冲数来完成待测色敏传感器的准确定位。
图6 下位机控制程序流程图
上位机软件程序是针对USB2000+微型光谱仪,在Visual Studio2017开发平台上,使用C#语言自主研发的Windows桌面软件,主要实现了用户注册/登录、通信步进电机与光谱仪、状态信息显示、光谱采集/显示、数据存储/处理、反应实时监测、样品在线检测等功能[7]。图7为Windows桌面软件的主页面。
图7 Windows软件用户主页面
3.2.1 用户注册与登录 用户在使用桌面软件对装置进行驱动时,输入账户名、密码后,通过登录按钮进入主页面。若是新用户,可通过注册子页面进行注册,获取软件的使用权限。
3.2.2 通信参数设置 通信参数设置包括串口设置和仪器设置。串口设置通过对端口号、波特率、停止位、数据位和检验位的赋值,实现上位机与步进电机的通信;仪器设置主要是配置光谱仪的积分时间、平滑度和平均次数。
3.2.3 状态信息显示 状态信息显示主要显示当前的登录用户、登录时间以及当前软件的运行日志。通过运行日志的不断更新,以帮助用户更加清晰地了解检测系统的执行情况,可实时进行调整。
3.2.4 光谱采集与显示 当前功能的实现依赖于图7主页面中的电机控制、光谱采集、谱图显示3个区域。检测时,电机控制区域各操作指令协同光谱采集区域依次完成参考白板的暗光谱校正、100%反射校正以及待测色敏传感器的反射率数据采集,同时在谱图显示区域实时显示出相应光谱曲线。
3.2.5 数据存储与处理 在线采集到的光谱数据主要存储为“.xlsx”格式的Excel文件,文件包括波长值及各染料点反射率值。用户在采集数据之后,可通过在数据预处理子页面选择相应预处理算法对样品光谱进行前处理,消除硬件设备、杂散光及色敏传感器平面不均匀等带来的干扰信息。
预处理算法包括微分处理(一阶、二阶),平滑处理(移动平均平滑、SG卷积平滑),规范化处理(中心化、归一化、标准化、标准正态变换SNV、多元散射校正MSC)。
3.2.6 反应实时监测 为使大米的特征性挥发气体充分与色敏传感器接触,反应模块设置反应时间12 min、反应温度55 ℃,对大米样品进行加热反应。该模块加热时间的监测使用timer控件的Interval属性来指定计时器触发事件,通过调用timer1.Start()函数实现计时器的开启,最终将时间倒数变化呈现于反应页面。
3.2.7 样品在线检测 用户在使用检测模块对大米样品快速检测时,需要从本地文件中加载模型文件,对大米样品所对应的色敏传感器光谱数据进行预测,以获取检测值及对应新鲜度。模型文件是“.txt”格式,为Matlab软件对大米光谱矩阵采用化学计量学算法分析与处理后得到的模型信息。
图8为Windows桌面软件对大米样品新鲜度检测的主要流程。用户打开软件输入用户名和密码进入主页面。首先,进行原料和传感器阵列选择(大米、单列三点);然后依次进行加热反应、连接步进电机与光谱仪、步进电机传送、采集与保存光谱数据、在线检测样品新鲜度。程序运行中,各模块交相辉映及递进,其操作过程与结果均呈现在UI界面,便于开发人员捕获系统异常及用户实时查看系统执行状况[8]。
图8 Windows软件检测大米新鲜度流程图
选取中粮集团的福临门苏软香大米作为试验对象(其中陈米为2020年9月,新米为2022年9月),并将购买的大米置于温度和湿度与当日环境一致的普通储物间中进行贮藏。
电子天平:BS-224S-CW型,赛多利斯有限公司;
便携式智能化大米新鲜度检测系统:实验室自制。
4.3.1 试验样品的制备 基于前期研究[9],选取对大米挥发性有机气体敏感的色敏材料制作色敏传感器(单列三点),染料点依次为BrBDP、NO2BrBDP、NO2Br2BDP。
试验部分分为多梯度掺陈大米的定性判别与跨批次大米新鲜度的定量预测。因此,第一部分是将大米样品制备成6个掺陈梯度:0%,20%,40%,60%,80%,100%;而第二部分则每一新批次都制备全新、掺陈50%和全陈的大米样品;其中每个梯度的大米各取20份,每份样品重10 g,则第一部分共120个样品,第二部分则每批次共60个样品。
4.3.2 光谱数据的采集 将不同掺陈度大米样品放入温度为55 ℃的反应室,将色敏传感器倒置并固定于反应器的顶部,使其与大米中标志性挥发气体充分反应;反应时间设置为12 min。待反应结束后,将自编的Windows软件中相关参数(积分时间、平滑度和积分次数)分别设置为5 ms、10和5;利用检测系统采集传感器染料区域的反射率。最终,每个色敏传感器将采集3条光谱;则第一部分共采集360条光谱,第二部分每批次共采集180条光谱。
4.3.3 数据处理与建模 所用光谱仪的波长范围为350~1 100 nm,每条原始光谱可以采集2 048个变量。由于前后波段光谱信噪比较低,为消除首尾噪声;则每条光谱选取400~1 000 nm,共1 805个变量进行数据分析。
首先利用标准正态变换(SNV)对第一部分试验的样本光谱数据进行预处理,以消除仪器噪声、基线漂移等带来的影响[10]。其次,利用联合区间偏最小二乘算法(Si-PLS)[11]来筛选每条光谱的最佳区间。为保证被划分的样本在空间距离上分布均匀,采用KS(Kennard-Stone)算法[12]对所有样本按照3∶2的比例划分为训练集(72个)和预测集(48个)。色敏传感器各染料点光谱数据的叠加使得初筛后的数据仍存在较多冗余,因此选用遗传算法(GA)[13]、无信息变量消除法(UVE)[14]及竞争性自适应重加权算法(CARS)[15]进一步筛选变量;并利用k-邻近法(KNN)[16]和线性判别分析(LDA)[17]来建立大米新鲜度的判别模型,以对其进行区分,模型优劣主要由训练集和预测集的识别率高低来判定。最后,取上述第一部分试验的最佳判别结果所确定的特征变量来构建跨批次大米样品新鲜度的预测模型,即第二部分试验;采用偏最小二乘回归(PLSR)[18]与支持向量机回归(SVR)[19]进行比较分析,模型优劣依据于训练集和预测集的相关系数、均方根误差、相对分析误差的高低。上述所有的数据处理和计算均在Matlab R2020b软件中进行。
4.4.1 光谱特性分析 图9为系统检测的参考白板100%反射校正光谱以及第二部分试验中3种不同掺陈度大米样品所对应色敏传感器的光谱。图9(b)与图9(c)相比,两者的光谱较为接近,但是在波峰位置紫色曲线有所降低;图9(b)与图9(d)相比,红色与绿色曲线波谷位置有所降低,而紫色曲线的波峰与波谷位置均有显著起伏变化,3条曲线也有着整体右移趋势。
红色响应曲线为BrBDP,绿色响应曲线为NO2BrBDP,紫色响应曲线为NO2Br2BDP
综上分析,在与不同掺陈度大米的挥发性气体反应后,每种色敏材料获得的光谱以及不同色敏传感器之间的光谱均存在差异。这表明色敏传感器的显色反应会因大米新鲜度的不同而产生区别,检测系统能稳定采集试验数据。
4.4.2 光谱变量优选 图10为染料点BrBDP、NO2BrBDP、NO2Br2BDP在400~1 000 nm的原始光谱与SNV预处理后光谱。研究使用Si-PLS对色敏传感器上3个染料点经SNV预处理后的光谱分别划分最佳光谱区间,具体处理过程为:将光谱数据划分为10~20个区间并从中联合2~4个区间,交互验证均方根误差(RMSECV)最小值作为最优筛选区间的指标。变量筛选结果见表1,光谱变量数由5 415降为1 384,总数仍然较多。
表1 基于Si-PLS算法的最佳区间筛选结果
图10 不同染料点在400~1 000 nm的原始光谱与SNV预处理后光谱
选用GA、UVE及CARS 3种智能搜索算法对染料点的联立数据进一步筛选,以提取有效变量。具体处理过程为:① GA算法是一种模拟自然进化过程的优化搜索方法,其利用遗传、变异、交叉等操作进化种群,通过评估适应度来挑选优秀个体作为下一代种群的父代,待到种群不断迭代至停止条件后,获取最优光谱变量。算法重要参数设置为:初始种群大小50,遗传迭代次数100,变异概率0.01,交叉概率0.8,适应度函数为RMSECV。② UVE算法通过在原始光谱的基础上添加一组相同维度的随机噪声,并根据组合后的自变量矩阵对目标矩阵建立PLS模型,获取回归系数矩阵来计算各光谱变量的稳定性,最终选出稳定性高于所设阈值的特征变量。该算法的参数设置包括:最大主成分数为20,随机噪声数为1 384,变量稳定性阈值为0.99。③ CARS算法主要使用指数衰减函数和自适应重加权采样方法来确定每次迭代竞争后的变量子集,从而在N次蒙特卡罗抽样运行中选择RMSECV值最低的一次作为最佳变量子集。CARS运行时,最大主成分数设为15,蒙特卡罗抽样运行次数设为50,交叉验证次数设为10。最终,GA、UVE和CARS各自精选出48,163,44个特征光谱变量。
4.4.3 多梯度掺陈大米的定性判别 研究将3种变量筛选组合重组后的大米光谱矩阵(Si-GA-PLS:120×48;Si-UVE-PLS:120×163;Si-GARS-PLS:120×44),构建LDA与KNN判别模型;两者均以60%样本数据作为训练集,40%样本数据作为预测集。由表2可知,经竞争性自适应重加权算法—联合区间偏最小二乘法(Si-CARS-PLS)所构建的LDA判别模型效果最好;预测集中48个大米样品的识别率为95.83%,仅2份新鲜大米分别被误判为掺陈度20%和40%的大米(主成分数为1~12,K值为3,5,7,9,11)。
表2 基于3种变量筛选算法的定性判别模型结果
4.4.4 跨批次大米新鲜度的定量预测 如前所述,由Si-CARS-PLS所筛选出来的44个变量在KNN与LDA两个判别模型中,训练集和预测集均有最高的识别率;两者相比较,则LDA判别模型更优。因此,研究将全新大米样品、掺陈50%大米样品、全陈大米样品定义分级标准为1、2、3,利用这44个变量来对不同环境下新批次大米样品光谱进行新鲜度定量预测模型的构建。表3为建模数据与新批次预测数据的结果。
由表3可知,在建模数据中PLSR与SVR均有较好的结果。但PLSR模型更为优越,其训练集相关系数(Rc)为1.000,训练集均方根误差(RMSEC)为0.016,预测集相关系数(Rp)为0.990,预测集均方根误差(RMSEP)为0.064,相对分析误差(RPD)为13.193。RPD作为所建模型的稳定性评估指标,其值越大,模型稳定性能就越好;通常RPD>3时,可用于实际运用[20]。同时,在新批次预测数据中仍然对比了PLSR线性回归模型与SVR非线性回归模型;两种模型下的Rc与Rp均稳定在0.95左右以及RMSEC与RMSEP均低于0.2,但联合建模数据的RPD可知,PLSR仍更具优势。因此,Windows软件中检测模块通过加载该PLSR模型来完成跨批次大米样品的新鲜度检测。图11为PLSR与SVR模型在建模数据与新批次预测数据下的拟合图,可以看出PLSR线性模型拟合效果更佳,能够将其应用于区分跨批次大米样品的3种不同新鲜度。同时,图12为第二批预测中某大米样品的定量预测结果,可知该样品为新鲜大米。
图11 不同批次数据在PLSR与SVR模型下的拟合图
图12 某独立大米样品的新鲜度定量预测结果
研制了主要由温度调控模块、电机传送模块、光谱采集模块组成的便携式装置,开发了集监控大米加热反应、电机精准传送色敏传感器、调控光谱仪完成不同染料点光谱信号采集、光谱数据可视化与有效保存,以及样品在线检测等功能为一体的Windows桌面软件。通过软、硬件的整机装配,搭建了大米新鲜度的在线无损检测系统。系统智能化地采集试验数据及加载模型在线检测,解决了传统检测耗时长、不稳定、采集信息困难等问题。在跨批次大米新鲜度的预测试验中,针对建模数据与第一批次、第二批次预测数据3个批次,PLSR模型有较好的预测效果,3个批次判别训练集和预测集的相关系数(Rc、Rp)均稳定在0.95左右,均方根误差(RMSEC、RMSEP)均低于0.2,相对分析误差(RPD)均大于3。该系统检测精度较高,整机尺寸较小,较为便携;有很好的现场检测应用前景。后期将在此系统基础上实现多产地各品种大米标准光谱数据库及其高精度模型数据库的建立,进一步提高系统性能。