项千漪, 潘奕如, 赵慕茜, 闻春敖, 蔡佩君
(浙江大学光电科学与工程学院,杭州 310027)
利用近红外光谱检测以及漫反射光谱分析原理可以实现对苹果的无损检测。相对于传统有损检测,有反应迅速、不必破坏样本、操作简易的优点,故而在苹果糖度无损检测方面得到了广泛的应用。目前在市场上已经有无损检测苹果糖度的产品,比较常见的是ATAGO(爱拓)公司出品的PAL-HIKARi5水果无损糖度计。但此类产品的价格较为高昂,难以普及。
本文通过设计光学系统、测量控制电路及安卓手机APP,开发了基于智能手机的多特征波长苹果糖度无损测量仪,具有成本较低等优势。
由于分子振动的非谐振性,分子振动可能从基态向高能级跃迁。物质被近红外光照射时,其含氢基团(X-H)会发生振动导致倍频及合频吸收,进而使得近红外接收光谱与发射光谱之间存在差异[1]。根据近红外接收光谱可以定性、定量分析物质成分与光谱的糖度预测模型。
近红外光谱分析方法有漫反射法、透射法等。漫反射光是指光进入样品内部后,经多次衍射、反射、折射、吸收出射到表面的光。漫反射光和样品内部物质相互作用后,承载了样品内部物质含量的信息,故而可用于分析[2]。红外光波长越短,散射越大,因此漫反射法使用近红外光效果更好[3]。
根据漫反射光谱分析理论中的Kubelka-Munk函数,吸光度与物质浓度呈线性关系[2]。依据近红外接收光谱以及标准糖度计得到的苹果糖度真实值,可以建立近红外接收光谱与苹果糖度值之间的糖度预测模型[4-5]。
不同环境温度对苹果糖度值的测定也有影响。温度会影响复杂生物组织的光学特性:温度变化会引起光谱振动变化,改变水分子吸收的波段及强弱。苹果含水量高,易受环境温度影响,因此有必要修正环境温度变化对苹果糖度模型预测精度的影响[6]。测定不同环境温度下苹果糖度值的差异值,修正糖度预测模型。
建立模型之前要进行异常样本的剔除。不规范操作、环境剧烈变化、苹果品质问题等都导致样本产生异常。本研究采用马氏距离法剔除异常样本[7]。马氏距离计算公式为
式中:X为样本数据;CX为X的协方差数据;Xi为第i个数据。
设定阈值区分异常样本,阈值的设定公式为
式中:ˉD为马氏距离的平均值;δD是马氏距离的标准差;e是一个权值系数。
偏最小二乘法(PLS)是一种新型的多元统计数据分析方法,于1983年由Wold等首次提出。PLS可以同时实现回归建模(多元线性回归)、数据结构简化(主成分分析)以及两组变量之间的相关性分析(典型相关分析)[8-10]。
(1)工作系统与流程。基于智能手机的苹果糖度无损测量仪系统框图如图1所示。测量仪的整体结构为16 cm×5 cm×8 cm,整体外观图如图2所示。测量仪中的光电检测模块实现光信号采集,通过节点微处理器单元(NodeMCU)模块与智能手机APP建立WiFi连接,采用用户数据包协议(User Datagram Protocol,UDP)在手机上实现数据计算、显示等功能[11-15]。
苹果样品置于测量仪上,与环状海绵圈紧密接触。NodeMCU模块等待来自手机APP的指令。点击APP“测定”按钮,该命令通过WiFi传输至NodeMCU模块。开启光电检测后,光源驱动模块驱动呈环形分布的多特征波长LED光源工作,光源发出不同波长的近红外光依次照射到苹果样品赤道面。位于环形光源中央的光电检测器检测苹果的漫反射光信号。检测结果通过WiFi无线传输到手机,由自主开发的APP将接收到的数据代入糖度预测模型后计算得到预测的糖度值,最后显示数据。
(2)光路系统。采用近红外发射管作为光源。基于多特征波长的近红外检测中,光源波长的选择是非常关键的一个环节。经过实验,采用5 mm直插式近红外发射管,选择了800、820、830、880、900、940 nm共计6个不同波长的LED。将6个近红外LED按环形阵列分布,成45°倾斜放置,保证6个LED出射的光到达检测器的光强基本一致。
检测采用漫反射法:光照传感器处于环形结构的中央,LED依次发出的光经过与苹果作用后,由一个直径13 mm凸透镜聚光采集近红外接收光谱[3]。具体光路结构示意图如图3所示。在通光口处,放置了黑色密封海绵圈,尽量减少杂散光和环境光[12]。
(3)测量控制电路。测量控制电路主要有NodeMCU模块、光电检测模块、温度测量模块。测量控制电路原理图如图4所示。基于ESP8266的NodeMCU模块,它是一个开源的物联网平台,内含32位Tensilica微处理器、ADC转换、低噪放大器、标准数字外设接口、WiFi模块等,搭载芯片CH340实现USB转串口UART,以便于调试。它可以实现多引脚的PWM调光,拥有一个10位ADC通道,并且可以与温度传感器DS18B20进行单总线通信。利用Arduino语言编写开发板代码。
光电检测模块主要是对光电探测器采集的苹果样品光信号进行转换处理,选择的光照传感器为OPT101,内置有信号放大滤波器。它的敏感波长范围为650~970 nm,可以尽量降低环境可见光对检测的干扰[13]。OPT101得到的模拟电压连接到NodeMCU模块的引脚A0,由NodeMCU内置10位ADC通道进行模数转化,读取光强数值。
考虑到温度对糖度检测的影响,采用基于DS18B20温度传感器设计温度测量模块,与NodeMCU模块进行单总线通信,实时检测环境温度。在不同环境温度下,用标准糖度计测定苹果糖度值,用以温度补偿。
(1)测量控制电路。基于Arduino语言进行NodeMCU模块开发,主要利用了开源的WiFi UDP库,来配置NodeMCU的AP工作模式并进行UDP通信[16]。Arduino程序流程图如图5所示。
实现的主要功能有:建立无线局域网,实现与手机APP通信;启动光电检测,实现LED光源的开、关,以及光强、温度测量。
(2)手机端。基于Java的安卓APP开发,开发平台为AndroidStudio。APP软件流程图如图6所示。主要功能有:①数据传输与通信。基于UDP通信协议,手机通过WiFi无线局域网与NodeMCU模块实现通信,实现光电检测命令,获得测量控制电路的数据反馈;②数据处理。对获取的数据进行预处理,依据糖度预测模型计算糖度值;③数据显示。输出糖度计算结果。
(3)基于Python的糖度PLS预测模型。多个LED光依次漫反射到光电探测器后得到的信号电压值(简称为“漫反射电压值”)与糖度值存在多重共线性关系,故采用sklearn.cross_decomposition库(Python语言)中的PLSRegression函数来实现苹果糖度的PLS预测模型的建立。PLS预测模型公式为
式中:Ypred为得到的糖度预测值;VLED、xmean、xstd、coef分别为漫反射电压测定值、漫反射电压平均值、漫反射电压值标准差、回归系数;ymean_是标定糖度平均值。基于Python的糖度预测模型建立算法流程为输入标定数据,马氏距离法剔除异常数据,计算方差、协方差确定PLS的成分个数,建立PLS预测模型。
主要采用红富士苹果作为测量对象,在挑选时尽量选择大小一致的苹果,剔除形状奇怪、部分腐烂、磕损的苹果。在实验室采集条件下,保持实验室温度恒定,将每个苹果均分为3个测量区域,并利用马克笔在每个区域做好标记并编号。这是由于即使是同一苹果,不同部位的糖度值也是有微小差异的。标记后进行标定,利用标准糖度计测定每个标记区域的实际糖度值。在检测苹果时,将苹果待测区域置于环形光源上,使苹果表面接触光源。在手机APP上点击“测定”后,读取APP显示的测得的漫反射电压值。
在室温25℃下,选择50个红富士苹果,测定每个苹果3个不同区域的糖度值,并且保存对应区域实验检测得到的6个LED的漫反射电压值。对于初步采集的漫反射电压值,减去LED不工作时测得的环境光照电压值,可以去除环境光的影响,修正数据。测量过程中,采用多次测量取平均值的方法,使得测量更加准确。分别建立各个特征波长下的电压值与糖度值的散点图,各波长电压-糖度散点图见图7,横轴为标准糖度计标定的糖度值,纵轴为该特征波长LED的漫反射电压值。
由图7可知,电压值与糖度值具备一定的线性相关性。计算并绘制苹果样本的马氏距离如图8所示。据式(2),设定马氏距离的阈值为3.0。
剔除超过阈值的异常样本后,将样本数据代入PLS预测模型式(3)计算得到预测糖度值为
将标定糖度值对应的实验测定电压值代入上述糖度预测模型,得到预测糖度值。以该预测糖度值为纵轴,以对应的标定糖度值为横轴,得PLS预测结果如图9所示。
计算所有数据后,可以得到该模型的MSE(均方误差)为0.346,证明猜测模型的预测能力良好,多特征波长的苹果糖度近红外检测测量仪基本满足苹果糖度检测精度的需求。使用多特征波长苹果糖度检测是可行的。
基于近红外光谱检测以及漫反射光谱分析原理,开发了基于智能手机的苹果糖度无损测量仪,采用800、820、830、880、900、940 nm共计6个特征波长。在实验室条件下,对苹果糖度测量的MSE(均方误差)为0.346。表明了LED光源及多特征波长选择、优化光路电路、建立PLS算法预测模型的设计方案的可行性,验证了开发的苹果糖度测量仪的准确性。