李志成,王文昌
(中华全国供销合作总社济南果品研究院,山东济南250014)
苹果作为大宗农产品,具有产量高、上市时间集中的特点。硬度是反映苹果品质的重要指标。目前,苹果的硬度指标检测一般使用硬度计,其最大的弊端是对苹果具有破坏性,一旦检测完毕苹果便失去了商品用途,无法进行销售。而近红外光谱法检测具有快速、方便、高通量、无损伤的优势[1-3],是农产品硬度检测的理想方法。
数据显示,我国是世界上最大的苹果生产国和消费国。2017年,世界的苹果总产量是7600多万t,中国有4380万t,约占全世界产量的近6成。硬度是苹果重要的品质指标之一,在苹果的收购、流通、销售环节中都备受关注。目前通常使用硬度计对苹果硬度进行检测,该方法速度慢、破坏性大。用近红外光谱仪采集被测定苹果的近红外光谱,通过解析谱图和进行不同的预处理,将比较复杂的弱光谱信息有效提取出来,找出苹果最好的预处理方法和有效光谱范围[4,5];用偏最小二乘法对苹果的近红外光谱数据进行定量分析[6],并对样本进行预测,达到快速、无损检测的目的[7]。本文利用近红外光谱建立预测苹果硬度的模型,并优化模型预测的准确性,从而快速、准确地对苹果硬度进行预测,传统硬度检测所致的实现苹果硬度的无损检测。
便携式近红外分析仪,聚光科技(杭州)股份有限公司生产,型号为SupNIR-1100,波长范围 600~1100 nm,光谱分辨率6 nm-1,波长准确性0.2 nm。
水果硬度计,意大利Fruit Test公司生产,型号为FT327。测量范围为0~13 kg,分度值100 g。
试验用的苹果来自苹果产区,有河南三门峡,陕西渭南,山东栖霞、威海、蓬莱。苹果数量为100个。随机分为校正组和检验组,校正组75个样本,检验组25个样本。
采集条件:以仪器内置背景为参比,积分球漫反射,扫描范围为600~1100 nm,在室温下(约22℃)采集其近红外扫描光谱,分辨率6 cm-1,所获得光谱即为样本的近红外光谱谱图,如图1所示。
图1 苹果样本的近红外光谱图Fig.1 Near infrared spectra of apple fruit samples
用硬度计测定苹果硬度,将硬度计探头对准苹果表皮,方向由果面指向果心,缓慢按压,观察硬度计表盘指针变化,当指针数值不随探头深入而变化时停止按压,读取硬度计表盘数值即为样本苹果的硬度。
采集的近红外光谱受噪声影响,噪声主要来源于随机噪声、基线漂移、信号本底、样品不均匀、光散射等。为此要对原始光谱数据进行预处理,降低噪声影响,提高光谱精度。本试验采用聚光科技近红外分析仪测量分析软件对原始图谱进行预处理,平滑消噪后提取样品的有效信息。光谱预处理方法有平滑、微分处理以及基准校正等。可以去除光谱中高频噪声的干扰,较多的平滑点数可以使信噪比提高。
从苹果的近红外原始光谱图(图1)可以看出,所有样品的光谱图形状具有相似性,在首尾两端具有较强的噪声干扰,在600~700 nm范围内出现了吸收峰,特别是在680 nm特征吸收峰最为强烈。采用聚光科技分析软件中自带偏最小二乘方法进行建模,选择偏最小二乘回归分析(PLS1),在性质列表中任选一个性质,点击“添加模型”,采用PLS1方法建立模型。
本文通过对校正组75个苹果样品的硬度校正模型来预测25个检验组样品的值,并以预测值和真实值的拟合程度来判断建模效果。预测集25个样品硬度的真实值和预测值的效果见图2。
图2 样品硬度的真实值和预测值的效果图Fig.2 Actual values and predicted values of hardness in predicted samples
从图2中可以看出,预测集中25个样品的硬度真实值和预测值的拟合程度比较好,基本可以实现预测评估的效果。用建立好的模型验证25个苹果的硬度值,得到硬度的真实值和预测值相关性较为理想。图3是预测集25个样品硬度真实值和预测值的相关线性曲线。
图3 预测集样品硬度真实值和预测值的相关性Fig.3 Relationship between actual values and predicted values of hardness in prediction set
利用建立的定量模型预测检验组的25个样品。由图3可以看出,样品各点分布在趋势线(与坐标轴夹角为45°)附近,说明近红外光谱的预测值和真实值基本一致。模型预测值和真实值的R2为0.8481。
采用聚光科技分析软件中自带偏最小二乘PLSI方法对苹果硬度原始光谱数据进行建模,得到了较为理想的模型以及预测效果。试验发现,使用该模型得到的苹果硬度预测值和真实值的决定系数R2=0.8481。可见,近红外光谱快速检测苹果硬度可以在无损的情况下快速、较为准确的获得样品硬度的预测值。