温冯睿, 关海鸥*, 马晓丹, 左 锋, 钱丽丽
1. 黑龙江八一农垦大学信息与电气工程学院, 黑龙江 大庆 163000
2. 黑龙江八一农垦大学食品学院, 黑龙江 大庆 163000
3. 国家杂粮工程技术研究中心, 黑龙江 大庆 163000
4. 黑龙江省农产品加工与质量安全重点实验室, 黑龙江 大庆 163000
稻谷在储运过程中适宜的温湿度等环境下极易发生霉变, 导致产生多种对人体和牲畜有害的真菌霉素, 严重威胁人与动物的健康, 降低稻谷食用价值, 也会造成大量的粮食浪费, 带来巨大的经济损失, 进而影响粮食安全, 因此对于霉变稻谷的检测和霉变程度的鉴别具有重要的意义。 传统稻谷霉变研究是通过化学处理后利用电子显微镜等仪器, 观测稻谷中真菌孢子, 用来检测稻谷霉变情况。 唐芳等[1]提出了一种使用扫描电镜观察方法, 通过真菌孢子的数量来判断稻谷霉变程度, 该方法存在的不足是耗费时间长, 检测过程繁琐。 为检测粮食的不同霉变程度, 严松等[2]对小麦产生的挥发性气体进行主成分分析, 检测了小麦的霉变程度; 库晶等[3]设计了一种电子鼻技术的稻谷霉变在线检测系统; 但目前电子鼻对于稻谷霉变的研究多局限在实验室环境中, 且在实际应用中, 设备的灵敏度, 布线等因素都会影响检测的结果。 在电子鼻技术基础上, 赵天霞等[4]利用PCA算法区分了未霉变、 轻度霉变、 以及重度霉变的稻谷。 随着数字图像处理技术快速发展, 基于机器视觉的智能信息处理技术, 被广泛地应用于粮食霉变的检测研究。 潘磊庆等[5]应用机器视觉获取五种真菌引起稻谷霉变后图像, 采用SVM和PLS-DA方法成功划分了无霉变组、 轻度霉变组、 以及重度霉变组, 机器视觉技术存在的不足是无法获取稻谷内部品质的信息。 光谱在稻谷霉变检测中具有可获得内部信息的优势, 因此, 光谱分析技术已逐渐在稻谷霉变中得到了成功应用, 如赖燕华等[6]在特定的范围内获得烟叶样本近红外光谱(near infra-red, NIR)数据, 识别了未霉变、 临近霉变、 以及已霉变的样品; Lu等[7]通过光谱特征结合主成分分析对不同生长阶段的真菌导致的霉变稻谷, 采用连续投影算法选择最佳波长并建立对应分类模型; 章林忠等[8]利用近红外高光谱图像, 建立了板栗果实的快速无损检测和品质鉴定方法, 实现了霉变、 虫害和正常果实的定性分析。 蒋大鹏等[9]应用近红外光谱无损快速鉴别霉变的松子; 沈飞等[10]采取霉变稻谷的近红外光谱数据, 利用PCA-DA-PLSR建模方法, 无损检测了稻谷受有害霉菌污染程度。 但相关北方寒地稻谷仓储和南运过程中多种复杂的环境因素和稻谷收获时属性条件, 基于近红外光谱图像技术的稻谷霉变程度检测方法鲜有报道。 本工作以东北寒地稻谷为研究对象, 获取牡响、 早香、 彩稻三个品种不同霉变状态的近红外光谱的成像数据, 分析NIR图像多种纹理和频域特性, 优选不同稻谷品种霉变状态的光谱特征, 利用BP神经网络(back propagation, BP)的自适应推理机制, 建立稻谷霉变程度与其近红外图像特征之间映射模型, 实现稻谷霉变程度无损检测的新方法, 能够为稻谷仓储时霉变早期自动快速检测提供技术支持。
以东北寒地稻谷为研究对象, 分别为: 牡响、 早香、 彩稻三种稻谷, 且均为没有脱离稻壳的籽实。 考虑到北粮南运中遇到的复杂情况, 如稻谷在集装箱中被雨水打湿, 在运输途中仓内温度过高等因素, 将四种健康稻谷各2 kg均匀平铺在培养盘中, 倒入无菌水搅拌均匀, 覆膜后放入35~40 ℃的人工气候箱中, 模拟稻谷发生复杂霉变过程。 采用五通道多光谱相机(Sequoia), 在近红外波长为790 nm且带宽为40 nm的参数条件下, 采集稻谷霉变全过程的近红外图像数据。 为减少外界环境对采集图像数据的干扰, 实验在标准拍摄箱内进行, 配备标准的全波段光源, 设定实验间隔为24 h, 固定多光谱相机在距离样本上方40 cm处垂直拍摄。
稻谷受真菌感染产生霉变后表面存在霉菌, 其表面颜色逐渐变深甚至呈现黑色。 依据文献[11]结合黑龙江稻谷储运的实际情况, 定义稻谷中霉菌量≤105CFU·g-1为健康稻谷; 霉菌量在105~106CFU·g-1定义为轻度霉变稻谷; 霉菌量≥106CFU·g-1定义为中度霉变稻谷。 选取霉变稻谷的近红外图像中大小160×160的中心区域为有效图像(见图1), 分析霉变稻谷在790 nm波长的近红外光谱图像特性。
图1 不同霉变程度的稻谷近红外图像
2.1.1 提取纹理特征
稻谷发生霉变时所产生曲霉属和青霉属为主的霉菌群, 随机分布在籽粒表面, 其近红外光谱反射值存在差异性分布。 研究稻谷不同霉变程度所成图像差异性, 计算霉变稻谷NIR图像的纹理特征, 分析稻谷霉变时NIR图像特性, 可为稻谷储运时霉变程度的快速检测提供数据指标。 依据文献[12]设计稻谷NIR图像纹理特征计算方法, 具体计算公式如表1所示。
为客观描述霉变稻谷NIR图像的清晰度, 应用平均梯度G表征NIR图像的多层次细节,G越大表明图像的层次越多且清晰, 反之, 图像越模糊, 平均梯度G计算公式为
(1)
式(1)中,m和n分别为NIR图像的行数和列数,F(i,j)为近红外图像的反射值。
霉变稻谷的NIR图像存在多变的周期性重复细节, 分形维数可以衡量图像内反射值的强弱, 并且表示其规则程度, 因此分形维数作为NIR图像非常重要的纹理特征, 计算分形维数FD公式为
(2)
式(2)中,N(ε)为覆盖整幅图像需要的盒子总数目,ε为原图像划分若干子图像的边长。
依据上述霉变稻谷特征计算方法, 选取健康、 轻度霉变、 中度霉变稻谷各200幅图像数据, 共计600组近红外光谱成像样本, 计算不同霉变状态下稻谷NIR图像的8个纹理特征, 三种霉变稻谷图像的纹理特征分布, 如图2所示。
图2 稻谷三种霉变状态的纹理特征分布
图2中为600个样本的特征数据进行归一化处理后的盒图, 可以直观反映每种状态稻谷各特征值中最大值、 最小值、 中位数、 以及50%的数据集中区域。 其中, 健康稻谷特征数据中50%样本的均值集中在0.39~0.68之间, 轻度霉变稻谷在0.62~0.84区间, 中度霉变稻谷在0.54~0.81之间, 霉变稻谷相较于健康稻谷均值的中位数有所上升, 反映了霉变稻谷NIR图像的亮度降低程度。 相对平滑度值, 中度霉变稻谷的矩形框较健康稻谷有所上移, 反映出稻谷在霉变过程中NIR图像越来越粗糙。 中度霉变稻谷三阶距值的中位数小于轻度霉变稻谷, 表明稻谷NIR图像逐渐变暗。 对比三种状态稻谷的分形维数, 表征出NIR图像的规则程度呈现相近且稳定。
2.1.2 近红外图像数据的反射值频率分析
由于稻谷在不同霉变状态时, 其霉菌群随机分布在籽粒表面, 引起霉变稻谷的近红外光谱图像反射值大小的频率变化。 直方图可以统计光谱图像中具有相同密度的反射值的数量, 以简单的方式描述图像中包含的统计学信息, 这种定量研究方式有利于克服定性分析带来的主观偏倚。 研究中应用直方图技术进一步分析稻谷不同霉变程度的反射值频率特性, 根据文献[13]提取近红外图像有效区域近红外光谱反射值的频率特征, 计算稻谷NIR图像直方图中每个区间反射值频率, 如图3所示。
图3中横轴表示的是稻谷NIR图像的反射值, 纵轴表示反射值在该区间内的个数, 稻谷NIR图像均有25 600个反射值, 且主要集中在0.2~0.8之间。 对全部样本反射值频率分布的统计可知, 健康稻谷图像直方图的峰值出现在0.6附近, 在0.2~0.3反射值区间为少数零散分布, 而轻度和中度霉变的稻谷图像, 在该反射值区间有相对较多的分布。 在0.7~0.8健康稻谷图像的反射值区间分布较多, 而霉变稻谷的分布相对减少甚至没有。 由于在发生霉变后稻谷表面发灰发暗, 导致对应NIR图像的反射值直方图整体向左偏移, 即向反射值较小的方向偏移。 所以在分析稻谷NIR图像反射值直方图的基础上, 提取0.2~0.8步长为0.1的六个连续区间反射值频率, 作为霉变稻谷NIR图像的频率特征, 计算公式为
图3 不同霉变程度稻谷反射值分布对比
(3)
前馈BP神经网络具有非线性函数的自适应推理机制, 可以很好地解决稻谷霉变程度与其近红外图像特征之间映射关系。 将提取不同稻谷品种霉变状态的光谱特征作为输入向量, 利用训练好的网络模型计算输出值并映射至霉变程度的解空间, 完成稻谷霉变自动无损检测方法。 具体步骤为: (1)采集不同霉变状态的稻谷的NIR图像; (2)计算NIR图像14维数字特征; (3)将数字向量输入训练好的BP神经网络, 计算模型前向输出值; (4)解析稻谷霉变程度编码向量, 输出稻谷霉变程度检测结果。
2.2.1 神经网络的结构与训练网络结构参数
在牡响、 早香、 彩稻三个品种的不同霉变状态中, 选择健康、 轻度霉变、 中度霉变的稻谷图像数据各180组, 共计540组特征向量作为训练样本。 计算均值、 标准差、 平滑度、 三阶距、 一致性、 信息熵、 平均梯度、 分形维数、 以及在0.2~0.8区间内反射值频率6个统计特征, 共计14维度的特征指标, 确定了神经网络输入层节点数为14; 稻谷霉变程度为3个等级, 采用3位二进制编码, 即输出层节点数为3; 依据隐含层神经元数量确定规则[14], 结合本研究实际试验情况, 最终确定网络隐含层神经元节点数为60, 所以稻谷霉变程度检测的神经网络结构为14-60-3型。 该神经网络采用梯度下降学习算法[15], 设定目标精度为0.06, 学习速度为0.8, 最大学习次数为30 000。 在实际训练时迭代次数为28 455次时, 达到目标精度的误差要求。
2.2.2 模型仿真应用与评价
利用全部样本中剩余的健康、 霉变初期、 中度霉变稻谷图像的特征向量各20组, 共计60组特征数据作为测试样本。 仿真应用中检测模型输出值所对应稻谷霉变状态(二进制编码)的解码规则为: 当网络输出层节点的计算值Ymax(y1,y2,y3)=y1, 则y1=1, 其余节点为0, 对应中度霉变稻谷样本编码为100; 当网络输出层节点的计算值Ymax(y1,y2,y3)=y2, 则y2=1, 其余节点为0, 对应轻度霉变稻谷样本编码为010; 当网络输出层节点的计算值Ymax(y1,y2,y3)=y3, 则y3=1, 其余节点为0, 对应健康变稻谷样本编码为001。 至此可以应用2.2.1节已训练好的霉变稻谷检测模型进行测试, 其输出的仿真结果, 如图4所示。
图4 稻谷霉变检测模型输出
图4中稻谷三种不同霉变程度的识别结果相对集中, 测试集中健康、 轻度霉变、 中度霉变稻谷的预测错误的样本数分为2个、 2个和0个, 对应稻谷霉变程度的识别准确率分别为90%, 90%和100%, 基于BP神经网络识别模型总体识别准确率达到93.33%。 该网络模型计算输出值和实际期望值的误差平均值为0.521 39, 方差为0.137 82, 误差的标准差为0.371 23。 选取霉变稻谷NIR图像的特征为基础, 建立径向基神经网络结构为14-281-3型的检测模型, 仿真试验得到的准确率仅为63.66%, 其均方根误差为0.186 27, 而BP神经网络均方根误差为0.046 26, 所以基于BP神经网络的稻谷霉变检测模型具有明显的性能优势, 能够满足稻谷储运过程中霉变程度检测实际需求。
针对稻谷储运过程发生霉变时, 传统稻谷霉变检测过程繁琐且耗时较长的不足, 提出了基于近红外光谱图像处理技术和神经网络的稻谷霉变程度检测模型, 实现稻谷霉变程度无损检测的新方法, 能够为仓储稻谷霉变程度的自动快速检测提供技术支持和参考。
(1)应用数字图像处理技术结合光谱图像分析方法, 提取了近红外图像的纹理特征(均值、 标准差、 平滑度、 三阶距、 一致性、 信息熵、 平均梯度、 分形维数)以及反射值6个区间的频率(0.2~0.3, 0.3~0.4, 0.4~0.5, 0.5~0.6, 0.6~0.7, 0.7~0.8), 共计14个特征值, 为稻谷霉变检测提供有效可靠的特征参数。
(2)以提取的NIR图像的特征向量为依据, 利用BP神经网络自适应推理机制, 建立稻谷霉变程度与其近红外图像特征之间非线性映射模型, 该网络输入与输出之间的相关系数R为0.85, 霉变稻谷检测的准确率为93.33%, 解决了稻谷霉变程度与NIR光谱成像特征值之间的数学建模问题。