陈天华, 雷春宁, 李 月
(北京工商大学计算机与信息工程学院,北京 100048)
花生具有很高的营养价值,是我国居民的一种常用食品.据测定,花生富含蛋白质、硫胺素、核黄素、尼克酸等多种维生素和丰富的矿物质,并含有人体必须的氨基酸,有促进脑细胞发育和增强记忆的功能.但含水率高的花生在储藏过程中容易产生霉变、感染黄曲霉毒素,这是目前公认的强致癌物之一.因此,检测花生含水率是否达标对提高花生品质具有重要的意义.
目前,国内检测花生含水率的技术手段主要有传统的烘箱法和基于电磁场理论的插针式水分检测法,这些方法虽然精度满足了要求,但检测的准确性与当时的温度、湿度有较大关系,不能完全满足现代市场经济的发展需求.20世纪70年代中后期得到快速发展的近红外光谱(near infrared,NIR)技术可用于谷类食品含水率的定量与定性检测[1-2].近红外是介于可见光和中红外之间的电磁辐射波,对植物十分敏感[3],美国材料检测协会将近红外光谱区定义为780~2 526 nm.应用近红外技术检测花生等粮食品质是现阶段的一个研究热点[4].近红外光谱区与有机分子中含氢基团(OH、NH、CH)振动的合频和各级倍频的吸收区一致,扫描物品的近红外光谱可得到物品中有机分子含氢基团的特征信息.
与传统方法相比,近红外光谱检测技术具有无前处理、无污染、快捷、无损、可在线检测和多组分同时检测等优点[5].此外,近红外无需化学试剂,可穿透塑料和玻璃等材料进行直接检测,具有成本优势.欧美国家已广泛应用近红外技术检测食品品质,对于花生检测,近红外技术可以在生产线上配置近红外装置,对原料及其相关产品进行在线检测,及时跟踪品质变化[6-7].基于国内花生含水率检测的实际情况,本文研究基于近红外光谱技术检测花生含水率的方法,探索其作为一种无损、快速检测花生含水率的简易方法.
在超市采购一定数量的花生,根据 GB/T 1532—2008和GB/T 5497的要求,检测花生含水率并使之达到规定标准.然后将花生分为30份,每份100 g,将其中18份置于阴凉处的密闭容器保存,另12份添加纯净水,提高样品的含水率,并放在密闭的容器内在常温下保存1天,使水分均匀吸收.将各花生样本研磨成粉末状,对每组进行编号标记.对达标的18个样本,根据国标要求,将部分样本放入烘箱内(105℃ ±2℃)0.5~2 h不同时长,然后取出并加盖,在干燥器中冷却至室温后密闭储存,待近红外光谱实验时随时可使用.
根据近红外光谱原理,近红外分析技术是一种间接的相对分析法,由于不同种类物质的化学成分不同,含氢基团倍频与合频振动频率不同,其近红外谱的峰位、峰数及峰值不同.样品成分差异越大,光谱特性差别越大,若样品成分相同,其光谱也一致[7].因此,若建立了光谱与待测物间的对应关系(又称为分析模型),则可根据光谱特性检测样品的质量.
BP神经网络,又称为误差反向传播学习算法,由信息的正向传播和误差反向传播两过程组成.BP网络的特点是各层神经元仅与相邻层神经元之间相互全连接,同层神经元无连接,各层神经元之间无反馈连接,构成具有层次结构的前馈型神经网络系统.
1.3.1 节点输出模型
隐节点输出模型:
输出节点输出模型:
q为神经单元阈值.
1.3.2 作用函数模型
作用函数是反映下层输入对上层节点刺激脉冲强度的函数,又称刺激函数,一般为(0,1)内连续取值,常用的Sigmoid函数如下:
1.3.3 误差计算模型
误差计算模型是反映神经网络期望输出与计算输出之间误差大小的函数,如下:
tpi为i节点的期望输出值;Opi为i节点计算输出值.
1.3.4 自学习模型
神经网络的学习过程,即连接下层节点和上层节点之间的权矩阵Wij的设定和误差修正过程.自学习模型为如下:
h为学习因子;φi为输出节点i的计算误差;Oj为输出节点j的计算输出;a为动量因子.
2.1.1 光谱采集
实验采用FoodScan FOSS光谱仪进行.光谱仪采用近红外透射原理,采集波长范围为850~1 050 nm,操作简便,可快速扫描、存储数据,分析过程可采用计算机完成,并提供基于人工神经网的预定标模型,可用于分析谷类、奶酪等多种食品,测定其脂肪、蛋白质、水分和盐的含量.3种不同含水率花生光谱曲线(横轴为波长;纵轴为花生对不同波长光的吸收情况)见图1.实验结果表明,不同含水率的花生,其光谱对光的吸收程度不同.
图1 3种不同含水率花生光谱图Fig.1 Spectra of three different moisture content peanuts
2.1.2 实验数据
将近红外光谱曲线中各波长对光的实验数据导出,得花生光谱实验数据(见表1).
将实验采集的数据应用BP神经网络进行建模,选择3层结构BP神经网络模型如图2,输入为选定的反射光检测数值,输出层神经元个数为1,经迭代,隐含层神经元个数选择为7个.将花生红外数据作为神经网络输入,应用BP网络对训练样本进行训练,得到优化的BP神经网络模型,然后将训练后的神经网络对未训练的样本进行识别.
表1 花生红外光谱吸光度数据Table 1 Peanut IR spectrum experimental data
续表1
图2 BP神经网络模型Fig.2 BP neural network model
2.2.1 训练集实验结果
已知20个训练样本中12个花生样本含水率完全达到国家收购标准,另8个样本未达标.采用BP网络对训练集样本进行训练,若输出节点的值在1.0±0.1之间,则识别结果分类为1,即达标;若输出节点的值在-0.1~0.1,则识别结果分类为0,即为未达标样本.将神经网络对全部20个训练样本进行训练和比较,直至BP网络能全部正确识别20个样本的水分含量达标.
2.2.2 测试集实验结果
将测试集待测花生样品的近红外实验数据作为BP网络的输入,将训练后的BP网络对测试集的10个样本进行识别.同时,依据国标 GB/T 1532—2008,对测试集各花生样本的含水率进行计算,其中6个为达标样本,4个为未达标样本.经BP网络模型对10个样本进行识别,结果与依据国标计算的结果完全一一对应,全部样本均识别正确.实验结果表明,采用近红外技术结合BP网络可正确识别花生含水率是否达标.
本文根据花生储存过程中含水率高可能产生霉变的问题,应用近红外光谱仪采集花生光谱数据,采用BP网络模型对实验数据进行处理和识别.全部30个样本中20个为训练集,10个为测试集.根据训练集样本的含水率结果,对BP网络进行学习和训练,然后对测试集样本进行计算,10个测试样本的识别与实际结果完全符合.实验表明,该模型可用于检测花生含水率是否达标,并具有准确、方便、快速等优点,适合于花生收购环节和运输线上进行含水率快速检测,确保花生品质控制.该研究不仅可用于花生等食品的检测,也可推广到肉类、奶类食品含水率分析检测.
[1] 尼珍,胡昌勤,冯芳.近红外光谱分析中光谱预处理方法的作用及其发展[J].药物分析杂志,2008,28(5):824-829.
[2] 孙永海,万鹏,于春生.基于BP神经网络的大米含水量近红外检测方法[J].中国粮油学报,2008,23(6):194-198.
[3] 黄晓荣,汪建来,赵竹,等.油菜样品前处理方法对近红外品质分析结果的影响[J].安徽农业科学,2004,32(4):643-645.
[4] 何勇,李晓丽.用近红外光谱鉴别杨梅品种的研究[J].红外与毫米波学报,2006,25(3):192-194,212.
[5] 刘洁,李小昱,李培武.数据处理方法在近红外光谱分析中的应用进展[C]∥中国科协.节能环保和谐发展——2007中国科协年会论文集(三).北京:中国科学技术协会,2007:1-6.
[6] 王艳斌.人工神经网络在近红外分析方法中的应用及深色油品的分析[D].北京:石油化工科学研究院,2000.
[7] 赵肖宇,关勇,尚廷义,等.应用近红外透射光谱和人工神经网络的豆油脂良莠鉴别[J].浙江农业学报,2011,23(4):825-828.