蔡炳育,杨帆
(1.苏州工业园区服务外包职业学院,江苏 苏州 215123;2.贵州财经大学,贵阳 550025)
酱油是日常生活中的必需品,酱油风味物质是影响酱油品质的关键性因素[1]。酱油的生产方式主要包含高盐稀态发酵和低盐固态发酵,酱油主要生产地区处于我国东部、南部和北部地区[2]。不同生产地区生产的酱油所用原材料存在较大差异,由此造成酱油的挥发性风味物质也存在较大的差异,因此对酱油挥发性风味物质的研究分析可间接鉴别酱油的生产地区和生产方式[3]。本文利用神经网络建立酱油分类模型,以酱油挥发性风味物质为输入参数,以酱油生产地区和发酵方式为输出参数,对酱油进行两种不同的分类,为进一步提高酱油生产地区和酿造方式的鉴别过程提供了参考。
神经网络包含输入层、隐含层和输出层,每一层级中包含若干神经元,各个神经元之间相互形成网络状拓扑结构,进行神经网络之间的信息发送与接收,神经网络中的信号脉冲强度由信号加权系数决定[4-6]。神经元是神经网络中的基本结构单元,是一种非线性阈值处理器,可进行多信号输入,经处理后形成单输出。其中a1、a2、……an表示N组输入信号,W1、W2、……Wn表示与输入信号相对应的加权系数,SUM表示信号输入总和,b表示阈值调整常数,f表示神经元阈值处理函数,t表示输出信号。
遗传算法是一种智能进化算法,通过自然界中的启发搜索方式进行参数选择,并进行过程优化,从而提供有效的算法方案[7]。遗传算法优化后的数学解转化成数字串,并进行重新编码形成新的个体,遗传算法的迭代过程利用生物进化的相关过程操作不断进行迭代,计算个体之间的适应度函数,并取代上一代个体,完成一次独立的遗传迭代[8-10]。迭代过程重复进行,直到生成新的适应度,每一次迭代过程相互交叉变异,在所有空间中进行全局搜索,使每一个新个体都能形成最优解[11]。
采用遗传算法对神经网络结构进行优化时,将78组酱油样品进行分组,其中一组用来进行网络训练,包含63组数据,称为训练集,另外一组用来进行模型网络测试,包含15组数据,称为测试集[12]。本文通过利用神经网络对酱油的发酵方式和生产地区进行分类,在建立发酵方式分类模型时,以灵敏度分析使用的28组挥发性成分和维度降低后的15种挥发性成分作为模型输入参数,高盐稀态和低盐固态作为两种输出参数进行发酵方式分类。
利用神经网络进行数据训练之前,对输入数据进行预处理,将检测得到的挥发性成分含量进行归一化处理,将所有数据进行压缩,使其数值处于[-1,1]之间,获取训练输出数据之后再将数据进行恢复,加速神经网络训练速率和精度。在进行发酵方式输出数据训练之前,将数据进行量化处理,生成二进制字符串编码,高盐稀态发酵方式表示为[-1,0],低盐固态发酵方式表示为[0,1]。
与发酵方式分类模型类似,对酱油发酵地区进行分类时,同样使用灵敏度分析使用的28组挥发性成分和维度降低后的15种挥发性成分作为模型输入参数,东部地区、南部地区以及北部地区作为3种输出参数进行发酵地区分类。发酵地区分类数据量化处理时,东部地区表示为[0,1,0],南部地区表示为[0,0,1],北部地区表示为[1,0,0]。
对训练数据进行学习,采用遗传算法对神经网络进行优化,优化参数见表1。使用维度降低前的28组挥发性成分进行酱油发酵方式的分类,使用15组测试集数据的识别正确率来验证酱油发酵方式分类模型效果,模型正确率验证测试结果见表2。维度降低后,对训练数据进行学习,采用遗传算法对神经网络进行优化,优化参数见表3。使用维度降低后的15组挥发性成分进行酱油发酵方式的分类,使用15组测试集数据的识别正确率来验证酱油发酵方式分类模型效果,模型正确率验证测试结果见表4。
表1 维度降低前模型优化参数(发酵方式)Table 1 Model optimization parameters before dimension reduction (fermentation mode)
表2 维度降低前模型正确率测试结果(发酵方式)Table 2 Model accuracy test results before dimension reduction (fermentation mode)
表3 维度降低后模型优化参数(发酵方式)Table 3 Optimization of model parameters after dimension reduction (fermentation mode)
表4 维度降低后模型正确率测试结果(发酵方式)Table 4 Model accuracy test results after dimension reduction (fermentation mode)
对训练数据进行学习,采用遗传算法对神经网络进行优化,优化参数见表5。使用维度降低前的28组挥发性成分进行酱油生产地区的分类,使用15组测试集数据的识别正确率来验证酱油生产地区分类模型效果,模型正确率验证测试结果见表6。维度降低后,对训练数据进行学习,采用遗传算法对神经网络进行优化,优化参数见表7。使用维度降低后的15组挥发性成分进行酱油生产地区的分类,使用15组测试集数据的识别正确率来验证酱油生产地区分类模型效果,模型正确率验证测试结果见表8。
表5 维度降低前模型优化参数(生产地区)Table 5 Model optimization parameters before dimension reduction (production area)
表6 维度降低前模型正确率测试结果(生产地区)Table 6 Model accuracy test results before dimension reduction (production area)
表7 维度降低后模型优化参数(生产地区)Table 7 Model optimization parameters after dimension reduction (production area)
表8 维度降低后模型正确率测试结果(生产地区)Table 8 Model accuracy test results after dimension reduction (production area)
续 表
由表6和表8中数据可知,维度降低前,测试集数据识别正确率达到80%,表明酱油发酵方式分类模型和生产地区分类模型可基本满足分类性能要求。维度降低后,测试集数据识别正确率达到100%,表明酱油发酵方式分类模型和生产地区分类模型可精确进行酱油发酵方式分类。
本文利用遗传算法和神经网络相结合的方式,建立酱油发酵方式分类模型和酱油生产地区分类模型,并利用遗传算法进行神经网络结构优化,使分类模型识别精确度达到100%,为酱油发酵方式及生产地区的分类鉴别提供了理论论依据。