枣花及枣花蜜香气成分保留指数的神经网络法研究

2021-09-26 10:08堵锡华
关键词:连接性枣花花蜜

堵锡华,田 林,徐 艳,李 靖,吴 琼

徐州工程学院 材料与化学工程学院,江苏 徐州 221018

枣树是原产于我国的优势果树,已有7 000多年栽培历史,优良品种达800 多种[1],其适应性、抗逆性和抗盐碱性等都很强,枣果由于口感香脆、营养丰富,而且其中的活性成分具有抗氧化、抗炎和预防癌症等功效[2-3],因此既有显著的经济价值和生态效益[4],又具有极高的保健价值,故近年来受到国内外营养学家以及医药科研工作者越来越多的关注[5].如: 李洁等人[6]以3种枣为研究对象,检测分析了糖含量及相关酶活性的变化,取得了满意的结果;王蓉蓉等人[7]则对6种枣果活性成分的抗氧化性能进行了比较分析,研究了抗氧化物与抗氧化能力之间的相关性,为枣果产品的开发利用提供了理论依据.为获得更好品质的枣果,研究工作者将更多的工作注重于枣花的研究方面.张瑜等人[8]利用气质联用技术,对沙枣花挥发油香气成分进行分析检测,为后期相关研究打好了坚实基础;丁嘉文等人[9]则利用气质联用仪分别对多种方法提取的沙枣花挥发性物质进行了成分分析,不但研究了最优的提取方法,还研究了沙枣花挥发性主要成分.同样,由枣花所得的枣花蜜也具有抑菌、抗氧化及抗炎等功效[10],故也逐渐受到科研工作者的重视[11],Cheng等人[12]对此进行了研究并取得了较好的成果.

已有的研究工作较多地集中于挥发性成分的提取、分析检测或抗氧化活性等方面[13-17],而对香气成分性质的研究相对较少,特别是利用在化学[18-19]、医学[20-21]、食品科学[22]、环境科学[23-24]和建筑学[25]等方面广泛应用的神经网络方法,对枣花和枣花蜜挥发性成分的相关性质的研究未见有报道,为此在前面研究[26-28]工作的基础上,本研究采用人工神经网络法中的BP算法,对敖常伟等人[29]检测枣花得到的84种挥发性香气成分、检测枣花蜜得到的65种香气成分化合物分子,建立连接性指数、电性距离矢量与这些化合物的色谱保留指数之间的神经网络模型.根据预测模型得到的保留指数值与实验值较为吻合,故利用神经网络法对物质香气成分进行研究,可快速获取香气成分的保留指数值,提高定性分析检测能力,从而为改良果品品质提供可靠的理论指导.

1 数据处理及研究方法

1.1 枣花和枣花蜜香气成分及其保留指数

枣花和枣花蜜香气成分种类及其色谱保留指数均来源于文献[29],其中枣花香气成分84种,包括酯、烯烃、醇、酸、醚、酮及其他少量的酚、胺等种类化合物;枣花蜜香气成分65种,包括醇、酸、醛、烷烃、酮类、萜烯类、酚类、酯类及其他少量芳香烃类化合物.枣花香气成分化合物见表1,枣花蜜香气成分化合物见表2.

表1 枣花香气成分的分子连接性指数和电性距离矢量

续表1

表2 枣花蜜香气成分的分子连接性指数和电性距离矢量

续表2

1.2 结构参数计算及多元回归分析

采用Chem3D 9.0三维分子结构演示软件,绘制文献[29]列出的枣花84种和枣花蜜65种香气成分分子的结构图,然后应用MATLAB数学分析建模计算软件,以文献[30-31]的方法编程程序,分别计算了84种枣花香气成分分子、65种枣花蜜香气成分分子的连接性指数及电性距离矢量两大类分子结构参数,去掉每种结构参数值中大部分分子为0的数组,用MINITAB质量统计分析软件以及SPSS统计分析运算软件,对结构参数进行变量分析,优化筛选了连接性指数中0X,1X,2X,3X,5Xc,4Xpc和电性距离矢量中M14,M15,M21和M32共10种参数,与枣花香气成分色谱保留指数相关性相对最优,得到的多元线性回归模型为:

(1)

同理,针对文献[29]中列出的65种枣花蜜香气成分色谱保留指数,优化筛选了连接性指数中0X,1X,3X和电性距离矢量中M1,M2,M14,M15,M21和M32共9种参数,得到多元线性回归方程为:

(2)

将枣花及枣花蜜的分子结构参数分别列入表1和表2中.从(1)式和(2)式可以看到,这两个多元回归模型的相关系数均不到0.9,相关性不是特别理想,为此需要进一步采用神经网络方法进行分析研究.

2 神经网络预测模型的建构

为提高多元回归模型(1)和模型(2)预测枣花和枣花蜜香气成分色谱保留指数的能力,这里应用MATLAB软件中的神经网络法进一步进行研究.神经网络法的三层结构中,主要是隐含层变量的选择,按照许禄[32]及Andrea等人[33]的建议规则综合分析,隐含层变量(Y)计算式为

2.2>n/M≥1.4

(3)

式中:n为总的样本数,M为权重,其计算公式为

M=(Si+1)Y+(H+1)So

(4)

式中:Si,Y,So分别为神经网络的输入层变量、隐含层变量和输出层变量.将枣花香气成分的连接性指数和电性距离矢量共10个参数作为输入层变量,相应分子色谱保留指数作为输出层变量,根据(3)式和(4)式,隐含层变量Y取4,故对枣花香气成分色谱保留指数预测的神经网络结构采用10-4-1方式,为防止建模过程中的过拟合现象,将84个枣花香气成分分子分为3组: 第1组为训练集组(以每5个分子为1组,取其中第1,2,4个分子)、第2组为测试集组(每5个分子组中的第5个分子)、第3组为验证集组(每5个分子组中的第3个分子),用MATLAB软件中神经网络计算软件进行计算分析,得到了预测枣花香气成分色谱保留指数模型的总相关系数rt=0.988 6,3个集组的相关系数分别为: 训练集组的相关系数r1=0.987 7、测试集组的相关系数r2=0.981 8、验证集组的相关系数r3=0.994 4.这里明显可以看出,模型总相关系数相比多元回归方法得到了明显的提升,达到了0.99左右的优级相关性,而且3个集组的相关系数与模型总相关系数较为接近,说明模型的稳定性相对较好,利用该神经网络模型预测的枣花香气成分的色谱保留指数与实验值的吻合度较为理想,两者的平均相对误差为2.34%,而利用方程(1)预测枣花挥发性成分保留指数的误差为10.26%,故神经网络法明显优于多元回归法结果,将枣花香气成分保留指数的预测值与实验值列于表3中,预测值与实验值的关系见图1.

图1 枣花色谱保留指数实验值与预测值关系

表3 枣花香气成分色谱保留指数的预测

同理,将枣花蜜香气成分的9个参数作为输入层变量,相应分子色谱保留指数作为输出层变量,根据(3)式和(4)式,隐含层变量Y可取3或4,经分析比较,当Y取4时,所得的结果更好,故对枣花蜜香气成分色谱保留指数预测的神经网络结构采用9-4-1方式,这样得到了预测枣花蜜香气成分色谱保留指数模型的总相关系数rt=0.992 3,3个集组的相关系数分别为: 训练集组的相关系数r1=0.991 2、测试集组的相关系数r2=0.996 7、验证集组的相关系数r3=0.992 2,模型的各相关系数均大于0.99的优级相关,利用该神经网络模型预测的枣花蜜香气成分的色谱保留指数与实验值的吻合度更为理想,两者的平均相对误差为2.07%,将枣花蜜香气成分保留指数的预测值与实验值列于表4中,预测值与实验值的关系见图2.

图2 枣花蜜色谱保留指数实验值与预测值关系

表4 枣花蜜香气成分色谱保留指数的预测

3 结果与讨论

各种不同的花卉或花蜜有其自身特征的香味,这主要是花卉或花蜜含有的香气成分化合物分子种类及含量有所不同,而形成这些香味成分的种类繁多,有烷烃类、烯烃类、芳香烃类、酯类、酸类、胺类、酚类、醛类、醇类、酮类和萜烯类等等众多类型的挥发性有机物,有的种类化合物含量相对较多,有的化合物种类虽然含量极少,但对其香气具有独特的作用.枣花香气成分中,酯类化合物和烯烃类化合物含量最多,醇、酸、酮、酚和胺等成分虽然含量很少,但也对枣花独特的香味影响较大;枣花蜜的香气成分则与枣花的成分有所不同,其醇、醛和酸类化合物含量最多,烷烃、酮、酚、酯、萜烯和芳烃等成分虽然含量很少,但也对枣花蜜的风味有一定影响.而香气化合物分子性质均与其结构有密切的联系,从表1-表4列出的枣花和枣花蜜香气成分的分子结构参数和保留指数可以看出,枣花和枣花蜜香气成分保留指数大小,不但与化合物种类有关,还与某种类化合物分子中所包含的取代基有关,取代基的数量、连接的位置、连接的方式以及基团之间相互影响大小,均对保留指数的大小有影响;一般而言,香气成分分子体积越大,其保留指数值也越大,故利用保留指数对挥发性成分进行定性分析,可指导对该物质具有的独特香气作出评价.

在本研究对枣花和枣花蜜建构的两个模型中,连接性指数中的0X,1X,2X,3X是0,1,2,3阶路径指数,5Xc是簇项指数,4Xpc是簇项/链项指数,电性距离矢量中的M1,M2,M14,M15,M21,M32是指—C与—C—、—C与—C=、—C=与—C=、—C—与—C<或—C=、—C—与=O、>C=与—O两两基团之间的相互作用.这里可以看出,影响保留指数大小的结构因素主要有—C—、—C=、—C<、=C<或=O这些片段以及连接方式.正是利用能反映空间连接拓扑结构信息的连接性指数,与能反映电性结构的电性距离矢量相互结合,才可以充分反映保留指数的变化规律,由此构建的神经网络模型才具有良好的预测能力,对枣花和枣花蜜的预测模型的总相关系数能达到0.988 6和0.992 3的优级相关,相应的预测值与实验值的相对平均误差达到2.34%和2.07%.由于没有对枣花和枣花蜜香气成分保留指数进行预测的相关报道,故无法直接进行比较分析,与其他复杂化合物成分的保留指数预测建模相比较,本法建构模型的相关系数达到0.988 6以上,已属较好结果.

4 结 论

1) 优化筛选的连接性指数中0X,1X,2X,3X,5Xc,4Xpc和电性距离矢量中M1,M2,M14,M15,M21,M32,这些结构参数能充分反映枣花或枣花蜜香气成分的空间结构和电性结构信息,它们与枣花或枣花蜜香气成分的保留指数有良好的非线性相关性.

2) 神经网络法模型的预测能力明显优于多元回归分析法,所得结果更为理想.

3) 影响枣花或枣花蜜香气成分保留指数大小的主要结构因素是—C—、—C=、—C<、=C<或=O等基团片段.

猜你喜欢
连接性枣花花蜜
小如枣花的爱情
博采芬芳酿花蜜——“风流三部曲”唱词创作谈
娘的枣花馍
大双领花蜜鸟
为什么花儿会有花蜜
吃花蜜
亚洲航运港口网络连接性分析
枣花
枣花
Imagination的Ensigma Whisper核:适用于可穿戴设备与物联网的业界最低功耗连接性IP