堵锡华,王 鹏,陈 艳,李 靖,吴 琼,田 林
(徐州工程学院 化学化工学院,江苏 徐州 221018)
清香型白酒的历史源远流长,以辛酸乙酯、丁酸乙酯、乙酸乙酯等为主体香味,具有清香纯正、醇甜绵软、余味爽净的特点[1-3].酿造清香型白酒的主要原料为高粱[4],高粱中淀粉、蛋白质、脂肪和单宁含量的高低,不但影响出酒率,而且直接决定白酒成味成分[5-6],从而影响白酒的风味,故对白酒中风味香气成分的研究,越来越受到科研工作者的重视[7-9].
产于北岳恒山脚下的“恒酒”,是山西省清香型白酒较为典型的代表,它具有清雅协调的香气,入口绵甜,醇厚爽冽,尾净香长;近年来虽然对清香型白酒的研究工作较多,但大部分工作集中于发酵、分析检测等方面[10-14],对香味成分的性质研究少见有报道[15],特别是在食品科学[16]、化学[17]、环境科学[18]、农业科学[19]等领域广泛应用的神经网络(Neural Networks)方法,对恒酒进行性质研究未见有类似的报道,为此笔者[20-22]在以前的工作基础上,采用神经网络方法中的误差逆传播多层前馈网络算法,对文献[15]所列的57个清香型恒酒香气成分的化合物分子,建立了分子结构参数与其色谱保留指数、主要香气贡献分子的气味活度值之间的神经网络预测模型,计算得到的色谱保留指数、气味活度值与文献[15]实验值较为吻合,通过神经网络法对清香型白酒香气成分的性质进行研究,可为提高该香型白酒的特征风味、改良生产工艺、提升感官品质提供科学的理论依据.
在文献[15]所列的57种恒酒香气成分中,其中有色谱保留指数值RI的为57种,有气味活度值OAV(即风味化合物含量与识别阈值的比值,odor activity value)的为30种(OAV>1的化合物即认为对白酒风味有贡献,OAV>10即认为有重要贡献[15]),恒酒香气成分化合物及保留指数实验值列于表1.
应用ChemOffice Chem3D绘图软件,绘制了文献[15]所列的57个恒酒香气成分的分子结构图,再通过使用MATLAB软件,以文献[23-24]方法自编的应用程序,计算57个恒酒香气成分的分子连接性指数和电性距离矢量两类结构参数,去除一半以上数据为0的数组,用MINITAB软件的最佳变量子集回归方法,优化筛选相关性好的结构参数.发现当选用0X、1X、2X、3X、4Xpc、M3、M9、M14、M32共9种结构参数时,与色谱保留指数的相关性最优,建构的模型也最稳定;当选用1X、2X、5Xc、M1共4种结构参数时,与恒酒中有主要贡献的30种香气成分的气味活度值相关性最优.Kubinyi函数FIT的值计算根据公式为
FIT=R2(N-B-1) / (N+B2)(1-R2),
(1)
其中:R2为决定系数,N为样本数,B为选用的变量数.
将上述数据分别列入表1~3中.
表1 恒酒香气成分的结构参数及色谱保留指数
续表1
注:表中RI为保留指数,Exp.为实验值,Pre.为预测值,Err.为误差.
表2 色谱保留指数RI与结构参数的最佳变量子集回归结果
注:R、R2、Radj2、F、S、FIT分别代表相关系数、决定系数、修正的判定系数、Fischer检验值、标准误差和Kubinyi函数.
表3 恒酒香气成分的结构参数及气味活度值
注:表中OAV为气味活度值,Exp.为实验值,Pre.为预测值,Err.为误差.
将文献[15]中列出的57种清香型恒酒香气成分的色谱保留指数,与筛选的两类结构参数中的9种参数进行回归分析,得到线性方程为
RI=641.6850X-1 651.9221X+470.2122X+1 069.5223X-817.7634Xpc+
43.961M3-132.330M9+7.598M14-67.428M32+1 117.901,
(2)
同样将文献[15]中列出的57种恒酒香气成分中具有香气贡献(OAV>1)的30种成分的气味活度值(OAV),与筛选的两类结构参数中的4种参数进行回归分析,得到的线性方程为
OAV=346.1471X-594.5392X+455.5555Xc+215.801M1-80.168,
(3)
如利用式(2)和式(3)对恒酒香气成分的色谱保留指数和气味活度值进行预测,所得预测值并不理想,特别是结构参数与气味活度值的相关性较低,说明恒酒香气成分的连接性指数、电性距离矢量两类结构参数与其保留指数、气味活度值之间不是简单的线性关系.有香气贡献的香气成分及其结构参数、气味活度值列于表3.
表4 Jackknifed相关系数R的检验
为提高模型(2)、(3)预测色谱保留指数和气味活度值的能力,在多元回归分析基础上,进一步采用神经网络法进行研究,对模型(2)以多元回归分析中筛选得到的与保留指数相关性最优的9个结构参数、对模型(3)以筛选得到的与气味活度值相关性最优的4个结构参数,作为神经网络法的输入层变量,以恒酒香气成分的保留指数或气味活度值作为输出层变量,综合Andrea[25]及许禄等[26]学者的建议规则,隐含层变量根据下列公式计算
2.2>N/M≥1.4,
(4)
其中:N为样本数,M为权重.M的计算式为
M=(I+1)H+(H+1)Q,
(5)
其中:I、H、Q分别为神经网络的输入层、隐含层和输出层的变量数.
分别将恒酒香气成分的结构参数9个或4个作为输入变量,色谱保留指数或气味活度值作为输出变量,根据式(4)和式(5)计算得到,隐含层变量H均应取3,故对色谱保留指数预测的神经网络采用9∶3∶1的拓扑结构方式,对气味活度值预测的神经网络采用4∶3∶1的拓扑结构方式,运算设定数据均为默认方式,即隐含层传递函数采用tansig 函数,输出层传递函数采用purelin函数,训练函数采用的为trainlm函数;而且在数据运算中,把香气成分化合物分为训练、测试和验证3个组集,以防止过训练、过拟合.
图1 Jackknifed相关系数R的雷达图
通过构建对色谱保留指数预测的神经网络模型,得到模型的总相关系数R=0.985 5,训练集(每5个数据为1组,取其中的第2、3、5个数据)相关系数R1=0.984 2、测试集(每5个数据中的第1个数据)相关系数R2=0.990 4、验证集(每5个数据中的第4个数据)相关系数R3=0.988 9,这里可以看出,训练、测试和验证3个组集各自的相关系数与总相关系数较为接近,利用所建神经网络模型预测的恒酒香气成分的色谱保留指数与实验值的吻合度较好,两者的平均相对误差为2.59%,优于多元回归法的预测结果,预测值与实验值列于表1中,两者之间关系见图2所示.
图2 色谱保留指数实验值与预测值关系
同理,通过构建对气味活度值预测的神经网络模型,得到模型的总相关系数R=0.999 7,训练集(每5个数据为1组,取其中的第1、3、5个数据)相关系数R1=0.997 4、测试集(每5个数据中的第2个数据)相关系数R2=0.999 5、验证集(每5个数据中的第4个数据)相关系数R3=0.999 9,利用该神经网络模型预测恒酒中具有香气贡献的30个香气成分的气味活度值的预测值与实验值的吻合度也较好,两者的平均误差为2.49,其预测值与实验值列于表3中,两者之间关系见图3所示.
图3 气味活度值实验值与预测值关系
某种类型白酒的特征香气,主要是由其含有的香气化合物成分所决定,而这些成分种类繁多,有烷烃、烯烃、炔烃、芳香烃、酯、酸、醛、醇、酮等多种类型的有机物分子,有的成分含量较多,有的含量极少,但都对其独特的风味影响很大,为判断香气成分对白酒独特香气的贡献大小,可借助气味活度值来进行评价,不管是定性分析香气成分还是定量分析气味活度值,这些香气成分化合物的性质均与分子结构有密切的联系.从表1列出的恒酒香气成分的相关数据可以看出,恒酒香气成分色谱保留指数值的大小,与分子中所含的取代基团有密切的关系,而且基团所处位置、基团之间连接的方式、基团之间的相互影响等,均会影响色谱保留指数的大小;香气成分的碳原子数或杂原子数越多,分子的体积越大,色谱保留指数也越大.
(1) 连接性指数和电性距离矢量的0X、1X、2X、3X、4Xpc、M3、M9、M34、M32,与恒酒香气成分的色谱保留指数有良好的相关性;连接性指数和电性距离矢量的1X、2X、5Xc、M1,与恒酒主要贡献的香气组分气味活度值有良好的相关性;优化筛选的这两类指数能充分反映恒酒香气成分的空间和电性结构信息.
(3) 笔者所建立的神经网络模型,对色谱保留指数和气味活度值的预测结果,明显优于多元回归分析模型所得结果,发现结构参数与香气成分的性质之间具有良好的非线性关系,而不是线性关系.