韩方凯,张雪柯,宋玉军,吕日琴,张东京,翟科峰
葡萄酒味美、富含大量的生理活性成分,深受消费者喜爱.近年来,随着生活水平的提高,葡萄酒的消费越来越大众化,同时葡萄酒的品质问题亦受到人们的广泛关注.传统的葡萄酒品质评价方法主要包括感官评价法和理化分析分法.感官评价虽简单易行,却具有较强的主观性;理化分析虽然客观可靠,然而每一种理化指标仅能标志葡萄酒一方面的品质特性,无法实现葡萄酒综合品质的准确评判.因此,葡萄酒综合品质检测新技术的开发尤为迫切.
为了克服传统检测方法的缺陷,研究人员采用新型传感器技术,如电子舌、电子鼻、近红外等,开发葡萄酒综合品质的快速检测方法.其中,近红外光谱技术具有检测速度更快、无需样品预处理的明显优势,具有较大潜力.2009年,吴桂芳等人采用近红外结合BP-人工神经网络实现了不同品牌葡萄酒样本的准确识别[1];2010年,刘巍等人采用近红外光谱技术构建了不同产地葡萄酒样本的Fisher判别识别模型,独立样本正确识别率达到86.7%[2];2017年,Jing Yu等人采用近红外结合径向基人工神经网络和最小二乘支持向量机构建了不同葡萄品种的葡萄酒识别模型,预测准确率均在90%以上[3].
极限学习机(Extreme learning machine,ELM)是一种新型前馈神经网络算法,由Huang等人于2006年首次提出[4].与传统采用梯度下降法的神经网络相比,ELM随机产生输入层与隐含层的连接权值及隐含神经元阈值,具有学习速度快,且泛化能力好的优势,现已广泛用于模式识别.然而,目前国内外尚未出现采用近红外光谱技术结合ELM算法建立葡萄酒品质快速识别方法的相关报道.
本研究尝试采用近红外光谱技术结合ELM算法构建不同产地、葡萄品种、品牌葡萄酒样本的快速识别模型,以克服传统检测的缺陷,建立葡萄酒品质快速识别新方法.
研究所用葡萄酒样本信息如表1所示.采样结果保证同一品牌(张裕),同一葡萄品种(赤霞珠),不同产地(山东烟台、河北廊坊、陕西咸阳)的葡萄酒样本各10个;同一葡萄品种(赤霞珠),同一产地(山东烟台),不同品牌(张裕、长城、朋珠)的葡萄酒样本各10个;同一品牌(张裕),同一产地(山东烟台),不同葡萄品种(赤霞珠、蛇龙珠、美乐)的葡萄酒样本各10个.
表1 葡萄酒样本
研究采用傅立叶变换近红外光谱仪(WQF-600N,北京北分瑞利分析仪器(集团)有限责任公司)对葡萄酒样本进行检测分析.仪器参数设置如下,采样分辨率为4cm-1,数据范围为3300.00cm-1~10000.00cm-1,每个样品扫描次数为32次.测样时,直接将葡萄酒样本原液置入样品室内进行光谱扫描.
研究首先采用主成分分析(Principal Component Analysis,PCA)对原始光谱信息进行降维和去共线化,以可以解释原始变量信息90%以上的主成分得分作为输入构建ELM模型.经过多次对比研究,采用阈值传递函数(hardlim)作为隐含层神经元激活函数.随机选取每组样本总数2/5个样本作为测试集,其余样本作为训练集构建ELM模型,并考察了不同隐含层神经元个数对模型预测效果的影响.
近红外光谱是由样品中含氢基团(C-H,O-H,S-H,N-H)分子振动引起的,反映出这些基团基频振动的合频与倍频信息,波普范围内,二级倍频区与三级倍频区,一级倍频区与二级倍频区,合频区与一级倍频区都有一定的重合带,再加上葡萄酒本身的复杂性,导致酒样近红外光谱数据具有严重的共线性.因此,研究首先采用PCA对近红外光谱数据进行预处理,以达到降维和去共线化的目的.不同产地、葡萄品种及品牌的葡萄酒样本近红外光谱信息在不同主成分下的累积贡献率如图1所示.可以看出,前7个主成分的累积贡献率已达到90%以上,可认为能够代表原始变量信息.
图1 不同主成分累积贡献率
ELM测试集预测结果如图2所示.从图中可以产出,针对产地识别,其中本属于山东烟台的2个样本判错给陕西咸阳,正确识别率为83.33%;针对品种识别,其中1个属于赤霞珠的样品错判给蛇龙珠,正确识别率为91.67%;针对品牌识别,共有2个样本预测错误,其中有1个属于张裕牌的样品和1个属于长城牌的样品均错判给朋珠牌,正确识别率为83.33%.
图2 ELM测试集预测结果(A-产地识别,B-品种识别,C-品牌识别)
从ELM模型预测结果可以产出,近红外光谱技术对品质差异性的成品葡萄酒样本预测正确率均在83%以上,效果良好.这主要是由于产地、葡萄品种及生产工艺(品牌)是影响成品葡萄酒综合品质的主要因素.产地、品种及品牌的差异导致终端葡萄酒产品理化成分(如酚类、香气成分、pH、总酸等)的差异[5-7],而近红外光谱技术可以识别出复杂基质中有机物成分及含量的变化,从而可以实现品质差异性葡萄酒样本的识别.
为克服葡萄酒综合品质传统检测方法的局限性,研究采用近红外结合ELM建立葡萄酒品质快速识别方法,结果显示,ELM模型对不同产地、葡萄品种、品牌葡萄酒样本的正确识别率均在83%以上.可以看出,近红外结合ELM可用于葡萄酒综合品质的快速预测.