青砖茶品质近红外特征光谱筛选及预测模型建立

2020-09-17 02:59王胜鹏龚自明郑鹏程刘盼盼高士伟桂安辉
食品科学 2020年18期
关键词:青砖人工神经网络预处理

王胜鹏,龚自明,郑鹏程,刘盼盼,滕 靖,高士伟,桂安辉

(湖北省农业科学院果树茶叶研究所,湖北 武汉 430064)

青砖茶是湖北省特有的一种黑茶,它是将茶鲜叶杀青、渥堆、蒸制后经压制而成,外形砖面光滑,棱角整齐,紧结平整[1]。青砖茶加工时,渥堆是非常关键的一道工序,会发生一系列以多酚类物质为主的生化反应[2],形成了青砖茶特有的品质特点。饮用青砖茶除利于消化外,还具有分解脂肪[3]、舒畅肠胃[4]、抗氧化[5]、降血糖[6]和杀菌止泻等功效,早已成为我国边疆少数民族群众和外国茶友[7]日常生活中不可或缺的一种必需品。因此,在市场销售时要严把质量关,对青砖茶品质开展评价就显得尤其重要。

通常应用GB/T 23776—2018《茶叶感官审评方法》[8]对小麦和大米等样品[9-12]品质进行评价,目前已实现对绿茶[13]、红茶[14]、乌龙茶[15]和普洱茶[16]等茶类进行品质感官评价。传统感官审评法虽然经典,但专业性较强,易受审评员嗜好差异、身体状况和环境等多种因素影响,结果主观性较强。而化学检测方法较客观、公正,通过测定内含成分[17-19]含量再评价茶品质高低[20]。虽然该方法较为准确,但测定前需先将样品粉碎,测定过程中费时、费力,不利于茶叶品质的实时检测,因此,非常有必要开发一种便捷、科学、客观有效的青砖茶品质评价方法。

近红外光谱主要反映的样品中X—H化学键信息,具有快速、无损的分析优势,目前已经广泛应用于农业、石油化工、纺织业和医药等行业[21-23]。国内外很多学者应用近红外光谱技术实现了对茶中茶多酚、抗氧化活性、咖啡碱[24]等成分含量预测、茶鲜叶质量的快速评估[25]和茶叶种类判别[26];此外,应用近红外光谱还对绿茶[27-28]和红茶[29]品质进行了评价。

但在青砖茶研究方面,目前主要集中在青砖茶加工技术[30]、香气成分分析[31]和菌类鉴别[32]方面,在青砖茶茶汤品质评价方面也开展了部分研究工作[20],但目前还较少有应用近红外技术对青砖茶品质开展快速、无损评价研究的报道。因此,本研究借助近红外光谱技术,分别结合联合区间偏最小二乘(synergy interval partial least squares,siPLS)法、主成分分析(principal component analysis,PCA)和Jordan-Elman nets人工神经网络方法建立青砖茶品质预测模型,为青砖茶品质快速评价提供一种新方法。

1 材料与方法

1.1 材料与仪器

青砖茶样品共130 个,加工时间:2015年5—10月。样品分别来自湖北省赤壁市羊楼洞茶业股份有限公司、赵李桥茶厂有限责任公司、洞庄茶业有限公司和思庄茶业有限公司。120 个样品用于建立模型,并将样品按照3∶1比例划分为校正集(90 个样品)和验证集(30 个样品)2 个集合,其中验证集样品用于检验校正集模型的稳健性。10 个样品来源未知,用于检验模型的实际预测效果。

Antaris II型傅里叶变换近红外光谱仪 美国赛默飞世尔公司。

1.2 方法

1.2.1 感官审评

根据GB/T 23776—2018,用四分法取得青砖茶样品5.0 g,置于250 mL评审杯中,注满沸水,加盖浸泡5 min,按照冲泡次序依次等速将茶汤沥入评茶碗中。3 名感官审评专家对青砖茶品质进行打分,看外形、审评汤色、嗅香气、尝滋味和看叶底,各项分数所占比例分别为20%、15%、25%、30%和10%。满分为100 分,青砖茶品质越好,分数越高。

1.2.2 近红外光谱采集

采用傅里叶变换近红外光谱仪测定,光谱扫描范围4 000~10 000 cm-1,分辨率8 cm-1,检测器InGaAs。在扫描光谱前,需将仪器开机预热1 h待状态稳定后再扫描光谱。扫描过程中,将青砖茶样品装入与仪器配套的样品杯中,采用漫反射方式扫描光谱;为确保采集每个样品的全部近红外光谱信息,扫描过程中样品杯会旋转360°,每个样品扫描3 条光谱,每条光谱扫描64 次,然后进行光谱平均,作为该样品的最终光谱(图1)。

图1 青砖茶平均近红外光谱Fig.1 Average NIR spectra of Qingzhuan tea

1.2.3 光谱数据分析

将每条光谱转化为1 557对数据点于Excel表中保存,数据点间隔为3.86 cm-1,分别应用TQ Analyst 9.4.45软件、OPUS 7.0软件和Matlab 2012a软件对数据进行分析。

从表7中可以看出,西部矿业股份有限公司在2013~2017年五年间的总资产净利率分别为0.01、0.01、0.00、0.00、0.01,企业这五年的总资产净利率的波动幅度极小,表明在2013~2017年五年间企业的盈利状况一直不佳,资产的综合利用效果不好。可通过合理规划运用闲置或暂时闲置的资产,将暂时闲置的资金、固定资产等投入到生产中,提高企业的盈利能力。

为有效去除光谱中夹杂的大量噪声信息,提高光谱的信噪比,分别比较标准变量变换(standard normal variate,SNV)、多元散射校正(multiple scatter correction,MSC)和一阶导数和二阶导数等光谱预处理方法的效果,筛选出最佳预处理方法。

应用siPLS法[33]将预处理后的全部光谱数据均等划分为10~24 个光谱子区间,然后联合其中的2~4 个光谱子区间分别建立偏最小二乘(partial least squares,PLS)法模型,当模型的交互验证均方根方差(root mean square error of cross validation,RMSECV)最小时,此时得到的光谱区间即为筛选的与青砖茶品质密切相关的光谱子区间。

RMSECV按式(1)计算:

式中:n为校正集样品数;为样品i实测值;’为校正集样品i预测值。

将上述得到的最佳光谱子区间进行PCA,以主成分数为输入值,以青砖茶品质为输出值,应用Jordan-Elman nets人工神经网络方法建立青砖茶品质近红外光谱预测模型,所得结果用校正集决定系数()、预测集决定系数()、RMSECV、预测均方根均方差(root mean square error of prediction,RMSEP)表示。其中,以R2越大、RMSEP越小时,模型预测效果越好。

RMSEP按式(2)计算:

式中:n为验证集样品数;yi为样品i实测值;′为验证集样品i预测值。

R2按式(3)计算:

式中:yi和yi′分别为样本中第i个样本实测值和预测值;为所有样本实测值的平均值。

2 结果与分析

2.1 青砖茶品质感官审评

表1 青砖茶品质得分结果Table 1 Sensory evaluation scores of Qingzhuan tea

从表1可以看出,全部青砖茶样品感官品质得分范围为75.00~93.00 分,校正集样品品质得分范围为75.00~93.00 分,验证集样品品质得分范围为83.00~90.00 分,验证集样品品质得分范围处于校正集样品品质得分范围内,表明建模样品的划分是合理的,为建立稳健的青砖茶品质得分预测模型提供了前提条件。

2.2 光谱数据预处理方法比较

应用多种光谱预处理方法对青砖茶样品的近红外光谱数据进行预处理,并应用PLS法分别建立品质得分近红外光谱预测模型,结果见图2。从图2可以看出,不同光谱预处理方法对青砖茶原始光谱预处理后效果不同,建立的青砖茶品质分数PLS模型预测结果差异较大,当无光谱预处理时,建立的PLS模型预测结果最差(=0.597,RMSECV=1.774);随着不同的光谱预处理方法对青砖茶原始光谱进行去噪处理,PLS模型结果都有不同程度的提升,其中以MSC+二阶导数的光谱预处理方法建立的模型预测结果最佳(=0.728,RMSECV=1.205),与无光谱预处理方法模型预测结果相比,RMSECV降低了32.1%,可见,对原始光谱进行预处理可以有效提高光谱的信噪比,这与前人的研究结论一致[34]。但是,图2中建立的青砖茶品质分数近红外预测模型结果还较差,不能较为准确地预测未知青砖茶的品质分数,因此,还需要进一步筛选反映青砖茶品质的特征光谱区间,提升模型的预测效果。

图2 不同预处理方法品质得分PLS模型结果比较Fig.2 Comparison of performance of PLS models with different pretreatment methods

2.3 品质分数预测模型建立

2.3.1 siPLS方法筛选特征光谱区间

表2 青砖茶品质分数siPLS模型结果Table 2 Prediction results obtained from siPLS calibration models for sensory score of Qingzhuan tea

应用siPLS[33]方法分别建立每2~4 个光谱子区间的预测模型,当RMSECV最小时,此时建模光谱区间即为筛选的反映青砖茶品质的特征光谱区间,所得结果见表2。从表2可以看出,随着光谱区间划分从10~24 个逐渐增长的过程中,全部应用4 个光谱区间建立PLS模型,表明4 个光谱子区间含有的建模有用信息比2 个或3 个光谱子区间波段有效信息多,因此,当全光谱划分为一定的光谱子区间时,应用4 个子区间建立的siPLS模型预测效果最佳。随着光谱划分子区间数逐渐增多,建立的siPLS模型RMSECV呈现逐渐变小再逐渐增大的趋势,当全光谱划分为16 个子区间、选用[2 3 7 10]4 个光谱子区间波段建立模型时,RMSECV最小(0.854),此时建模的[2 3 7 10]4 个光谱子区间波段即为筛选的反映青砖茶品质的最佳光谱区间波段,对应的光谱波数分别为4 377.6~4 751.7、4 755.6~5 129.7、6 262.7~6 633.9、7 386~7 756.3 cm-1。可见,应用siPLS方法筛选的特征光谱区间只占全部光谱数据的25.00%,但模型的预测效果又得到了进一步提升,与2.2节中模型最佳结果相比,RMSECV降低了29.1%。在4 377.6~5 129.7 cm-1范围内,是C—H键一级倍频吸收区和C=O二级倍频吸收区;6 262.7~6 633.9 cm-1范围内,是N—H二级倍频吸收区;7 386~7 756.3 cm-1范围内,是C—H键二级倍频吸收区[35]。青砖茶在渥堆过程中,会发生一系列以多酚类物质为主的生化反应,产生新的化学物质,富含大量的茶多酚、儿茶素、表没食子儿茶素没食子酸酯(epigallocatechin gallate,EGCG)、表儿茶素没食子酸酯(epicatechin gallate,ECG)和表没食子儿茶素(epigallocatechin,EGC)等物质,这些物质含有大量的C—H和C=O化学键;青砖茶茶汤中还含有大量的游离氨基酸,游离氨基酸对茶汤的鲜爽味具有很大的关系,与茶汤品质呈正相关,含有较多的N—H化学键,这些物质含有的化学键信息在近红外光谱波段范围内被siPLS方法筛选出来,可见,筛选的特征光谱区间可以有效反映青砖茶的品质[20]。因此,应用siPLS方法筛选的特征光谱区间较好反映了青砖茶的品质,与实际感官审评结果相符。

2.3.2 特征光谱区间PCA

表3 前7 个主成分贡献率Table 3 Contribution rates of the first seven principal components

从表3可以看出,对特征光谱区间进行PCA后,前7 个主成分的贡献率迅速降低,其中PC1贡献率为92.33%,PC2贡献率为4.87%,PC3贡献率为1.95%,PC4~PC7的各个主成分贡献率均低于1.00%;前3 个主成分的累计贡献率为99.15%,可见前3 个主成分的信息就可以代表特征光谱区间的全部信息[36],可用于下一步建立Jordan-Elman nets人工神经网络预测模型。

2.3.3 人工神经网络预测模型建立

以前3 个主成分为输入值,以青砖茶品质分数为输出值,应用Jordan-Elman nets人工神经网络方法建立青砖茶品质分数近红外光谱预测模型。在建立模型过程中,各传递层之间应用的传递函数不同,模型预测结果也不同。本实验在建立人工神经网络模型过程中,学习速率为0.1,比较3 种信息传递函数,分别为linear[-1,1]函数、logistic函数和tanh函数。模型的预测结果见表4。

表4 3 种传递函数人工神经网络模型结果Table 4 Results obtained from three transfer functions of back propagation-artificial neural network

从表4可以看出,3 种传递函数建立的青砖茶品质分数Jordan-Elman nets人工神经网络模型中,线性的linear函数模型预测结果最差(Rp2=0.908,RMSEP=0.525),双曲线型tanh函数模型预测结果最佳(Rp2=0.973,RMSEP=0.386),这是由于在建模过程中,青砖茶光谱中含有的信息较为复杂,而不是单纯一种物质的光谱信息,因此,线性的传递函数linear预测效果会相对较差;logistic函数是S型函数,表明光谱信息存在一定的非线性因素,模型预测结果较线性linear函数稍佳;tanh函数是双曲正切函数,模型收敛速度较快,减少迭代次数,模型的预测结果在3 种传递函数中最佳[37],预测模型也最稳健。

2.3.4 模型应用效果检验

为检验建立的Jordan-Elman nets人工神经网络模型的实际预测效果,对10 个未知样品品质分数,所得结果见图3。

图3 未知样品品质分数预测结果Fig.3 Real versus predicted sensory scores for unknown Qingzhuan tea by the best back propagation-artificial neural network model

从图3可以看出,应用最佳的人工神经网络模型可以准确预测10 个未知样品的品质(=0.971,RMSEP=0.393),预测结果与验证集模型较为接近,表明在tanh传递函数下,应用Jordan-Elman nets人工神经网络模型可以准确的预测青砖茶的品质。

3 结论与讨论

青砖茶品质快速、无损检测是当前的发展趋势,有利于产品销售时品质的实时检测。本实验将近红外光谱技术、siPLS法、PCA和Jordan-Elman nets人工神经网络相结合,建立一个稳健的青砖茶品质预测模型(=0.973,RMSEP=0.386),在不破坏样品的前提下,几秒钟内就可快速、准确地预测青砖茶品质高低,为降低产品的销售成本提供了一种新的途径。同时,在今后应用过程中,通过利用已经筛选的特征光谱区间,剔除了大量无关的光谱信息,还可以有针对性的开发检测青砖茶品质的近红外光谱仪器,而不必使用全波长近红外光谱检测器,可以降低仪器的研发成本,有利于开发的仪器尽早投入使用。此外,为了增强模型的预测精度,还应当采集不同年份的青砖茶样品,对现有模型数据库进行适当扩充,增强模型的适应性。

猜你喜欢
青砖人工神经网络预处理
泥灰雕塑:青砖黛瓦上的技艺传承
求解奇异线性系统的右预处理MINRES 方法
古建筑青砖墙体修复施工技术研究
高COD二噻烷生产废水预处理研究
利用人工神经网络快速计算木星系磁坐标
烈马
人工神经网络实现简单字母的识别
青砖茶 良心做——湖南伟仁永巨茶业股份有限公司
基于预处理MUSIC算法的分布式阵列DOA估计
基于改进人工神经网络的航天器电信号分类方法