宋雪健,王洪江,钱丽丽,曾华英,赵文瑜,张东杰
(黑龙江八一农垦大学食品学院,大庆 163319)
草莓(strawberry)营养丰富,滋味酸甜,受消费者青睐,市场广阔[1]。《中华人民共和国农业行业标准》中指出草莓品质包括外部感官指标(色泽、伤碰及畸形果比率等)和内部理化指标(可溶性固形物、维生素、酸度和硬度等)。目前对草莓外部品质的评价方法仅为感官评定,但准确度会受到经验、身体状况及环境等外界因素的干扰,从而影响评判效果。对于草莓内部品质的检测多是采用化学方法进行测定,不仅操作烦琐,检测周期长,效率低下,而且检测费用昂贵[2-3]。因此,研究开发一种快速高效的检测方式,对于草莓品质的研究极为重要。目前对于水果品质的快速检测技术主要有基于介电频谱技术[4],生物散斑技术[5],电子鼻技术,近红外光谱技术(Near infrared spectroscopy,NIR)等,近红外光谱技术具有快速、高效、无损的检测特点而广泛应用于农业、石化、医学、食品等领域。
近红外光分布于可见光和中红外光之间,波长为4 000~12 000 cm-1(780~2 526 nm)。近红外光谱所收集的是物质中分子的单个化学键的基频振动引起的倍频及合频等有效信息,它常常受到含氢官能团中R-H(R 为C、O 或N)的倍频及合频的重叠所影响,因此在近红外光谱范围内所检测的信息主要是含氢官能团振动的倍频和合频吸收。相对于多种组分的复杂物质来说,近红外光谱也并不是各个组分独立光谱的简单累加,因此需要运用“化学计量学”(stechiometry)对图谱进行处理,从而提取出复杂的光谱中的有效信息。近红外漫反射光谱分析方法是将物质中的丰富信息赋予给近红外光谱区,光谱区不同位置的吸收强度与物质分子中的自身结构或者浓度有相关性,因此可以利用该技术来对物质的成分及理化性质进行分析[6],因水果内部结构的差异性,近红外光在内部会存在不同程度的反射、透射及吸收等特点,光谱图会直接反映水果的组分及结构特点等信息,进而实现对水果品质信息的无损采集。数据分析的一种方式是定量分析,是通过建立水果品质的组分值与近红外光谱之间的相关联系,运用化学计量学如偏最小二乘法(partial least square method,PLS)建立回归模型更容易分析系统中的有效、无效信息,也能对复杂多变的自变量进行条理清晰的回归处理[7]。同时研究要对原始光谱进行预处理来消除样品自身、噪声、杂质等因素的干扰[8]。
采用近红外光谱技术能够实现对梨、桃、苹果、柑橘及草莓等多种水果中的多个品质进行不破坏样品的快速检测[9-10]。罗枫等[11]在波长为408.8~2 492.8 nm范围内利用近红外漫反射光谱技术结合化学计量学方法对樱桃中的Vc 含量进行分析研究,结果表明,采用的改进偏最小二乘法建立的模型,其验证集均方根标准误差(Root mean square error of prediction,RMSEP)为0.258 3,R2为87.79%,该模型对樱桃在冷藏过程中Vc 含量的检测具有可行性。杨晓玉等[12]对157 份长枣中Vc 含量进行检测研究,结果表明,在将全波段光谱与特征波段建立偏最小二乘模型和支持向量机模型其校正集的R2为84.71%,验证集的R2为71.49%。王茜等[13]对101 份枇杷果样品采用PLS建立的可滴定酸度和Vc 的模型其预测集R2分别为0.745,0.554,RMSEP 分别为0.048,2.230。金同铭等[14]研究发现采用近红外光谱技术可满足对完整草莓中Vc 含量的精准测定。牛晓颖等[15]对三个品种的草莓采用近红外光谱技术对其可溶性固形物及可滴定酸度含量进行快速检测研究得到了较好的检测效果。虽然取得了一定的成果,但其模型的RMSECV 及R2等量值较低,因此,研究采用近红外光谱技术结合OPUS 软件处理对草莓中的Vc 含量、可滴定酸度含量、可溶性固形物含量及硬度值自动优化处理进行快速建模检测研究,旨在为该技术在草莓品质检测中提供参考依据,进而推动该技术的实际应用能力。
草莓,购置于北京华联超市;草酸,AR500 g,沈阳泉瑞试剂厂;抗坏血酸,AR25 g,天津富宇化工厂;2,6-二氯靛酚试剂(纯度98%),BR25 g,上海研生实业有限公司;氢氧化钠,AR500 g,天津市大茂化学试剂厂;邻苯二甲酸氢钾,AR500 g,穗冠化工;酚酞,AR25 g,天津市大茂化学试剂厂。
TA-XT2i 物性测试仪,上海光学仪器厂;TENSOR II 型傅立叶变换近红外光谱仪,德国布鲁克(北京)科技有限公司,仪器参数为漫反射镀金积分球,InGaAs 检测器。
1.3.1 样品的选取
试验选取新鲜的草莓果实共计120 个,并且形状大小相似、无腐烂、无变形及明显损伤的个体,其中把80 个草莓作为校正样品集,40 个作为检验样品集。
1.3.2 草莓近红外原始光谱的采集
将TENSOR Ⅱ型傅里叶变换近红外光谱仪打开预热30 min 后,利用OPUS 7.5 软件对草莓样品进行光谱扫描,并通过检查信号、保存峰位,扫描背景单通道光谱(每间隔1 h 扫描一次),测量样品单通道光谱等操作,来消除外界信息的干扰提高采集数据的精度。
随机在草莓样品赤道上均匀的取3 个点进行扫描,并取平均值[16],试验所处的环境温度为(25±1)℃,相对湿度为20%~30%,光谱波数范围12 000~4 000 cm-1,分辨率8 cm-1,扫描64 次。
1.3.3 定量分析模型的建立与验证
在进行定量分析时,需要先建立校正模型,即草莓样品中Vc 含量及可滴定酸度含量组分值与其近红外光谱,通过化学计量学处理之后的关系;然后用已知组分的草莓用于模型的验证,进而来衡量模型的检测精度,其原理如下:
PLS 所涉及到的是有限逆矩阵计算过程,而不是对整个矩阵进行处理。PLS 要求矩阵X 是双对角线化的:
矩阵U 和V 是正交的,B 是双对角线的形式。因此可以表示成:
矩阵T 的元素被称为“得分因子”,PLS 中的矢量有时被称之为“载荷”。
PLS 的第一矢量V1用下式选择:
第一偏最小二乘法矢量表示了校正样本的化学值与光谱强度的关系,当化学值Y 通过回归系数再现的时候,PLS 分析将会停止。
采用PLS 在全波数范围内对样品的原始光谱图进行预处理,原始光谱的预处理方式有消除常数偏移量(Eliminate constant offset)、减去一条直线(Subtract a line)、矢量归一化(Standard Normal Variate,SNV)、最小-最大归一化(Minimum-maximum normalization)、多元散射矫正(Multiplicative Scatter Correction,MSC)、内部标准(internal standard)、一阶导数+平滑(5、9、13、17、21、25 点,下同)、二阶导数+平滑、一阶导数+减去一条直线+平滑、一阶导数+矢量归一化+平滑、一阶导数+多元散射矫正+平滑。将测定好的水果样品的指标一一对应的输入给原始光谱,通过系统自动优化筛选出合适的波数范围及预处理方式,通过衡量校正集均方根误差(Root mean square error of cross validation,RMSECV),验证集均方根标准误差(RMSEP)及定向系数(R2)来衡量模型的好坏。其中R2数值越接近100%则预测含量值愈接近真值;RMSECV 数值越小越好[17]。将预测样品集带入模型中通过计算得出均方根误差(RMSEP)值,若RMSEP≤RMSECV 时,说明所建模型预测效果极佳。
1.3.4 草莓中Vc 含量的测定
采用2,6-二氯靛酚法对Vc 含量进行测定,用活性炭吸附色素避免草莓中色素的干扰[18],下同。
1.3.5 草莓中可滴定酸度含量的测定
根据GB/T 12456-2008“食品中总酸的测定”对草莓的可滴定酸度含量进行测定,用换算系数为0.067 的苹果酸表示[19]。
1.3.6 可溶性固形物含量的测定
将草莓研磨榨汁处理,吸取汁液均匀涂在阿贝折射仪上进行测定[20]。
1.3.7 硬度的测定
用物性测试仪测草莓硬度,将草莓沿着中心线切开,切面向下测定,测量3 次,取均值,仪器参数为:探头型号P/50;设置测前速率为1.00 mm·s-1;测试速率为1.00 mm·s-1;测后速率为1.00 mm·s-1;压缩量为30%;触发力为5 g[21]。
1.3.8 数据处理
试验采用spss 19.0 软件对数据进行处理,采用OPUS 7.5 软件对近红外光谱进行数据分析。
采用化学方法测定草莓Vc、可滴定酸度、可溶性固形物和硬度指标含量如表1。
表1 草莓的理化指标Table 1 Physical and chemical indexes of strawberry
续表1 草莓的理化指标Continued table 1 Physical and chemical indexes of strawberry
草莓的近红外光谱图如图1。维生素C 含有多个手性碳原子,并含有能使其在近红外谱区内有强烈吸收的官能团,如4 个-OH 官能团和多个-C=O-以及=CH2和≡CH 官能团,6 800 cm-1左右的吸收峰是R-OH 和O-H 一级倍频吸收峰,由于二者的相互作用使得此处的吸收峰较大。9 400~10 000 cm-1处的吸收峰主要反映了样品内部的碳水化合物。可滴定酸度在大于12 000 cm-1处相关系数波动剧烈[22-24]。
图1 草莓近红外光谱图Fig.1 Near infrared spectrogram of strawberry
采用PLS 进行定量分析不仅能够提取草莓近红外光谱中的主成分,还能对草莓所测指标的浓度主成分进行提取,从而降低了外界噪声、杂散光等因素的干扰,提高模型的检测精度,并且通过系统自动优化处理,能根据组分成分中官能团引起的吸收峰筛选出最优的波数范围及预处理方式。草莓的近红外光谱检测模型如表2。在波数6 089~7 498.5 cm-1范围内采用最小-最大归一化预处理方式建立的草莓Vc 含量校正模型相比于其他处理效果较好,其RMSECV 为0.761,R2为97.64%,并利用验证集样品进行验证结果表明,预测样品集的RMSEP 为0.352,R2为99.52%,RMSEP<RMSECV 因此模型精度较高。故选此方法建立模型,如图2 中a,b 所示。在波数7 498.5~9 400.9 cm-1范围内采用减去一条直线预处理方式建立的草莓可滴定酸度含量校正模型效果较好,其RMSECV 为0.019 5,R2为96.81%,并利用验证集样品进行验证结果表明,预测样品集的RMSEP为0.013 4,R2为98.77%,由RMSEP<RMSECV 故该模型适用于对草莓的可滴定酸度含量进行检测,且检测精度较高,如图2。石吉勇[25]运用近红外光谱技术采用PLS 结合矢量归一化的预处理方式建立的草莓Vc 含量检测模型的校正集相关系数R2=92.35%,验证集相关系数为R2=91.54%,故试验所建立的模型效果要明显优于上述方法。在波数4 249.8~9 400.9 cm-1范围内采用一阶导数+MSC+17 点平滑预处理方式建立的草莓可溶性固形物校正模型效果较好,其RMSECV 为0.713,R2为95.07%,且预测模型的RMSEP为0.037 9,R2为98.75%。在波数4 597.8~5 450.6 cm-1和6 098~9 400.9 cm-1范围内采用减去一条直线预处理方式建立的草莓硬度含量校正模型效果较好,其RMSECV 为144,R2为97.84%,且预测模型的RMSEP 为144,R2为98.09%。牛晓颖等[20]利用近红外漫反射光谱技术在波数为6 000~12 500 cm-1范围内采用最小二乘-支持向量机法建立的草莓可滴定酸度含量检测模型,其RMSECV 为0.028,RMSEP 为0.027,试验与其取得的研究成果要优于该方法。
表2 草莓近红外光谱模型Table 2 Near infrared spectral model of strawberry
续表2-1 草莓近红外光谱模型Continued table 2-1 Near infrared spectral model of strawberry
续表2-2 草莓近红外光谱模型Continued table 2-2 Near infrared spectral model of strawberry
续表2-3 草莓近红外光谱模型Continued table 2-3 Near infrared spectral model of strawberry
为实现对草莓品质的快速高效检测,试验采用近红外光谱技术结合PLS 对120 份草莓进行营养成分含量快速检测研究,结果表明采用以下方式建立的模型效果较高,在波数6 089~7 498.5 cm-1范围内采用最小-最大归一化预处理方式建立的草莓Vc 含量检测模型,校正集RMSECV 为0.761,R2为97.64%,验证集RMSEP 为0.352,R2为99.52%。在波数7 498.5~9 400.9 cm-1范围内采用减去一条直线预处理方式建立的草莓可滴定酸度含量检测模型,其校正集RMSECV 为0.019 5,R2为96.81%,验证集的RMSEP 为0.013 4,R2为98.77%。在波数4 249.8~9 400.9 cm-1范围内采用一阶导数+MSC+17 点平滑预处理方式建立的草莓可溶性固形物含量校正模型效果较好,其RMSECV 为0.713,R2为95.07%,且预测模型的RMSEP 为0.0 379,R2为98.75%。在波数4 597.8~5 450.6 cm-1和6 098~9 400.9 cm-1范围内采用减去一条直线预处理方式建立的草莓硬度含量校正模型效果较好,其RMSECV 为144,R2为97.84%,且预测模型的RMSEP 为144,R2为98.09%。因此,以上试验模型检测精度较高,适用于对草莓内部品质快速检测,试验得到的一系列研究结论为近红外光谱技术在草莓内部品质检测方面的应用提供了理论参考与数据支持,旨在推动该技术逐步从实验化走向应用化,提高草莓品质质量检测水平。前人的研究多局限于对草莓品质的一项或两项指标进行研究,而试验是一次性对草莓四项品质采用近红外光谱技术进行检测分析,是对之前研究的一个汇总并且通过自动优化处理得出的衡量模型精度的参数上略优于之前的研究。
图2 草莓品质校正模型图及预测模型图Fig.2 Strawberry quality correction model map and forecast model map
采用近红外光谱技术对草莓品质进行检测研究时,容易受到地理位置、生长环境及品种等因素的影响,造成检测模型的稳定性及检测精度降低,因为,为提升模型的实用性,未来可以不断的完善模型,不断的补充不同种类的草莓样品,建立完整的数据库。在信息采集及数据处理方面要采用学科进行交叉处理的计算方式进行运算,旨在为数据处理的更具有说服力。也采用多种无损检测检测相结合的方式来建立一种通用能力很强的模型,以达到对草莓及其品种甚至其他农产品的快速检测,并且检测的数据真实可靠、模型的稳定性极佳。