吕欣欣,冯志恒,林 熙,李赛楠,黄少伟
(华南农业大学 林学与风景园林学院 广东省森林植物种质资源创新与利用重点实验室,广东 广州 510642)
火炬松(PinustaedaL.)为松科松属乔木,原产于美国东南部,是一种生长迅速、适应性强的树种。火炬松材质强韧,用途广泛,可供建筑、桥梁等使用[1],从其树干中割取的树脂多用于医药、化工等行业[2-3],可以提取松香和松节油,两者均是很重要的化工原料[4-5]。松针是松树的针形叶,现代科学研究表明,松针提取物中含有多种对人体有益的重要活性成分,如黄酮类[6]、萜类[7]、挥发油类[8]等化合物,具有抗氧化[9]、降血脂[10]、抑菌[11]、抗癌[12]等药理作用。目前,国内外检测植物中活性成分含量的方法主要有紫外分光光度法、高效液相色谱(HPLC)、气相色谱-质谱联用(GC-MS)和液相色谱-质谱联用(LC-MS)[13-14]等,但这些方法都存在成本高、操作费时、有污染风险等问题。
近红外光谱(near infrared spectroscopy,NIRs)预测技术是基于植物中某成分含量变化引起其对近红外光的吸收产生差异,通过在近红外光谱区采集该植物样品有机分子中含氢基团(O-H、N-H、C-H)的特征信息,经过一系列计算将这些信息与相应的化学值产生联系,建立能够快速预测样品中某成分含量的近红外预测模型,用于该成分含量快速预测的一种方法。该方法在不同领域的研究中多有应用。蒋开彬等[15]建立了火炬松木材基本密度和纤维长度的近红外预测模型,该模型能够满足快速、准确、大规模检测火炬松育种群体木材材质的要求;Karoojee等[16]建立了石斛兰叶片中全氮含量的近红外预测模型,通过预测叶片的全氮含量来达到及时为石斛兰施加氮肥的目的;林艳等[17]基于近红外光谱技术建立了沉香含油量的预测模型,经过验证该模型能够准确、快速地鉴定沉香的结香品质。
目前国内外对于火炬松的良种选育工作多集中在提高木材形质和产脂量上,尚未开展以提高生物活性成分含量为目标的良种选育工作。儿茶素主要是从茶叶等植物中提取出来的酚类物质,在降脂、消炎、抗氧化、抑菌等方面具有良好表现[18-20]。国内外基于近红外技术建立的儿茶素含量预测模型主要集中在茶叶[21]、大豆[22]等作物上,尚未建立松针中儿茶素含量的近红外预测模型。为了节省松针中活性成分含量检测的时间和成本,提高选择效率,本研究采用液相色谱-质谱联用技术(LC-MS)检测火炬松针叶中的儿茶素含量,基于近红外光谱技术建立火炬松针叶儿茶素含量近红外预测模型,旨在为高儿茶素含量火炬松优良品种的选育奠定基础。
1.1.1 主要试剂与仪器 甲醇、甲酸,沃凯化学试剂公司;儿茶素标准品,Aladdin化学试剂公司。API5000三重四极杆液质联用仪,SCIEX质谱系统公司;多功能近红外成分分析仪,瑞典 Perter公司;ACQU ITY UPLC BEH C18色谱柱(2.1 mm×100 mm,1.7 μm),美国Waters公司。
1.1.2 样品的采集与处理 2019年10月,于广东省英德市林业科学研究所火炬松1.5代种子园自由授粉子代林摘取火炬松针叶样品,该子代林于2015年春造林,有8个区组,5株行式小区。采集火炬松刚木质化枝梢上的第1、2颗针叶,带回实验室进行清理,65 ℃烘干处理[23]。将充分干燥的针叶利用粉碎机粉碎,过孔径270 μm的筛子后得到火炬松针叶粉末,将样品装进密封袋后置于装有硅胶的干燥器中保存。试验共采集102个火炬松针叶样品,从中随机选取90个样品作为近红外预测模型的校正集,其余12个样品作为近红外预测模型的验证集。
1.2.1 儿茶素标准曲线的绘制 称取儿茶素标准品1.0 mg,用体积分数80%甲醇配制成儿茶素母液。取适量儿茶素母液用体积分数80%甲醇稀释至质量浓度分别为125,250,500,1 000,2 000,4 000,10 000,20 000 ng/mL,制成儿茶素标准溶液,-80 ℃保存备用。采用API5000三重四极杆液质联用仪对儿茶素标准溶液进行LC-MS检测,以标准溶液的质量浓度为横坐标(X),以峰面积为纵坐标(Y),绘制标准曲线。
1.2.2 松针叶样品前处理 称取200 mg火炬松针叶粉末于2 mL EP管中,加入600 μL甲醇溶液,涡旋振荡30 s,室温超声15 min,4 ℃下12 000 r/min离心10 min,取上清液经孔径0.22 μm的滤膜过滤,将滤液加入到检测瓶中。
1.2.3 松针叶儿茶素含量测定 采用API5000三重四极杆液质联用仪对经前处理的火炬松针叶样品进行LC-MS检测,根据标准曲线计算儿茶素含量,绘制儿茶素含量频率分布直方图。色谱条件:ACQU ITY UPLC BEH C18色谱柱(2.1 mm×100 mm,1.7 μm),进样量5 μL,柱温40 ℃,流动相A为体积分数0.1%甲酸水溶液,流动相B为甲醇,流速0.25 mL/min。梯度洗脱条件为0~1 min,10% B;1~3 min,10%~33% B;3~10 min,33% B;10~15 min,33%~50% B;15~20 min,50%~90% B;20~21 min,90% B;21~22 min,90%~10% B;22~25 min,10% B。质谱条件:电喷雾电离(ESI)源,负离子电离模式;离子源温度500 ℃,离子源电压4 500 V,碰撞气6 psi,气帘气30 psi,雾化气和辅助气均为50 psi;采用多重反应监测(MRM)进行扫描[24]。
1.3.1 近红外光谱信息采集 使用多功能近红外成分分析仪扫描火炬松针叶粉末样品,采集其近红外光谱信息。该近红外成分分析仪扫描的光谱范围为950~1 650 nm,分辨率5 nm,采用漫反射的方式扫描,光斑直径3.5 cm。采集光谱信息前,将需要扫描的针叶粉末样品置于近红外成分分析仪所在实验室24 h,以适应温度等环境因素,减少环境变化对试验过程产生的影响;开机后,先打开软件预热30 min,预热结束后将样品盛在近红外成分分析仪配套的样品杯中进行扫描和光谱信息采集。试验重复装样3次,每次装样重复3次。
1.3.2 近红外光谱信息的预处理和建模 采集的样品近红外光谱信息会受到噪音、仪器、环境中散射光等的干扰[25],进而影响近红外模型的准确性。对采集的近红外光谱信息进行预处理可以在一定程度上降低上述干扰因素对近红外模型造成的影响。从近红外成分分析仪中导出火炬松针叶的近红外光谱信息,利用软件The Unscrambler 9.7(CAMO公司)对获得的光谱信息进行预处理,预处理方式有一阶导数(first deviation,FD)、标准正态变量转换法(standard normal variate transformation,SNV)、平滑算法(smoothing)、乘积分散校正法(multiplicative scattering correction,MSC)和标准化(normalization)以及FD+SNV、MSC+FD,以未预处理光谱信息为对照。通过杠杆值影响图和学生化残差图剔除异常样品,最后结合偏最小二乘法进行建模。
利用Excel 2016进行数据整理和计算,采用SAS 9.4软件进行标准差计算和t检验分析。
以儿茶素标准溶液的质量浓度为横坐标(X),以峰面积为纵坐标(Y),绘制标准曲线,拟合的回归方程为:Y=92.608X-18.515,相关系数R接近0.99,定量限为125 ng/mL,表明在125~20 000 ng/mL时儿茶素质量浓度与峰面积具有较好的相关性,能够满足对火炬松针叶粉中儿茶素含量进行定量分析的要求。
由表1可知,90个火炬松针叶校正集样品的儿茶素含量最小值为4.24 μg/g,最大值为33.74 μg/g,平均值为15.03 μg/g,标准差为5.58 μg/g。由90个火炬松针叶校正集样品儿茶素含量的频率分布直方图(图1)可知,火炬松针叶儿茶素含量基本符合正态分布,可以用于建立预测模型。12个验证集火炬松针叶样品的儿茶素含量最小值为5.29 μg/g,最大值为22.30 μg/g,平均值为11.97 μg/g,标准差为4.04 μg/g。
在样品各近红外光谱预处理方法所获模型的校正集相关系数(RC)、校正集均方根误差(RMSEC)、交互验证集相关系数(RV)及交互验证集均方根误差(RMSEV)中,RC和RV越接近1,RMSEC和RMSEV越小,模型的预测效果越好[26]。不同光谱预处理方法得到的火炬松针叶儿茶素含量预测模型的参数如表2所示。由表2可知,火炬松针叶儿茶素含量近红外预测模型的最优光谱预处理方法为FD+SNV,该法所建立的预测模型主成分数为14,RC为0.969 6,RMSEC为1.308 4,RV为0.817 1,RMSEV为3.105 2,RC和RV值均达到最大,且RMSEC和RMSEV均达到最小,表明该模型的预测效果较好。与未预处理的近红外光谱图(图2)相比,经过FD+SNV预处理后近红外光谱图(图3)的曲线更加聚集,吸收峰更加明显。
为了进一步验证近红外预测模型的准确性,使用建立的火炬松针叶儿茶素含量近红外预测模型预测验证集中12个火炬松针叶样品的儿茶素含量,并与其实测值进行对比,结果(图4)显示,验证集中12个火炬松针叶样品儿茶素含量预测值与其实测值之间有显著的相关性(R=0.880 7),表明所建模型的预测准确度较高。
预测效果好的近红外预测模型首先应该具备较高的RC值[27],刘洪林[28]建立的工夫红茶儿茶素近红外预测模型RC值为0.971 5。本研究建立的火炬松针叶儿茶素含量近红外预测模型校正集RC值为0.969 6,与前人的研究结果接近。
对于建立的近红外预测模型,可通过验证集的实测值和预测值的相关系数对其预测准确度进行评价。陈华才等[29]建立了茶多酚总儿茶素近红外光谱预测模型,其验证集样品的实测值与预测值相关系数R=0.992。Huang等[21]建立的4种儿茶素含量光谱模型的相关系数分别为0.949,0.893,0.968和0.931。本研究验证集中12个火炬松针叶样品儿茶素含量实测值与预测值之间有显著的相关性,相关系数R=0.880 7,与前人的研究结果接近,表明本研究的结果可信且准确度较高。t检验表明,本研究验证集的预测值与实测值存在一定的偏差,但是偏差不显著(P=0.109 4>0.05),偏差产生原因可能与火炬松针叶粉碎不均匀有关,也可能是仪器在长时间工作的过程中产生误差所致。
本研究建立了火炬松针叶儿茶素含量的近红外预测模型,该模型的主成分数为14,RC为0.969 6,RMSEC为1.308 4,RV为0.817 1,RMSEV为3.105 2,预测值与实测值之间有显著的相关性(R=0.880 7),可用于火炬松针叶儿茶素含量的预测。