基于不同预处理方法建立苜蓿营养成分近红外快速分析模型的研究

2022-01-05 06:36任晋东
家畜生态学报 2021年12期
关键词:定标苜蓿预处理

纳 嵘,任晋东,胡 波,赵 强,雷 茜

(1.宁夏职业技术学院,宁夏 银川 750021;2.浙江省农业科学院,浙江 杭州 3100212;3.宁夏大北农科技实业有限公司,宁夏 银川 750200;4.北方民族大学 生物科学与工程学院,宁夏 银川 750021;5.植物性农产品贮藏与加工重点实验室,宁夏 银川 750021)

苜蓿以“牧草之王”著称,含丰富的粗蛋白、粗纤维、矿物质和维生素等营养成分,不仅为草食家畜提供优质的粗饲料,也是制作精饲料的良好替代品和配合饲料的原料之一[1-2]。饲料中主要营养成分的检测是保证其产品质量的重要技术手段之一。苜蓿主要营养成分检测所使用的常规分析方法,是一项繁琐的工作,不仅费时费力,还需消耗大量测试样品和化学试剂,检测过程中产生的废料还可能造成环境污染[3]。

近红外光谱分析技术(near infrared spectroscopy,NIRS)是近年来发展较快的、用于有机物质定性和定量分析的新技术[4-5]。近红外光谱分析技术已经在动植物分析检测中被广泛应用[6-10],具有一次性分析指标多、分析速度快、无需样品前处理、能减少和降低化学试剂对环境的污染等优点,从而满足用户对饲料检测快速、准确的需求[11]。近红外光谱分析技术是一项间接分析技术,在实际应用中需要采集大量具有代表性的样本建立模型。由于国内外的苜蓿样本在来源、刈割时间、茬次等方面的差异,所以无法用国内外已建成的近红外分析模型直接预测本区域的苜蓿,必须建立一套适合地域特点的分析模型,才能应用于实践中。

本研究在前人研究的基础上,采用近红外光谱技术,扫描收集94个苜蓿样品的近红外光谱,对苜蓿含水量(Moisture)、粗蛋白(CP)、粗脂肪(EE)、酸性洗涤纤维(ADF)、中性洗涤纤维(NDF)和粗灰分(Ash)等6个营养成分定量检测,采用近红外光谱测定仪系统软件将近红外光谱对应的化学值相关联进行建模。由于近红外光谱的采集容易受颜色、样品颗粒大小等影响,导致光谱的基线漂移和平移,因此有必要对原始光谱进行预处理后再建模,尽管有关近红外光谱分析技术检测苜蓿营养成分的相关研究较多,然而将预处理方法应用于光谱的优化探索相关研究较少。本研究将4种数学处理方法与5种散射校正方法相结合,共20种预处理方法对光谱进行预处理,综合分析不同预处理方法对苜蓿样本建模的影响,得出最佳光谱预处理方法后对苜蓿近红外光谱进行建模,构建最佳的苜蓿营养成分近红外定量分析模型,并对模型进行验证,为饲料营养成分快速分析技术提供一定的参考。

1 材料与方法

1.1 材料与试剂

2018年10月-2019年10月期间,共收集紫花苜蓿干草94个,由宁夏普瑞祥科技有限公司、宁夏大北农科技实业有限公司提供,来自于宁夏德瑞牧场、宁夏东联牧场、宁夏新华牧场和宁夏前进牧场等4个牧场。所有样品粉碎至90%以上,通过40目的样品筛。

1.2 方法

1.2.1 样品的近红外光谱采集 苜蓿样品的近红外光谱采集,采用丹麦FOSS公司DS 2500F型近红外光谱分析仪测定。分别扫描94个苜蓿样品(在850~2 498 nm波长范围内),采集反射量(R),每隔2 nm采集1次,每份样品重复扫描4次,取平均值。

1.2.2 样品的营养成分化学值测定 苜蓿样品的营养成分化学值测定按国家标准法对样品中Moisture、CP、EE、ADF、NDF和Ash的含量进行测定[12],每个样品做3个平行测定,取均值作为常规法化学值,检测方法见表1。

表1 苜蓿营养成分化学值测定方法Table 1 Chemical methods of nutritional components in alfalfa

1.2.3 样品集的划分 选取84个苜蓿样品组成定标集,建立苜蓿营养成分近红外定量分析模型,其余10个样品组成样品验证集,以验证定标模型准确性。

1.2.4 光谱预处理 本研究使用FOSS公司光谱分析软件Win ISI III对扫描后的苜蓿样本光谱进行预处理,剔除异常样品后,剩余样品经过光谱和数学处理,选择不同的数学处理方法和散射校正方法,并比较不同预处理方法对模型建模的影响。

为降低散射对光谱分析的干扰,FOSS公司光谱分析软件Win ISI III软件可以提供以下几种去散射处理技术,包括:对光谱不进行散射校正(None);标准正常化处理+去偏异技术(SNV+Detrend);标准正常化处理(SNV only);去偏差技术(Detrend only);标准多元散射校正技术(Standard MSC)。

数学处理方法包括4方面内容(D,G,S1,S2),D表示对光谱所做导数处理的阶数,G表示导数处理计算所采用的光谱点间隔数量,S1表示一次平滑处理间隔点,S2是二次平滑处理间隔点。

本试验分别采用5种散射校正方法,包括:None,SNV+Detrend,SNV only,Detrend only和Standard MSC,并结合4种数学处理方法,包括“1,4,4,1”,“2,4,4,1”“3,4,4,1”和“4,4,4,1”综合分析后,比较20种不同预处理方法对苜蓿6种常规营养成分含量的近红外定量分析模型参数预测效果的影响,以交叉验证标准误差(SECV)、定标决定系数(RSQ)和交叉验证相关系数(1-VR)为选择依据,得出最佳光谱预处理方法和建模方法。

1.2.5 定标模型的建立与评价 采用改进最小二乘回归法(MPLS),使用FOSS公司Win ISI III近红外光谱分析软件,建立苜蓿Moisture、CP、EE、ADF、NDF和Ash 6种常规营养成分近红外定量分析模型。通过内部验证和外部验证两种形式,评价近红外定量分析模型的预测性能。内部验证以交叉验证标准误差(SECV)、定标决定系数(RSQ)和交叉验证相关系数(1-VR)可以评定苜蓿含水量、粗蛋白、粗脂肪、酸性洗涤纤维、中性洗涤纤维、粗灰分6种常规营养成分定标模型预测性能。交叉验证标准误差(SECV)越小,定标决定系数(RSQ)和交叉验证相关系数(1-VR)越大,证明模型的预测性能越好[19-21]。

外部验证通过比较苜蓿验证集样品的模型预测值与测定值相关性、预测标准误差(SEP)、验证决定系数(RSQ)和交叉验证相对分析误差(RPDV)评价模型预测性能。目前,饲料行业普遍应用的评价标准是,当RPDV≥2.5时,模型的预测性能良好,可用于实际检测;当2.0≤RPDV≤2.5时,定标模型可用于样品的粗略筛选;当RPDV≤2.0时,定标模型的预测性能较差。

2 结果与分析

2.1 苜蓿样品的常规化学成分含量分析

苜蓿样品常规营养成分的化学分析结果如表2所示,苜蓿样品中各营养成分含量变化幅度较大,说明样品范围覆盖面大,数据分布合理,可用来建立苜蓿营养成分近红外定量分析模型。

表2 苜蓿样品常规营养成分的化学分析结果Table 2 Measurements of nutritional components in alfalfa samples

2.2 样品的近红外光谱图与处理分析

经过近红外光谱分析仪得到苜蓿样品的近红外原始光谱图见图1。横坐标代表光谱波长(nm),纵坐标为相对吸光度,苜蓿样品在850~2 498 nm的波长范围内有明显的吸收峰和基本相同的变化趋势,说明苜蓿样品的吸光度与化学成分含量存在线性相关性,苜蓿的近红外原始光谱图可作为建立苜蓿营养成分含量快速检测模型的依据。

图1 苜蓿样本原始光谱图Fig.1 Original near-infrared spectra of alfalfa samples

近红外光谱除含有样品自身的化学信息外,还包含有其他无关信息和噪声,如电噪声、样品背景和杂散光等,因此,要对光谱进行预处理,对原始光谱图进行一阶导数处理后,可得到一阶导数处理后光谱,如图2所示。处理后的光谱消除噪声影响,吸收峰更加明显,更有利于模型的准确性。

图2 一阶导数处理后光谱Fig.2 One derivative spectra of alfalfa samples

2.3 定标模型的建立

2.3.1 定标集超常样品的剔除 使用FOSS公司光谱分析软件Win ISI III软件中的主成分分析技术(聚类分析技术),将光谱数据压缩并分解为主成

分和得分矩阵数据,然后比较各样品光谱间的差异及某样品与主组群品组间的差异,从而确定参与定标的最好样品。用马氏距离评价样品间的差异,将剔除限设置为3.0,经过软件得分计算后,标记20号和29号两个超常样品,使这两个样品不参与定标,对苜蓿定标集的剩余82个样品进行建模。

2.3.2 最佳预处理方法的确定及定标模型的建立 经过5种散射校正方法与4种数学处理方法综合分析后[22],共20种预处理组合,分析比较得出最佳光谱预处理方法和建模方法,确定最佳定标模型参数,结果如表3所示。使用最佳定标模型参数,建立苜蓿Moisture、CP、EE、ADF、NDF和Ash6种常规营养成分含量定标模型。

表3 最佳定标模型参数Table 3 Optimal calibration model parameters

2.4 定标模型的验证

2.4.1 苜蓿营养成分近红外定量分析模型的内部交叉验证 对苜蓿Moisture、CP、EE、ADF、NDF和Ash6种常规营养成分含量定标模型进行内部交叉验证,分析内部交叉验证效果。苜蓿6种常规营养成分含量的预测模型的交叉验证标准误差(SECV)分别为0.2419、0.4615、0.1812、0.8848、1.4332,0.4227;定标决定系数(RSQ)分别为0.9632、0.9257、0.9879、0.9745、0.9511、0.9726;交叉验证相关系数(1-VR)分别为0.9614、0.8715、0.8554、0.9513、0.9218、0.8246。6种营养成分含量定标模型的定标决定系数(RSQ)数均达到0.9以上,交叉验证相关系数(1-VR)数均达到0.8以上。

2.4.2 苜蓿营养成分近红外定量分析模型的外部验证 苜蓿营养成分近红外定量分析模型建立后,用10个验证样品集对模型进行外部验证,预测结果见表4。通过计算预测标准误差(SEP)和验证决定系数(RSQ)来评价模型实际测定效果,进一步检验其优劣。

表4 近红外法与化学法测定苜蓿营养成分含量的比较Table 4 The predictive value by NIRS and chemical value of nutritional components in alfalfa

近红外光谱预测模型的外部验证结果参数如表5所示。运用已建立的近红外预测模型预测集,将预测值和实测值进行相关性分析,其中横坐标代表化学测定的实测值,纵坐标代表预测模型的预测值,结果如图3所示。结果表明:预测标准误差(SEP)分别为0.317、0.551、0.253、3.732、2.332、0.709;验证决定系数(RSQ)分别为0.905、0.929、0.758、0.567、0.886、0.630。交叉验证相对分析误差(RPDV)分别为3.372、3.403、1.925、1.418、3.668、1.660。苜蓿中Moisture、CP、NDF的交叉验证相对分析误差(RPDV)>3,EE、ADF、Ash的交叉验证相对分析误差(RPDV)<2。证明所建成的模型对苜蓿中Moisture、CP、NDF的含量能精准预测,对EE、ADF、Ash含量不能精准预测,还需要调整。

图3 苜蓿样品验证集营养成分的光谱预测值与化学测定值的关系Fig.3 The relationship between predicted value and reference value of nutritional components in alfalfa samples

表5 近红外光谱预测模型的外部验证结果参数Table 5 The external validation parameters of NIRS prediction model

3 讨 论

利用近红外光谱分析技术快速测定苜蓿营养成分在之前已有研究,郭涛[23]采集200份苜蓿干草样品,对样品6种营养成分分别进行定标。采用3种导数处理与7种去散射处理结合,构建的DM和NDF预测模型可以用于实际生产中的精确预测,Ash的预测模型可以用于粗略的分析样品;EE预测模型的湿化学分析值和预测值的相关性较差,模型还需要进一步优化。何云等[24]采集265个苜蓿干草草捆样品,利用近红外光谱技术,采用偏最小二乘(PLS)的化学计量学方法,结合4种散射校正和10种导数处理方法,建立苜蓿干草4个指标的近红外预测模型。薛祝林等[25]采集苜蓿草捆样品229份,利用改进的偏最小二乘法,结合不同光谱处理和数学参数设置,建立苜蓿营养品质和消化率的近红外预测模型,结果表明模型可以用于苜蓿部分营养成分含量的分析。但由于国内外的苜蓿干草在加工工艺、来源和收获季节等方面存在差异,所以无法直接用国内外研究的近红外分析模型预测本区域的苜蓿,必须建立一套适合地域特点或企业的预测模型。本研究广泛收集不同来源的苜蓿样本94个,样本具有较好的代表性,和之前的研究者所使用的预处理方法有所不同,通过4种数学处理方法与5种散射校正方法相结合,共20种预处理方法对原始光谱进行预处理,旨在建立一套更加准确的苜蓿干草常规营养成分含量近红外分析模型,实现苜蓿草营养成分快速测定,解决企业快速检测苜蓿营养成分的需要。

近红外光谱分析结果的准确性受多种因素的影响,主要包括三大类:①样本本身的影响,包括定标样本的数量、来源、成分含量与变异及物理性状等;②样本常规化学测定的准确性,实验室化学分析误差是影响近红外分析准确性的关键性因素。在建立定标时,应严格国家标准对样品成分进行准确测定,减小误差,提高检测数据的准确度;③近红外仪器的稳定性及操作环境。了解影响近红外光谱分析技术的各种因素,降低其影响,是今后减少近红外模型误差、提高效率的关键[26]。说明在实际生产实践中,还需要不断扩充苜蓿模型样本量及验证指标,提高试验检测的准确度,并对模型进行长期校正和维持。本研究中苜蓿的定标模型数据库将应用于企业,并继续更新和扩增模型。

4 结 论

本试验利用近红外光谱分析技术建立了苜蓿干草6个指标的近红外快速分析模型,经过4种数学处理方法与5种散射校正方法综合分析不同预处理方法对苜蓿样本建模的影响,以交叉验证标准误差(SECV)、定标决定系数(RSQ)和交叉验证相关系数(1-VR)为选择依据,得出最佳光谱预处理方法和建模方法,并使用内部验证和外部验证对模型的预测能力进行评价。结果证明:所建成的模型对苜蓿中Moisture、CP、NDF的含量能精准预测,对EE、ADF、Ash含量不能预测,还需进一步调整优化,提高模型的准确性。

猜你喜欢
定标苜蓿预处理
KR预处理工艺参数对脱硫剂分散行为的影响
近红外定标法分析黏/锦/氨三组分纤维含量
环境减灾二号A/B卫星在轨定标模式设计与验证
求解奇异线性系统的右预处理MINRES 方法
手术器械预处理在手术室的应用
我国为世界大豆精准选种“定标”
又到苜蓿飘香的季节
污泥预处理及其在硅酸盐制品中的运用
海洋一号C/D卫星在轨交叉定标设计
苜蓿