彭玉梅,李雅玲,蔡敏,刘华强,朱学栋
(重庆市渝东南农业科学院,重庆涪陵408000)
苎麻是中国特有的以纺织为主要用途的经济作物,中国的苎麻产量约占世界苎麻产量的90﹪以上,国际上称为“中国草”。如今,苎麻的应用出现多元化,除了用作传统的纺织原料外,由于含有较高的粗蛋白质,还可作为动物饲料。粗蛋白质是由各种氨基酸以肽键连接而成的各种含氮有机化合物的总称,它包括真蛋白质和含氮物(氨化物)两部分,是饲用苎麻的主要营养成分之一。苎麻嫩茎叶干料的粗蛋白(CP)含量在22%左右,是很好的植物蛋白饲料[1]。
粗蛋白含量高低是评价饲用苎麻品种和高产优质栽培措施优劣的一个重要指标。目前,粗蛋白含量的化学测定一般采用凯氏定氮法,该法分析过程复杂,耗时耗力,各种化学试剂的使用不仅污染环境,对分析人员身体健康也有一定的危害。由于测量周期长,对饲用苎麻研究与应用带来诸多不便。
近红外光(NIR)是指波长介于可见光与中红外光之间的电磁波,其波长范围约为780~2526 nm。近红外光谱法是利用有机分子中的C-H、N-H、O-N等含氢基团的倍频与合频吸收,以漫反射方式获得光谱即近红外谱区包含的物质信息,主要用于有机物质定性和定量分析的一种分析技术[2]。该方法不需要任何化学试剂,不产生污染,既安全又环保,属于“绿色分析”技术,而且可对样品内多种成分同时测量,操作简便,分析效率高,成本低。
针对应用近红外光谱法快速测定苎麻粗蛋白含量的可行性作了相关研究,应用偏最小二乘法(PLS)建立苎麻粗蛋白的预测模型,并对预测模型进行验证,以探讨应用近红外光谱仪测定苎麻粗蛋白的可行性。
近红外光谱法实验仪器:聚光科技(杭州)股份有限公司生产的SUPNIR-2720近红外分析仪,相应的分析软件和笔记本电脑。
分析仪器:KDY-9820型凯氏定氮仪,FA100A4分析天平,电热鼓风干燥箱,多功能快速消煮炉。
主要化学试剂:40%氢氧化钠(质量百分比)、2%硼酸(质量百分比)、硫酸(浓硫酸,分析纯)、双氧水(化学纯)、溴甲酚绿(分析纯)、甲基红(分析纯)等。
2.2.1 样品制备
材料来源于重庆市渝东南农业科学院内的苎麻试验地,选取6个营养生长期中性质差异较大的60个样品,其中50个作为校正集样品,10个作为验证集样品。
样品预处理:由于苎麻叶背密生银白色茸毛,不易粉碎,先将1000 g左右苎麻样品85℃烘干,用摇摆式高速粉碎机粉碎,再105℃烘干至恒重,用FZ102型植物粉碎机粉碎过筛,以备光谱扫描和化学分析。
2.2.2 化学值的测定
苎麻粗蛋白的化学测定采用凯氏定氮法[3]。每个样品均进行2次平行测定,同时,用空白测定作为对照,取其算术平均值,有效分析结果作为建模数据。
2.2.3 原始光谱的采集和预处理
用近红外光谱仪采集50个样品的光谱,其波长范围约为1000~1799 nm。将样品装入光谱仪附带的样品盒内,用玻片将样品刮平,保持装载的深浅和紧密均匀一致,采用漫反射的测样方式使样品盒匀速转动,每个样品扫描2次,其光谱数据的平均值作近红外光谱分析。苎麻原始光谱图如图1所示。
从图1可看出,50个样品苎麻的光谱趋势很相近,具有一定的代表性,但由于噪声等各种因素的干扰导致光谱之间存在较大的平移。因此,为消除NIR光谱信号中的基线漂移,背景和光散射等各种干扰信号和噪声,提高模型的预测精度,需对原始光谱进行预处理[4],该处理过程由光谱仪附带的聚光世达近红外分析仪测量分析软件(模型管理)进行。该软件提供了4种类型光谱预处理方法,包括标准化,导数,平滑和信号校正处理。经过比较优化之后,最后采用一价求导,Savitzky-Golay平滑,多元散射校正和均值中心化相结合的方式来完成。
图1 苎麻的原始光谱图Fig.1 The original spectra of ramie
样品的的选择会直接影响建立模型的稳定性和质量的好坏,一般样品的检测参数范围越广,表示样品分布越均匀,所建模型的稳定性和适用性越好。分析所选用的50个苎麻样品的化学值测定结果含量范围为15.34% ~28.08%,平均值为20.09%,表明此批样品粗蛋白有较宽的覆盖范围,可以用作近红外光谱采集建立模型。
光谱预处理后,将光谱数据与样品含量的化学值相关联,建立校正样本集。用光谱仪附带的(模型管理)分析软件,采用偏最小二乘法(PLS)和交叉验证法建立模型。建模中可根据自身经验,剔除并校正异常样品,直接调整建模的各个参数,确定最佳主因子数,进行逐步优化模型。主因子数是影响模型质量的一个最主要参数,太大会出现“过拟合”现象,太小会出现“欠拟合”的现象。因此,通过内部交叉验证的方法,结合各个参数,限制最大主因子数为11。校正样本集的建模与预测情况见图2、图3。图2为PRESS图,该图是模型选择主因子的依据,当PRESS值最小时对应的主因子数,则为最优模型所选择的主因子数。图3为校正样本的预测值和真实值的对比图,该图显示预测值和真实值的吻合程度。
图2 PRESS图Fig.2 Press figure
图3 校正样本化学值与预测值对比Fig.3 Contrast between chemical values and predicted values of calibration sample
好的模型应有较高的相关系数和较低的标准偏差。优化后的校正模型见表1,从表1可知,模型的校正系数RC为0.98,校正标准差SEC为0.43,交互验证标准差SECV为0.59,说明校正模型还是比较稳定可靠的。
表1 校正模型结果Tab.1 The correction model results
校正模型建立后,用10个样品(所备的60个样品除50个用作校正集外的)采用外部验证法对所建模型预测效果进行评价检验。首先用已建的校正模型对10个样品用近红外光谱仪进行扫描预测,用同样的化学方法测定其粗蛋白的含量。将预测值与化学值进行比较,结果见表2。
李延莉等用近红外光谱法测定油菜籽蛋白质时,绝对误差介于0.45-2.75间,认为这在油菜育种材料筛选过程中完全可以应用[5];赵环环等用傅立叶近红外漫反射光谱法测定玉米粒中蛋白质的含量,相对误差介于0.121-11.898[6]。由上表可见,两种研究方法测定值绝对误差介于0.13-1.34,相对误差介于0.63-6.42,平均绝对误差0.72%,平均相对误差3.54%,误差较小。同时通过DPS7.05统计分析软件进行显著性差异分析,在95%置信区间进行真实值与预测值的多重比较,结果显示不存在显著性差异,说明两种方法测定结果比较相近,该模型预测效果较好。
表2 凯氏定氮法化学值和近红外光谱法预测值的结果对比(﹪)Tab.2 Comparison between values by Kjeldahl method and predicted values by near-infrared spectroscopy
为了更好地说明苎麻粗蛋白含量的化学测定值与近红外光谱模型预测值之间的相关性,以化学值为横坐标,预测值为纵坐标,通过绘制化学值与预测值之间的散点图来表明二者之间的相关性(图4),其相关方程为y=0.9319x+0.6596,相关系数为0.936。从图4可见,实验点均匀分布在直线及直线两侧,且偏离不大,说明了化学测定值与预测值之间具有良好的线性关系。
图4 苎麻粗蛋白含量化学值与预测值之间相关图Fig.4 The correlation of chemical values and predicted values of crude protein content in ramie
该文应用近红外光谱仪建立了苎麻粗蛋白含量的预测模型,同时对模型进行了验证。该模型具有较高的相关系数0.98,较低的校正集标准差0.43和交互验证标准差0.59,通过外部验证,化学值与预测值比较接近,二者之间具有较好的相关性,可知,应用近红外光谱法快速测定苎麻的粗蛋白含量是可行的。
通过研究为苎麻粗蛋白的定量分析提供了新的测试方法,具有环保、快速、准确等特点,可以提高工作效率,对苎麻的育种和鉴定,品种筛选等具有指导作用。该研究中使用的样品较少,所建的模型及结论的适用性还有待进一步的检验,在以后的应用研究中应该不断扩大样本集,进一步优化和验证模型。
[1]熊和平,喻春明,王延周,等.饲料用苎麻新品种中饲苎1号的选育研究[J].中国麻业,2005,27(1):1-4.
[2]严衍禄,赵龙莲,等.近红外光谱分析基础与应用[M].北京:中国轻工业出版社,2005:1-9.
[3]鲍士旦.土壤农化分析[M].北京:中国农业出版社,2000:42-108.
[4]肖爱平,冷娟,杨喜爱,等.苎麻纤维素含量近红外预测模型的建立与探讨[J].中国麻业科学,2011,33(4):189-191.
[5]李延莉,孙超才,钱小芳,等.油菜籽品质测定方法(近红外反射光谱法与传统化学方法)的比较[J].上海农业学报,2003,19(1):11 -14.
[6]赵环环,严衍禄.利用傅立叶近红外漫反射光谱技术快速测定玉米子粒中蛋白质的含量[J].玉米科学,1999,7(3):77-79.