肖朝耿 叶 沁, 卢文静 谌 迪 唐宏刚 杨慧娟 孟祥河 陈黎洪
(浙江省农业科学院食品科学研究所1, 杭州 310021)(浙江工业大学海洋学院2, 杭州 310014)
稻谷是世界上最重要的粮食作物之一,而我国作为世界上最大的稻谷生产国,近几年的稻谷生产量大约为2亿t。随着生活水平的提高,人们对于稻米的质量要求也日渐提升。而稻谷中蛋白质含量是影响稻米食用品质的关键因素之一。研究表明,稻谷蛋白质含量与蒸煮品质之间有密切的负相关,且蛋白质含量的变化直接影响其他成分含量的变化[1-2]。因此,准确测定稻谷中蛋白质的含量对评价稻谷品质至关重要。目前常用的蛋白质含量测定方法有凯氏定氮法、双缩脲法、染料结合法、紫外分光光度法等[3],但这些方法均存在操作繁琐、检测周期长、分析效率低、需要消耗大量的有机试剂、对环境不友好等问题。因此寻找一种更为快速、准确的稻米蛋白质含量分析方法十分必要。
作为一种快速无损的分析方法,红外光谱技术已广泛应用于稻谷脂肪酸、直链淀粉、胶稠度等指标的检测,成为谷物品质分析的重要手段[4-6]。然而对于红外光谱技术测定稻谷中蛋白质含量的分析,目前的研究主要集中于近红外光谱技术(NIR)。例如Sohn等[7]利用近红外光谱技术,经平滑、归一化及二阶导数预处理后结合偏最小二乘法(PLS)对大米中的蛋白含量进行了测定,所建模型的交叉相互验证校正均方差为0.22。俞法明等[8]同样利用NIR对稻谷、糙米、精米和精米粉的样品波谱进行预处理后结合PLS分别建立了稻米蛋白质含量的预测模型,所得交叉验证均方差分别为0.507、0.379、0.336、0.258。此外,谢新华等[9]利用近红外谷物分析仪结合计量数学处理方法建立了单粒糙米蛋白质含量测定的近红外定标模型,其标准集的相关系数为0.924。然而近红外光谱技术在稻米蛋白质含量测定上虽已有较多研究,但相比中红外光谱技术,仍存在灵敏度低、无法直观给出特征基团信息等缺点。而目前中红外光谱技术关于蛋白质的分析研究,主要集中在利用中红外光谱技术定性分析蛋白质结构等问题上[10],而关于利用中红外光谱技术定量分析稻谷中蛋白质含量的研究还鲜有报道。
本研究旨在利用中红外漫反射光谱技术(DR-FTIR)结合化学计量学的方法,通过波谱预处理及波谱区间优化选择,构建稻谷中蛋白质定量检测模型,同时对比研究了DR-NIR与DR-FTIR快速定量分析稻谷中蛋白质含量技术,以期为稻谷的品质检测技术提供参考。
供试的180份稻米样品均由杭州市粮油检测中心站提供,包括57份粳稻谷、60份晚籼稻谷、63份早籼稻谷。所用样品经过砻谷机、高速实验粉碎磨研磨成精米,经150目(106 μm)筛子过筛处理后,储藏于4 ℃冰箱备用。
硫酸、硫酸铜、硫酸钾、硼酸、氢氧化钠、95%乙醇等试剂均为分析纯。
BRUKER TENSOR 27傅里叶变换红外光谱仪;AntarisTMⅡ近红外光谱仪;3100型高速实验粉碎磨研磨仪;消化炉;半自动凯式定氮仪。
稻米直链淀粉含量理化值的测定按照GB/T 5009.5—2010中第一法(凯氏定氮法)进行测定。每个样品测定3次,取其平均值。
中红外漫反射光谱的采集,利用BRUKER TENSOR 27 傅里叶变换红外光谱仪(配有漫反射采样系统)采集样品光谱。样品上样量为80 μg,选用样品杯的规格为直径10 mm,深度为2.3 mm,同时使样品状态尽量保持一致。红外光谱测定范围4 000~400 cm-1,扫描次数32次,分辨率为4 cm-1,测量环境的湿度小于70%,温度保持在25 ℃。以KBr作为背景,光谱数据以log(1/R)形式表示。为了减少样品光谱采集误差,每个样品采集3次光谱。
近红外漫反射光谱采集,利用近红外光谱仪(配有RESULT-Integration操作软件)采集样品光谱;测定范围10 000~4 000 cm-1,扫描次数32次,分辨率4 cm-1。每个样品采集3次,取平均波谱。
采用TQ Analyst 光谱分析软件对所得的红外光谱进行预处理及模型的构建,通过对红外光谱进行预处理,可以优化所建立的模型。预处理方法包括矢量标准归一化(SNV)、多元散射校正(MSC)、一阶导数(FD)、二阶导数(SD)、自动平滑等。
采用偏最小二乘法(PLS)建立定量模型,建模样品约占2/3,其余样品用于验证分析。同时通过采用区间偏最小二乘法(iPLS),向后偏最小二乘法(biPLS),以及向前偏最小二乘法(fiPLS)进行波谱区间选择[11-12],实现模型的优化。通过校正相关系数(R),交叉相互校正均方差(RMSEC)、预测均方差(RMSEP)及残差预测偏差(RPD)评价模型效果[13]。R越接近1,RMSEC和RMSEP的值越小,则表明模型的稳定性越好。而RPD越大,且大于3时表明模型具有较高的预测性[14]。
所得红外光谱分别通过TQ Analyst分析软件结合PLS进行相应的波谱模型分析,同时利用Origin 8.0进行分析。
180种来自不同地区的稻谷样品经辗米机去壳、精米机去除糙米层、粉碎机磨粉后,根据GB 5009.5—2010对其进行蛋白质含量测定。结果显示,其蛋白质含量范围为7.03~10.74 g/100 g,其中测定结果最大值为10.74 g/100 g,最小值为7.03 g/100 g,平均值为8.69 g/100 g。
图1 精米样品蛋白质含量频率分布
图2b是精米近红外漫反射典型的红外光谱图,8 840~8 655 cm-1和5 974 cm-1是C—H的伸缩振动,7 220~7 050 cm-1和5 399~5 245 cm-1是O—H的对称和反对称伸缩振动[18]。相比于近红外光谱,中红外光谱提供了更多的基团振动峰信息,且波谱响应比近红外更强[19]。
a 中红外光谱
b 近红外光谱
图2 精米粉中红外及近红外光谱图
通过对180个稻谷样品的DR-FTIR和DR-NIR光谱图开发不同的PLS回归模型并分别预测蛋白含量,同时通过不同的预处理方法对相应的波谱信号进行校正,所得结果列于表1中。由表1可以看出,DR-FTIR和DR-NIR波谱经过SNV、FD、SD处理后,其模型效果并未得到改善。而经过MSC处理后,所得模型的R、RMSEC、RMESP均有所提高。这可能是因为MSC可以消除颗粒分布不均匀及颗粒大小对漫反射光谱带来的影响[20]。
在MSC预处理的基础上,进一步对波谱进行多项式卷积(Savitzky-Golay多项式法)平滑预处理,其结果显示DR-NIR通过3点平滑处理时,所得模型效果达到最优,其R、RMSEC、RMESP、RPD分别为0.895 6、0.75、0.92、1.28。而DR-FTIR波谱经过5点平滑处理时,所得模型效果最优,其R、RMSEC、RMESP、RPD分别为0.939 0、0.66、0.83、1.42,DR-FTIR模型效果略优于DR-NIR。
表1 波谱预处理对稻谷蛋白含量模型稳定性的影响
表2 波谱区间优化对DR-FTIR稻米蛋白含量模型效果的影响
与全波谱相比,经波谱区间优化后DR-NIR的蛋白含量模型效果均有不同程度的改善,R从0.895 6提高至0.936 9~0.960 7,RMSEC从0.75降至0.34~0.58,RMSEP从1.21降至0.40~0.71。尤其biPLS-34模型的RPD为2.96,模型表现出较好的预测能力。俞法明等[8]同样利用近红外光谱技术对精米和精米粉的样品波谱进行一阶导数和MSC预处理后结合PLS建立了稻米蛋白质含量的预测模型,所得RMSEC分别为0.336、0.258。然而相比DR-FTIR的蛋白含量模型而言,DR-NIR的模型效果仍不及DR-FTIR,这可能是因为NIR的灵敏度明显低于FTIR,从而导致DR-FTIR的蛋白含量模型效果优于DR-NIR。
FTIR蛋白含量最优模型的预测值与真实值之间的散点分布图如图3所示,模型预测值与化学值之间的线性关系为Y预测=0.99X实际+0.008 2,相关系数为0.992 3,说明精米中蛋白含量的预测结果均与实际值高度相关,吻合度高,说明所开发的蛋白含量的DR-FTIR分析模型准确度高。
图3 精米粉蛋白质含量标准集与预测集的红外预测值与真实值之间的线性关系
模型建立后,随机选取10组不同地区不同年份的稻米样品,验证分析模型的准确性,见表3,其中DR-FTIR模型预测组的平均相对误差为1.72%,DR-NIR模型预测组为3.04%,DR-FTIR的预测效果明显优于DR-NIR。吴金红等[23]利用近红外光谱技术结合PLS分别建立了不同品种稻谷蛋白质含量回归模型,结果表明所建立的模型具有良好的预测能力,其外部验证相关系数为0.786 1~0.931 5。Himmelsbach等[24]同样利用NIR结合PLS,通过基线校正和归一化预处理后构建了精米中蛋白质含量的快速检测模型,其所得模型的相关系数R为0.992,外部验证的均方差为0.138。但这些模型的预测效果均不如本实验结果,其原因可能是因为中红外光谱的灵敏度明显优于近红外光谱,且中红外光谱可以直观给出特征基团信息,这也间接证明了中红外漫反射光谱结合biPLS法对于构建精米粉中蛋白含量分析模型的有效性。
表3 DR-FTIR和DR-NIR准确性验证结果
本研究对比了DR-FTIR和DR-NIR在分析精米粉蛋白质含量中的可行性,经分析比较发现DR-FTIR和DR-NIR均可用于精米粉蛋白质含量的快速测定。但当DR-FTIR结合PLS建模,波谱通过MSC、卷积平滑预处理,biPLS波谱选择优化后,所得模型效果优于DR-NIR。此时建模区间为1 700~1 400,1 300~1 200, 900~600 cm-1,相应的R为0.990 1,RMSEC、RMSE分别为0.13、0.25。此外,在模型的准确性中,其外部验证样品的红外预测值与实际值相对误差为1.72%,说明本研究所建立的精米粉蛋白质含量的DR-FTIR模型有效,同时该方法也对稻米的质量监控和监管具有重要的指导意义。