刘登飞 潘 涛
(1、中山火炬职业技术学院光电信息学院,广东 中山528436 2、暨南大学,广东 广州510632)
在甘蔗制糖过程管理中,清糖浆是某一环节的重要产物,清糖浆的锤度(Bx)是最基础、最重要的品质评价指标之一。制糖工业中检测方法通常采用化学试剂分析方法,这种方法耗时、成本也高,无法快速和在线测定。同时中红外光谱测试组分的红外光谱存在着强烈吸收导致不必要的干扰影响。据文献报道,利用傅里叶变换红外(FTIR)和衰减全反射(ATR)技术[1]可以非常好的解决相关问题,使得中红外光谱分析获得了广泛的应用[2,3]。
本文采用MWPLS 算法结合FTIR /ATR 技术建立甘蔗清糖浆锤度的定标模型。为了进一步提高模型精度,试探多种方法,最后结果表明,采用MWPLS 遴选的局部最优波段的最好组合波段比全谱波段所得到预测值具有更高的精度。
105 份甘蔗清糖浆样品及其重要参数参考化学值数据由广东某糖厂提供。样品锤度化学值范围57~67.16%。全体参考化学值的均值和标准偏差分别为62.41%和1.99%。实验器材采用布鲁克公司的V 70 型傅里叶变换红外光谱仪(FTIR)和水平衰减全反射(ATR)样品测量器材。附件器材ATR 的样品槽为硫化锌晶体,450入射角,反射3 次。光谱扫描范围为4500~600cm-1,分束器为溴化钾,传感器敏感元件为R-D,扫描次数为32,分辨率为4cm-1。实验室温度为26±1℃,湿度为45%RH。
做实验时,采集清糖浆样品置于附件器材样品槽中,用ATR方式获得样品的吸收光谱,每个样品重复扫描3 次,计算平均光谱。
光谱技术是一种数据分析技术,需要借助样品重要参数的化学值和光谱数据一起建立数学模型。本文基于所有样品最好单个波数模型的计算效果给出划分定标集和预测集的一种新方法。根据甘蔗清糖浆样品吸光度与重要参数锤度(Bx)化学值的单个波数线性模型
SWPB 是所有测试样品二值的线性关联性,为了让定标模型的分类划分具有良好的科学性和预测性,在这里利用计算机组合筛选,使得定标集和预测集的所有样品的SWPB 值分布一致。
SG 平滑有原谱平滑、s 阶导数平滑多种模式(s=1,2,…),窗口平移的方式,窗口大小(平滑点数: 2m+1)可变。在窗口内,每一个波数点先做最小二乘拟合(多项式次数n 可变),用同次数的多项式来要求各点总残差平方和最小,拟合后计算几何中心光谱平滑值和所有阶导数平滑值,再通过窗口平移,算出所有几何中心点的平滑值,得出原谱和各阶导数的平滑谱。经过计算机程序计算,得到对应的平滑模式共有582 个。经过选择,可以有效消除各种光谱随机噪音,保留有用的光谱信息[4]。
为了减少噪声信号的影响和提高模型的预测性能,本文采用一种基于移动窗口策略的偏最小二乘法来建立PLS 模型。MWPLS 算法考虑到这一点:靠近波数信息一般具有很高的关联性是因为红外光谱的本质是物质分子各种运动能级的外在表现;如果一个波数信息可以用来建立定标预测模型,那么以它为中心其周围的范围内也应该可以建立定标预测模型;如果一个波数信息受到与目标物无关信息的干扰,那么以其为中心其周围的范围内也应该受到与目标物无关信息的干扰[5],所以在这里采用MWPLS 优选波段。
图1 为105 个甘蔗清糖浆样品和纯水的FTIR/ATR 光谱。在3260 cm-1、1633 cm-1附近对应有水分子的强烈吸收。在指纹区域(1500 cm-1~600 cm-1)有非常尖锐的吸收峰,这部分区域包含了丰富的甘蔗清糖浆等主要成份的吸收信息。所以主要考虑3000 cm-1~2400 cm-1和1500 cm-1~600 cm-1这两个区域。
图1 105 个样品和水的FTIR/ATR 光谱
图2 全体样品SWPB 值与化学值的分布
按2.2 节所述,在每个波数信息点ν 上,建立单个波数模型,计算全体样品的预测值与参考化学值的均方根偏差,按照均方根偏差最小找到最好波数vOptimal 为1140 cm-1。根据1140 cm-1对应的最好单个波数模型计算每个样品的预测偏差值,结果如图2。根据图2,所有样品的化学值和预测偏差值值分布平均,没有明显的坏样品,所以,采用所有样品来建立定标预测模型。按照大约2:1 的比例,得到105 个样品中定标集(70个)和预测集(35 个)的范围,划分后用于建模的所有样品的重要参数锤度化学值的初步分析如表1。
表1 105 个清糖浆样品化学值的初步分析
按2.4 节所述,建立移动窗口PLS 模型,移动窗口的起点从4500cm-1到600cm-1,每隔1.8 cm-1一个波数点,移动窗口包含的波数点数为2~2100。本文选取了具有代表性的一部分窗口(内的波数数据点)建立PLS 模型。MWPLS 程序在Matlab 下实现(本文所牵涉到的算法均用Matlab 语言编写实现)。又按2.3节的方法,采用SG 平滑化法,得到结果是SG 平滑预处理之后的定标模型的RMSEP 值都要低于未做预处理的定标模型的RMSEP 值。最终程序结果表明采用MWPLS 遴选的局部最优波段的组合波段可望代替全谱波段得到好的预测效果。
本文采用FTIR /ATR 光谱技术结合MWPLS 算法建立甘蔗清糖浆锤度的定量模型。所采用的定标集和预测集的划分方法具有良好的建模代表性、客观性和稳定性,有望推广。以模型的RMSEP 为优化目标,利用MWPLS 在全谱中遴选出若干个局部最优波段,建立直接PLS 定标模型得到最优组合波段。另外,也对前面组合建立平滑PLS 模型,计算相应的RMSEP 值,得到更优的组合波段。从而表明,SG 平滑光谱预处理要比未做预处理预测效果要好,Matlab 程序采用MWPLS 遴选的最优组合波段所建立的模型具有最好的预测精度,为FTIR/ATR 技术应用于甘蔗清糖浆锤度的定量分析提供优秀的数学模型。