郭 桐,张晓萌,宋文波,郭隆海
(1. 北京化工大学 有机无机复合材料国家重点实验室 碳纤维与功能高分子教育部重点实验室 水性聚合物合成与应用工程技术中心,北京 100029;2. 中石化(北京)化工研究院有限公司,北京 100013)
聚丙烯(PP)是五大通用塑料中产量增长最快、牌号最多的产品[1],具有密度小、力学均衡性好、耐化学腐蚀、易加工、热变形温度高及价廉等优点,在众多领域被广泛应用[2]。熔体流动速率(MFR)是评价PP加工流动性的重要指标,对成型工艺起决定性作用[3]。目前,测定MFR通常采用GB/T 3682.1—2018[4]规定的方法,存在操作繁琐、单个试样测量时间长等问题,无法满足PP聚合过程控制中的实时在线检测需求。
近红外(NIR)光谱对—OH,—NH,—CH等含氢基团具有强响应性,且具有快速、无损、环保的优点,可用于有机分子的定性和定量的在线分析[5-8]。张彦君等[9]采用漫反射NIR光谱,结合偏最小二乘法(PLS),建立了测试PP样本MFR的定量分析模型,但选用的PP样本集中分布在MFR(10 min)=3 g左右,针对MFR差异较大的多牌号PP工业产品的适用性有限。谢锦春等[10]提出一种基于NIR光谱分析乙烯-醋酸乙烯共聚物树脂MFR的快速检测方法,但它的MFR分布也较窄,MFR(10 min)最小值和最大值分别为1.7 g和6.8 g。因此,针对宽MFR分布样本的快速无损检测仍是NIR工业化应用需解决的问题。
为了快速准确预测宽MFR分布的PP粒料样本,本工作采用NIR光谱,结合簇状独立软模式法(SIMCA)和PLS,针对160个PP粒料样本,建立了判别MFR分布区间和预测MFR的模型,以实现宽MFR分布PP粒料的快速检测,对PP聚合过程的控制具有重要意义。
160个PP粒料样本由中石化(北京)化工研究院有限公司提供,样本外观如图1a所示。参照GB/T 3682.1—2018规定的方法对PP粒料的MFR进行测定,MFR(10 min)分布区间为0.15~66.46 g,不同MFR的样本数量见图1b。
图1 NIR光谱测试用PP样本及其MFR分布Fig.1 Polypropylene(PP) samples for near infrared(NIR) test and its melt flow rate(MFR).a PP pellet samples appearance; b Numerical distribution of PP MFR;c Integral spherical diffuse reflection accessory for NIR spectroscopy acquisition
采用SupNIR-2750型近红外光谱仪(聚光科技(杭州)股份有限公司),配置有积分球漫反射模式单元(图1c),对PP粒料进行NIR光谱的采集,波长范围4000~10000 cm-1、分辨率8 cm-1、扫描次数64次。
使用CM2000软件(聚光科技(杭州)有限公司)建立NIR光谱预测PP粒料MFR的校正模型。采用Kennard-Stone(K-S)法将样本筛选为校正集和验证集,使用预处理后的NIR光谱,采用PLS方法建立校正模型。以校正相关系数(RC)、预测相关系数(RP)、交互验证校正标准偏差(SEC)和预测标准偏差(SEP)为指标来评价模型性能。
采用SIMCA方法建立了利用NIR光谱判别MFR数值区间的鉴别模型,SIMCA算法是一种以主成分分析(PCA)为基础的判别方法,选定已知类别的训练集进行主成分回归分析,建立已知类别的SIMCA模型,SIMCA算法程序采用MATLAB R2016a 软件编写。
160个PP粒料样本在4000~10000 cm-1范围内的NIR谱图见图2a。从图2a可以看出,所有样本的谱图均非常相似,包括—CH3,—CH2和—CH在6500~9000 cm-1区间的二级倍频吸收和4500~6000 cm-1区间的一级倍频吸收。二级倍频吸收峰主要由8396 cm-1处—CH3、8230 cm-1处—CH2、7170 cm-1处—CH的伸缩振动产生。图2b为一级倍频区间的放大图。5800~5930,5652~5797,4551 cm-1处分别为—CH3,—CH2,—CH的一级倍频吸收。选取MFR(10 min)分别为0.25 g的样本A,0.27 g的样本B,66.46 g的样本C,它们的二阶导数曲线如图2c所示,处理方法为Savitzky-Golay求导(SGD)(2,3)。从图2c可看出,不同MFR的PP样本在—CH3的一级倍频特征吸收区间5900~5930 cm-1处有明显差异,这说明通过NIR谱图可以准确反映MFR信息[11]。
图2 PP粒料的NIR光谱及其二阶导数曲线Fig.2 NIR spectra and its second derivative curve of PP paticles.a NIR spectra; b 1st overtone of —CH3,—CH2,—CH; c 2nd derivative curves of PP particles
采集的NIR谱图中除了有样本组分信息外,还包含有背景噪音、杂散光、基线漂移等杂光谱信息,因此必须进行光谱预处理来消除无用信息的干扰[12]。主要选取均值中心化(MC)、Savitzky-Golay平滑(SGS)、SGD、差分求导(DD)、多元散射校正(MSC)、正交信号校正(OSC)等方法对PP粒料的NIR光谱进行处理。建模波段分别采用全波段和一级倍频吸收波段(4500~6000 cm-1),通过组合不同的预处理方法来优化校正模型。
采用K-S法选择校正集和验证集样本,校正集样本的数量约占样本总数的80%,分别使用4000~10000 cm-1范围内的全部光谱矩阵数据和4500~6000 cm-1区间的一级倍频吸收光谱矩阵数据,采用PLS建立NIR光谱预测PP粒料MFR的校正模型。选择不同的光谱预处理方法建立的校正模型结果见表1。由表1可见,采用MC,SGD(21,3,1),OSC(5)对NIR光谱进行预处理,并使用全波段光谱信息建立校正模型时,模型的SEC和SEP最小,即主因子数为14,RC=0.997,RP=0.988,SEC=1.416,SEP=3.094。
表1 光谱预处理方法对NIR光谱校正模型的影响Table 1 Influence of spectral pretreatment method on the NIR spectral calibration model
预处理后的光谱矩阵与PP粒料MFR性质矩阵之间的相关性见图3a。从图3a可看出,—CH3和—CH2的一级倍频与MFR具有较高的相关性,相关系数均接近1。PP粒料MFR的实测值与预测值的关系见图3b。由图3b可见,样本的预测值与实测值具有较高的一致性,数据点均匀分布在斜率为1的绿色直线附近。但针对MFR较小的样本,尤其是MFR(10 min)小于1 g的样本,校正模型的SEP(3.094)较高,无法满足实际的在线检测要求。这可能是由于PP样本的分布太宽、MFR数值差异较大,在进行模型校正时会忽略小数值样本。因此,需进一步考虑不同MFR数值区间分布的PP粒料分析的实际情况,将PP粒料样本分为多个样本集进行NIR光谱校正模型的建立,从而提高校正模型的准确性。
图3 PP粒料的NIR光谱与MFR的相关性(a)及MFR的实测值与预测值的关系(b)Fig.3 Correlation coefficient between NIR spectrum and MFR of PP paticles(a) and relationship between measured and predicted MFR(b).
采用MC,SGD(21,3,1),OSC(5)的预处理方法,根据MFR对全部PP样本进行分区间建模。首先,将PP样本分为MFR(10 min)<10 g和MFR(10 min)≥10 g两组,并分别建立校正模型,结果见表2。
表2 MFR分区间建模的校正模型Table 2 Correction model with MFR intervals
如表2所示,采用上述两组不同MFR分布区间的PP样本建模与采用全部PP样本建模相比,校正模型的RC和RP均有所提高。对于MFR(10 min)<10 g的PP样本,定标模型的SEP=0.665,与全部PP样本定标模型的SEP=3.094(表1)相比下降了约78%,但该数值相比MFR(10 min)<1 g的样本依然较大。
PP 粒料分区间MRF的实测值与预测值的关系见图4。从图4a可看出,当MFR(10 min)<10 g时,样本分布于绿色直线两边,很少落在直线上。进一步将PP分成MFR(10 min)≤1 g(区间Ⅰ)、1 g<MFR(10 min)<10 g(区间Ⅱ)和MFR(10 min)≥10 g(区间Ⅲ)的样本组,进行MFR不同分布区间的校正建模。如表2所示,区间Ⅰ的PP样本的SEP=0.010,与全部PP样本建模的SEP相比降幅为99%,对于MFR最小(MFR(10 min)=0.15 g)的PP样本来说,SEP也仅为0.7%,满足MFR(10 min)<1 g的PP样本预测精度要求。区间Ⅱ的PP样本的SEP=0.766,与MFR(10 min)<10 g的样本定标模型的0.665相比略有增加,这是由于MFR(10 min)<1 g的样本误差波动幅度小,从而降低了整体预测的离散程度。但对MFR(10 min)介于1~10 g的PP样本,SEP=0.766仍满足精度要求。按区间Ⅰ,Ⅱ,Ⅲ建模所得定标模型的SEC分别为0.001,0.111,0.691,SEP值分别为0.010,0.766,2.877,说明通过分区间建模可显著提高校正模型的预测准确性。
图4 分区间建模PP 粒料MFR的实测值与预测值的关系Fig.4 Relationship between the measured and the predicted values of the PP pellet MFR by correction model with MFR intervals.MFR(10 min) of PP/g:a <10;b ≥10;c ≤1;d 1-10
使用SIMCA对PP粒料样本MFR分布区间判别时,首先需要对每一区间样本的光谱数据进行PCA,为充分利用光谱中的有效信息并避免过拟合,通过交互验证计算预测残差平方和(PRESS)及变量累积贡献率来合理选择主因子数。PRESS与变量累积贡献率随主因子数的变化曲线及PP粒料的SIMCA分类结果见图5。从图5a可看出,当主因子数为5时,PRESS较低,累积贡献率均达到98%以上,因此选择主因子数为5建模。模型以Q和T2(Q为样本与PCA模型中主成分投影之间的残差,用于评价样本与模型拟合程度的好坏;T2用于描述样本在PCA模型内部的远离程度[13])为参数衡量样本与PCA的拟合程度。从图5b~d可看出,采用SIMCA分类方法,区间Ⅰ,Ⅱ,Ⅲ均可明显分类。
图5 PRESS与变量累积贡献率随主因子数的变化曲线(a)及PP粒料的SIMCA分类结果(b~d)Fig.5 Change curve of PRESS and variable cumulative contribution rate with the number of principal factors(a) and SIMCA classification results of PP pellets(b-d).PRESS:predicted residual sum of square;SIMCA:soft independent modelling of class analogy;Q:residual error;T 2:distance degree.MFR(10 min) of PP/g: b <10;c 1-10;d ≥10
采用不同区间的验证集样本,对SIMCA定性模型的效果进行评价,识别效果见表3。从表3可以看出,识别正确率为100%,表明建立的SIMCA定性模型对PP样本的MFR具有很好的识别能力。
表3 SIMCA模型预测结果Table 3 SIMCA model prediction results
1)不同MFR的PP样本在—CH3的一级倍频特征吸收区间有明显差异,即通过NIR谱图可以准确反映MFR信息。
2)针对宽MFR分布的PP样本预测,将PP粒料区分为MFR(10 min)小于等于1 g(区间Ⅰ)、介于1~10 g(区间Ⅱ)和大于等于10 g(区间Ⅲ)的样本区间,分别建立了NIR光谱预测模型,可提高模型的预测准确性。采用MC,SGD(21,3,1),OSC(5)对光谱进行组合预处理时,模型的SEC分别为0.001,0.111,0.691,SEP分别为0.010,0.766,2.877。
3)使用SIMCA模式识别方法,可准确判定PP样本的MFR分布区间,模型判别准确率为100%,进而可选用相应的NIR光谱校正模型对PP样本的MFR进行准确预测。