基于梯度提升回归树算法的生活用纸皱纹等级软测量模型

2020-07-23 08:53张冬启洪蒙纳李继庚
中国造纸 2020年6期
关键词:起皱用纸粗糙度

张冬启 洪蒙纳 李继庚 满 奕,2,*

(1.华南理工大学制浆造纸工程国家重点实验室,广东广州,510640;2.深圳新益昌科技股份有限公司,广东深圳,518000)

我国生活用纸产量近10 年的增长率达5.9%,是全国纸张总产量增长率的2倍以上。在所有的纸产品生产过程中,生活用纸具有最高的单位产品水耗和能耗[1-2],如何提髙生活用纸能效水平和纸张质量是近年来造纸工作者面临的共同挑战。起皱是生活用纸生产中重要的环节,不仅影响纸机的能耗水平和后加工环节,还直接影响纸张的品质。研究表明,生活用纸经过起皱后,纵向伸长率可提高800%,纸张厚度增加300%,挺度下降38%,纸张强度下降70%。因此对起皱过程进行实时监测[3]、定量化测量和表征皱纹质量、监测纸病[4],在提高生活用纸质量和降低能耗方面有着重要作用。

为了对生活用纸皱纹质量进行科学表征,前人已经做了一些研究。在皱纹质量表征方面,Pan 等人[5]测量了生活用纸皱纹深度、频率等指标,分析了这些指标对纸张伸长率和拉力的影响。在生活用纸皱纹质量影响因素方面,屈云海等人[6]通过监测纸机的振动,及时发现故障,从而提高纸张皱纹质量。李广森[7]通过实验,发现影响生活用纸皱纹质量的因素主要有纸张定量、浆料质量、起皱刮刀、起皱率等,进而提出了改善纸张皱纹质量的建议。管敏等人[8]探究了皱纹质量与纸张柔软度之间的关系,研究了起皱刮刀的安装和使用对皱纹质量的影响。在制浆造纸建模方面,李远华等人[9]利用机器学习等知识,建立了基于数据挖掘的抗张强度软测量模型。孟子薇等人[10]建立了基于梯度提升回归树算法的打浆度软测量模型,并取得良好效果。Man 等人[11]通过机理建模,模拟造纸废水处理过程,结果表明,模型效果良好,能够准确得到出水COD 含量。这些成果在一定程度上量化了影响生活用纸皱纹质量的影响因素,为起皱过程的优化提供了依据和参考。然而,影响皱纹等级的关键指标依然存在难以实时测量,存在大滞后或者测量仪器成本较高等缺陷。因此,在工业实践中,对皱纹等级的评定,往往依赖人工经验,这就导致了主观化判断和分类不准确的问题。

为解决生活用纸生产过程中皱纹等级的科学、快速、实时表征问题,本研究基于梯度提升回归树(GBRT)算法,在大量测量数据的基础上,建立皱纹等级软测量模型。为工业在线实时测量皱纹等级,提高纸张质量提供了科学依据。

1 技术路线和研究方法

为建立生活用纸皱纹等级软测量模型,本研究首先测量了生活用纸皱纹质量指标。之后通过相关性分析方法,选取了对皱纹等级影响大的几个指标作为输出结果。通过探究纸张生产中的各个环节对皱纹质量的影响,选择合适的输入变量;最后根据选择的变量,建立基于GBRT 算法的生活用纸皱纹质量软测量模型。本研究的技术路线如图1所示,具体如下。

(1)数据获取及预处理。通过企业数据库获取相应的制浆数据、造纸数据并测量皱纹质量数据。选择合适的皱纹质量指标作为皱纹质量软测量模型的输出,并对原始数据进行预处理,提高数据质量。

(2)特征选择。数据预处理后,通过单因素探究和相关性分析,选择对皱纹质量影响最大的因素,作为生活用纸皱纹质量软测量模型的输入。

(3)皱纹质量软测量模型的建立。由于GBRT 具有精度高、收敛速度快等特点,故本研究以支持向量机(SVM)和AdaBoost 为比对,建立基于GBRT 算法生活用纸表面粗糙度、皱纹深度、皱纹频率软测量模型。3 个软测量模型建立过程类似,后面将以表面粗糙度软测量模型建立为例,进行详细说明。

(4)模型评估及验证。计算误差,模型验证。

图1 生活用纸皱纹质量软测量技术路线图

1.1 生活用纸皱纹质量及其测量

生活用纸皱纹质量分析仪是对生活用纸皱纹质量进行定量化的测量与分析的仪器,其基本测量项目包括表面粗糙度、皱纹深度、皱纹频率、皱纹宽度、细小皱纹、角度、独立峰脊数、针孔等15 个指标。本研究采用的生活用纸皱纹质量分析仪由北京奥普乐科技开发有限公司生产。皱纹等级和质量指标及其物理含义如表1所示。

本研究采用生活用纸皱纹质量分析仪结合现代光学与计算机图像处理,采用多光源光度学立体重构技术进行分析。在获取纸面的不同角度光源图像后,通过分析反光与阴影的变化规律来计算出纸面各部分对应的高度,从而得到纸张的三维信息。其中,皱纹频率、深度等参数,可以从三维高度图中通过傅里叶变换红外光谱仪得到,在温度和湿度相对稳定的条件下,连接好相关软件和仪器,取少量单层待测样品置于试样台上,即可进行测量。图2所示为生活用纸皱纹质量原图和3D合成图。

表1 皱纹等级和质量指标及其物理含义

图2 生活用纸皱纹质量原图和3D合成图

皱纹等级可以通过皱纹指标得到。以某生活用纸企业定量为15.5 g/m2的纸种为例,使用生活用纸皱纹质量分析仪测量其标准纸样的皱纹指标,通过相关性分析得到。图3为标准纸样皱纹指标与皱纹等级的相关性。由图3可知,与皱纹等级相关性最大的指标分别是皱纹深度、表面粗糙度、皱纹频率。选取这3个指标对生活用纸皱纹等级进行定量化表征。图4为标准纸样皱纹深度、皱纹频率、表面粗糙度与皱纹等级的关系。

由图4 可知,对于同一纸种而言,不同皱纹等级的皱纹指标存在一个明显的分层,皱纹等级越高,其表面粗糙度越低,皱纹深度越小,皱纹频率越大,皱纹越细腻。即可以使用粗糙度、皱纹深度和皱纹频率来定量化表征生活用纸的皱纹等级,进一步表明,通过这3个皱纹质量指标就可以得到皱纹等级。

1.2 相关性分析

在皱纹质量软测量模型建立之前,首先需要选择合适的变量作为软测量模型的输入。本研究使用Pearson相关系数进行分析,如式(1)所示。

式中,xi、yi分别代表2 个变量的值;分别为2 个变量的平均值;相关系数能够反映x 与y2 个变量之间的相关性,通常在-1~1 之间;r 的绝对值越大,x与y的相关程度越密切。

图3 标准纸样皱纹指标与皱纹等级的相关性

图4 皱纹深度、皱纹频率、表面粗糙度与皱纹等级的关系

1.3 梯度提升回归树

梯度提升回归树(Gradient Boost Regression Tree,GBRT)模型是Boosting 算法的一种,也是Boosting 算法的一种改进[12]。

GBRT模型的具体过程如下。

输出:回归树fM(x)。

步骤1:模型的初始化,如式(2)所示。

式中,f0(x)是只有1 个根节点的初始决策树,ρ为损失函数最小化常数,L(yi,ρ)为损失函数[13]。

步骤2:迭代生成M棵树。

(1)对于所有的样本N,计算损失函数的负梯度值,并将它作为残差的估计值rim,如式(3)所示。

(2)针对上一步产生的残差生成一棵回归树gm(x),将第m 棵树的输入空间分割成J个不相交区域R1m,R2m,…,Rjm,并计算梯度下降的步长,如式(4)所示。

利用线性搜索估计叶节点区域的值,使损失函数极小化。

步骤3:更新模型,其中Ir表示学习率,如式(5)所示。

步骤4:达到最大迭代次数,或者迭代停止条件时,输出回归树模型f(x)=fM(x)[14],其中M表示树的数量。

1.4 对比模型

支持向量回归(SVR):SVR 是支持向量机(SVM)的一个重要分支、其原理主要为寻找一个回归平面,使得所有样本数据到该平面的距离最近。SVR的性能和核函数的选择有很大关系,常用的核函数是高斯核(RBF)[15]。SVR 能较好地解决有限样本学习问题,可避免局部最优解,但其精度受核函数的影响较大,这是由于采用不同的核函数,SVR将形成不同的方法所致。

AdaBoost:该算法的基本思想是将大量拟合能力一般的弱学习器通过一定方法叠加起来,构成一个具有很强拟合能力的学习器。理论证明,只要每个弱学习器的拟合能力比随机猜测的好,那么当弱学习器的个数趋向于无穷时,强学习器的错误率趋于零[16]。可对损失函数进行极小化优化。与其他算法相比,Ada-Boost 算法具有精度高、鲁棒性好等特点,但是其收敛速度较慢,有噪声时,容易过拟合。

2 模型建立

2.1 原始数据获取及预处理

本研究的数据来源于国内某大型生活用纸厂某生产线2019 年4-5 月的工艺数据和皱纹质量数据,共计380 组。该生产线定量为11 g/m2、13.8 g/m2和15.5 g/m2等8 个纸种,不同的纸种在浆料配比、磨浆工艺和造纸工艺等方面有所不同。因而,获取原始数据时,在保证生活用纸皱纹质量的情况下,每个纸种在起皱率、化学试剂用量、刮刀使用时间等工况方面,都设置了一定的梯度,确保涵盖95%以上的工况。其中,制浆工艺数据和造纸工艺数据从该企业的历史数据库中获取[17],皱纹质量数据由生活用纸皱纹质量分析仪测量得到。

数据预处理主要包括磨前纤维形态的计算和制浆、造纸、皱纹数据的匹配。根据浆料配比和不同浆板的原始纤维形态,计算混合后浆料的纤维形态[10]。然后通过测量生活用纸的皱纹质量,得到生活用纸的表面粗糙度、皱纹深度、皱纹频率等皱纹指标,并且通过数据库系统采集造纸过程中的车速、卷速、烘缸压力、烘缸温度等造纸过程数据,在此过程中,数据库通过记录该批次纸张的轴号,按照轴号将皱纹质量数据和造纸过程工艺数据进行匹配。

2.2 特征选择

为选取合适的变量作为生活用纸皱纹质量软测量模型的输入,本研究采取相关性分析和单因素探究。得到皱纹数据和工艺数据之后,使用相关性分析,探究工艺条件对皱纹质量的影响。以粗糙度为例,造纸过程工艺数据与纸张表面粗糙度的相关性如图5所示。

由图5 可知,对生活用纸表面粗糙度影响较大的几个因素分别为:刮刀使用时间、加热后温度、卷曲率、烘缸压力等,其中,刮刀使用时间与表面粗糙度的相关性最高,对表面粗糙度的影响最大。

为了确保输入特征的准确性,根据相关性分析的结果和相关文献研究[5],本研究分别选取了与皱纹质量相关性大且容易控制的刮刀使用时间、起皱率等6个变量来做单因素探究。在其他情况不变的情况下,分别探究这6个因素对皱纹质量的影响。以刮刀使用时间和起皱率为例,图6 和图7 分别为刮刀使用时间和起皱率对纸张表面粗糙度的影响。

由图6 可知,刮刀使用时间对纸张表面粗糙度影响很大,随着刮刀使用时间的增加,纸张表面粗糙度增加,且刮刀使用时间对纸张表面粗糙度的影响是分阶段的。前20 h 纸张表面粗糙度显著增大,20~60 h纸张表面粗糙度变化不大,60 h后纸张表面粗糙度进一步增加,皱纹质量下降。当超过接受范围时,需要更换刮刀以保证皱纹质量。

由图7 可知,在其他条件相同时,随着起皱率的增加,纸张表面粗糙度上升且接近线性变化,即随着起皱率的增加,纸张皱纹质量变差。因此,想要得到高质量的皱纹,起皱率需控制在一定的范围之内。

综上可知,起皱率、刮刀使用时间等因素对生活用纸皱纹质量的影响很大,这与相关性分析的结果是一致的。为了防止过拟合,选取刮刀使用时间、加热后温度、起皱率、车速、卷速、纤维宽度、细小纤维百分比、长纤比等10 个变量作为模型的输入,构建生活用纸皱纹质量软测量模型。

2.3 皱纹质量软测量模型的建立与评估

本研究选取GBRT 算法,以支持向量机(SVM)和AdaBoost作为对比。每种算法都需要调节相应的参数,本研究选择网格搜索的方法进行参数调节,即对各个参数可能的取值进行排列组合,遍历各个参数的排列组合进行模型优化。为了减小样本分配带来的误差,防止过拟合,通过5折交叉验证的方式对模型进行评分,平均评分最高的参数组合为模型的最优参数。

选择均方误差(Mean Squared Error,MSE)、平均绝对误差(Mean Absolute Error,MAE)、平均相对误差(Mean Relative Error,MRE)以及均方根误差(Root Mean Squared Error,RMSE)[18]作为模型的评价指标,在这4个指标中,数值越小表示误差模型的误差越小,模型效果越好。计算公式见式(6)~式(9)。

图5 造纸过程工艺与纸张表面粗糙度的相关性

图6 刮刀使用时间对纸张表面粗糙度的影响

图7 起皱率对纸张表面粗糙度的影响

式中,yi是实际值,是预测值,N 是验证样本数量。

图8 3种模型软测量表面粗糙度结果与实际值对比

以纸张表面粗糙度为例,调节好参数之后,随机选取80%数据作为训练集,20%数据作为测试集,3个模型的拟合情况如图8所示。由图8可见,在3个模型中,GBRT和AdaBoost效果良好,预测结果的变化趋势与实际值基本相同。其中,基于GBRT的表面粗糙度软测量模型的误差分布如图9所示,由图9可知,模型效果良好,其绝对误差均在1.6以内,其误差主要来自于某些工况突变。3个模型的评价结果如表2所示。

表2 基于3个算法的表面粗糙度软测量模型结果

由表2可知,在这3个模型中,GBRT和AdaBoost的RMSE分别为0.800、0.868,其MRE分别为3.44%、3.88%,模型拟合效果良好,平均相对误差小,能够准确地软测量得到生活用纸的表面粗糙度。在保证模型没有过拟合的情况下,模型精度越高越好,在误差允许的范围内,也可以考虑使用其他模型。

图9 基于GBRT的表面粗糙度软测量模型误差分布

由于皱纹深度和皱纹频率的软测量模型建立过程与表面粗糙度软测量模型建立过程类似,在此不详细介绍。表3 为基于GBRT 算法的皱纹深度和皱纹频率软测量模型评估结果。由表3 可知,基于GBRT 算法的皱纹深度和皱纹频率软测量模型的MRE 分别为3.64%和4.16%,模型效果良好,能够准确软测量得到生活用纸的皱纹质量。因此该模型可广泛应用于生活用纸企业。

表3 基于GBRT算法皱纹深度和皱纹频率软测量模型结果

3 结 论

本研究建立了基于梯度提升回归树(GBRT)算法的生活用纸皱纹等级软测量模型,解决了生活用纸皱纹质量等级在线软测量的问题。分别建立生活用纸的表面粗糙度、皱纹深度、皱纹频率软测量模型,基于GBRT算法3个模型的平均相对误差分别为3.44%、3.64%、4.16%,模型效果良好。该模型能够准确软测量生活用纸的皱纹质量,对实时监测生活用纸皱纹质量、精细控制起皱过程具有重要意义。

猜你喜欢
起皱用纸粗糙度
青藏高原高寒草甸的空气动力学粗糙度特征
生活用纸展区:用心呵护,打造精致之美
材料粗糙度变化对卫星光谱红化效应的影响
侧围外板转角深拉伸起皱缺陷研究
SUV车型流水槽整形开裂起皱原因分析及对策
冷冲模磨削表面粗糙度的加工试验与应用
汽车侧围外板A柱起皱缺陷分析及处理方法
可以用纸锅煮面吗?
CFRP槽的表面粗糙度预测
洗碗时手指皮肤为何起皱?