回归分析在梁片质量异常检测中的应用

2021-12-21 09:27姜雪亮
福建交通科技 2021年8期
关键词:理论值粉煤灰骨料

■姜雪亮

(福建省高速公路集团有限公司,福州 352101)

高速公路及桥梁建设施工质量是一个项目中最关心的问题,因为其对群众的生命安全、城市形象和建成之后的经济效益产生重要的影响。 我国经济的高速发展,也带来了公路桥梁行业的飞跃。 截至2020 年底, 全国公路总里程已达519.81 万km、高速公路达16.1 万km,我国桥梁超过80 万座。 但是,飞速发展的公路桥梁行业还存在安全和质量问题,这些问题对人民的生命财产造成重大损失[1]。 而桥梁倒坍、路面塌陷频有发生,暴露出了公路桥梁建设质量、 安全隐患问题, 据统计从2000 年到2020 年国内大型桥梁坍塌事故超80 起, 其中由于施工过程中发生的事故存在多例,主要是因为钢筋混凝土质量病害和安全违规施工风险造成。 混凝土是道路桥梁工程中最重要的材料,其质量的好坏决定着道路桥梁的质量,国内相关道路建设工程师们对此展开了一系列研究,例如杨胜成[2]针对混凝土原材料的成分进行了分析,主要从混凝土的成分水泥、水、矿物质混合材料、集料、化学外加剂的成分的质量以及成分比例进行了分析。 王秉泽等[3]指出,在道路施工过程中混凝土成型后蜂窝、麻面、裂缝和漏浆的质量问题主要是混凝土原材料的质量及质量的波动造成,并进一步指出控制混凝土原材料的配合比是合格的必要保证。 郭亚琼[4]针对道路桥梁施工中混凝土原材料的常见问题进行分析,包括水泥材料质量不合规、 粗细骨料级配低等问题,指出提高混凝土质量对提高道路桥梁的使用寿命有着积极意义。

回归分析因其对响应变量和解释变量之间提供简单的函数模型吸引了一些学者的研究兴趣[5-9]。Najafi A 等[10]采用多回归分析建立预制混凝土安装的生产率模型。Zhang[11]采用回归分析方法对预应力混凝土小箱形梁供度影响因素的正交试验分析。 田程等[12]提出提出一种回归分析的齿面误差修正方法,通过加工参数的灵敏度系数向量与实测齿面误差向量的线性相关性分析来选择变量。 在梁片生产过程中,混凝土的各种材料配比,施工工艺都直接影响梁片的质量,单纯从某种材料的超标,难以判断其对梁片的质量指标是否在正常范围之内。 通过对梁片生产过程中试验数据、理论配比、偏差、材料的实际配比、材料的重量、生产时间、批次等等因素和梁片的质量评价指标张拉力、伸张量、强度、重量用深度学习网络建模, 求解其中的隐藏复杂关系,从而实现在生产过程实时的异常模式识别和预警。通过线性回归分析,能够获得梁片的重量、张拉力、伸长量、强度等因变量与混凝土材料(如骨料、水泥等)之间的关系。

本研究基于大数据分析技术提出了一种基于回归分析模型的梁片强度与混凝土配合比偏差相关性分析模型,该模型以梁片生产过程中混凝土配材料的实际配比与理论配比及偏差作为回归自变量,梁片强度和重量作为因变量,通过对福建省高速公路信息平台采集的29 529 个预制梁片数据相关性分析,为实现对梁片混凝土配比异常的实时检测提供关键技术支持。

1 线性回归分析

1.1 线性回归模型

在线性回归中,数据使用线性预测函数建模,模型的未知参数可以通过模型估计。 这种模型被称作线性模型。 最常用的线性回归建模是给定x 值的y 的条件均值是x 的仿射函数。 线性回归是分析中经过严格研究在实践中得到广泛应用的一种分析方法。 主要是由于其模型线性依赖未知参数比较容易拟合, 产生的估计的统计特性比较容易确定。

如果目标是预测或者映射,线性回归可以对观测数据集X 拟合出一个线性模型。 给定一个变量y和一些变量x1,...xp,这些变量可能与y 相关,通过线性回归分析可以量化y 与x 之间的相关性的程度,评估出与y 不相关的xj, 识别出哪些X 的集合中包含了关于y 的冗余信息。

本研究中假设目标值梁片强度y 与混凝土拌合材料x 之间线性相关, 即满足一个多元一次方程。 通过构建损失函数,来求解损失函数最小时的参数B 和ε。 通常可以表达成如下公式:y^=BX+ε,y^为预测值,其中,自变量x 定义为混凝土拌合中的配合比的成分,因变量y 为梁片混凝土强度,且自变量与因变量为已知。 为了构建这个函数关系,求解线性模型中B 和ε 两个参数 (其中B 是截距,ε是斜率)可实现对一批新增混泥土拌合数据,预测对应的梁片混凝土强度y^,公式如下:

常用的多元回归解方法有最小二乘估计、极大似然估计、矩估计等。 为了求出多元线性回归模型中的参数b0,b1,b2,…,bm,本文将采用应用最为广泛的最小二乘法,即在其数学模型所属的函数类中找一个近似的函数,使得这个近似函数在已知的对应数据上尽可能和真实函数接近。

设c0,c1,c2,…,cm分别是b0,b1,b2,…,bm的最小二乘估计,则多元回归方程为:

其中,c0,c1,c2,…,cm叫做回归方程的回归系数。对每一组xi1,xi2,…,xim,由回归方程可以确定一个回归值y。这个回归值y 与实际观测值y 之差,反映了y 与回归直线的偏离程度。

若对所有的观测数据,y 与y(I=1,2,…,n)的偏离越小, 则认为回归直线与所有试验点拟合得越好。根据微分学中的极值原理xi1,xi2,…,xim,应是方程组的解。 通过整理可将上述方程组写成如下形式:

其中,c=(c0,c1,c2, …,cm)′称为回归方程的系数矩阵,X′ 是X 的转置矩阵。 当X′ X 满秩时,逆矩阵(X′X)-1 存在,系数矩阵C 可以表示为:

上式即为回归模型中参数B 的最小二乘估计。

1.2 皮尔森相关系数

皮尔森相关系数也称皮尔森积矩相关系数(Pearson product-moment correlation coefficient) ,一种线性相关系数,用来反映两个变量线性相关程度的统计量。

相关系数用r 表示,n 为样本量, x,y 为观测值,x,y 为两个变量的均值。r 是描述两个变量之间线性相关强弱的程度。r 的绝对值越大表明相关性越强。

r 的取值在-1 到+1 之间,若r>0,表明两个变量是正相关,若r<0,表明两个变量负相关,r 的0 表示两个变量无线性相关性, r 的绝对值越大表示相关程度越高。

相关分析或简单的线性回归分析可以确定两个数值变量是否显著地线性相关。 皮尔森相关分析提供关于两个变量之间线性关系的强度和方向的信息,而简单的线性回归分析估计线性方程中的参数,可用于根据另一个变量预测一个变量的值。

2 结果及分析

为了分析和量化梁片强度y 与混凝土拌和材料x 的相关性,通过采用回归线性分析法对梁片强度和混凝土拌和材料建模。 梁片数据采用福建省某高速公路建设项目的预制梁片数据和混凝土拌合实际配比数据。试验使用Jupyter notebook 作为开发环境,Python 语言进行编程实现, 并且所有实验选用Windows 10 系统,Intel Core i7,8.00 GB 内存作为实验平台。

2.1 数据描述与预处理

2.1.1 数据描述

预制梁片混凝土数据量主要包括强度理论值、强度实际值、重量理论值、重量实际值、砂实际值、砂理论值、机制砂实际值、机制砂理论值、4.75~9.5 mm骨料实际值、4.75~9.5 mm 骨料理论值、9.5~19 mm骨料实际值、9.5~19 mm 骨料理论值、19~31.5 mm骨料实际值、19~31.5mm 骨料理论值、水泥实际值、水泥理论值、粉煤灰实际值、粉煤灰理论值、矿粉实际值、矿粉理论值、水实际值、水理论值、添加剂实际值、添加剂理论值等。

2.1.2 数据预处理

(1)由于设备异常、数据传输过程中出现丢失等原因,所获得的数据存在着许多“脏”数据,因此,需要进行异常数据的清洗,以保证数据的质量。 首先,对原料都缺失的数据直接删除、过滤;其次,对于任意一种原料存在缺失值也直接删除、 过滤。(2)为了便于分析,根据原料使用情况对数据集进行子集划分,并对每条数据的原料使用情况进行编号,有使用的原料标注为“1”,未使用的原料标注为“0”。 根据原料(砂、机制砂、4.75~9.5 mm 骨料、9.5~19 mm 骨料、19~31.5 mm 骨料、水泥、粉煤灰、矿粉、水、添加剂),本数据集可以分为10 个子集,分别为“0011111111”、 “0111011111”、 “1001011111”、“1001110011”、 “1001111011”、 “1001111111”、“1011010011”、 “1011011011”、 “1011011111” 及“1011111111”。(3)偏差预处理。本试验对数据集进行偏差预处理,求取对应的极大值、方差、取绝对值之后的均值和均值。

2.2 结果分析

2.2.1 变量相关性定性分析

为了解预制梁片、混凝土材料砂、机制砂、4.75~9.5 mm 骨料、9.5~19 mm 骨料、19~31.5 mm 骨料、水泥、粉煤灰、矿粉、水、添加剂等配料之间的相关性,以及各实际混凝土组成成分与预制梁片强度之间的相关性,采用皮尔森系数分析法分析。 皮尔森相关系数是一种线性相关系数,是最常用的一种相关系数。 预制梁片强度理论值与各混凝土材料理论值的皮尔森相关系数分析见图1(a),预制梁片的强度实际值与混凝土各材料成分实际值相关系数分析见图1(b)。

图1 预制梁片强度理论(实际)值与混凝土材料成分理论(实际)值相关系数热力图

从图1(a)可知,预制梁片强度理论值与水泥理论值的相关系数r=0.8, 与9.5~19 mm 骨料理论值的相关系数r=0.48, 与粉煤灰理论值的相关系数r=0.46, 预制梁片理论值与这几种材料成分之间存在较强的相关性。 由图1(b)可知,预制梁片强度的实际值与水泥实际值的相关系数r=0.79, 与9.5~19 mm 骨料的相关系数r=0.46, 与粉煤灰的相关系数r=0.47,由此可以看出,梁片混凝土强度的理论值和实际值与对应配料的相关性呈一致趋势。 因此,在数据采集过程中可以通过对采集的混凝土材料实际值的相关性与理论相关性之间进行一致性检查, 从而可以实时检测出混凝土配比异常值,达到对混凝土配合比施工的实时预警控制,提高梁片生产质量,降低生产成本。

2.2.2 预制梁片混凝土强度相关性分析

为进一步研究分析梁片强度与混凝土拌合材料的相关性,随机选用梁片子集1011011111(未使用机制砂和19~31.5 mm 骨料的梁片),并对数据进行偏差预处理,得到各材料用量偏差平均值作为数据集。 根据变量相关性定性分析,水泥、粉煤灰及9.5~19 mm 骨料与梁片强度采用线性回归模型建模分析见图2。 得到最佳拟合线为:

图2 预制梁片强度与水泥、9.5~19 mm 骨料、粉煤灰线性回归拟合模型

截距:63.810193113930396;

回归系数:[3.11026798;2.46924991;6.38760552];

所得的多元线性回归模型的函数为:y=63.81 +2.46 ×水泥+ 3.11 ×骨料+ 6.38×粉煤灰。 对于给定了粉煤灰和骨料, 如果在水泥上每多投入1 个单位,对应梁片混凝土强度将增加2.46 个单位。

从图2 可知,梁片混凝土强度与水泥用量偏差量、9.5~19 mm 骨料用量偏差及粉煤灰用量偏差存在强相关性,表明随着水泥、9.5~19 mm 骨料及粉煤灰的使用量越大,梁片强度大概率存在明显上升趋势。 特别值得一提的是, 粉煤灰用量偏差均值为0时,即粉煤灰用量越接近理论值时,其梁片强度越高。 因此通过对比混凝土拌和材料的理论和实际值之间的偏差,可以推断这几种材料的配合比偏差对预制梁片的强度有较强的相关性,应该加强对这些材料的配比监督,以保证生产梁片的质量。

3 结论

随着高速公路工程建设“数字化”转型的加速,高速公路信息化建设过程中积累了海量的工程数据。 本研究通过回归线性分析和皮尔森相关性分析,从定性到定量地深入挖掘分析预制梁片与混凝土拌和材料之间的相关性。 研究结果的主要贡献如下:(1)采用皮尔森系数分析实现了梁片强度与混凝土拌合材料的理论和实际值相关性定量分析,可以进行数据一致性检查,如果混凝土拌合材料的实际值与理论值存在较大偏差,将会破坏预制梁片强度与各材料理论与实际的皮尔森相关性一致性。(2)通过线性回归分析表明预制梁片与混凝土拌合材料水泥、9.5~19 mm 骨料以及粉煤灰存在较强相关性,从而在项目施工质量控制过程中,通过对混凝土配合比实时监测, 以降低理论与实际配比偏差,可保证混凝土拌合按理论配比精准投料。 (3)通过对梁片强度等质量指标和混凝土各材料之间的相关性分析,可以对影响梁片质量的混凝土拌合材料配比偏差范围进行精确预测,从而实现异常值实时预警,对项目管理提供精准的管理目标,从而提高梁片生产质量,降低施工成本。 由于回归分析和皮尔森相关性分析是基于梁片强度变量与混凝土配比材料各解释变量之间存在相关性的假设前提。 而梁片张拉、伸长量等混凝土材料之间的关系尚不能通过简单的线性回归分析实现。 需要通过建立非线性模型如深度学习模型来实现, 这是将来研究的方向。

猜你喜欢
理论值粉煤灰骨料
低品质再生骨料强化技术研究
不同骨料替代方案下再生骨料混凝土力学性能分析
基于多重点云与分级聚合的全级配混凝土三维细观结构高效生成方法
GH4169高温合金螺栓高温疲劳载荷理论值的选择研究
粉煤灰陶粒石油压裂支撑剂的制备与表征
粉煤灰综合利用进展及前景展望
再生骨料含量对再生混凝土性能的影响
扩招百万背景下各省区高职院校新增招生规模测度研究
组合变形实验中主应力方位角理论值的确定
ASME规范与JB/T4730对接焊缝超声检测的灵敏度差异探讨