马国杰, 赵锐,2, 淡丹辉,3, 张志, 马福强
1.新疆大学 建筑工程学院,乌鲁木齐 830017;2.新疆建筑结构与抗震重点实验室,乌鲁木齐 830017;3.同济大学 土木工程学院,上海 200092;4.中建新疆建工集团第四建筑工程有限公司,乌鲁木齐 830000
为了保障大跨度空间结构的安全性, 越来越多大跨度空间结构安装了健康监测系统[1-2].对大跨度空间结构长期的监测实践发现, 完整且持续的监测数据对于后期科研工作的开展非常重要, 这使得监测数据的处理修复成为一项十分重要的工作[3].正因为如此, 监测数据识别修复也是近年来重要的研究课题.
目前监测数据的识别修复技术手段主要应用在气象学领域和管理科学领域[4-5], 而在大跨度空间结构监测领域中关于非均匀温度场的监测数据处理方法研究较少, 特别是大跨度空间结构监测的数据处理方法多种多样, 针对温度、应力和加速度等数据处理均需要有针对性地采用不同的处理手段.从以往的学者对温度数据处理方法的研究中可以看到, 研究混凝土温度和研究钢结构温度采用的方法有差异, 并且针对具体研究目的, 数据处理手段也不尽相同.比如: 宁泽宇等[6]使用移动平均线来识别大坝混凝土温度, 韩晓健等[7]采用改进的数据跳跃法剔除梁桥温度数据的粗差, 高照明[8]使用三倍西格玛准则作了异常数据识别处理, 这些方法看似可以对温度监测数据进行处理, 但是在细分的非均匀温度场研究领域, 改进的数据跳跃法并不适用于大跨度结构的非均匀温度场监测数据的处理, 并且无论是三倍西格玛准则还是移动平均线处理法, 均是在原始数据的处理基础上进行数理统计分析, 非常依赖原始数据的准确性, 没有考虑各地区非均匀温度分布的各异性, 导致方法应用不够灵活, 而且未考虑极端温度的影响.可见传统的温度识别法研究仍不够深入, 在处理温度数据上过于“呆板”, 往往是使用固定的分析参数进行应用, 并且在处理数据时忽略了极端温度的突变情况, 容易忽略非均匀温度场中关键的极端温度数据的影响, 即把极端温度产生的突变温度“抹去”, 不利于对非均匀温度场的研究.而BOLL通道法[9-10]虽然在金融领域应用较多, 但是经过改造之后应用于结构监测领域可以对异常温度数据处理有较好效果.因此本研究首次引入第三方数据与原始数据互相验证分析, 以此构建BOLL通道上下轨线, 处理温度数据时可以兼顾非均匀温度场对数据精细化、区域化的需求特点, 并提出以偏离值衡量非均匀突变温度的发生概率频次, 得到改进型BOLL通道法, 达到较好完成对非均匀温度场监测数据处理的目的.与此同时, 若从非均匀温度场中识别出由传感器等非自然因素造成的异常温度, 那么剔除识别出来的异常温度后, 需要选择合适的温度补全方法.以往的处理是使用线性插值法[11]对温度值进行插值, 但是线性插值法在处理非均匀温度场的研究数据时过于粗糙, 无法体现温度数据的细部变化, 而IDW算法[12-13]基于多测点的温度之间的插值, 考虑了非均匀温度场的细部区域不均匀温度的影响, 综合各测点温度的权重影响系数, 克服了线性插值法的缺点, 得到的数据特征较好, 可以较好地应用于非均匀温度场缺失数据的修复.对于非均匀温度场研究的监测数据中另外一项应力数据缺失的修复方面, ZHANG Z Y等[14]使用线性回归的方法对数据进行修复, 但是仅仅是针对监测数据中的应力数据的修复, 并且该方法的修复精度仍有待提高; 赵昕等[15]利用BP神经网络基于相关性分析得到了大跨高空连廊的应力修复数据, 提供了相关的研究思路.因此本研究借此提出两种基于BP神经网络的应力数据修复方法, 即基于温度相关性的应力数据处理方法和基于多测点相关性的应力数据处理方法, 以此来验证BP神经网络在修复大跨度空间结构监测应力数据方面的可靠度.
根据以上研究思路, 本研究结合BOLL通道法、IDW算法与机器学习算法, 提出一种适用于非均匀温度场监测数据处理的改进型BOLL通道法, 用于识别异常温度数据; 然后利用IDW算法对缺失温度数据进行修复; 最后利用机器学习中的BP神经网络算法建立一种基于温度相关性、多测点相关性的神经网络模型, 完成对监测数据中应力数据的修复.整体的数据处理流程见图1.最后通过某大跨度空间结构的监测数据验证本研究方法的可靠度.
图1 整体处理流程
本研究方法由两个子步骤组成, 先是基于改进型BOLL通道法识别出异常温度数据, 然后剔除异常温度数据, 最后通过IDW算法进行重建, 补全缺失温度数据.
BOLL通道法是利用统计学原理求出股价的标准差及其信赖区间, 然后对异常波动值进行识别, 在实际应用中有较好的识别作用.自然界的温度升降是属于一种缓和的温度波动.温度的上升和下降都是在前面一个温度数值的基础上增长或者减少, 其波动形态类似于股价波动, 因此本研究以BOLL通道法作为参考借鉴, 对这种统计方法进行改造, 将其引入土木工程结构健康监测领域, 得到改进型BOLL通道法.
BOLL通道法的计算公式为:
式中:MB为中轨线, 表示数据变化的平均趋势;N为n个数值的移动平均周期数,MA为移动平均线;UP为上轨线, 是区间上限的阈值;DN为下轨线, 是区间下限的阈值;MD为计算数据的标准差;Ci为第i个数据值.
这里借鉴BOLL通道法的原理, 依据自然界温度升降的变化规律, 引入温度通道的概念得到改进型BOLL通道法, 得到:
改进的细节说明: 中轨线由测点实际温度值构成, 因为考虑非均匀温度场的敏感性, 不用像(1)-(4)式那样进行移动平均处理.在构建上下通道时,(1)-(4)式是采用数据经过移动平均后得出来的数值加减两倍标准差构成, 此计算步骤的值依赖原数据的准确性.本次改造舍弃依赖原数据进行数据分析的方式, 把原数据与第三方数据结合分析, 降低原数据对指标识别准确性的影响.本研究的方法巧妙地引入第三方气象数据构建上下轨线, 由于不同地区的气象数据有区域性, 非均匀温度场的特性也受区域气温的影响带有区域性, 以当地第三方气温作为核验非均匀温度场的温度监测数据具有较好的契合度.下轨线由当日的气象最低气温构成, 考虑的是极端气温的影响, 无论是夜间无太阳辐射影响, 还是区域极端降温, 区域最低气温可以较好衡量下轨线的准确性.偏离值是指测点温度值减去最高日气温值, 不是每个测点温度值都会高过最高日气温值, 偏离值是考虑到太阳辐射到结构上造成结构温度场分布非均匀, 导致局部测点出现测点温度值高于最高日气温值的情况, 研究非均匀温度场需要重视这些出现偏离值的测点的影响; 因此上轨线就是考虑到这种影响, 所以上轨线是由最高日气温值加上偏离值的平均值再加上两倍偏离值的标准差, 这种情况就能把处理非均匀温度场的数据细部化, 兼顾非均匀温度场产生的“突变”温度的影响, 在识别出异常温度点的同时最大程度地保留真实的非均匀温度场的“突变”温度.
IDW算法又叫空间插值算法, 是一种通过离散的空间数据计算未知空间数据的方法.在本研究中, 分布于空间结构各处传感器测量的是三维空间温度场, 可以认为三维空间温度场的插值就是通过已知点的温度值Ti内插计算未知点温度值T.其思想是离所估算的未知温度点的距离越近的已知温度点对该未知温度点的影响越大, 距离越远的已知温度点影响越小, 甚至可以认为没有影响.在计算某未知温度点的温度值时, 假设离该未知温度点最近的n个已知温度点对其有影响, 那么这n个点对该未知温度点的影响与这些已知点到未知点之间的距离成反比.
已知点的坐标为(xi,yi), 未知点的坐标为(x,y), 有:
其中:Z(x,y)为未知点的估算温度值;x为未知点的横坐标;y为未知点的纵坐标;Di为已知温度点到未知温度点的距离;p是距离的幂, 一般取2;m为参与计算的已知温度点的个数;Zi为已知温度点的温度值.
在运用时, 第1步是利用(11)式计算出所有已知温度点到未知温度点的距离, 第2步是把距离值和已知温度点的温度值代入(10)式中计算得到未知点的温度值.
某体育馆的屋盖结构是长为131.98 m, 宽为90.19 m的大跨度空间结构, 网架支撑条件为下悬柱支撑.本研究选取该屋盖结构监测数据中的温度数据与应力数据进行研究验证.部分测点的安装位置见图2.
图2 测点安装位置
选取屋盖结构的测点SX11在2022年8月记录的监测温度数据和从气象网站获取当地在2022年8月的最高日气温与最低日气温的气象温度数据, 将其全部代入(5)-(9)式中进行计算分析, 得到图3所示的结果, 可以看到实际温度数据处在一个由BOLL上下轨道线组成的波动通道上, 而图3中的圆圈标注出来的是异常温度数据点.
图3 改进型BOLL通道法识别的数据
因此, 经过改进型BOLL通道的处理, 可以识别出异常的温度数据, 为下一步的缺失点的温度数据修复做准备.
利用此算法对图3识别并且对剔除异常数据后留下的空缺数据位置进行修复.本次修复利用的数据点是SX11作为未知温度值的点, 其附近的两个测点SX12和SX13作为已知温度值的点, 把通过现场计算得到的这两个已知点到未知点的距离和这两个已知点的温度值代入IDW算法中得到未知点的温度值, 并把该温度值绘入图4中, 把未修复的效果图3与修复后的效果图4对比可以看到明显的修复效果.
图4 数据修复效果图
因此, 经过此步骤的处理, 将正常的温度值修复出来, 可以满足对非均匀温度场的科学研究, 同时避免异常温度值对后期研究结果的干扰.
机器学习中的BP神经网络算法能够学习和存储大量输入输出模型的映射关系, 并且可以充分逼近任意复杂的非线性关系[16-17].其核心在于反向传播在模拟的过程中收集系统所产生的误差, 并且返回这些误差到输出值, 然后用这些误差来调整神经元的权重, 从而生成一个可以模拟出原始问题的人工神经网络系统.
由于大跨度空间结构属于高次超静定结构, 其结构内各个杆件互相连接、共同作用, 既受太阳辐射影响, 也受自重荷载影响, 所以在测点处产生的应力属于综合应力.并且大跨度屋盖结构在长期监测过程中, 受温度效应影响较大, 所以可以把温度荷载作为主控荷载, 认为综合性应力与温度荷载必然具有较强的相关性, 从图5可以看到温度与应力的相关性.因此, 利用BP神经网络这种强大的非线性映射能力建立温度与应力之间的相关性模型就可以解决应力数据缺失的问题.
图5 测点的实际应力与实际温度
本研究选取下弦杆测点XX7在2022年8月的所有温度与应力数据; 每个温度数据对应一个应力数据, 因为在应力传感器失灵期间, 温度传感器能正常工作, 温度数据正常.所以把温度数据作为输入数据, 输入到神经网络预测应力重建模型中, 可以得到输出的预测应力, 这个预测应力可以作为缺失的应力数据使用.因此可以利用BP神经网络来构建环境温度与结构响应的内在关系模型.
本次数据修复工作采用的神经网络模型是效率较高的3层神经网络, 考虑到温度与应力作为输入与输出的量, 隐藏层传递函数采用非线性变换函数, 输出层激励函数采用线性函数, 同时通过相关系数R值与均方根误差RMSE值判断神经网络重建结果的精度.
式中:Xi为重建的应力数据(实际输出),Ti为真实的应力数据(期望输出),k是需要重建的缺失数据的个数.
在实际操作中把2022年8月的监测数据随机分成3部分: 训练集、测试集和验证集, 比例分别为70%,15%和15%.采用试错法确定模型的最优隐藏层神经元个数, 具体是把神经元的数量从1到10进行输入, 比较在不同神经元数量影响下, 相关系数R值与均方根误差RMSE值的大小, 然后根据R值和RMSE值来判断模型的优劣.经过多次测试, 神经网络隐藏层采用5个神经元的时候得到模型结果最优, 此时RMSE值较小,R值趋近1, 预测精度较高, 而且稳定.一般来说,R越接近1, 表示x与t两个量之间的相关程度就越强, 反之,R越接近于0,x与t两个量之间的相关程度就越弱.与此同时, 当整个模型的训练学习过程达到6 000 epoches时, 若还不收敛, 就强制停止.
因此得到训练好的神经网络模型后需要验证神经网络模型的数据修复性能.同时因为该数据完整, 所以可以选择其中60个应力数据假设为丢失数据, 用来验证该神经网络模型的数据修复能力.神经网络修复缺失应力数据的步骤为:
第1步 选取大跨度屋盖结构下弦杆测点XX7在2022年8月记录的所有温度与应力数据作为训练数据, 其中60个作为验证数据;
第2步 以测点的温度训练数据作为输入层的输入数据, 测点的应力训练数据为输出层的输出数据, 隐藏层负责处理输入输出数据的关系, 以此建立3层神经网络(图6), 拟合温度与应力之间的相关关系;
图6 3层神经网络
第3步 把60个验证数据输入训练好的神经网络模型, 输出得到应力数据的重建结果;
第4步 本次丢失的应力数据为假定丢失数据, 所以可以把应力数据的修复结果与实测数据进行比较, 从而验证神经网络修复数据的能力.
图7是修复后的应力数据与原始数据的效果对比.可以看到, 此时修复的效果较好:R值为0.712 6,RMSE值为3.218 5, 修复的应力数据与实际数据相差较小, 满足长期监测数据的精度需求.
图7 重建应力的效果
由于该大跨度空间结构属于高次超静定结构, 其结构的连接关系与力学性能存在内在联系, 不同测点之间的应力变化具有相关性, 所以可以利用不同测点应力之间的相关性建立神经网络模型, 然后通过该模型修复缺失测点的应力数据.前面图2b和图2c是该大跨度空间结构的部分测点, 假设XX7为缺失应力数据的测点, XX6,XX5,SX9均为有完整应力数据的测点.因此选择对比利用应力数据缺失点XX7与不同距离的测点XX6,XX5和SX9之间的相关性展现修复效果.
首先选择的是距离最近的相邻测点XX6与测点XX7的应力传感器在2022年8月正常工作时间段内监测的数据, 随机选择70% 的数据作为训练集, 15%的数据作为测试集, 15%的数据作为验证集, 训练完成神经网络模型.然后把测点XX6的应力数据输入训练好的神经网络模型中, 输出得到测点XX7的预测重建应力数据.XX5和SX9两个测点的相关处理步骤与测点XX7与测点XX6相关性的应力数据的分析步骤一样.本次利用测点XX7与XX6,XX5,SX9这3个测点分别依次建立相关关系模型, 从而得到对应的输出应力数据.缺失的应力数据重建效果见图8-图10.
图8 基于测点XX7与XX6的相关性
测点XX7与XX6,XX5,SX9的相对位置关系与重建精度的指标值见表1.
表1 模型的相关参数与重建精度
从表1可以看到选择位于邻近下弦杆的测点XX6与XX7的相关性来重建应力数据的效果是最好的, 重建应力曲线与实际应力曲线具有相当高的一致性.此时计算出来的R值为0.722 32,RMSE值为3.450 1, 相关系数表明其相关性较好, 同时均方根误差也较小, 说明测点XX6与XX7的相关性较强, 从图8的效果也可以看出神经网络模型重建精度较高, 真实值与重建值的误差较小, 满足工程误差的要求.
当选择稍远的下弦杆的测点XX5与XX7的相关性重建应力时, 计算出来的相关系数R值为0.584 30,RMSE值为3.770 7, 此时相关系数下降, 均方根误差也变大, 说明选取的测点距离变远之后, 杆件测点的相关性会变弱, 从图9也能看到重建应力数据的效果变差, 误差也变大.
图9 基于测点XX7与XX5的相关性
当选择位于上弦杆的测点SX9与XX7的相关性重建应力时, 计算出来的R值为0.197 75,RMSE值5.238 3.此时相关系数已经低于0.50, 属于不太相关, 此时均方根误差已经大到5.238 3.从图10也能看到重建应力数据的精度下降不少, 重建效果也较差.
图10 基于测点XX7与SX9的相关性
所以经过表1的比较可以看到, 在选择基于多测点应力相关性的方法进行神经网络模型建立时, 对相关测点的选取尤为重要.选择测点XX6重建测点XX7, 其相关性较好, 重建精度较高, 选择测点SX9的重建精度最低.离待测点越近的测点, 建立的神经网络模型相关性越高.在最近的杆件上的测点其相关性是最强的, 是最优的选择.
本研究针对大跨度空间结构长期监测数据修复的问题, 提出一种以改进型BOLL通道法结合IDW算法的温度数据修复方法以及基于温度与应力相关性和测点应力相关性通过BP神经网络算法建立模型从而对丢失应力数据进行修复的方法, 并对其修复效果进行分析, 得出如下的结论.
1)通过引入第三方数据结合原始数据构造上下轨线, 基于BOLL通道法提出一种改进型BOLL通道法, 在进行非均匀温度场的监测数据处理方面有较大优势, 克服了传统方法的缺点, 方法在应用上具有区域适用性和针对性.
2)提出使用IDW算法应用于非均匀温度场的缺失数据补全环节, 该方法考虑了非均匀温度场的细部不均匀温度的影响, 综合各测点温度的权重影响系数, 克服了线性插值法的缺点, 使用该算法可以较好地进行缺失温度数据的修复.
3)研究分析了基于BP神经网络建立数据之间的相关关系模型, 提供了基于温度与应力相关性和基于测点相关性的两种应力修复方法, 证明了BP神经网络在修复大跨度空间结构应力数据方面的可靠度.对于大跨度空间结构, 其温度与应力具有较强相关性, 可以对缺少的应力数据进行修复.同时不同测点之间的应力在距离上也具有相关性, 最近距离杆件上两个测点的应力相关性是最强的.所以基于最近距离杆件上的两个测点的相关性建立的模型其重建精度最好, 离待测点杆件的距离越远, 经过杆件的节点越多, 其相关性越弱.那么, 在选择修复的待测点应力数据的时候, 建议选择最近距离的杆件甚至是同一根杆件上的两个测点, 而不是距离较远的测点.