WEKA在建筑结构安检影响因子筛选建模上的应用

2019-09-10 21:02杨嘉琳
大东方 2019年10期

杨嘉琳

摘 要:本项目以某工程岩土勘探为背景,通过研究其项目过程勘探中的部分各层土方数据,借助EXCEL对数据源进行预处理,结合WEKA数据分析平台,分别以贝叶斯网络、分类规则进行模型建立,为地基土层的沉降评价以及结构安全平台建立提供数据支持。

关键词:岩土勘探;WEKA;结构安全平台

1.背景

1.1国内研究现状

近些年来,工业领域的灾害频频发生,这种现象在建筑工程中尤为明显。其中包括各种自然灾害的侵害和难以避免的质量事故等导致的建筑结构安全问题,与人们日益增长的建筑功能的需求以及在“十三五”时期倡导创新、协调、绿色、开放、共享发展理念之间的矛盾日益突显。鉴于以上原因,对现存或者正在建立的建筑结构的安全性能检测就十分必要。对于建筑结构的安全性能检测是对其安全性控制过程中的一个重要环节,目前国内针对其研究主要着力于检测技术的开发研究,采集数据技术的改良以及结构安全状况评估反馈系统的建立三块内容。

在建筑结构安全性能检测技术开发研究方面,孙莉,梁德志,李宏男在《振动、测试与诊断》杂志上发表的《用 FBG传感器监测框架-剪力墙结构裂缝》中通过开发基于光纤布拉格光栅(FBG)的应变传感器对振动破坏下的模型结构裂缝发生以及发展过程进行数据采集,来解决在恶劣环境下混凝土结构的健康安全检测;孙威,阎石,张莺等在《混凝土》杂志上发表的《基于压电阻抗技术的混凝土剪力墙裂缝损伤监测》基于压电阻抗技术提出来一套传感器的布置策略,用以解决混凝土结构监测过程中常见的技术问题,并验证其方法的有效性。

在建筑结构安全性能检测数据改良方面,周智,欧进萍在《传感器技术》杂志上发表的《土木工程智能健康监测与诊断系统》考虑监测结构参数的多源性对诊断结果的偏差影响,提出了利用多传感器信息融合技术将多个数据源在时间和空间上进行修补组合,最终建立一个最优化系统达到高效即时反馈的效果;陈保平,苏木标,樊可清在《石家庄铁道学院学报》上发表的《大型桥梁健康监测远程数据采集系统设计》对远程数据采集系统的设计中涉及的影响因素,分别从现场采集系统、文件传输系统以及用户终端三方面进行考虑,为数据采集技术改良提供理论支持。

在建筑结构安全状况评估反馈系统方面,王清华,周瑜,刘立辉在《基于时间序列分析法的建筑变形监测技术研究》采用时间序列法建模,利用F检验原理对短期结构沉降量进行预测,并绘制相应的沉降过程曲线,等值线分布图;农秀莲,刘琼在《矿山测量》中发表的《基于 MATLAB 自动生成建筑沉降监测图表》利用MATLAB绘制生成沉降量图表,提高工作效率。

1.2国外研究现状

国外对于建筑结构安全性检测领域中,已经有不少研究结合数据挖掘技术开拓新的思路方向。T.Rivas等通过减少施工工程项目中风险率的途径,验证数据挖掘中贝叶斯网络、决策树、联合规则、逻辑回归等几种方法最终建立起最优化模型;Shuo Chen等开发了一种能够利用超声波翼激发和接受取样信息的新型无线传感器,从而减少在结构检测中过多投入在传感器的精力和开销。

1.3总结述评

综上所述,对于建筑结构的安全性能研究,现国内外研究偏向于检测技术尤其是传感器的开发研究,包括利用不同领域技术的融合提高在前期数据信息采集阶段的准确性。然而,对于在后期信息处理结构安全状况的评估的研究不多,尤其是系统进行建筑安全检测平台的开发,数据挖掘为其提供了可行的理论支持。

本项目旨在依据以上现状,以某工程岩土勘探为背景,通过研究其项目过程勘探中的部分各层土方的样本类别,建立快速筛选土方类别的优化模型,为地基的土层均匀性进行评价提供数据支持,有助于结构检测平台的建立。项目采用数据挖掘的方法,利用WEKA作为数据分析平台,将数据中潜在信息进行加工处理后再开发,挖掘模型建立关联因子,由此提高信息利用率,为结构安全检测平台的建立提供坚实的保障。

另外尽管数据挖掘在现今“互联网+”模式下发展迅速,但其在建筑领域中的应用范围仍旧较为狭隘。本课题研究的内容一定程度上扩展了大数据技术在建筑结构中的应用领域,积极响应创新、协调、绿色、开放、共享发展理念,对生产实践具有重要的理论和现实意义。

2.建筑安全检测平台设计

2.1结构安全关联因子

建筑的结构可靠度受到不同因素的影响。在结构受力构件中,需要考虑可变荷载与永久荷载的影响,而对于不同结构体系,荷载的影响系数有很大差异。在荷载组合中,可变荷载与永久荷载的主导性直接决定不同的荷载组合方式。永久荷载控制时,可变荷载只需要考虑活荷载标准值,可变荷载控制時,可变荷载还需要考虑组合值。除此以外,结构的受力分析需要考虑构件的极限强度承载能力和正常使用承载能力。在此,我们将以这两种承载能力为理论支持,分析与土层类别对于地基不均匀沉降的影响,乃至对结构安全性的联动作用。

2.1.1 极限强度承载能力

结构构件的强度是其自身的一种属性,取决于构件的尺寸以及材质。一般构件的尺寸可根据不同截面形状归类分析其形心位置,由此在不同荷载施加时有不同的形变,而不同的材质抵抗变形的能力不同,弹性模量不同,由此形成的应力应变图变化规律迥异,最终达到构件的极限强度,构件破坏。

针对这种情况,在检测结构安全性阶段,应在构件强度薄弱处进行应力应变的测试,并将数据以时间为节点保存为表格形式上传存储,以便后续汇总分析。数据检测仪器可采用无线电阻应变式传感器,其对于环境要求低,测量数据精度高的同时使用时间也相对更长。构件的强度薄弱处可根据弹塑性理论分析结构受力模型,在内力最大处,包括弯矩、拉力、扭矩等最大处位置粘贴电阻应变片。

2.1.2 正常使用承载能力

在日常生活中,一定比例的建筑构件在无法达到其极限强度承载能力前就已经丧失了其使用能力,或者构件使用时存在较大的安全隐患,这种情况下,结构达到其正常使用承载能力。处于这种情况的构件主要可从其外观、形状进行辨别,比如出现在梁、结构柱外表面的裂缝,建筑局部的基础不均匀沉降。

本次项目从分析土层的类别入手,对影响土层分类的因素进行分析,为评价项目地基的均匀性以及建筑不均匀沉降提供技术支持。

2.2 结构安全检测体系

结构安全检测体系的建立数据、平台、用户三大方面。

首先,数据采集可与相关房屋安全检测平台沟通合作,根据现有的危险房屋坚定标准对已有的建筑构件进行系统的检测,具体通过无线传感器的设置,对基础、梁、柱、楼板、屋顶等主要受力构件的关键部位(应力最大处)变化情况汇总监测此外,对于既有结构构件,主要又可通过各种仪器比如红外热像仪等对内部情况进行勘探。其次对于规划建筑需要收集的大量数据信息和资源,除了建筑本身结构建模的参数外,还需要通过勘探得到外環境的数据,比如土质情况。

再者,数据获取后,需要建立筛选、分析、输出结果的平台,然后将信息传递给用户,结合实际情况修正数据,反复传递给平台,循环往复。

2.3 WEKA数据分析平台

WEKA是一个应用广泛的数据挖掘工作平台,基本界面如图1所示。WEAK能够对数据进行多方面的分析,包括分类、回归、聚类、关联等形式。在实际应用中,WEKA平台能有效分析数据间的关系并对其通过算法进行验证。WEKA数据挖掘平台可对文件扩展名为arff和csv等的文件进行处理分析,平台能够处理的数据格式是一个二维表格,如下图2所示。其中横行和竖行数据分别代表实例和属性,故需要对待分析的数据在数据分析前期进行初步定性分类,可通过不同软件对数据源预先进行处理,比如PROCESSING、EXCEL。

WEKA平台有多种数据分析的形式,以上四大类又可细分为决策树分类、贝叶斯分类、神经网络、聚类分析等。在数据挖掘前期,首先对挖掘算法进行选择,再经过比较不同模型之间的结果差距,确认算法和模型有效性。本次数据试验处理通过交叉验证对模型进行检验。

3.案例分析应用

本项目以某工程岩土勘探为背景,在拟建建筑场地进行土质钻孔取样,对其勘探过程中74个土样进行分类测试,实验数据包括以下19个属性:soil sample NO、moisture content、wet density、dry density、proportion、void ratio、saturability、iquid limit、plastic limit、plasticity index、liquidity index、coefficient of compressibility、modulus of compression、cohesion 1、internal friction angle 1、cohesion 2、internal friction angle 2、free swell ratio、class。其中soil sample NO与class为文本型,其余均为比例数值型属性。数据实际分类有14个粉质黏土、60个粘土。本实验通过classify对样本数据进行两类算法的处理分析。

3.1 实验过程

本实验采用WEKA中的EXPLORER界面,对74个进行分类算法测试。测试前先对数据源预处理,并且保存为土方试验.csv格式。本次数据预处理的方法为通过EXCEL表格对以上19个属性进行整理编辑转化,确保所有数据属性不包含中文字符。具体试验过程为首先在WEKA平台中进入EXPLORER界面,并在preprocess界面中导入土方试验.csv数据,其中选择classify选项卡,先后选择NaiveBayes朴素贝叶斯分类和ZeroR分类器,如图3所示,并对两种算法均设置10次交叉验证,其余算法参数均保持不变,完成后单击start开始运行试验数据,分别得到两组算法的试验结果。

3.2 数据分析

NaiveBayes朴素贝叶斯数据分析结果如图4所示,ZeroR运行结果如图5所示。结果显示,所有土方试验样本被分为两类,其中对于朴素贝叶斯算法,错分实例为15个,占总数的20.3%。数据显示,confusion matrix(混淆矩阵)中a代表粉质黏土,B代表粘土,NaiveBayes算法中14个实际类别为粉质黏土的实例被误分类成粘土,1个实际类别为粘土的实例被误分类成粉质黏土,分类正确率为80%。ZeroR算法中,错分实例为14个,占总数的19%,分类正确率为81%,其中两种算法对于粘土的分类与实际情况均较为符合,误差小,而对于粉质黏土的分类精确度低。简而言之,以上两种算法均能对其中一类数据进行较为准确的分类,但对于另外数据处理能力弱,分析其原因推断出数据源中参数的相关性分析在前期预处理中存在纰漏,仍需要在数据降噪中反复修剪处理,以便提高分类的准确度与精准性。

结合以上试验结果分析,以及依照土方试样实际样本分类,两种分类算法均能够较好分析出粘土类别的样本,但对于粉质黏土的样本识别度低。在两类算法运行过程中,误判率保持在20%上下,运行时间均较短。

4.结论

本项目通过WEKA数据挖掘工具对土方试样进行分类的数据分析,采用NaiveBayes朴素贝叶斯算法以及ZeroR分类算法进行实验分析。试验结果表明,对于土方数据能准确筛选出“粘土”类数据,运行时间短,与实际类别吻合度高,但对于“粉质黏土”识别度低,需要在预处理阶段对该类别的属性进行降嘈处理,添加有效属性,删减无效属性。

通过此次试验得出,经过有效的数据预处理,可采用classify算法对于土方识别进行模型建立,快速识别具有特定参数的土方类别,提高工作效率,为地基沉降监测平台的建立提供数据支持。

参考文献

[1]孙 丽,梁德志,李宏男.用 FBG传感器监测框架-剪力墙结构裂缝[J].振动、测试与诊断,2010,30(5):496-499

[2]孙 威,阎 石,张 莺,吴金国.基于压电阻抗技术的混凝土剪力墙裂缝损伤监测[J].实用技术,2011,7(42):125-128

(作者单位:宁波城市职业技术学院)