摘要: 为剔除混凝土侵彻深度试验数据异常点,提出了一种融合先验知识的异常检测算法。利用反向传播(backpropagation, BP)神经网络模型拟合试验样本数据的分布,结合偏差指标筛选离群样本点,并通过经验算法评价模型异常检测性能。针对试验数据特点选择全量梯度下降结合动量优化方法,从而提高模型迭代训练的稳定性和效率,并且在构建模型过程中融合领域先验知识约束对样本数据的拟合,使得模型在训练过程中能反映附加特征的影响。结果表明,BP神经网络模型适合于刚性弹对混凝土侵彻试验数据异常点的检测,加入合理的领域先验知识可有效提高模型的检测精度。
关键词: 混凝土侵彻;神经网络;先验知识;异常检测
中图分类号: O385 国标学科代码: 13035 文献标志码: A
弹丸对混凝土靶的侵彻贯穿过程往往伴随着高压、高应变率和多物理场耦合,加之混凝土材料的非均匀性和其动态力学性能的复杂性,使得该现象成为一个非线性的复杂问题,传统的科研三范式,即试验研究、理论分析和数值模拟在处理此类问题时存在一定的局限性。随着混凝土侵彻贯穿试验数据的积累和大数据技术的发展,第四科研范式,即数据驱动型或数据密集型科研范式,提供了另一种可行的技术途径[1],其主要依靠收集、分析和利用大量科研数据来发掘隐藏在数据背后的规律,以实现更准确地预测并指导决策,已在多个冲击爆炸毁伤效应研究场景中得到成功应用。Li 等[2] 将不同机器学习模型运用于爆炸载荷预测,对比分析了多个机器学习模型,发现Transformer 模型是预测爆炸载荷最有效的工具,其性能明显优于MLP (multi-layer perception) 等其他模型。Almustafa 等[3] 提出了一种基于随机森林的机器学习模型来预测钢筋混凝土板承受爆炸载荷时的结构响应,发现机器学习模型可以有效预测爆炸载荷下钢筋混凝土板的最大位移。Almustafa 等[4] 又利用420 条数据对爆炸载荷下钢筋混凝土柱的最大位移进行预测,并提出了基于集成树的机器学习模型,有效提升了预测性能。Zhao 等[5] 利用支持向量机算法、高斯过程回归算法、随机森林算法和反向传播神经网络等4 种机器学习模型进行了钢筋混凝土板的最大位移预测,尽管每种算法模型各有优劣,但是这4 种模型预测效果都优于现有的基于数值模拟和理论分析的方法。Neto 等[6] 采用机器学习方法评估局部爆炸载荷下软钢板的动力响应,并结合试验数据和有限元模拟数据为训练神经网络提供了一个混合数据集,研究发现,有限元模拟数据可解决试验数据不足的问题,能够显著提高模型的预测精度。
数据质量是数据驱动模型有效性和准确性的基础,缺乏可信数据,数据驱动模型无疑是空中楼阁。数据源中的异常点在数据处理过程中会将错误的信息逐渐累积,最终造成错误的挖掘结果。另外它还会降低数据挖掘算法的效率,也可能会在数据模型中引入非正态分布或其他的数据复杂性,从而很难甚至不可能找到准确的数学模型[7]。而由于试验条件、量测技术、人为因素以及出于保密要求而加入的噪声数据和虚假数据等,会导致原生数据中存在异常点。因此,为确保数据驱动模型的准确性,必须先对原生数据进行异常值剔除操作。
神经网络模型是在回归和分类问题中被广泛应用的一类机器学习模型,它具有强大的非线性关系提取能力,可以自动从输入参数中学习到复杂的多维特征,并有效地拟合数据样本的分布,因此广泛用于异常检测任务[8]。相较于传统的异常检测方法,基于神经网络模型的异常检测方法更适合于处理复杂多维、分布不均的混凝土侵彻深度试验数据。然而,由于数据数量有限、数据分布不均匀以及数据质量不高等因素的影响,纯依赖神经网络模型自动拟合数据分布会导致预测效率降低、预测精度下降以及过拟合等问题[9]。此外,神经网络模型由于可解释性较差,从而造成模型鲁棒性较差,一些微小的干扰就可能欺诈模型使其造成错误的判断[10]。而领域先验知识的加入,有利于提高神经网络模型的预测精度,增强模型的可解释性以及鲁棒性,使得模型更具有清晰的领域背景[9,11]。
在混凝土侵彻问题研究中,基于理论分析和试验总结,已经积累了较丰富的先验知识。以刚性弹侵彻无限厚混凝土靶为例,空腔膨胀模型已经得到了较广泛的应用,在可以获取简化靶标材料本构模型的基础上,空腔膨胀模型一般可给出弹体运动的封闭解[12],但高压高应变率下混凝土材料本构模型的复杂性限制了空腔膨胀模型的应用。基于试验数据和量纲分析,也建立了多个半经验-半解析公式,它们一方面具有形式简单、便于求解的优势,另一方面又结合理论分析和试验规律,给出了基础物理量组合而成的无量纲数,作为控制弹体侵彻深度的主要控制参数,有效避免了纯经验方程基本物理概念不清晰、不便于推广应用等不足[13]。目前,刚性弹对无限厚混凝土靶侵彻深度半经验-半解析模型主要有Chen 等[14]提出的两参数模型和Li 等[15] 提出单参数模型以及文献[16] 中建立的三参数模型等,这些组合参量形式简单、易于获取,而且现有研究结果表明其能较真实地反映弹和靶的物理性能对侵彻过程的影响[17],因此可作为刚性弹对无限厚混凝土靶侵彻深度预测的先验知识。
某些特定领域,由于试验数据获取困难、代价昂贵、实际试验过程中干扰因素较多,导致数据数量有限、分布不均匀甚至缺失以及数据噪声和异常数据等,纯依赖神经网络模型从原生数据中自动拟合数据分布,可导致模型仅学习到局部分布规律和错误知识,会严重影响模型性能,甚至会因训练样本数据质量问题导致错误的预测结果,也会降低模型的收敛速度。从机器学习角度来看,神经网络的训练过程就是从样本数据中学习拟合数据分布规律的过程,通过加入额外输入分支的方式为模型赋予领域先验知识相当于使模型提前掌握一定的数据分布规律,从而节省模型学习时间,提高模型收敛速度。本文中,通过集成相应领域专家知识的形式为模型赋予先验知识,将混凝土侵彻深度的物理模型、参数约束和参数间依赖关系等知识以额外输入参数的形式提供给模型,以提升模型的性能,增强模型的鲁棒性,同时提高模型收敛速度。
本文中,首先在传统BP (back propagation) 神经网络模型的基础上,加入不同专家先验知识提升模型性能,约束模型对试验数据分布的拟合,结合基于偏差的指标剔除试验样本异常点;然后,利用经验公式检验模型异常检测的准确率;最后,利用数值实验结果分析不同先验知识对数据异常检测结果的影响,为爆炸冲击试验数据异常检测提供一种可靠高效的机器学习算法。