一种面向机翼可靠性设计与验证的数据挖掘方法

2024-06-19 08:54:57何钊
江苏科技信息 2024年10期
关键词:数据挖掘大数据

何钊

摘要:文章通过研究面向飞机机翼强度可靠性设计与验证数据的收集、管理、分析、挖掘技术,构建相应强度数据新的处理模式,从微观至宏观对强度数据进行统计、分析、综合和预测,掌握飞机典型结构的刚度变化规律及强度计算方法。突破强度大数据的处理、挖掘、可视化等关键技术,挖掘强度数据之间的相互关联关系,为飞机研制全生命周期的各个阶段提供技术支撑。

关键词:数据挖掘;大数据;强度试验

中图分类号:TP273文献标志码:A

0引言

本论文通过研究面向机翼强度可靠性设计与验证数据的收集、管理、分析、挖掘技术,构建相应强度数据新的处理模式,从微观至宏观对强度数据进行统计、分析、综合和预测,掌握飞机典型结构的刚度变化规律及强度计算方法,形成飞机强度分布式数据仓库;突破强度大数据的处理、挖掘、可视化等关键技术,挖掘强度数据之间的相互关联关系,为飞机研制全生命周期的各个阶段提供技术支撑。

1背景

1.1强度试验大数据现状

中国飞机强度研究所(以下简称“强度所”)作为我国航空工业唯一的飞机强度研究、验证与鉴定中心,掌握了几乎全部的飞机强度试验数据以及强度试验所产生的相关数据。这些围绕着飞机强度试验所产生的数据除了具备了基本的大数据4V特征之外,还具有其特有的强度数据特征。

1.1.1结构化数据与非结构化数据并存

在强度试验研究中,对于强度试验数据的精确性要求是十分高的,在任何阶段产生的数据都需要真实、完整、可靠。这就需要强度结构化数据对飞机强度试验的全生命周期无障碍互通,对强度试验进行科学、理论、可度量的数据管理[1]。在强度试验过程中又包含了大量的非结构化数据,根据现有强度所数据类型分析可得,大约有75%的强度试验产生的数据为非结构化数据。这些非结构化数据无法利用传统数据库管理的方法进行分析处理,只有利用大数据思想的新型数据仓库才能对其进行科学可靠完整的数据管理。

1.1.2强度数据的复杂性

飞机强度试验是一项复杂的系统工程,其中蕴含了静强度试验、动强度试验、疲劳试验、热强度试验、噪声试验、气候环境试验等多专业工程试验方法,复杂多变的现场试验环境以及强度试验的复杂功能工程模型。其复杂性决定了传统数据库管理方法远远不能满足对强度数据的管理[2-3]。因此,构建满足强度试验数据管理要求的,利用大数据管理思路的分布式数据仓库是飞机强度大数据挖掘与应用平台的基础组成部分。

1.2强度试验大数据需求

强度试验大数据应针对包含历史数据在内的强度数据的综合管理,并为平台的大数据分析以及数据挖掘作基础,满足强度大数据的综合分析、挖掘、处理的要求,实现强度试验数据的持久积累与智能管理。本次强度试验大数据需求如下:

1.2.1基于模型的强度数据管理

基于强度所各专业方向、各试验类型相融合的分布式数据仓库,利用模型统一管理策划阶段、设计阶段、试验阶段、分析阶段和试验总结阶段所产生的数据,本平台数据仓库主要构建了3个模型,实现强度试验数据的全收集。

强度数据模型:强度数据模型是强度数据仓库的核心模型,管理以试验件数据、物理试验数据、虚拟试验数据以及辅助试验进行的音视频数据为主体的试验核心数据,其数据特点为包含大量围绕强度试验三维可视化展现的三维模型;设计试验阶段物理虚拟试验数据多为标准化与结构化数据;辅助试验数据多为非结构化数据。

试验环境模型:试验环境模型主要管理强度试验条件数据、位置数据、试验准备数据、试验设备数据和试验人员数据等。可作为之后试验场景可视化的数据基础。其特点为围绕强度试验的环境要素构建的环境模型,包含大量的环境三维数据,用于三维可视化应用。

试验现场监测模型:试验过程模型依照试验现场监测体系要求,描述强度试验过程中所产生的质量控制数据以及现场采集监控数据。其特点是多为非机构化数据,但是检测过程均需遵循试验标准化规范要求;健康监测数据主要为试验现场故障检测作基础。

1.2.2分布式存储管理

强度分布式数据仓库借用Hadoop大数据技术思想中MapReduce计算框架,实现并行分片、并行存取。以Hadoop的分布式文件系统HDFS作为系统基础[4-5]。建立元数据接口,对强度数据进行结构化的描述,规定强度数据的组织特征与属性,覆盖强度大数据全生命周期。设计标准化的元数据接口,将强度大数据关联起来,形成强度分布式数据仓库,实现强度试验结构化数据以及非结构化数据的高效存储、管理以及备份功能,满足强度大数据的通用化数据访问、数据分析、数据挖掘、数据备份以及管理的应用需求。

1.2.3强度大数据全生命周期管理

强度试验数据管理一方面需要强度试验的全过程数据管理一体化,即完成强度试验的全生命周期,确保强度试验数据信息的可追溯性。另一方面,强度试验数据需要覆盖强度试验的全过程之外,还要与飞机设计数据、制造数据以及试飞数据进行对接,形成完整的、一致的飞机研制全生命周期数据仓库。建立飞机研制的全生命周期数据管理,保证飞机研制全过程的试验数据流转、一致性以及完整性,为未来的飞机研制全过程大数据分析与挖掘作基础。

1.2.4支持大数据分析与挖掘应用与云计算

强度分布式数据仓库具备分析效率高、数据质量高、拓展性高的特点,不仅可以提供高效的海量数据保存,也为之后的大数据分析与挖掘甚至未来的云计算提供保障。

2研究方法

2.1强度数据表征技术研究

航空结构的飞机强度大数据是一个系统工程,涉及航空结构的设计、制造、试验、试飞等众多部门。对于飞机强度大数据来说,具有其自己的属性。第一,数据处理时的高时效性,在强度试验现场,需要对大量的测量数据进行实时处理和判断,保证试验的正常顺利进行,不使飞机结构出现意外损伤或破坏,保证了经济性。第二,非结构化数据的量远大于结构化的数据,结构化数据为飞机强度试验测量得到的数据,其数量并不大,但研究价值和意义深远[2-3],其他为大量的非结构化数据,需要将其与结构化的数据一起进行挖掘,发现规律,为未来预测提供支持。第三,结构强度面临的专业较多,即使是结构化的数据,其特征和意义也需要分别对应研究。第四,强度试验数据一般具有明显的正常和异常表征形式,一旦结构发生屈曲或共振,对应的应变曲线出现明显拐折或者对应的振幅突变;试验现场中的异常声响、裂纹扩展等,都可以利用基本的数据特征进行表征。这些特征为关联规则的挖掘提供了丰富的数据。

目前,试验现场的状态监控数据来源主要为试验件上应变片、传感器等测量设备的测量参数,而这些测量参数随着现有试验规模的不断增大以及试验设备、测量手段的不断更新,现场状态数据的类型与数据量呈现越发庞大的趋势,具备大数据分析的条件。本部分将构建试验现场大数据源,以多来源多种类数据为基础,通过历史事件匹配、失效模式判断、故障现象,形成试验异常监控的前兆信息,用ARMA时序模型对试验前兆数据进行拟合及预测;利用变量R聚类的数据挖掘方法对前兆子数据之间的相似性进行度量,为试验异常判别提供依据[4-5]。

2.1.1试验件多来源现场监测数据关联

对试验件现场监测相关数据建立大数据模型。将设计载荷、试验载荷等数据关联至现场监测大数据模型中,对于现场测量设备数据源进行大数据模型归纳分析,作为实时监测的数据依据。 2.1.2试验数据实时监测、评估

试验过程中对现场测量数据,实现实时监测与评估。对现场状态进行实时的监测与评估,对可能出现的问题实现提前预判与诊断分析。实现试验状态识别科学化、理论化,形成强度知识体系。

2.1.3声响定位与诊断

飞机结构在加载过程中,会出现各种各样的声响异常。常规方法基本属于事后检测,对试验过程中出现的各种声响,无法完全判断其来自何处、是否由结构损伤引起。因此,常规检测具有一定局限性和盲目性,极易忽略结构中非薄弱部位的损伤。声发射作为一种动态、被动损伤监测技术可全程对结构实时监测,可及时发现损伤并定位,了解结构损伤的产生和扩展,为判定飞机结构安全性和准确定寿提供科学依据。通过数据挖掘技术,对声发射所获得的各类信号进行分析挖掘,及时有效的判断损伤发生部位和损伤形式。根据监控的信号,预测可能发生结构损伤情况,提前预警显示。

2.2强度大数据处理及挖掘技术

地面强度试验作为飞机研制全生命周期的第三阶段,利用各类试验技术,模拟真实的飞行状态,而强度大数据是首飞前飞机强度最全面、最真实的评价指标。这些数据信息不仅直接为首飞试验提供鉴定、定型依据,而且对飞机及其系统的改进、改型或科学研究具有较大研究价值。强度大数据处理与挖掘应结合强度所各专业发展,提升强度试验数据的挖掘分析处理能力。

数据挖掘技术是多学科交叉的新兴技术,对强度大数据进行科学、理论的探索与分析,解释强度大数据中的隐藏的、未知的规律性,将其进一步模型化、知识化。强度大数据挖掘处理及技术主要包含以下大类:关联规则技术、分类技术、聚类技术、模式分析技术。强度大数据挖掘将实现对强度数据的低层次存储、查询的应用,提升为从强度数据到强度知识的转化。

就试验数据和仿真数据的挖掘而言,其基本任务是对元件级、部件级、全机级数据进行整理,利用数据挖掘及分析手段,实现数据与知识的智能筛选、层级之间的数据关联、价值分析、趋势预测等,最后将这些分析结果提供给仿真设计人员,指导仿真及设计过程,为仿真设计人员降低时间成本、提高仿真精度等提供智能化支持。

2.2.1关联规则技术应用

根据数据挖掘中关联规则的分类,对强度大数据所需进行的关联挖掘进行分类,根据关联规则方法中经典的Apriori算法,针对强度试验过程中产生的不同类别结构化与非结构化强度数据进行数据预处理及提取之后,形成数据挖掘关联规则标准下的项集。通过强度大数据之间的关联关系构建,尤其是其中强关联关系的发掘,对强度试验过程中的时序或因果关联判定,具有极大的参考价值。

本平台在利用经典Apriori算法之外,还将根据强度试验过程中的特点,进行关联规则算法改进的相关研究,适应未来发展的新大数据应用与场景,主要在以下几个方面进行提升:关联规则算法效率;非结构化数据关联规则挖掘;强度多专业数据关联规则挖掘;关联规则可视化。

2.2.2分类技术应用

针对强度大数据的特点,在分类技术上,平台主要研究的算法包含决策树方法、神经网络方法、KNN分类方法、贝叶斯分类方法以及支持向量机分类方法。通过这几类分类算法与方法的模块化应用,结合机器学习与模式识别的相关知识,实现强度大数据不同层次、不同类别、多专业融合的数据分类。

构建强度分类体系时,对于强度大数据的策划阶段、设计阶段、试验阶段与分析阶段;静强度、动强度、疲劳强度、热强度、航空声学、气候环境适应性等14个研究方向;试验类别区分物理试验与虚拟试验等不同条件的已知强度大数据,发掘分类规则,实现预测新数据类型的愿景。

2.2.3聚类分析技术应用

强度大数据包含了海量多种类、多层次、多维的数据。聚类分析利用数学工具、多元分析理论,通过衡量不同数据间的相似性,将数据分至不同的簇中,描述数据的固有结构与特征。平台将根据数据间的距离与相似系数对强度数据进行度量,通过自定义度量参数,对强度数据进行进一步细分,定量的细分与划分预设数据。平台主要聚类算法包含Kmeans、层次聚类、神经网络聚类、高斯聚类等几种经典算法应用。

3结语

本文通过梳理一种面向机翼可靠性试验的数据挖掘方法研究,分析试验数据需求,给出试验表征与数据挖掘方法,对试验数据挖掘技术进行探索并取得成效,未来需进一步围绕机翼负责试验数据体系开展数字化研究,推动强度数据应用与挖掘专业的发展。

参考文献

[1]陈玉斌,刘娜,赵志刚.基于数据挖掘的试验数据关系挖掘方法研究[J].测绘与空间地理信息, 2020(43):173-176.

[2]钟宇,陈欢,黄嘉伟.基于数据挖掘的试验数据异常值检测方法研究[J].现代电子技术,2020(43): 158-162.

[3]高彬,黄艳红.基于数据挖掘的试验数据预处理方法研究[J].现代计算机,2021(2):107-111.

[4]朱晓军,杨晓芳,张贺.基于数据挖掘的试验数据分析方法综述[J].电子测量与仪器学报, 2021(35):1-9.

[5]马晓娜,杨旭,赵明.基于数据挖掘的试验数据分类与聚类方法研究[J].计算机工程与应用,2021(57):142-148.

(编辑何琳)

Data mining method for reliability design and test of aircraft wings

He  Zhao

(National Key Laboratory of Strength and Structural Integrity, Aircraft Strength Research Institute

of China, Xian 710065,China)

Abstract:  This paper studies the collection, management, analysis, and mining techniques for the design and verification of aircraft wing strength reliability data, and constructs a new processing mode for corresponding strength data. From micro to macro, the strength data is statistically analyzed, synthesized, and predicted, and the stiffness change laws and strength calculation methods of typical aircraft structures are mastered. Breaking through key technologies such as processing, mining, and visualization of strength big data, exploring the interrelationships between strength data, and providing technical support for various stages of the entire life cycle of aircraft development.

Key words: data mining; big data; strength test

作者简介:何钊(1991—),男,工程师,硕士;研究方向:信息化规划与数据管理。

猜你喜欢
数据挖掘大数据
探讨人工智能与数据挖掘发展趋势
基于并行计算的大数据挖掘在电网中的应用
电力与能源(2017年6期)2017-05-14 06:19:37
数据挖掘技术在中医诊疗数据分析中的应用
大数据环境下基于移动客户端的传统媒体转型思路
新闻世界(2016年10期)2016-10-11 20:13:53
基于大数据背景下的智慧城市建设研究
科技视界(2016年20期)2016-09-29 10:53:22
数据+舆情:南方报业创新转型提高服务能力的探索
中国记者(2016年6期)2016-08-26 12:36:20
一种基于Hadoop的大数据挖掘云服务及应用
数据挖掘的分析与探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的离散数据挖掘研究