高 卓
(中海油能源发展装备技术有限公司 天津 300452)
近年来,大数据、云计算等现代信息技术的发展推动了新一轮的科技革命,行业数字化建设进入新的发展阶段[1]。 油气产业作为社会发展的重要经济命脉,数字化、智能化转型已经势在必行。 目前各大油气企业纷纷加大了数字化业务布局的力度,开展智能化建设。 依托大数据、云计算等智能化技术,将海量工业数据作为输入信息进行智能化分析,解决油田开发生产面临的难题,为项目运行提供科学的解决方案[2]。
透平发电机、天然气压缩机等是油气田开发生产的重要装备,在运行中多采用传动设备传递动力。 然而受自身缺陷以及外界作业环境等因素的影响,在生产作业过程中,动设备不可避免地会出现各种形式的故障,制约了油田开发生产的优快进行,严重者可能导致设备损坏,诱发安全生产事故。 在长期运转状态下,随着时间的推移,设备自身性能也会随之降低并逐步演化成为功能性故障[3]。根据设备的历史运行数据,对其潜在故障进行评估和预测,有计划地安排停机检修,能够保证动设备长期稳定运转。 目前油气行业多通过设备状态监测、实时数据库系统等方式对动设备运行状态进行评估,基于人工经验判断或者设置阈值等方式实现设备故障预警。 在新一轮技术科技革命浪潮中,应用大数据技术对动设备历史数据进行深入挖掘分析,提取关键信息评估设备运行状态变化是动设备维护管理的必然需求。
本研究以石油工业常见的动设备实时运行数据参数、检验参数、监测数据、海上平台中控生产数据等为基础,以机器学习等智能方法为手段,开展常见动设备运行状态和异常预测研究,构建动设备异常预测和早期识别诊断模型,实现动设备异常的提前预警,减少设备故障发生率,提高油气田开发生产效率。
动设备运行过程中,可靠度是评判动设备正常运行的重要指标。 因此通过数据分析得到设备各项参数,对设备的运行状况以及故障发生率进行预测。 该过程需要大量的数据,包括设备固有参数、运行环境数据以及运行信息等等。 设备运行信息数据能够直接反映设备的运行状态,其余信息则间接反映其运行情况,因此应根据不同参数的影响程度给予不同的权重值[4]。 动设备运行环境数据对设备的使用年限有着重要的影响,常见的参数包括温度、湿度、空气灰尘量、振动数据等等。 利用传感器采集设备环境数据并传入数据库中,能够提升模型预测的精度。 动设备的固有参数包括设备尺寸、额定参数、材料材质等,是大数据分析的重要信息。 在构建模型的过程中还应该将设备的商品信息纳入数据库中,如设备品牌、供货商以及规格参数等,该类数据是设备追本溯源的重要信息,是对设备产品品牌评估预测的重要支撑。 动设备运行状况数据能够直接反映设备状态,是故障预测和诊断分析的重要凭证,常用的参数包括温度、实际电压、功率、开关量、振动量等。 数据收集是大数据预测分析的重要基础,上述数据分布在不同系统中,需要借助有效的平台工具采集存储[5]。 一般来说,传感器读数、工作参数、技术资料信息、巡检信息、分析化验信息、检维修记录、设备状态等数据可通过传感器、监控和数据采集系统(supervisory control and data acquisition,SCADA)、设备记录器等部件获取,并存储在数据仓库或云平台中。
1.2.1 模型构建
基于大数据分析的动设备运行状况预测模型及其架构,如图1 所示。 针对构建的原始数据库,进行特征提取与选择,即从清洗后的数据中提取与设备运行状况相关的特征数据,包括设备工作参数、振动频率、温度变化等。 同时,可以借助特征选择算法筛选出对设备运行状况预测具有较高影响的特征数据作为样本。 在采集动设备历史数据的基础上,对原始数据分类处理,并进行深入挖掘,评估不同参数变量之间的相关程度,得到变量的相关变化趋势,构建动设备系统信息模型,将采集到的设备固有参数、环境数据以及运行信息加载到数据库中,组成动设备系统大数据源。 应用机器学习方法对大数据源建模,通过分析不同系统参数相互间的关联性,对其运行状态进行正确表征。 基于深度学习输出结果,进行故障诊断并制定维护计划。 当模型预测出设备可能出现的故障时,采取相应的维护措施,预防故障的发生,减少停机时间。 另外,通过不断收集新的运行数据和反馈信息,对预测模型进行持续优化和改进,提升模型的准确性、可靠性,提高设备运行状况的预测精度和实用性。
图1 基于大数据分析的动设备运行状况预测模型和架构示意图
一般来说,传感器等部件采集到的原始数据多存在遗漏值、离群值以及无效数据等问题,直接建模精度有限。为保证预测的有效性,需要对采集的原始数据进行清洗和预处理,包括去除异常值、填补缺失值、去除噪声等,确保数据质量。 此外,保留动设备运行核心数据,对数据进行降维处理,在保证模型预测精度的前提下降低模型数据量。 主成分分析法、最小二乘回归误差分析法、Pearson 相关系数分析法、最大互信息系数分析法是常用的降维方法。 对于石油工业动设备来说,不同参数间的关系多表现为多线性、非线性特征,为准确表达其数学函数特征,因此多采用最大互信息系数分析法描述两个随机变量之间的依赖关系,对变量之间的函数关系进行准确表征。 最大互信息系数分析法认为,如果两个参数变量之间存在关联性,那么可以在其平面散点图上绘制网格,将数据点进行分割,在提升网格分辨率的前提下,计算不同分辨率下的最大互信息值,对计算得到的信息值进行归一化处理,即得到所需的结果[6]。
1.2.2 预测分析
基于提取的特征数据,应用机器学习、统计分析等方法预测设备运行趋势,常见的预测方法包括回归分析法、时间序列分析、神经网络法、支持向量机回归法、灰色预测模型法以及马尔科夫链模型法等,其中尤其以支持向量机回归法应用更为广泛[7]。 支持向量机回归法预测分析时,对于给定的训练数据,优选训练样本D={(x1,y1)…(xi,yi)},yi∈R,其中x表示样本数据的属性,y表示属性的对应值,构建函数关系表达式f(x)=wx+b,其中w、b表示待定参数,f(x) 为输入变量的预测值。
支持向量机回归方法原理如图2 所示,给定两类数据,分别用实心圆形和空心圆形表示,两条虚线分别表示穿越两类样本的直线,二者之间的距离为分类间隔,即2/w。 可以看出,当w为最小值时,分类间隔2/w达到最大。 通过机器学习使得预测值f(x) 尽可能地接近y, 当二者的差值较小时,即能较为准确地预测y, 该计算过程可以看作是凸函数最佳化的求解问题,即min1/2w2,约束条件s.t.|f(xi)- yi |≤εi,其中ε表示预测值与实际值的差,即将求解分类间隔问题转变为求解最小值的问题。在ε合理的情况下,能够进行有效的数学求解,即可行性预测[8]。
图2 支持向量机原理图
在实际计算过程中,受离群值和误差等因素的影响,可行性预测难以实现,需要应用损失函数、惩罚函数进行求解,其数学表达式见式(1)所示,其中C表示正则化系数,ξi表示松弛变量。 应用约束条件的目的在于确保所有属性点值(xi,yi) 均能满足敏感度损失函数,即让松弛变量ξi替代属性点值(xi,yi) 的损失。 对于惩罚函数来说,其能够较好地解决因离群值等因素导致的问题,并判断训练模型是否过度。 在机器学习过程中,惩罚系数以及模型内部参数对于输出结果有着较大的影响,因此需要通过试误法得到错误率最低的最佳参数组合,并作为最适模型的参数。
另外,动态劣化度g(xp) 指标能够对设备运行趋势进行科学的评估,其计算公式如下式(2)所示,其计算结果介于0 和1 之间,0 表示最优,1 表示最差,xp为指标参数预测值,xmin表示指标参数运行的最小值,xmax为运行最大值[9-10]。 基于支持向量机回归法以及动态劣化度计算方法,对动设备运行状态和趋势进行预测,能够得到满意的应用效果。
在构建大数据模型的基础上,从线上、线下两个角度建立动设备故障诊断知识图库,如图3 所示。 在大数据源的基础上,选择合适的特征参数,计算待选特征域信息之间的相关性,基于故障规则表,构建故障诊断模型。 线上方面,构建基于大数据的故障诊断知识库,通过智能化采集设备将相关信息记录到数据库中,当出现故障问题时生成故障信息表,其中设备型号、状态详情等信息作为知识库的输入信息,在此基础上预测、推荐可能的故障原因,并默认优选可能性最大的原因。 线下方面,采用人工巡检的方式,如果设备未发生故障,巡检人员填写巡检单,将巡检站点、设备、时间、人员等信息记录到数据库中。 如设备未处于正常运行状态,巡检人员填写故障信息单,故障原因可以人工判断选择,也可以通过知识库调用选择。 当动设备故障处理完成后,对现场拍照并填写任务详情单,记录动设备故障处理人、任务内容、任务完成情况等,根据实际处理情况确认设备故障原因,并上传到知识库中。
图3 动设备故障诊断知识图库的构建示意图
以某石油企业某压缩机组某工艺系统为例,对其运行状态进行预测。 结合技术人员实际经验,选择独立子系统指标参数XI⁃A,TI⁃B,FIC⁃C,PIC⁃D 作为指标参数,应用支持向量机回归以及动态劣化度计算法,得到t时刻XI⁃A等指标的预测值和动态劣化度,计算结果见表1,并对设备状态进行检测。 以PIC⁃D 子系统为例,将计算得到的动态劣化度作为状态监测指标,某日上午08:42 触发动态劣化度并报警;传统阈值监测方法于当日08:58 触发阈值并报警,本文方法监测的最早报警时间较常规阈值报警提前了16 min,并通过知识库给出故障分析原因,应用效果显著。
表1 某项目t 时刻工艺系统转速、压力、温度等指标参数预测结果
石油工业生产工艺和生产装备复杂,在长周期作业环境下容易出现设备隐患问题,因此进行动设备运行状态监测对于防范设备运行风险、保证设备正常运行有着重要的意义。 收集设备固有参数、运行环境以及设备运行信息等数据,对采集的原始数据进行清洗和预处理,包括去除异常值、填补缺失值、去除噪声等,确保数据质量,提取与设备运行状况相关的特征数据,应用机器学习方法对大数据源建模,通过分析不同系统参数相互间的关联性,对设备运行状态进行正确表征。 在构建大数据模型的基础上,从线上、线下两个角度建立动设备故障诊断知识图库,基于机器学习模型进行故障原因诊断。 综上,基于大数据的动设备运行状况预测研究能够实现设备故障提前预警,进而提升设备可靠性和运行效率,应用效果较好,具备推广价值。