刘重阳
(辽宁省地震局,辽宁 沈阳 110034)
地下流体观测井井体内部监测得到的温度数据通常会在一个预设范围内上下波动,温度允许波动范围被称之为公差,而当监测结果数据大于波动范围时,可以认为此时井内温度存在超差现象[1]。当发现温度发生急剧变化时,可以预测地区存在短期或邻近阶段的地震灾害。但由于部分地区的气象台的监测能力较差,无法及时感知地震前区域的异常变化,容易导致地区经济遭受了大量损失、地区居民出现人身安全威胁的情况发生[2]。因此我国在各地建立了多个地下流体观测井,通过对井内温度的及时监测,发现自然灾害前的异常现象。为了全面落实并推进此项工作,本文引进数据挖掘技术,以地下流体观测井为例,设计一种针对井内温度数据超差异常现象的全新监测方法,通过对温度异常现象的及时感知,发挥地下流体观测井在地区更高的作用与效能。
为了精准监测的需求,应明确井内温度超差的判定依据[3]。定义地下流体观测井温度数据集合表示为D,获取温度数据的数量表示为q(样本数据集合表示为q),设定q 在D 中是以多概率ξ 值存在的。此时,q 的表示方式为q^,q 的取值范围为σ,当q^∈D 时,此时井内的温度数据为超差异常数据[4]。在此基础上,设定采集温度数据样本的所有数值满足σ 在空间内的高斯分布特征,则q 的正常温度值概率的95.0%应满足±2σ 的均值相差要求,而不满足上述要求的温度数据便属于超差异常数据。
给定地下流体观测井温度数据流为s,在对井内温度进行采样内,假定两次连续采样的温度数值均不满足±2σ 的均值相差要求,即两个连续采样数据均为温度数据超差异常数据,进行超差异常判定依据的描述[5]。表达式如下:
公式(1)中:r 表示为温度超差判定依据;i 表示为温度数据采集样本中的遗忘因子。为了确保设定依据的准确性,设定r 的取值范围在0~1 之间。
采用建立井内反馈温度数据仓库的方式,对不同测点的温度进行反馈[6]。在此过程中,设定地下流体观测井参数信息、温控参数,设定>10.0 个光纤温度测点,建立多个基于Access 的关系数据库。采用集成数据库Visual C++技术,对温度监控过程进行可视化处理,确保编程技术可以集成或应用在温度监控过程中时,插入温度数据仓库信息表,建立全过程可视化的数据仓库技术框架[7]。
数据仓库共由源端数据、ETL 技术建库、数据仓库核心存储和处理工具四个部分组成。通过直接监测的方式进行温度信号的反馈,部分数据具有冗余、随机等特点[8]。在数据样本集合中进行主题数据的抽取,对采样数据进行格式的统一化处理。对反馈的此部分数据进行清洗处理,清除数据集合中的冗余数据、重复数据、错误数据、乱码数据等,将剩余数据按照元数据的标准描述方式导入数据仓库层[9]。通过对大量数据的统计处理与分析后,根据数据的类别进行统一化处理,为终端监控与预警提供决策。
引进数据挖掘技术,通过对仓库中历史温度数据的选择、温度数据的处理与数据格式的标准化转换,实现对数据集合的高效率、频繁检索,从而获得更加高质量的温度数据集合[10]。数据挖掘过程的本质是对温度数据的降噪、转换、增添等过程,通过对大量异常数据的提取,挖掘温度数据的变化规律。
利用数据挖掘技术中的关联规则,对建成的数据仓库集合进行反复迭代处理分析,找出不同温度指标之间的内在联系,通过对指标的调整实现对温度数据的频繁检测。使用SQL 软件,建立一个针对数据仓库的关联规则挖掘模型,根据不同数据集合的强关联,进行温度数据最大阈值与最小阈值的设定,将规则数据中置信度大于阈值的规则数据作为此次挖掘的关联规则[11]。根据数据挖掘规则,建立一个温度数据频繁项数,对其进行描述,如下计算公式所示:
公式(2)中:s(A)表示为温度数据s 频繁项数;t 表示为温度数据事务元素;T 表示为温度数据事务元素集合;P(A)表示为温度数据频繁项集。其中T=t1;t2;t3;…;tn。完成对频繁检索集合的描述后,找出数据集合中的非空子集,将其表示为B,按照频繁项数的导出规律,进行温度数据集合的频繁检索,将此过程用下述计算公式表示:
公式(3)中:Bc表示为温度数据频繁检索过程;C 表示为温度数据集合中的非空真子集。
引进模糊ARHMM 算法,对处理后的数据超差异常现象进行监控与预警。建立温度数据马尔科夫链,通过温度数据集合之间的联系,对温度状态进行转移,将温度转移的状态与情况用初始化概率参数表示,将参数表示为π,利用π建立一个温度状态数据转移矩阵,将矩阵表示为R,对R 的描述可用下述计算公式表示:
公式(4)中:aij表示为温度状态数据转移矩阵中的状态量;N 表示为矩阵行数与列数。为了确保对温度数据的高精度监控,对上述计算公式中的aij进行描述,aij计算公式如下:
公式(5)中:P 表示为地下流体观测井温度数据发生转移现象的概率;St表示为温度超差数据的状态描述方式;sj表示为预测温度数据值;sk表示为观测温度数据值。将计算得到的温度数据进行串联处理,即可得到一个针对地下流体观测井的温度超差马尔科夫链。完成处理后,将温度数据链导入AR 数据观测模型,对温度数据的超差现象进行描述,将描述后超出预设范围的温度数据作为超差数据,通过此种方式,实现对井内超差温度的监控,将此过程表示下述计算公式:
为了满足此次实验的真实性需求,选择青海玉树中心区域外围700.0km 位置的地下流体观测井为实验对象。获取与此井孔相关的数据信息,具体内容如表1 所示。
产妇在顺产时,胎儿的娩出会使得阴道极度扩张,虽说产后会自动复原,但依然会有不同程度的变化,对于有些阴道重度撕裂的女性来说,甚至会影响性生活。别担心,产后这些盆底康复训练助你和阴道松弛say byebye!
表1 地下流体观测井构造描述
为了确保地下流体观测井可以在该地区发挥应有的效果,在对其进行设计时,在所有井孔内布设HYJH1-A1100型号的电子式温度计,用于井内温度测量与反馈。
此次实验以已知的青海玉树地震信息作为研究对象,将井内温度数据库中2009 年10 月~2011 年5 月水温观测分钟值数据作为样本数据。设定此地下流体观测井在投入使用后的公差,明确井内温度数据的上限值。通过对数据的处理,统计井孔月超差温度数据(当月超出3.0 倍公差的温度数据个数)、每月导入的数据量。数据完整度为98.54%,月导入数据量为92215bit,月超差温度数据均方差为0.0023。
完成对本次实验的部署与样本数据的采集后,将本文设计的方法集成在地下流体观测井计算机监测终端,建立HYJH1-A1100 型号的电子式温度计与计算机监测终端之间的通信连接。
在监测终端上设定一个地下流体观测井温度数据公差(将公差值表示为A),即温度界限值,以此种方式,实现对监测终端相关参数的设计。
在此基础上,设定地下流体观测井温度数据超差判定依据,收集并获取地下流体观测历史数据,按照标准进行历史数据的处理,建立一个针对地下流体观测井反馈温度的数据仓库,将相关数据参照标准导入数据仓库中。引进数据挖掘技术,对不同温度数据进行深度分析,掌握数据之间的关联性与规则,实现对前端HYJH1-A1100 电子式温度计反馈数据的多次迭代与频繁检索。引进模糊ARHMM 算法,对比反馈的温度数据与公差值,实现对地下流体观测井温度数据超差异常的监测。根据终端监测的结果,对超差温度数据进行预警。
将样本数据按照月份顺序导入计算机监测终端,将监测结果绘制成平滑的曲线以便于后续分析。地下流体观测井温度超差异常监测结果如图1 所示。
图1 地下流体观测井温度超差异常监测结果
上述图1 中,A 表示为地下流体观测井温度数据公差。根据图中曲线的变化趋势可以看出,井内温度共发生过4.0次突跳,分别发生在2 月~3 月、4 月初、5 月初、6 月~7 月,在7 月~12 月,井内温度监测结果未超过公差值,即没有发生温度超差异常现象。根据监测终端技术人员反馈,从开始监测到完成监测,终端共触发四次预警,与前端井内温度共发生过4.0 次突跳对应,由此可以证明,本文此次设计的监测方法,可以实现对地下流体观测井温度超差异常的有效监测,即本文方法在实际应用中具有一定可行性。
完成对本文设计方法可行性的检验后,为了进一步证明本文方法在使用中的优势,选择基于BIM 及SQL-SERVER的监测方法(方法1)与基于WeMos D1 物联网的监测方法(方法2)作为传统方法,进行本文方法与传统方法监测效果的对比。
实验中,随机抽取一段时间的地下流体观测井温度数据,在已知井内真实温度数值的基础上,分别使用上述提出的传统方法1 与传统方法2,进行区段温度的监测。为了更加直观地评价监测方法对温度的监测效果,将监测结果绘制成折线图,如图2 所示。
图2 传统监测方法与本文监测方法监测效果对比
从上述图2 中可以看出,本文方法监测温度数值与地下流体观测井真实温度数值几乎一致;传统方法1 监测温度数值与地下流体观测井真实温度数值变化趋势一致,但部分监测结果数据与实测数据存在误差;传统方法2 不仅存在监测温度数值与地下流体观测井真实温度数值差异较大的问题,还存在部分温度数据监测结果缺失的现象。
在此基础上,获取实验结果,对三种温度数据超过异常监测方法的监测精度进行比较。通过测试可知,传统方法1的最大相对误差为3.61,均方差根误差为4.05,平均相对误差为4.77;传统方法2 的最大相对误差为3.28,均方差根误差为2.17,平均相对误差为3.09;而本文方法的最大相对误差为0.56,均方差根误差为0.38,平均相对误差为1.24;由此看出本文方法监测结果的最大相对误差、均方差根误差、平均相对误差,均小于传统方法,可以实现对温度的高精度监测,从而提高监测结果与真实结果的一致性。
本文从设定地下流体观测井温度数据超差判定依据、建立地下流体观测井反馈温度数据仓库、温度数据频繁检索、基于模糊ARHMM 算法的数据超差异常监测与预警四个方面,完成了基于数据挖掘的地下流体观测井温度数据超差异常监测方法设计。并在完成此方面内容的设计后,通过对比实验证明了本文设计的方法,可以实现对温度的高精度监测,从而提高监测结果与真实结果的一致性。因此,可在后续对地下流体观测井的监测中,使用本文方法代替传统方法使用,以此种方式,获取精度更高的温度数据监测值,为地区地震等自然灾害的发生给予正确预警与判断。