利用水温观测数据进行仪器性能分析

2024-01-24 03:54王秀英成万里
华北地震科学 2023年1期
关键词:极差标准差水温

任 佳,王秀英,罗 娜,王 静,成万里

(1.河北红山巨厚沉积与地震灾害国家野外科学观测研究站, 河北 邢台 054000;2.国家自然灾害防治研究院,北京 100085;3.张家口地震监测中心站, 河北 张家口 075061;4.邢台地震监测中心站, 河北 邢台 054000;5.河南省地震局, 郑州 450016)

0 引言

水温是流体观测的一个重要观测手段。全国部署了300 多个水温观测站[1-2],是地震预测预报日常工作的重要支撑[3-4]。总结以往对水温观测数据的研究,主要聚焦于3 个方向:①水温观测的同震效应[5-7];②水温固体潮效应[8];③水温前兆异常[9-12]。

水温观测,尤其是对于地下中、深层的水温观测,温度变化极其微小,大多需要高精度水温观测仪才可记录到观测量的微小变化,如北京塔院井的水温日变幅度仅为0.000 1~0.000 2 ℃。如此细微的变化对于观测仪器的性能要求极高,因为在观测仪器与观测环境(对象)组成的观测系统中,最终观测数据中同时叠加了仪器与观测环境的共同影响,只有仪器探头自身影响与环境变化相比足够小时才能忽略仪器影响。那么如何从观测数据中区分仪器影响和观测环境变化,进而分析仪器自身对观测数据的影响大小,以客观评价观测仪器对观测环境的适应性,即:观测仪器本身能否适应所在观测环境对仪器的要求。纵观目前的水温研究,主要集中于具体应用方向,对观测数据与观测仪器性能的研究极少。

但是从观测数据中区分观测仪器造成的影响,对于水温观测数据的应用,特别是前兆异常的识别,具有重要意义。鉴于此,本文拟以邢台中心台宁晋冀22 井连续多年水温观测数据为例,展示利用数据分析方法,判别观测仪器性能对产出数据的影响、不同性能仪器产出数据的差异以及仪器分辨率与观测环境的适应性。希望通过本文数据分析案例的展示,为水温数据的更多领域应用提供参考。

1 数据和方法

1.1 观测数据

宁晋冀22 井,台站代码13108,位于宁晋县苏家庄镇李羊杯村,华北沉降带束鹿凹陷西斜坡南部,华北平原临清拗陷三级构造单元上,隶属于河北省邢台中心站。该井终孔深度2 003.78 m,观测段1 899 m 至1 919 m,采水层为第三系沙河街组砂质灰岩、砾岩裂隙水,水温探头布设于井水面以下190 m,属于中层水温(井水面以下100~1 000 m 深度之间观测的水温)上段的观测范围。

宁晋冀22 井,自2001 年开始水温观测, 采用SZW-1A 数字式温度计(以下简称“仪器1”),仪器分辨率优于0.000 1 ℃。2013 年开始产出正式观测数据,一直运行到2017 年12 月25 日;之后,改用ZKGD3000-NT 水温仪(以下简称“仪器2”)观测,分辨率优于0.1%F.S,2017 年12 月26 日开始产出观测数据,至今仍在运行。

该井具有连续长达20 年的观测数据积累,期间经历了观测仪器的几次变更,对于不同目的的数据分析和应用研究非常适合。利用该井观测数据,不仅可以分析仪器对观测数据的影响,还可以分析不同仪器对观测数据影响的差异,进而推测仪器在实际观测环境中的表现性能优劣,使数据分析过程更具典型性。因此,本文拟对前述2 个型号仪器的观测数据分别分析;为使2 段数据具有可比性,对2 段观测数据选取相同的数据时长。仪器1,选取2013—2016 年连续4 年的分钟值数据作为研究数据;仪器2,选取2018—2021 年连续4 年的分钟值数据作为研究数据。分别对2 个时段数据进行分析与比较,以获得预期研究结果。

1.2 分析方法

对前述2 个时段的分钟采样水温观测数据,分别计算日均值、标准差、极差以及在4 个局部时段的半小时均值、标准差以及极差,这4 个局部时段分 别 是00:00—00:30、00:06—06:30、12:00—12:30、18:00—18:30。通过这些特征量来分析仪器自身性能、观测环境变化、仪器性能与观测环境的适应性以及不同仪器对观测数据影响的差异性。

采用这些特征量进行分析主要基于以下考虑。

对于一般的地球物理观测,观测仪器和观测环境/观测对象构成一个完整的观测系统。在这个系统中,观测数据的变化同时叠加了仪器自身变化和观测环境变化,即:

其中:VD、VI、VE分别表示观测数据变化、仪器自身变化和观测环境变化。

对于一般观测对象,仪器足够稳定,如探头分辨率相较于环境变化极微小时,仪器自身引起的数据变化可忽略不计,(1)式中数据的变化即等于观测环境的变化。但当仪器自身变化与环境变化的量级接近时,仪器自身变化不能忽略。这时需要考虑如何获取(1)式中VI和VE部分的估计值。

对于年变和日变都比较小的地球物理观测,如本文的水温观测,由于环境变化在一般情况极其缓慢,在一个极短时间内可以忽略环境变化,这时数据反映的变化即是仪器自身的变化,或者说仪器的分辨率。对于更长时段的数据变化,则认为主要由观测环境变化引起。如果长时和短时数据变化接近,则表明仪器自身变化与环境变化水平接近,需进一步提高观测精度才能满足观测环境要求;反之,如果两者相差较大,表明仪器基本能满足观测环境变化的需求。

本文计算的短时和长时分别取0.5 小时和24 小时。反映数据变化的特征值,本文选取了2 种,标准差和极差。标准差反映的是一组数据的平均变化程度,或者说波动水平;极差反映的是一组数据中最大和最小值的差异,即最大波动水平。如果仅对几天的数据结果进行分析,其中会带有偶然误差的影响。为消除可能存在的偶然误差,本文对2 个型号仪器分别采用了连续4 年的观测数据,以计算结果主要聚集区作为分析依据。

另外,本文设计的特征量不会受观测环境长期或者趋势变化的影响,因为长时时窗仅有24 小时,对于年度趋势或漂移不到0.1°的变化,平均到每日的变化量现有仪器难以分辨。

2 结果与分析

2.1 仪器1 观测数据

利 用 宁 晋 冀22 井2013 年1 月1 日 到2016 年12 月31 日连续4 年的水温观测数据,按1.2 的方法分别计算每日和每日4 个局部时段的均值、标准差和极差,结果如图1 和图2 所示。

图1 水温日均值、极差和标准差的时序曲线(2013—2016 年)Fig.1 Time series for the features of daily average, range, and standard deviation of water temperature(2013—2016)

图2 2013—2016 年极差和标准差结果的分布Fig.2 Distributions of range and standard deviation results from 2013 to 2016

图2 为2013—2016 年连续4 年极差和标准差计算结果的分布情况,不同颜色表示不同的计算时长,其中红色表示对每日数据的计算结果,其他4 种颜色表示4 个不同局部短时段的计算结果。

分析图1 的结果,尽管宁晋冀22 井连续几年的水温观测变化很小,但仍能看到一些比较明显的时序变化。连续4 年的日均值和不同局部的短时均值保持了几乎一致的时序形态,数据形态变化比较明显的部分,如图1 中箭头标示部分,在几组数据中是同步变化的。这表明观测系统受到的影响作用于整体,所以长时窗和短时窗呈现同步变化形态;如果仅作用于局部时,仅影响某段短时窗的局部数据。通过调查核实,图1 中最显著的变化时段,即2016 年8—9 月有一段观测数据的明显台阶,对应的是一台并行水温观测仪的安装和撤出。由此可见仪器探头相互之间会产生影响,而且这个影响的幅度相对于数据自身的相对变化幅度比较大,造成数据以台阶现象呈现。这种台阶的剧烈变化,不仅在不同数据均值中呈现同步变化,在极差和标准差中也有表现,特别是每日极差和标准差上表现极为明显,两个指标同步减小,如图1 所示。

图1 中,每日的极差(Range)变化比4 个局部的短时极差变化约大一个量级,进一步由图2 中极差的分布看出,每日极差的峰值大概在0.013 5 附近;4 个局部极差的分布几乎重叠,峰值在0.005 1 附近,两者之间相差将近3 倍。按照1.2 节的定义,长时窗和短时窗的这种差异反映了环境变化和仪器自身变化的差异,仪器1 数据分析结果显示这种差异比较明显。图2 中,4 个局部极差的分布几乎重合的结果表明短时内数据的最大波动范围完全一致,这种一致性应该呈现的是仪器自身的固有特性。因为4 个短时窗取自4 个不同观测时间点,对于一个具有日变周期的观测环境或者对象,或者虽不具有日变周期但观测时间间隔较长时,不同时间点的环境变化应有差异。4 个短时窗统计特征分布的一致性表明短时变化仅受仪器自身性能影响,即反映式(1)的VI项。因为4 个短时窗平均间隔6 小时,最长间隔12 小时,间隔时间较长,依常规认识如果存在环境影响,它们之间会有差异。实际数据计算结果表明,它们之间几乎没有差异,那么它们的波动只能反映同一个来源,即仪器自身性能的波动导致的观测数据波动。

另外,根据1.2 节的假设,如果长时变化代表观测环境变化,短时变化代表仪器自身变化,图2 中虽然仪器1 的长时变化比短时变化大,但并没有大到可以忽略的程度,可以说属于基本满足观测要求。

图1 中,标准差(表征平均数据波动水平的指标)的每日变化与每日内的4 个短时变化稍有差异,24 小时长时窗的标准差波动范围大致在0.00 2~0.00 3 ℃之间,而4 个0.5 小时短时窗的标准差波动范围则主要集中在0.00 1~0.00 2 ℃间,两者波动水平比较接近。进一步根据图2 中标准差的分布,得到日均值标准差的峰值集中在0.002 4 ℃附近,4 个短时窗标准差的分布峰值集中在0.001 5 ℃附近,两者相差约0.001 ℃。很明显,图2 中4 个短时窗的标准差分布也是重叠的,表明不同时间点观测数据的平均波动水平相当,可以基本排除环境波动的影响。据此也可以认为,局部短时数据的波动主要反映仪器自身影响的平均水平。

如果把短时窗平均波动水平看作仪器在实际运行环境中的分辨率,长时窗平均波动水平或者最大波动水平作为实际观测环境的变化,两者差异越大,表明仪器越能满足观测环境要求;相反,两者差异越小,或者接近,则表明仪器难以满足观测环境要求。

对于图1 和图2 反映的仪器1 而言,无论根据最大波动水平(极差)分析结果还是平均波动水平(标准差)分析结果,仪器1 基本可以满足观测环境需求。

2.2 仪器2 观测数据

对 宁 晋 冀22 井2018 年1 月1 日 到2021 年12 月31 日仪器2 连续4 年的水温观测数据,按同样方法计算并绘图,结果如图3、图4 所示。

图3 水温日均值、极差和标准差的时序曲线(2018—2021 年)Fig.3 Time series of daily average, range, and standard deviation of water temperature (2018—2021)

图4 2013—2016 年极差和标准差结果的分布Fig.4 Distributions of range and standard deviation results from 2013 to 2016

图3 中水温观测数据的平均值、日均值和几个局部短时均值都呈下降趋势,与图1 中的均值趋势相比,仪器2 存在明显的“零漂”问题。虽然两者的观测时间段不同,存在观测环境发生变化的可能,但对2017 年2 台仪器同步观测数据分析结果显示,可以确认仪器2 存在“零漂”现象。由于2 类型仪器同步观测时存在交叉影响,问题比较复杂,已超出本文研究范围,这里不再详细叙述。除同步下降趋势外,图3 中几个均值的连续时序曲线中也呈现了比较明显的变化,而且这些变化在几组数据中是同步的,这种同步一致变化也说明引起这些变化的原因是整体性影响,而非局部影响。经核实,2019 年6 月附近的显著下降台阶由撤出并行观测仪造成,2021 年底的数据上升台阶是由安装并行观测水温仪造成。同仪器1 情况类似,虽然仪器2 存在“零漂”现象,但撤出和放入探头时的台阶现象仍清晰可见。由此可见仪器探头(即观测仪器)对观测数据的影响非常大。两者都表现为:撤出探头时温度下降,放入探头时温度上升。这种现象表明仪器探头间存在非常明显的相互影响。很显然,新探头的放入,相当于一个持续的热源,导致温度上升;如果该热源持续稳定供热,则会抑制其他较小的随机干扰或影响,使观测数据的极差和标准差减小;反之,撤出仪器探头后,持续热源消失,温度下降,被抑制的干扰重新表现出来。如图3 所示,2021年底放入新探头后,导致观测数据中出现上升台阶,与此对应的极差和标准差却出现下降的趋势,尤其在24 小时时窗的特征中表现更为明显。

由仪器的交叉影响可以进一步推测,即使只有一个仪器探头,也会对观测环境/观测对象造成影响,这种影响会反映到观测数据中。只是没有对比,很难从数据中分析出这种影响的大小。探头放入观测环境对观测对象造成的影响,其实就是1.2 节式(1)中VI的一种影响方式。探头影响的波动范围越大,对观测数据的影响越大。如果探头影响的波动范围超过观测环境的变化范围,则很难捕捉观测对象的细微变化。对于地震地球物理观测而言,来自地震孕震过程的信号可能非常微弱,仪器的影响较大时,难以观测到前兆信号,失去本来的观测目的。因此,如前节对仪器1 的分析中提及,这就要求观测仪器需要满足观测环境的要求,即观测仪器的波动影响要小于观测环境的变化。

根据图3,24 小时时窗的极差主要集中在0.02~0.03 ℃范围内,4 个短时窗的极差范围则大概在(0.005~0.020 ℃)范围内波动,两者差异不是很明显。进一步根据图4 的极差分布,得到每日极差的峰值大概在0.022 6 ℃附近,短时窗极差的峰值约0.009 7 ℃,而且4 个局部极差的分布曲线基本重合。长时窗极差与短时窗极差相比,两者相差2 倍多一点。仅就长短时窗的极差分析结果而言,仪器2 较仪器1 表现稍差,因为根据前面的分析,两者差距越大,观测仪器越能满足观测环境的要求,仪器适应性越好。由仪器1 和仪器2 日均值的极差峰值比较,仪器2 为仪器1 的近2 倍。如果观测环境的波动水平在2 台仪器的观测时段内没有发生变化,则可以确定由仪器2 观测数据得到的更大数据波动源于仪器自身影响。但由于分析数据的时间跨度较大,并不能确定观测环境长期不会改变。但如果仅考虑每台仪器自身的连续观测数据表现,仍是仪器1 表现较好。关于观测环境是否存在长期变化的分析在“结果分析与讨论”中给出。

图3 中,24 小时时窗的标准差波动范围约在0.002 5~0.004 0 ℃之间,04 个短时窗的标准差波动范围则在0.001 5~0.004 0 ℃之间,长短时窗的平均波动范围区别不明显。进一步由图4 的标准差分布,可以看到长时窗标准差峰值约在0.003 5 ℃附近,4 组短时窗的标准差峰值约为0.002 5 ℃,两者差异较小,在分布图上长短时窗的峰值更加靠近,峰值之间有更多重叠部分,这表明仪器2 短时窗的数据平均波动水平和长时窗的平均波动水平比较接近。根据前面的分析,如果将短时窗的标准差(数据平均波动水平)视为仪器在实际运行环境的分辨率,分辨率接近观测数据的平均波动水平时,则难以识别更微弱的信号。所以从这一点而言,仪器2 的实际运行表现稍逊于仪器1,与2 种仪器标称的分辨率水平是符合的。所以,利用实际观测数据可以对仪器的运行性能进行检验和评估。

3 结果分析与讨论

根据1.2 节数据分析的基本思想,对于比较稳定的地球物理观测量,在极短的时间内观测数据的变化主要反映仪器自身的变化,环境变化的影响可以忽略不计,这种假设得到了仪器1、仪器2 数据计算结果的支持。根据第2 节对2 个时段数据的计算结果,4 组局部时段数据的极差、标准差分布几乎完全重合,虽然本文只选取了4 个短时段,但由其一致的表现可以推测对观测数据中任意一组短时观测也可以得到同样一致的极差和标准差分布,这种一致的分布展现的是一种仪器固有的属性,即由观测仪器自身的观测误差范围决定。所以,对于变化极小的地球物理观测量,1.2 节中对仪器变化和环境变化的分析方法是可行的。

对数据反映的仪器情况进行分析,2 个时段的观测数据属于同一个观测点的2 种不同型号观测数据,2 组数据日均值反映的观测结果大致相当,但仪器2 明显存在“零漂”问题。一些研究中提到水温观测仪器存在“零漂”问题[4],但仅分析仪器2 的一部分数据时,并不能确认数据的趋势性变化是由仪器引起还是数据自身就存在趋势性变化。本文对2 个时段数据的分析结果对比,可以确定仪器2 存在“零漂”问题。

对计算结果反映的仪器自身对观测数据的影响,仪器1 每日极差反映了观测点对应观测环境每日的最大变化幅度,其峰值也即大多数极差的计算结果集中在0.013 5 ℃附近,而4 组局部数据的极差则集中在0.005 1 ℃附近。把每日的极差看作环境变化范围,4 组局部数据的极差看作仪器自身变化范围,两者有一定差距,表明仪器具有较稳定的性能,基本能够满足观测环境对仪器的要求。仪器1 每日观测数据的标准差大概集中在0.002 4 ℃附近,而4 个局部均值的标准差峰值大概在0.001 5 ℃附近;由于标准差反映的是一组数据的平均变化情况,局部数据的标准差则反映的是仪器在短时内观测数据的平均变化情况,可以大致视作仪器的实际运行分辨率;运行分辨率与观测环境变化相差越大,越能适应观测环境的要求。同样,仪器2 所得每日极差的峰值集中在0.023 0 ℃附近,4 组局部极差峰值约在0.009 7 ℃附近,两者虽有差距,但较仪器1 的情况差距偏小,也即局部变化范围与整体变化范围更接近,难以胜任更精细的观测要求。同理,每日标准差分布峰值0.003 5 ℃附近以及4 组局部数据标准差峰值0.002 5 ℃,大致反映了该仪器的平均分辨率。

将2 个时段观测数据的结果比较,可以看到仪器1 的分辨率要高于仪器2,相应仪器1 对观测数据的影响要小于仪器2。这个结论可以进一步由2 组数据的标准差变化来反映,仪器1 的数据标准差大概为0.002 4 ℃,而仪器2 的标准差为0.003 5 ℃,两者相差1 倍多。

2 组观测数据对应同一观测环境,虽然2 组数据的观测时间段有差异,不能排除观测环境存在长期的变化,但由于本文分析使用的特征指标是由最长24 小时、最短0.5 小时的观测数据计算获得,在这种时长情况下,即使存在环境变化,以现有仪器的分辨率也无法识别,所以特征指标的设计本身已排除长期变化的影响。事实上,可以从这些指标的长期序列中观察是否存在环境变化,就本文数据分析结果而言,所选观测点未发现观测环境存在长期变化的情况。

最后,由于仪器标识的分辨率一般都是在实验室中获得,可以控制影响仪器运行性能的各种参数,如温度、湿度、气压等。但在实际观测环境中,影响仪器运行性能的条件与实验室环境大相径庭,所以仪器在实际观测环境中的分辨率不能达到理想状态也可以理解。通过本文的分析实例,我们认为:仪器实际的运行性能表现已隐含到观测数据中,通过对大量观测数据的分析可以评价仪器的表现性能,判断仪器能否适应实际运行环境要求。

4 总结

本文利用邢台中心站宁晋冀22 井长达8 年的水温分钟值采样观测数据,通过分析几个特征指标的计算结果,以及比较2 种类型观测仪器的性能表现,得到如下认识:

1)每种型号仪器4 年的观测数据分析结果表明:观测仪器本身会对观测数据产生影响,这种影响会叠加到仪器产出的观测数据中。

2)由于实际运行环境与实验室观测环境有较大差异,导致仪器在运行环境中的性能表现不能达到实验室标称的性能,仪器在实际环境中的性能表现可以通过大量观测数据的分析来获得。

3)观测仪器能否满足观测环境要求,也可以通过适当的数据分析来实现,并可以分析推测不同仪器的实际运行性能差异。

本文方法对于利用大量数据分析检测数据、仪器等的稳定性提供了一种新的思路。车用太和鱼金子曾经提到:中国水温观测由于缺少有效的平行检验系统,尚不能给出对仪器稳定性的评定结果[4]。本文方法展示了利用大量观测数据对仪器稳定性进行分析和评定的案例,在目前缺少检验系统的情况下,不失为一种可行的方案。 另外,地震观测数据自“九五”数字化以来,已积累了20 余年海量的观测数据,为利用数据分析方法对数据自身、观测仪器、观测环境的研究和认识奠定了基础,而这些研究是进行其他应用研究的基础,亟待开展更多分析和研究工作。

猜你喜欢
极差标准差水温
用Pro-Kin Line平衡反馈训练仪对早期帕金森病患者进行治疗对其动态平衡功能的影响
二次函数极差的规律与应用
基于PLC的水温控制系统设计
基于DS18B20水温控制系统设计
在分位数回归中结构突变的经验极差检验
对于平均差与标准差的数学关系和应用价值比较研究
大联大:最先感知“水温”变化
水温加热控制系统的设计
方差中亟待澄清的两个错误观点
医学科技论文中有效数字的确定