基于不同调查尺度的城市土壤氡浓度背景值和异常阈值测算方法稳健性分析与应用

2024-01-11 08:14马婷婷阙泽胜
辐射防护通讯 2023年5期
关键词:检验法中位数尺度

马婷婷,阙泽胜

(广东省核工业地质局辐射环境监测中心, 广州, 510800)

在土壤氡背景值和异常阈值确定过程中,样本总体服从正态分布时,传统方法在筛选“清洁”土壤样品时具有较高效率。由于人为活动和自然环境影响,地球化学数据并非服从完美的正态分布,一定程度上影响传统统计方法剔除异常阈值的效果。因此,部分学者探索了更为稳健的方法。

稳健的统计方法是否对不同调查尺度样本均有较好耐抗性,目前文献鲜有报道。为验证稳健统计方法在测算土壤氡背景值和异常阈值的可靠性,本文在已有研究基础上[1-4],结合地理信息系统理论,将地理要素抽象为点、线、面3种尺度,即进一步考虑了特点区域型(近似点型)、线型和区域型(面型)3种尺度,对研究区域调查空间进行细分。应用传统统计法[5]、分布形式检验法[6]、探索性数据分析(EDA)法[7]和中位数绝对离差(MAD)法[8]等4种方法,对不同调查尺度对象的土壤氡浓度的背景值和异常阈值分别测算,并对测算方法进行了稳健性分析,最后计算得到研究区域土壤氡浓度背景值和异常阈值水平。

1 研究区域概况和数据来源

1.1 研究区域概况

研究区域位于广东省东部某城市。地形呈“西边高东边低”,地貌以平原和丘陵为主。气候以亚热带季风气候、亚热带海洋气候为主导。研究区域地质构造复杂,地下河网密布。地下水的补给、径流、排泄主要受降雨、地形地貌、岩性条件、地质构造等条件的控制,降雨是地下水的主要补给来源。

1.2 数据来源

数据来源于广东省《2021年度省地质勘查与城市地质专项项目》“某城市区域放射性地质调查”项目课题的土壤氡成果数据[9]。使用的测氡仪型号为FD-3017RaA,根据《氡及其子体测量规范》[10]要求采集数据信息。测氡仪通过了“三性(即重复性、稳定性和一致性)”检测和仪器标定。现场抽取地表下80 cm处氡气,高压设置为2 min,观测时间为2 min。

土壤氡调查编号1~37为区域型尺度调查点,定义为全区地质体(简称为QQDZT)。土壤氡调查编号78~86为点状型尺度调查点,定义为秋长空地(简称为QCKD)。选取两条典型地质剖面作为线型尺度,即秋长构造(简称QCGZ),测点编号为38~59号;沙田构造(简称STGZ),测点编号为60~77号)。

研究区域土壤氡测量布点如图1所示。

图1 研究区域土壤氡测量布点图

2 研究方法

2.1 传统统计法

传统统计法进行数据处理时,通常以区域氡浓度的几何平均值作为背景值,以“均值+2倍标准差”确定氡异常阈值[5]。

2.2 分布形式检验法

分布形式检验法是通过剔除离群值(一般用算术平均值±2或3倍标准差)后,使数据服从正态或对数正态分布。然后将服从正态或对数正态分布的样本数据,求取算术平均值作为背景值,算术平均值±2或3倍标准差作为异常阈值[6]。

2.3 EDA法和MAD法

分布形式检验法剔除的数据可能隐含重要的信息,不能客观描述实际数据所隐含的真实状况[11]。针对上述情况,文献[3]中采用更为稳健的统计分析技术来计算异常阈值,包括探索性数据分析(EDA)法[7]和中位数绝对离差(MAD)法[8]。

(1) 探索性数据分析(EDA)法

先求出样本的中位数,利用中位数将数据分为两组,最小值到中位数的一组数据为 LH,最大值到中位数的另一组数据为UH,再分别求取两组数据的中位数XLH和XUH。XLH和XUH之差的绝对值就是四分位数间距YIQR[1-2]。通过式(1)、式(2)计算XLIF和XUIF:

XLIF=XLH-1.5YIQR

(1)

XUIF=XUH+1.5YIQR

(2)

落在XLIF和XUIF的数据之外的数据,即为异常数据 ,以四分位数间距作为背景值。

(2) 中位数绝对离差(MAD)法

首先求出中位数XMe,再将中位数与每一项浓度值做差并求出绝对值,然后对求得的绝对值再求中位数XMAD[12]:

(3)

XMAD=Median|Xi-XMe|

(4)

异常阈值为第一次求得的原数据的中位数XMe与2倍XMAD之和。首次计算的中位数,与每一项浓度值做差并求出绝对值,用求得的绝对值的算术平均值作为背景值。

3 结果分析

3.1 不同调查尺度土壤氡样本统计

应用SPSS 16.0软件,选择Analyze模块下的Descriptive Statistics 工具集里的Explore工具,进行土壤氡样本的统计分析,结果列于表1。

表1 土壤氡浓度样本统计结果

由表1可见:QQDZT和QCGZ土壤氡浓度值的峰度和偏度均大于1,样本不服从近似正态分布;STGZ和QCKD的土壤氡浓度值的峰度和偏度均小于1,样本服从近似正态分布。全区域土壤氡浓度值的峰度和偏度均大于1,样本不服从近似正态分布;经对数转换后,峰度为-0.105,偏度为-0.673,样本服从近似对数正态分布。

3.2 不同调查尺度土壤氡样本背景值和异常阈值

(1) 传统方法。剔除异常阈值后计算平均值和标准差:QCDZT土壤氡测量值平均值为3 794 Bq/m3,标准差为4 024 Bq/m3;QCGZ土壤氡测量值平均值为5 975 Bq/m3,标准差为3 288 Bq/m3;STGZ土壤氡测量值平均值为26 469 Bq/m3,标准差为20 535 Bq/m3;QCKD土壤氡测量值平均值为4 656 Bq/m3、标准差为2 460 Bq/m3,全区土壤氡测量值平均值为9 484 Bq/m3,标准差为13 645 Bq/m3。剔除异常阈值后,算术平均值为背景值,“均值+2倍标准差”为异常阈值。

(2) 分布形式检验法。STGZ、QCKD样本服从近似正态分布,算术平均值为背景值,“均值+2倍标准差”为异常阈值;QQDZT、QCGZ、全区域样本不服从正态或近似正态分布,取对数结果服从近似正态分布,用对数变换结果按上述方法计算背景值和异常阈值。

(3) EDA和MAD法。根据式(1)、式(2)、式(3)、式(4)计算背景值和异常阈值。

4种方法计算得到的研究区域土壤氡样本背景值和异常阈值列于表2。

表2 不同方法计算的研究区域土壤氡样本背景值和异常阈值结果(Bq·m-3)

由表2可见,传统统计法、分布形式检验法、EDA法和MAD法在计算不同尺度的土壤氡背景值和异常阈值时,结果差异较大。对特定区域型的QCKD,土壤氡背景值传统统计法、分布形式检验法和MAD法计算结果基本一致,EDA法的结果较低;异常阈值传统统计法、分布形式检验法和EDA法计算结果基本一致,略高于MAD法。对线型的QCGZ和STGZ地质构造,土壤氡背景值4种方法计算结果基本一致;异常阈值MAD法较稳定,其他3种方法波动较大。对区域型的QQDZT,土壤氡背景值4种方法计算结果差异较大。对全研究区域,土壤氡背景值传统统计法、EDA法和MAD法计算结果基本一致,分布形式检验法计算结果偏低;异常阈值传统统计法>EAD法>MAD法>分布形式检验法。

3.3 土壤氡计算方法稳健性分析

为分析4种方法在不同调查尺度区域的土壤氡背景值和异常阈值的计算稳健性,对各调查对象,将4种方法计算的背景值和异常阈值结果进行排序,排序结果列于表3。

表3 不同方法计算的研究区域土壤氡样本背景值和异常阈值排序结果

统计所有调查对象排序出现的次数,定义为位序频数,结果列于表4。

表4 不同测算方法的土壤氡位序频数统计表

计算方法稳健性评价标准为:

(1) 背景值和异常阈值值对应中间排名的位序频数概率越大,计算方法越稳健且计算结果越保守;

(2) 背景值和异常阈值对应名次靠前的位序频数概率越大,方法越激进且计算结果偏大;

(3) 背景值对应名次靠前、异常阈值对应名次靠后,或者背景值对应名次靠后、异常阈值对应名次靠前的位序频数概率越大,方法越不稳健且计算结果不确定;

(4) 背景值和异常阈值对应靠后排名的位序频数概率越大,方法稳健且测算结果偏低;

(5) 背景值或异常阈值对应多个名次的位序频数概率越大,方法越不稳健且结果不确定。

由表3、表4可见:

(1) 用传统统计法计算的5个调查对象土壤氡背景值第1名出现3次,异常阈值第1名出现2次,两者合计第1名5次,说明传统统计方法计算的土壤氡背景值和异常阈值结果均趋于偏大,计算方法不稳健。

(2) 用分布形式检验法计算的5个调查对象土壤氡背景值第1名出现2次,异常阈值第4名(D)出现3次,两者合计第4名4次、第1名3次,说明分布形式检验法计算的土壤氡背景值趋于高值,异常阈值趋于低值,两者不同步,计算方法不稳健。

(3) 用EDA方法计算的5个调查对象土壤氡背景值第1名和第2名均出现2次,异常阈值第1名出现3次,两者合计第1名5次,说明EDA方法计算的土壤氡背景值不稳定,异常阈值趋于低值,计算方法不稳健。

(4) 用MAD方法计算的5个调查对象土壤氡背景值和异常阈值第3名各出现3次,两者合计第3名6次,说明EDA方法计算的土壤氡背景值和异常阈值结果趋于较保守,计算方法稳健。

综上分析,MAD法在计算不同调查尺度对象的背景值和异常阈值时稳健性较高。因此,选用MAD法计算研究区域土壤氡背景值和异常阈值,结果见表2所列。

4 结语

城市放射性地质调查是城市地质调查的重要组成部分,城市土壤氡浓度是城市放射性地质调查的重要内容。本文从特定区域型(点型)、线型和区域型(面型)3种调查尺度,应用传统统计法、分布形式检验法、EDA法和MAD法等4种方法进行了土壤氡浓度背景值和异常阈值计算。应用位序频数检验法对4种方法的稳健性进行了检验,检验结果表明MAD法在计算不同调查尺度对象的背景值和异常阈值时有较好的稳健性。

应用MAD法,计算出区域型调查尺度对象QQDZT的土壤氡背景值和异常阈值分别为1 339、4 469 Bq/m3;线型调查尺度对象QCGZ的土壤氡背景值和异常阈值分别为5 975、13 616 Bq/m3;STGZ的土壤氡背景值和异常阈值分别为21 875、56 280 Bq/m3;特定区域型调查对象QCKD的土壤氡背景值和异常阈值分别为4 656、9 422 Bq/m3;不分调查尺度的全研究区域土壤氡背景值和异常阈值分别为9 132、13 497 Bq/m3。

猜你喜欢
检验法中位数尺度
财产的五大尺度和五重应对
中位数计算公式及数学性质的新认识
PCR 检验法和细菌培养法用于阴道细菌检验的效果
宇宙的尺度
9
导学案不能沦落为“习题单”:以“中位数和众数”的导学案为例
关于协方差的U统计量检验法
阿基米德Copula函数的拟合检验
水准点稳定性F检验法与t检验法异同的研究
室外雕塑的尺度