杨国华, 冯文新, 孟 博
(1.河南地矿职业学院,郑州 450070;2.吉林大学 新能源与环境学院,长春 130021)
地下水中的氮来源广泛,包括大气、雨水、污水、土壤、含水层介质、含氮化学物质、粪便等[1-5],且氮在地下水中具有很强的迁移能力[6]。查明地下水氮浓度现状,了解其成因并提出相应的治理措施是十分重要的。目前地下水氮浓度调查往往通过水井获取测试样品,仅能得到有限个离散点的污染物浓度数据。要获得地下水氮浓度的空间分布状况,则需要通过空间插值手段来实现。ArcGIS软件的地统计向导功能提供了多种内插方法,可分为确定性方法和地统计方法两大类。确定性方法包括反距离权重法、径向基函数法等;地统计方法包括克里金法、面插值法等[7]。
本文以中国东北某灌区的地下水氮浓度监测数据为基础,分别使用反距离权重法、径向基函数插值法、普通克里金法、简单克里金法、泛克里金法、指示克里金法、析取克里金法及经验贝叶斯克里金法进行插值得到研究区的地下水氮浓度分布图;在此基础上通过比较交叉验证方法获取的插值预测误差,对比不同插值方法在地下水氮浓度分析中的可行性。
东北某灌区总面积192.76 km2,整体地势低平,东部略高,地面坡度1∶1 000~1∶2 000,区域内高平原的海拔高度为55~65 m,河谷平原的海拔高度为53~54 m,发育有沼泽湿地。区内第四纪以来一直处于间歇性下降,沉积了厚度较大(100~150 m)的第四系。地层沉积物颗粒松散,孔隙发育,为地下水的赋存创造了条件。
含水层由早中更新统至全新统组成。由于不同时代含水层之间没有分布稳定的隔水层,形成了统一的含水岩组,换算成涌水量变化范围为100~5 000 m3/d。含水层上部大多覆盖一层厚度为2~5 m的粉质黏土,从高平原向河谷漫滩粉质黏土由厚变薄,地下水类型由承压水过渡到微承压水至潜水,水位埋深受地貌控制:冲积河谷平原区水位埋深1~3 m,冲湖积高平原区水位埋深3~7 m。区域内,含水层厚度不均,冲湖积高平原含水层厚度为50~80 m,冲积河谷平原含水层厚度为20~30 m。
大气降水通过部分表层粉质黏土层较薄的区域形成的“天窗”补给地下水,河流入渗、农田灌溉的渠系入渗和田间入渗,都对地下水有一定的补给作用。灌区内地下水的水力坡度为1∶5 000~1∶10 000,地下水径流运动迟缓,径流方向基本与地形坡向一致,总体上由南东向北西方向径流。灌区地下水主要以侧向径流、蒸发和人工开采等方式排泄。
2017年8月,在研究区共采集了35件地下水样品(图1、表1),采样井平均深度34.22 m,取样层位在第四系巨厚孔隙含水岩组上部,所有样品均属于浅层地下水。从表1中可以看出:区内地下水品质的空间变异性普遍较大。基于这些采样所获得的离散点水质信息,需要通过适当的插值方法才能获得区域上的水质分布特征。
图1 地下水采样点位置图Fig.1 Sampling points of groundwater
表1 地下水样品检测结果统计特征值Table 1 Statistical characteristic values from detected groundwater samples
若一种插值方法预测的值与采样位置的测量值相同,则称之为精确插值器。本文选用的反距离权重法和径向基函数插值法均是精确插值器。
反距离权重法基于相近相似性原理,用待估点周围邻近采样点的值贡献权重与距离成反比对其值进行预测,距预测位置越近的测量值对预测值的影响越大[8]。该方法具有原理易懂、便于计算的优点,不要求数据具有一定的分布规律,在气温[9]、降雨量[10]的空间插值,大气[11]、地表水[12]、地下水[5]中的污染物浓度分析等领域中均有广泛使用。但其插值结果受数据中的极值影响很大,往往会围绕极值点形成“牛眼”使预测结果的准确性降低,常用于进行精确插值前的预插值[8]。
径向基函数插值法的基本思路是:插值表面必须通过每一个测得的采样值,并使用可能己经超出样本数据范围的观测值来构建具有渐变趋势的平滑表面[13]。在土壤重金属污染的预测中,一些学者的研究显示应用径向基函数插值可以取得良好效果[14-15]。
克里金(Kriging)插值法是应用于地下水模拟、土壤污染模拟、降水量模拟等领域最广泛的插值方法[16],是一种常用的地质统计格网化方法[2],当数据点越多时,得到的内插结果越可信[17-19]。
常用的克里金法包括如下几类:①当随机变量x0的数学期望E(x0)对所有位置都是一个未知常数时,可采用普通克里金插值方法[19]。②当随机变量x0的数学期望E(x0)对所有位置都是一个已知的常数时,可采用简单克里金插值方法[18]。③当随机变量x0的数学期望E(x0)是非平稳、存在漂移时,可采用泛克里金插值法,充分利用数据点的空间相关性,并能有效解决数据边界扩展问题[20]。④当区域化变量不服从正态或对数正态分布时,可采用指示克里金方法,该方法无需对变量的分布形态做出假设,但要求样本数据满足强平稳性要求[21]。⑤当待插值数据不符合正态分布规律时,也可使用经验贝叶斯克里金方法,该方法使用固有的随机函数作为克里金模型,可对数据的趋势进行校正,在处理地质层面高程估计方面具有一定的优越性[22],但处理速度相对其他克里金法较慢。
在选取的各种插值方法中,反距离权重法和径向基函数法作为确定性插值方法,不要求数据具有一定的分布规律,可直接使用污染物浓度测量数据进行插值。各种克里金插值法(不包含经验贝叶斯克里金法)均需要数据在一定程度上符合正态分布的趋势,因此如果数据不呈正态分布,应对数据进行变换使其符合正态分布。
首先利用地统计向导中的数据探索功能对数据进行分析,检验数据分布,找出离群点,防止由于测量和输入错误的离群值的存在影响半变异建模。本文使用的地下水氮浓度测量数据存在少量离群值,但均属真实值,不应去除;数据正态分布情况检验结果表明,研究区的地下水“三氮”污染物中,氨氮浓度较好地满足正态分布规律,硝酸盐氮和亚硝酸盐氮浓度在进行了自然对数变换后更加符合正态分布规律(表2)。利用数学曲面模拟要素在空间上的分布规律及其变化趋势,以此在建模中更准确地模拟短程随机变异。
表2 “三氮”测量数据分布偏度、峰度系数Table 2 Distribution of skewness and kurtosis coefficients of measurement data for three kinds of nitrogen
在误差检验方面,采用交叉验证的方法,比较不同插值方法的插值预测误差中的平均值误差、均方根误差、标准化平均值误差、标准均方根误差和平均标准误差。具体的评判标准为:当平均值误差和标准平均值误差越接近0、标准均方根误差越接近1、平均标准误差和均方根误差数值相差越小,表明插值结果精度越高。
采用7种插值方法得到了研究区氨氮浓度预测结果(图2)。以GB/T 14848-93《地下水质量标准》的5类水中氨氮含量标准作为图中填充等值线的划分界限。因区内地下水氨氮浓度普遍较高,在Ⅴ类水氨氮质量浓度(ρ)>0.5 mg/L的基础上增加了>2.5 mg/L的等值线来区分污染的严重程度。不同的插值方法得到的插值结果图大体是相似的,均可看出区内的地下水氨氮污染状况十分严重,除东部少数区域,绝大部分区域的地下水氨氮质量浓度均高于0.5 mg/L,属于Ⅴ类水,中南部的条带状区域内氨氮质量浓度可达2.5 mg/L以上。
图2 研究区地下水氨氮浓度分布图Fig.2 Spatial distribution of ammonium concentration in groundwater in the study area
以GB/T 14848-93《地下水质量标准》的5类水中亚硝酸盐氮含量标准为浓度等级界限,采用不同插值方法得到的研究区亚硝酸盐氮浓度预测结果如图3所示。简单克里金法和指示克里金法的插值结果显示区内亚硝酸盐氮浓度均基本处于Ⅱ类水标准。其余各种插值方法显示的插值结果区别不大,即由西北向东南方向亚硝酸盐氮浓度逐渐升高,大部分地区满足Ⅰ类水标准;东南部地区由泛克里金法显示可达Ⅱ类水标准,反距离权重法、径向基函数法、普通克里金法和经验贝叶斯克里金法均显示污染物浓度仅满足Ⅳ类水标准。
图3 研究区地下水亚硝酸盐氮浓度分布图Fig.3 Spatial distribution of nitrite nitrogen concentration in groundwater in study area
以GB/T 14848-93《地下水质量标准》的5类水中亚硝酸盐氮含量标准为浓度等级界限,采用不同插值方法得到的研究区硝酸盐氮浓度预测结果如图4。区内地下水硝酸盐氮浓度普遍符合Ⅰ类水标准;除径向基函数法和简单克里金法,其他插值方法的预测结果均显示南部少量区域的硝酸盐氮浓度处于Ⅱ、Ⅲ类水标准。
图4 研究区地下水硝酸盐氮浓度分布图Fig.4 Spatial distribution of nitrate nitrogen concentration in groundwater in study area
氨氮浓度各种插值方法的误差统计值如表3所示。灌区内地下水氨氮的浓度较好地符合正态分布规律,通过交叉检验误差显示出的插值精度普遍较好。根据误差检验评判标准:普通克里金法标准平均误差最接近0,标准均方根误差最接近1;简单克里金法平均误差最接近0;经验贝叶斯克里金法的均方根误差与平均标准误差最为接近。上述3种方法预测结果均显示插值与测量值之间的差距小,得到了较为理想的插值结果。
表3 氨氮浓度插值检验误差比较Table 3 Statistical error of different interpolation methods (ammonium)
亚硝酸盐氮浓度各种插值方法的误差统计值如表4。比较不同插值方法的检验误差可以得出,普通克里金法和经验贝叶斯克里金法的平均误差均很接近0;普通克里金法的标准平均误差更接近0;经验贝叶斯克里金法的标准均方根误差更接近1,且其平均标准误差与均方根误差最为接近。经验贝叶斯克里金法是通过估计基础半变异函数来说明所引入的误差;而其他克里金方法通过已知的数据位置计算半变异函数,由于不考虑半变异函数估计的不确定性,其他克里金方法都低估了预测的标准误差。考虑到以上情况,综合判断通过经验贝叶斯克里金法得到的亚硝酸盐氮浓度插值结果精度最佳。
表4 亚硝酸盐氮浓度插值检验误差比较Table 4 Statistical error of different interpolation methods (nitrite)
硝酸盐氮浓度各种插值方法的误差统计值如表5。由表2可知硝酸盐氮浓度测量数据分布不够符合正态分布规律,在经过对数变换后有所改善,但偏度系数仍然达到1.712。硝酸盐氮的插值结果相比于氨氮、亚硝酸盐氮,误差相对较大。比较不同插值方法的检验误差,可见经验贝叶斯克里金法的平均误差较小、平均标准误差最小、标准化均方根误差最接近1、平均标准误差与均方根误差最为接近,与其他插值方法相比,经验贝叶斯克里金法插值精度更高。
表5 硝酸盐氮浓度插值检验误差比较Table 5 Statistical error of different interpolation methods (nitrate)
本文应用ArcGIS软件提供的插值方法对地下水氮浓度分布状态进行分析,比较不同插值方法的检验误差,可见当地下水氮浓度测量数据较好地符合正态分布规律时,各种空间插值方法的预测精度均较高;当数据空间变异性较大、不符合正态分布规律时,经验贝叶斯克里金法得到的插值结果往往优于确定性插值方法和其他克里金插值方法。因此,在实际研究区域中,地下水污染物浓度的空间插值方法应结合实测数据的特点进行选择:污染物浓度的测量数据较好地符合正态分布规律时,考虑选择操作简便、运算速度快的插值方法即可;当数据空间变异性较大、正态分布规律不显著时,可优先考虑选用经验贝叶斯克里金法,以提高结果的可靠性。
数据获取不充分,在地学领域是普遍存在的问题[22],基于数据规律选择适宜的空间插值方法只是解决问题的一种技术手段;加深对地下水污染成因与演化规律的理解和认识,才是保障空间插值结果科学性的根本保障。下一步工作将研究如何把地下水污染形成与演化的主要控制因素(地质条件、水文地质条件等)纳入空间插值体系中,以进一步提高插值结果的可靠性。