宁夏地下水原生氟污染空间分布预测

2022-11-26 02:43谢殿荣
安全与环境工程 2022年6期
关键词:氟化物人工神经网络宁夏

谢殿荣

(福建省闽东南地质大队,福建 泉州 362011)

中国人均水资源量仅为世界水平的四分之一,全国600个城市中有400个城市缺水或严重缺水,尤其是在华北和西北地区,水资源短缺的问题尤为突出。全国以地下水为饮用水源的城市占比约为61%,近70%人口饮用地下水。随着我国经济社会的快速发展,地下水资源开发利用量呈迅速增长态势,地下水占全国总供水量的比例在30年间增长了1倍[1]。由于人类活动加强,预计地下水质量的提升将会面临越来越大的压力。近年来的研究表明,大多数地下水的大规模污染与地质成因有关,地下水与含水层矿物的相互作用可能会导致地质成因污染物的释放[2]。

本研究在系统收集整理宁夏地下水中氟化物浓度样本数据以及地质气候、土壤等相关空间变量数据的基础上,利用人工神经网络方法对宁夏地下水中氟化物浓度与对应的预测变量进行建模,并根据建立的高氟地下水人工神经网络预测模型生成了宁夏高氟地下水(地下水中氟化物浓度>1.5 mg/L)空间分布预测图,进而确定影响宁夏地下水中氟化物富集的关键参数。本研究结果可为宁夏饮用水氟暴露风险的防控提供指导,为地下水的合理开发与利用和保障居民饮水安全提供科学依据。

1 数据来源与研究方法

1.1 数据来源

本文从已发表的文献[16-22]中收集了宁夏333个地下水中氟化物浓度数据,其中99个地下水中氟化物浓度(29.7%)超过1.5 mg/L。虽然数据来源不同,但由于所有数据均来自经同行评审的文献,因此认为收集的数据质量是可靠的。

在宁夏北部、中部以及南部均选取了地下水中氟化物浓度样本数据,其数据点分布见图1。地下水样本采样时间从2007年至今,采样深度在300 m以内,地下水样中氟化物浓度最高为7 mg/L。一般来说,地下水中元素的浓度在时间上是相对稳定的,在几十年的时间尺度内基本没有变化或者变化很小,因此选取的样本数据包含几十年的氟化物浓度是合理的[26-28]。理想情况下,地下水溶质浓度的预测模型应基于反映溶质迁移转化关键特征的三维参数。然而,在缺乏含水层条件和深度的三维空间连续数据库的情况下,全球和区域可用的(二维)表面参数可作为溶质富集的代理指标[29]。根据已有的关于地下水中氟化物释放和积累的研究文献以及数据可获取性[2,14,23,25],本文选择15个预测变量用于建立地下水中氟化物浓度预测模型(表1),主要包括地质、土壤和气候等预测变量数据,由于分辨率、数据格式和投影的差异,先将所有预测变量的分辨率转换为0.5弧分,以保持预测变量之间的统一性;然后以1.5 mg/L为阈值将地下水中氟化物浓度数据转化为二分变量,其中地下水中氟化物浓度>1.5 mg/L为1,地下水中氟化物浓度≤1.5 mg/L为0;再将地下水中氟化物浓度数据与对应的预测变量编译为完整的数据集;最后将上述数据集随机拆分为训练(70%)、验证(15%)和测试(15%)数据集用于建模。

图1 宁夏地下水中氟化物浓度数据点分布图

表1 用于建模的预测变量

1.2 研究方法

1.2.1 人工神经网络预测模型的建立

本文利用训练数据集和15个预测变量建立了宁夏高氟地下水人工神经网络预测模型。人工神经网络(ANN)是一种自适应系统,通过在类似于人脑的分层结构中使用相互连接的节点或神经元进行学习,从而可以建立变量之间的复杂关系。具有单个隐藏层的ANN模型能够作为通用拟合器,2N+1个隐藏神经元足以满足具有N个输入的预测任务[30]。因此,本文使用网格法从2-31(2×15+1)中搜索得到的最佳神经元数量为10。隐藏层与输出层之间使用Softmax传递函数,其他层之间使用双曲切线传递函数连接[30],采用均方误差作为性能函数。

1.2.2 模型性能评估

将预测模型在测试集上的准确性、敏感性、特异性、阳性预测值和阴性预测值以及受试者工作特征曲线下的面积(AUC)作为预测模型性能的评估指标。此外,将预测模型的不确定性也作为评估标准。本文采用Bootstrap (100个Bootstrap数据集)预测值的标准差作为预测模型不确定性的衡量标准,标准差越低代表模型不确定性越低[24]。

1.2.3 预测变量重要性分析

本文采用上述ANN预测模型和排列重要性[24,31]来评估选取的预测变量的重要性。排列重要性基于一个直观的概念,即通过计算预测变量置换后模型预测误差的增加来衡量预测变量的重要性。具体操作为:随机排列数据中所选定预测变量的数值,并计算这种随机排列所造成的预测准确率的降低,预测变量的重要性与预测准确率的降低成正比。本文对每个预测变量执行50次排列重要性计算,以预测准确率降低值的均值作为预测变量重要性的度量值。

2 高氟地下水人工神经网络预测模型建立与性能评估

2.1 模型训练及其性能评估

对建立的高氟地下水人工神经网络预测模型进行训练及其性能评估,其结果见图2和图3。

图2 模型训练过程中性能的变化

图3 模型在训练集和测试集上的混淆矩阵以及在测试集上的AUC值

由图2和图3可以看出:

(1) 模型训练开始后,训练集、验证集和测试集的均方误差迅速降低(图2),并在Epoch=86时,验证集均方误差达到最低值0.06,达到了验证提前停止条件,模型训练停止。

(2) 最终的人工神经网络模型在训练集和测试集上的准确率分别为97.6%[图3(a)]和93.5%[图3(b)],具有良好的泛化性能,几乎不存在过拟合。

(3) 相比于训练集,模型在测试集上的性能直接体现了模型的预测能力。当截断概率为0.5时,模型在测试集上的敏感性(模型识别高氟地下水的准确性)和特异性(模型识别低氟地下水的准确性)分别为98.3%、87.8%[见3(b)]。

(4)AUC可以显示模型在不同截断概率下对观测结果的区分程度。AUC的取值范围为0.5~1,当AUC=0.5时,表示模型无分辨能力;当AUC>0.80时,表示模型具有较好的分辨能力。本文所建立的人工神经网络模型的AUC值为0.93[图3(c)],表明该人工神经网络模型具有较高的预测能力。

2.2 模型不确定性评估

图4为模型预测概率及其对应的标准偏差和占比。越低的预测概率标准偏差,表示模型预测的确定性越高,即模型能够以更高的可靠性来判断地下水中氟化物浓度是否大于阈值1.5 mg/L。

图4 模型预测概率及其对应的标准偏差和占比

由图4可知:模型预测概率与相应的标准偏差之间的关系呈抛物线型,即预测概率为0.5时预测概率的标准偏差最大,而低预测概率和高预测概率的标准偏差较小。分析认为这种抛物线结构非常符合预期,原因在于响应变量为二进制变量,人工神经网络的输出为样本属于高氟地下水的概率,而预测概率在0.5附近时表明模型不能判断样本是否属于高氟地下水,也就是模型预测具有不确定性,因此预测概率的标准偏差较高;但同时,模型预测概率值在0.4~0.6之间的占比仅约为总体的4.1%,说明本文建立的人工神经网络预测模型对绝大多数样本预测都具有较高的确定性。

3 模型应用与分析

如前所述,本文所建立的ANN预测模型同时具有较高的敏感性、特异性和确定性,因此利用该模型能够很好地预测高氟地下水,同时避免对非高氟地下水的的误报。基于本文所建立的高氟地下水人工神经网络预测模型生成了宁夏高氟地下水风险空间分布预测图(见图5),图中显示了宁夏地下水中氟化物浓度大于1.5 mg/L的预测概率,其中预测概率大于0.95的高氟地下水高风险区约占宁夏全域28.7%的区域。

图5 宁夏高氟地下水风险空间分布预测图

由图5可见:宁夏高氟地下水高风险区主要集中分布在吴忠市和中卫市,总体上沿西南-东北呈带状分布,其余高风险区呈零散分布。Amini等[23]首次给出了包括中国在内的分辨率为5弧分的全球高氟地下水风险空间分布预测图,但其训练集数据中仅有呼和浩特盆地的25个样本来自中国。相较于已有的宁夏高氟地下水风险空间分布预测图,本文生成的预测图基于更大的训练样本,分辨率提升了2个数量级。此外,《中国生活饮用水地图集(1988)》中显示,宁夏高氟地下水主要分布在北部沿黄两岸以及由中卫市、吴忠市和固原市围城的区域,这与本文预测的分布结果一致。

4 模型预测变量重要性分析

本文利用ANN模型和排列重要性方法量化了预测变量的重要性,其结果见图6。

图6 基于ANN模型和排列重要性方法的预测变量重要性分析结果

由图6可知:15个预测变量中有12个预测变量能够导致ANN模型预测的准确性降低超过10%,其中降水、潜在蒸散发(PET)、实际蒸散发(AET)、地形湿度指数(TWI)和土壤阳离子交换容量(CEC)是影响最大的5个预测变量,因此气候预测变量是宁夏高氟地下水最重要的预测因子。

气候对地下水中氟化物浓度的影响主要来自于降水对地下水补给和流动的影响。在降水较多的地区,如潮湿的热带地区,由于稀释作用,地下水中氟化物的浓度通常较低[25,32]。相比之下,在干旱和半干旱环境中,长期的水-岩相互作用增强了矿物的溶解,导致地下水中氟化物的浓度较高[7],而强烈的蒸发作用也增强了以碳酸盐形式存在的钙离子的沉淀,从而降低了地下水中钙离子的浓度,因此氟的富集很难通过萤石的溶解/沉淀来控制[4,6]。此外,气候对地下水中氟化物浓度的影响也可能是由于干旱和半干旱环境有较高的pH值所致。土壤pH值的升高有利于含氟矿物如萤石、冰晶石的溶解,从而增强了这些矿物中氟化物从富氟岩石中溶解出来[33-34]。此外,由于相同的电荷和几乎相同的半径,氟离子和氢氧根离子可能在矿物结构的八面体薄片中发生交换[35],在碱性条件下,氢氧根离子可以替换吸附在矿物上的氟离子,从而增加地下水中氟化物的浓度[36]。因此,土壤pH值也是ANN预测模型中重要的预测因子。

土壤CEC和土壤粒径变量的重要性可能来自于其可以反映黏土和有机质含量。一般来说,细粒土壤比砂土含有更高水平的黏土和氢氧化物,因此通常比粗粒土壤保留更多的氟化物[32]。此外,土壤有机碳密度通常与降水呈正相关关系,因此土壤有机碳密度也可以作为气候的一个指标。

5 结 论

本文利用人工神经网络方法建立了性能优良的宁夏高氟地下水预测模型,其中气候变量是宁夏高氟地下水最重要的预测因子。基于预测模型生成的宁夏高氟地下水风险空间分布预测图显示,吴忠市和中卫市是主要的高氟地下水高风险区。本研究生成的高氟地下水风险空间分布预测图对潜在的高氟地下水区域提供了准确可靠的判断,能够有效助力当地相关部门改水降氟工程的实施。但考虑到地下水系统的高度非均质性,本研究生成的高氟地下水风险空间分布预测图并不能代替实际测试工作,而只能为地下水检测与风险管控提供指导。

猜你喜欢
氟化物人工神经网络宁夏
铅锌冶炼行业高氟碱性废水除氟技术研究
利用人工神经网络快速计算木星系磁坐标
宁夏
茶包含氟化物过多会损害骨骼甚至致癌
人工神经网络实现简单字母的识别
宁夏煤电博弈
宁夏
基于改进人工神经网络的航天器电信号分类方法
模糊人工神经网络在工程建设项目后评价中的运用
磷肥厂氟化物对周边农作物的危害与防治