杜坤娟,高 军,武希峰
(1.科尔沁右翼前旗防汛抗旱服务中心,内蒙古 兴安盟 137400;2. 兴安盟水务投资集团有限责任公司,内蒙古 兴安盟 137400)
基于遥感数据的水资源变化分析与预测系统的硬件设计中,计算机服务器型号采用Dell PowerEdge R740,用于存储、处理和分析大量的遥感数据,实现数据挖掘、模型训练和预测等任务。遥感数据采集设备选用航空遥感仪及卫星遥感传感器,用于获取水资源相关的遥感数据,如卫星影像、雷达图像等。全球定位系统(GPS)设备采用Garmin GPSMAP 64 sx,用于记录遥感数据采集设备的位置信息,以便后续的地理定位和数据对应。系统中的数据存储设备选择Synology DS920+系统,用于存储大量的遥感数据、预处理数据和中间结果,提供可靠的数据存储和访问功能。
图形处理单元(GPU)选择NVIDIA GeForce RTX 3080,用于加速计算机服务器上的遥感数据处理和深度学习任务,提供并行计算能力。数据显示和可视化设备为Dell UltraSharp U2720Q高分辨率显示器,展示和查看遥感数据、分析结果和预测模型输出,以便用户进行数据分析和决策。网络设备中的交换机、路由器主要用于构建局域网(LAN)或广域网(WAN),实现设备之间的数据传输和通信。传感器设备包含水位传感器、雨量传感器,以便实时监测水资源相关的环境参数,提供实地观测数据与遥感数据的对比和校准。
数据获取是基于遥感数据的水资源变化分析与预测系统中的关键步骤之一,具体的获取步骤如图1所示。
图1 遥感数据获取流程
如图1所示,首先选择Sentinel-2高分辨率的光学卫星平台进行遥感数据获取。挑选具有多个波段的遥感影像,以获取丰富的地物信息,根据具体的数据源进行后续处理和分析[1-5]。根据研究需求和预算确定数据采集的时间、频率和区域范围,制定一个符合具体测算区域的计划。
使用卫星平台和数据传感器,根据预定的计划进行数据采集,该数据采集是一项操作性任务,只需操控Sentinel-2系统并制定出具体区域的数据即可。利用卫星数据传输通道或互联网传输数据,并使用云存储服务进行数据存储和备份,将高速数据传输通道和云存储服务进行数据传输和存储。对数据进行校正、去噪、辐射定标等处理,应用大气校正、辐射定标算法进行数据校正,并使用滤波和去噪技术降低数据噪声,确保数据质量。最后,将原始遥感数据转换为适合分析和处理的格式,转换为GeoTIFF栅格数据格式或Shapefile矢量数据格式,以此来完成对遥感数据的采集工作,以方便对数据进行预处理。
2.2.1 图像几何校正
在基于遥感数据的水资源变化分析与预测系统设计中,图像几何校正是遥感数据预处理的一个重要步骤。校正图像几何旨在将采集到的遥感影像进行几何校正,以消除由于平台运动、地球曲率和地形变化等因素引起的几何畸变,使得影像在地理坐标系统下的位置和尺度准确。首先需要收集参考数据,获取精确的地面控制点(GCPs)数据,如已知位置的地物或人工标志物的地理坐标,这些GCPs将用于校正遥感影像。使用多项式几何校正模型来描述影像的几何畸变特征,具体的二阶多项式模型如式(1)所示:
X′=a0+a1X+a2Y+a3XY+a4X2+a5Y2
Y′=b0+b1X+b2Y+b3XY+b4X2+b5Y2
(1)
式中:X′和Y′为校正后的地理坐标,(°);X和Y是原始影像的像素坐标,pixel;a0~a5、b0~b5为模型的参数,通过拟合GCPs得到。在遥感影像和参考数据中定位GCPs,进行GCP的匹配,建立遥感影像和地理坐标系统之间的关联。利用匹配的GCPs最小二乘法等拟合方法,通过最小化残差平方和来估计模型参数,以使得校正后的影像像素与GCPs的地理坐标之间的差异最小化。根据估计的几何校正模型参数,对整个遥感影像进行几何校正,对每个像元进行重采样操作,将其从影像坐标转换到地理坐标,对校正后的影像进行降噪和平滑处理,以提高影像质量和几何精度。
2.2.2 影像配准
影像配准旨在将不同时间、不同传感器或不同平台获取的遥感影像进行空间对齐,以实现精确的比较和分析。在采集遥感数据过程中,将采集到两幅遥感影像,一幅是待配准影像(Image A),另一幅是参考影像(Image B)。为实现影像配准,首先选择使用SIFT(尺度不变特征变换)算法进行特征提取,用现有的SIFT算法库或开源工具来实现SIFT特征提取,并根据具体需求进行调整和优化。采用最佳候选匹配算法,基于特征点的描述子进行特征匹配,建立待配准影像和参考影像之间的对应关系。选择仿射变换模型,使用最小二乘法估计待配准影像和参考影像之间的初始变换参数,具体的仿射变换如式(2)所示:
(2)
(1)确定待插值位置(x,y)所在的四个已知像素点的位置和像素值。
(2)获取水平方向上的插值结果Va和Vb。
(3)获取垂直方向上的插值结果Vs。
(4)得到最终的插值像素值Vz。
通过上述流程,对经过几何变换的待配准影像进行像素值插值处理,以保持图像的空间连续性。
2.2.3 影像滤波
在基于遥感数据的水资源变化分析与预测系统设计中,影像滤波是一种常用的预处理步骤,用于去除噪声、平滑图像、增强特定信息等,均值滤波(Mean Filtering)的整体影像滤波流程如图2所示。
图2 影像滤波流程
首先要定义滤波窗口的大小,选择5 pixel×5 pixel的正方形。移动滤波窗口,以每个像素点为中心,依次遍历整个图像。对于滤波窗口中的每个像素,计算其与邻域像素的平均值作为滤波后的像素值,均值滤波如式(3)所示:
(3)
式中:Ifiltered(x,y)为滤波后的像素值;N、M为滤波窗口的尺寸,pixel;i、j分别为滤波窗口的行列索引;I(x+i,y+j)为滤波窗口中的像素值,pixel。将计算得到的均值赋值给当前像素,完成滤波操作。
当设计基于遥感数据的水资源变化分析与预测系统时,水资源变化分析旨在识别和理解水资源在时间和空间上的变化趋势、规律和影响因素。根据遥感影像预处理结果,对校正后的影像进行地物分类和提取,目的是获取感兴趣的水体区域。使用时间序列分析方法对水资源数据进行建模和分析,以揭示长期趋势、季节性变化和周期性变动等,对不同地区的水资源数据进行比较和分析,以寻找空间上的差异和变化模式。使用线性回归进行水资源变化预测时,具体如式(4)所示:
S=a+bH
(4)
式中:S为水资源变化量(例如,水体面积变化),m2;H为时间,d;a、b为回归系数。得知水资源变化量之后,探索水资源变化与其他影响因素之间的相关性,如气候因素、土地利用变化等,使用相关系数来评估不同变量之间的关联性。利用机器学习算法进行水资源变化的预测,支持向量机模型如式(5)所示:
f(x)=sign(wx+b)
(5)
式中:f(x)为向量机模型;w为权重向量;b为偏置项。建立决策树对历史数据进行训练,学习出数据中的模式和规律,并预测未来的水资源变化。同时,数据的质量和准确性也对预测结果产生重要影响,因此,在预测过程中,数据预处理、特征选择和模型评估等步骤也是必不可少的。
试验使用一台配置较高的Dell PowerEdge R740服务器,其具备足够的计算能力和存储容量。安装适用的操作系统、开发环境和相关软件,包括Python、GDAL遥感数据处理库、Scikit-learn、TensorFlow机器学习库。选择Landsat系列遥感数据源,从数据源中获取多期的水体遥感影像数据,涵盖一定时间范围内的变化。对获取的遥感影像进行辐射校正、大气校正、地物分类和提取等预处理步骤,得到水体的面积变化数据。根据预处理后的数据,提取每期水体面积、气象数据(如降雨量、温度等)等作为特征,选择合适的机器学习模型,使用历史数据进行模型的训练,以此来测试系统的性能。
通过测试系统在长时间运行下的表现来评估构建平台的稳定性,抽选3组数据集,记录系统运行的稳定性指标。根据训练得到的模型进行水资源变化预测,记录系统在处理不同规模数据集时的时间消耗,包括数据加载、预处理、模型训练和预测等环节,监测系统在运行过程中的计算资源利用率,如CPU和内存的使用情况,具体的试验结果数据如表1所示。
表1 测试试验结果
从表1中各项结果指标的详细分析可以看出,RMSE(均方根误差)在数据集1、数据集2和数据集3中分别为0.123、0.234和0.178,表明模型的预测误差相对较小。MAE(平均绝对误差)在数据集1、数据集2和数据集3中,MAE分别为0.086、0.129和0.101,表明模型的平均预测误差相对较小。预测模型在准确性方面表现良好,具有较小的RMSE和MAE值,这意味着模型能够较为准确地预测水资源变化,并与实际观测值较为接近。在数据集1、数据集2和数据集3中,加载数据集所需的平均时间分别为2.34 s、3.67 s和1.98 s,表明数据加载的速度较快。内存利用率在数据集1、数据集2和数据集3中,分别为55%、58%和52%,表明系统能够有效利用计算资源,提高数据处理和模型训练的效率。
基于遥感数据的水资源变化分析与预测系统旨在提供一个全面、准确的工具,帮助监测、分析和预测水资源的变化和趋势。通过对遥感数据的获取和处理,结合机器学习技术,该系统能够准确提取水体变化信息并建立预测模型,为水资源管理和决策提供重要的支持。在系统的设计和实现过程中,本文详细介绍了数据预处理和预测模型建立的关键步骤。通过对试验数据的测试和分析,验证了系统的稳定性和性能。结果表明,该系统具有较高的准确性,能够准确分析水资源变化,并提供未来趋势的预测。