刘涵薇, 陈富龙, 廖亚奥
(1.中国科学院空天信息创新研究院数字地球重点实验室,北京 100094; 2.可持续发展大数据国际研究中心,北京 100094; 3.中国科学院大学,北京 100049; 4.中国地质大学(北京),北京 100083)
长城作为我国首个列入世界文化遗产名录的遗产项目,承载着中华民族“创造、奋斗、团结与梦想” 的伟大精神。《北京城市总体规划(2016—2035年)》提出,北京长城文化带总面积4 929.29 km2,为历史文化名城保护体系中的重要组成部分,亦是全国文化中心建设的重要内容。注重保护其自然生态系统的原真性及完整性,对北部生态涵养功能区建设、北京历史文化脉络探索、京津冀一体化战略协同发展都极为重要[1]。开展线性遗产文化带环境要素动态变化及其驱动因子研究,能够科学掌握其保护现状和发展态势,在监测评估中更好地落实自然生态系统的整体保护,为文化带经济、生态协调发展与遗产文化景观可持续保护利用提供科学数据和技术手段。
明长城(北京段)景观廊道范围广,传统踏勘方法耗时耗力。卫星遥感技术具备宏观、客观、快速和精准等观测优势,在大型线性文化遗产景观廊道环境要素一体化监测中具备应用潜力。遥感动态监测方法历经了数理统计[2]、面向对象[3-4]、融合遥感大数据和机器学习[5-6]的技术革新过程。当前,深度学习方法为遥感科学与技术的纵深发展带来了新的生命力。该方法能规避人工主观性,依据损失函数自行抽取与任务最相关的特征; 且学习模型具备一定迁移性和多场景应用能力[7]。近年来,众学者对深度学习方法在遥感数据分析中的作用机制、面临挑战、具备优势和应用价值等进行了深入探索[8-9],提出了改进模型与算法[10-11],并成功应用于城市绿地分类、大型遥感建筑物变化检测[12-14]以及文化遗产环境要素监测分析[15-17]等多种领域。然而,该方法在大型线性文化遗产景观廊道整体性监测与方法适应性评估等方面的工作仍较为匮乏。综合考虑明长城(北京段)文化带监测评估工作相对不足和环境要素变迁机制相对不明的现状,本文选取该文化带为实验对象,使用提出的集成面向对象变化向量分析和U-net深度学习遥感动态监测方法开展应用研究,旨在厘清2015—2020年度明长城(北京段)文化带土地覆盖类型变化趋势及其与社会经济之间的内在关联,进而为该文化带生态环境协调发展和文化景观可持续保护提供技术支持。
北京市(E 115.7°~117.4°,N 39.4°~41.6°),地处于华北平原的西北边缘,地势西北高、东南低,三面环山,东南部为一片缓缓向渤海倾斜的平原。海拔范围8~2 303 m,东邻天津,南与河北交界。北京是全球拥有世界文化遗产(7处)最多的城市,也是全球首个拥有世界地质公园的首都城市。2020年全年接待旅游总人数达1.84亿人次; 其中八达岭长城、慕田峪长城是该城市文化遗产重要名片。
明长城(北京段)总长约527 km,整体走势较连续。累计保存完整墙体比例约为12%,较完整约21%,存在损坏约67%,其保护工作仍有待加强。墙体周围环境廊道作为该文化遗产的核心监控范围,对于明长城本体的保护具有影响和承接作用。土地覆盖类型的变化可反映自然生态变迁及社会经济活动态势,对于其整体的监测评估和驱动机制挖掘极为重要。本文以明长城(北京段)位置及走向为基准、向两侧各扩充2 km的文化带为研究区域。该景观廊道处于北京市北部,西临军都山,北靠燕山山脉,蜿蜒跨越延庆、怀柔等多个区域,空间展布范围较大(图1)。
图1 明长城(北京段)文化带研究范围示意图
覆盖明长城(北京段)的2015年和2020年2期高分二号(GF-2)图像,包含2 m分辨率全色和8 m分辨率多光谱(蓝、绿、红、近红外)波段。经过ISH融合增强处理,得到2 m分辨率多光谱(RGB)真彩色图像。
为了对明长城(北京段)文化带进行多维度的影响因子驱动分析,收集了相关年份各行业产值及比例等社会经济数据(北京统计年鉴: http: //nj.tjj.beijing.gov.cn/nj/main/2021-tjnj/zk/indexch.htm)。
研究从GF-2图像及明长城展布范围出发,集成面向对象的变化向量分析(change vector analysis, CVA)掩模提取和U-net深度学习图像分类技术,对2015—2020年间明长城(北京段)文化带的环境要素进行遥感动态监测; 进而通过对重点靶区的精准聚焦和土地覆盖变化矩阵的过程追溯,实现影响驱动因子的信息挖掘与科学诠析(图2)。
图2 明长城文化带遥感动态监测与影响因子驱动分析技术流程图
将配准好的前后2个时相的图像叠置,组合成兼顾二者信息的多时相组合图像; 采用多尺度分割算法对其进行分割,得到矢量斑块,作为后续变化区域掩模提取的尺度对象。分割中需要确定尺度因子、形状因子、紧致度以及各个波段所占权重大小等。为了能够将聚集的同质对象有效识别出来,在保证相邻图斑明显差异性的基础上,需要避免过度分割导致数据零碎[18]。
由于分割结果难以做到与实际地物类别分离情况完全吻合,分割后需进一步进行斑块分离与合并。总体而言,分割参数的选用需要根据实际情况、影像分辨率、地物分布特点等优化选定。
采用面向对象的CVA方法[19],将前后2期数据的斑块特征值构成特征矢量,设定基准图像(前时相)特征矢量为X,待检测图像(后时相)的特征矢量为Y,即
,
(1)
式中n为特征值数。
二者相减得到变化矢量ΔX,即
,
(2)
选取欧式距离值代表变化强度大小记为|ΔC|,即
,
(3)
式中|ΔC|包含了从前-后时相数据各个特征值变化的总和,代表着2期图像的特征差异; 其值越大,表明2期图像间的差别越大,即对应斑块土地覆盖类型变更概率越大; 反之亦然。进而,可以根据计算的变化强度阈值,判定斑块变化属性。
深度学习模拟人脑多层嵌套的神经系统,逐层进行数据特征的提取并学习其内在的规律特点,能够从样本中抽取更高层次的特征,为遥感图像的处理提供了更为智能化的方式。
卷积神经网络是根据输入/输出建立对应关系的网络模型,主要由提取特征的卷积层、浓缩数据量并过滤提取信息的池化层、整合类别区分信息的全连接层以及输入、输出层构成[20]。而针对图像语义分割,该方法通过全卷积网络,确定遥感图像像素类别并保留其位置信息。
本文采取一种U形对称全卷积网络—U-net,最初由Ronneberger等[21]提出。其体系结构主要分为2部分: 编码器和解码器。编码器通过多个卷积层连续采样,得到不同的图像特征级别,在每次下采样之后,特征通道的数量也增加了一倍; 由于最大池化层的存在,特征映射的大小也将逐级减小。解码器对顶层特征图进行多层反卷积,并在下采样过程中结合不同的特征层,将特征图恢复到原始输入图像大小,完成图像的端到端语义分割任务[22]。
假设前后2时相分别为t1和t2,分类结果共有m种,则以灰度值0 ~(m-1)代表各类别,将2时相结果进行差分: 若像素值为0,代表前后类别相同,未产生变化; 若前后类别不同,则重新赋值为1,代表发生变化。计算变化区域占总研究区的百分比即为变化率,即
δ=nv=1/(nv=0+nv=1)
,
(4)
式中:δ为变化率;v为灰度值;n为像素个数。 土地覆盖变化率综合反映自然过程及人为活动影响下地表覆盖变化的强度。
变化矩阵由分类后各类别的转换情况构成,为m×m的矩阵,代表各类别转换的数量及占比情况,能够较为清晰地表达地表覆盖的转换过程。
为了方便2期数据对比处理以及综合考虑程序内存容量限制,将整体廊道通过棋盘分割方式,以5 000×5 000像素为基本单元,划定为53个区块(图3),构成2015年和2020年53对区块影像。
图3 明长城(北京段)文化带廊道影像分块示意图
将每对区块影像叠置,进行多尺度分割。根据研究区地物整体特征,设置尺度因子为30,形状因子0.1,紧致度0.5,实现人工用地细节信息地精细分割。根据分割后的矢量文件,通过CVA算法提取差异较大的斑块,作为变化区域掩模图层输入。
3.2.1 样本制作及数量测试
依据已有土地利用分类体系标准,结合GF-2融合影像特征,选取人工用地、水体、林地、草地、耕地、裸地进行样本勾画和制作,以凸显和刻画明长城文化带环境要素地动态变化过程[23]。选取全连接网络U-net模型,将大尺寸影像及标签图像切割为若干256×256像素样本集合,并通过旋转、翻转、改变对比度等方式对样本集进行增广,以提高模型学习的鲁棒性。
通过控制样本数量对模型进行分类精度测试,分类精度性能对比如表1与图4。
表1 不同样本量对U-net模型分类精度的影响
图4 不同样本量下U-net模型分类精度变化
从图4可以看出,分类精度整体随样本量的增加而提高; 其次,当样本数量从前期的千级到万级跨越时,模型学习性能提升幅度明显; 后期则随着样本量增加,精度提升呈现收敛趋势。将所制作的样本以7∶3的比例进行训练样本和测试样本的分配,最终使用的学习样本数量为: 2015年训练样本53 020个,验证样本22 640个; 2020年训练样本53 244个,验证样本22 788个。本研究样本量在7万~8万之间,可实现优于85%的分类准确度。
3.2.2 模型训练及预测
经过测试,设置batch_size=16,学习率为0.000 1时模型效果最佳,2期模型训练精度及损失曲线如图5。训练均在5轮内收敛且继续稳步提升。2015年模型训练精度最高达99.3%,验证精度达97.1%,训练损失降至0.024,验证损失降至0.123。2020年模型训练精度最高达96.5%,验证精度达96.8%,训练损失降至0.223,验证损失降至0.218。
(a) 2015年精度 (b) 2015年损失
针对整景或广覆盖遥感图像的处理,本文采用待分类图像分割批量预测和结果拼接的处理策略。CVA变化掩模图层的输入,可使U-net深度学习聚焦预变化重点区域,在提升数据处理效率的基础上,进一步抑制基于像素处理的分类散斑噪声。在整个研究区生成1 000个随机验证点位,人工判别确定真值类别,对分类结果通过混淆矩阵分析精度(表2、表3)。结果显示: 2015年整体精度可达86.40%,Kappa系数为0.66; 2020年整体精度可达87.20%,Kappa系数为0.65; 揭示了模型预测结果的鲁棒性以及研究区各类别面积占比变化的差异性。
表2 明长城(北京段)影像U-net分类结果混淆矩阵(2015年)
表3 明长城(北京段)影像U-net分类结果混淆矩阵(2020年)
研究区GF-2图像的获取时相对应作物成熟/收割生长周期,光谱特征与同时期的草地、耕地、裸地相似(同谱异物)。考虑这些土地覆盖类型与人为扰动相关度不大,故对其进行合并处理为“裸土耕地等”,与原“人工用地”、“水体”、“林地”生成4大土地覆盖类型。将重分类后的2015年和2020年度图像进行差分,得到文化带景观廊道土地覆盖变化图及其对应类型变更信息(图6); 子图A—D为放大后的典型转换类别。计算变化图斑比例得到土地覆盖总体变化率为:
δ=2 229 413/(2 229 413+2 280 197 447)= 0.098%
,
(5)
为了验证所选模型的适用性与有效性,选取一处含多种地物类型的图像为示例,分别使用决策树(decision tree classifier,DTC)、支持向量机(support vector machine,SVM)、随机森林(random forest,RF)分类器与U-net进行对比试验; 并随机选取100个点位对分类结果进行精度评价,结果见表4。由图7、图8分类对照结果可知,图像中裸地与耕地光谱差异较小,山体阴影造成林区易与水体混淆,即DTC,SVM,RF分类器按光谱等特征进行土地覆盖分类,因同物异谱、异物同谱现象错分明显; 而U-net模型能通过样本迁移,学习发现地物之间整体规律和语义信息,改善山体阴影等错分现象,类别完整性好,分类精度提升明显。
(a) 测试图像分类结果 (b) U-net分类结果
(a) RF分类结果 (b) DTC分类结果 (c) SVM分类结果
统计各地表要素变化类型像素的数量与比例,得到类别变化矩阵(表5)。
表5 明长城(北京段)文化带2015—2020年土地覆盖变化矩阵
由计算结果可知,总体变化率不到0.1%; 揭示明长城(北京段)所受影响较小。对变化矩阵作统计分析见图9。由图9可知,地表要素的变化主要体现在裸土耕地等与人工用地、林地的转化,占比最大的为裸土耕地类别向林地转化,是森林覆盖面积增加的表征,贡献文化带生态正向变化(占比1/3)。其次是裸土耕地向人工用地转化(占比约1/4),表现为自然空地、耕地等的人为占用,包括工业、商业以及居住用地的建设(图10(a),(b)),揭示社会经济建设对生态环境的人为干预与破坏。同时占比约12%的人工用地拆除与环境整治情况,贡献林地面积增加和生态正向变化。林地与人工用地互为转化比例相当,占比约11%; 另存在约6%的人工用地拆除或土地复耕。
图9 不同变化类别占比情况
(a) 细节一: 2015年图像、2020年图像和变化标记 (b) 细节二: 2015年图像、2020年图像和变化标记
同时研究也发现了少量伪变化标记,见图10,图中每幅小图从左到右分别为2015年图像、2020年图像和变化标记,如季节气候等变化引起的农作物的不同生长周期表征(如图10(c)为生长季与收割期差异); 冬季水体表面结冰导致的高反射与常态深色水体的差异(图10(d))。
对比2015年及2020年的各类经济数据(图11),发现以养殖、种植、培育生物材料相关的第一产业逐年下降,对自然地类的使用率有所降低。而生产总值仍随经济发展而增长,含建筑土木、工业生产、房地产等的第二产业则呈现小比例提升,体现在土地覆盖中人工用地的征用或退还,与经济稳步发展整体协调。城市绿化覆盖(由48.4%变更至49.0%)较为稳定,森林覆盖率从41.6%小幅增加至44.4%,与变化矩阵中林地比例的上升情况相符。近年来,北京旅游人数缓慢增加(去除2020疫情重大社会事件因素),2015—2020年旅游产业数据呈上升趋势,揭示对文化遗产保护与开发的更高要求。
图11 各产值分布及各年份比率增长趋势
综上所述,2015—2020年明长城(北京段)文化带人工用地对裸土、林地等自然地类的侵占使用整体可控,生态环境保护与开发呈现正向发展态势。
针对明长城大型线性文化遗产赋存环境一体化监测和评估研究需求,本文提出了一种集成面向对象变化向量分析和U-net深度学习的遥感动态监测方法,开展2015—2020年时相文化带景观廊道土地覆盖遥感变化监测和社会经济影响驱动机制诠析,实验结果表明:
1)明长城(北京段)文化带2015—2020年期间,土地覆盖变化率约千分之一,主要表现在裸土、耕地等向林地转化,以及人工用地部分占用; 社会经济建设等扰动整体可控,文化带生态环境正向发展态势良好。
2)针对GF-2真彩色图像中同物异谱、异物同谱等问题,深度学习图像分类相较于传统遥感分类方法具备优势,可以保留地物完整纹理和影像语义信息,获得更为精确的遥感地物分类结果。
3)深度学习模型分类精度直接受制于样本数量,总体呈正比关系; 但达到一定量级之后,精度改善缓慢并趋于饱和。使用U-net全连接网络进行语义分割需要保证样本与标签的全面对应,对典型性标签样本制作提出了更高要求。
总体来说,使用面向对象CVA变化掩模提取方法,辅助分类后变化检测可高效、精准获取土地覆盖变化靶区,抑制基于像素分类的散斑效应,便于时相间地物类别变化检测与变化矩阵定量分析。融合社会经济数据的遥感智能处理和信息解译,可以深层次挖掘、佐证变化驱动力因素,为文化带景观廊道环境要素动态变迁研究提供全新方案。未来我们将进一步细化样本类别,提升其广度与精度; 针对遥感图像特征改进U-net模型结构,进一步提高模型的适配性与分类精度,为方法模型的普适性推广与复杂场景应用奠定技术基础。