崔闰虎,张海洋,支俊俊
(1.全图通位置网络有限公司,北京 100176;2.安徽师范大学 地理与旅游学院,安徽 芜湖 241002)
目前,我国城市轨道交通已经历50多年发展历程,轨道交通不仅成为城市交通运输领域的骨干,也带动了城市轨道交通沿线的经济发展。以北京地铁为例,2021 年,北京地铁运营里程达783 km,日均客运量840 万人次,年客运量超过30.66 亿人次。但是,城市轨道交通保护区内的工厂施工、基坑开挖、钻探挖井等活动,对轨道交通地下结构产生极大影响,成为城市轨道交通安全的重大隐患[1-2]。
在以往的城市轨道交通运营维护中,多采用人工巡检方式对线路周边生态环境、施工信息进行调查。近年来,随着城市轨道交通蓬勃发展,运营里程不断增加、覆盖区域愈加广阔,人工巡检暴露出调查方式单一、调查周期长、更新时间慢等弊端[3],不仅耗费巨大人力、物力,巡检信息还不能及时反映沿线施工状态。
目前,多尺度遥感产品不断涌现,特别是稳定可靠、更新周期短、持续性强、精度高的高分辨率遥感数据,为城市轨道交通保护区监测提供了数据保障[4-6]。但是,现有遥感影像分析方法与数据处理技术难以满足城市轨道交通保护区监测的实际需求[7],亟须更高效的方法及技术体系,利用高分遥感影像的宏观性、时空全覆盖性等优势,进行城市轨道交通保护区建筑信息识别[8-10]。
第一次世界大战以来,得益于超级大国的激烈竞争及空间技术发展,遥感技术进入高速发展期。1972 年,美国发射“地球资源技术卫星”后,各国开始效仿跟进。我国遥感技术后来居上,并于2013 年发射高分辨率对地观测系统的“高分一号”卫星。此后,我国遥感技术逐渐达到国际领先水平,基本形成应用广泛的陆地卫星格局。在遥感技术应用中,如何快速、有效地处理遥感数据并提取所需信息成为技术难点,而卷积神经网络(Convolutional Neural Networks,CNN)的发展为解决该问题提供了有效方法。
1943 年,McCulloch 和Pitts 提出神经元网络,神经网络概念出现;2006 年,卷积神经网络进入快速发展期;2012 年起,深度学习研究进展迅速,并提出一系列模型,卷积神经网络的应用领域逐渐广阔。随着数字图像分析技术的发展、遥感影像精度的提高,图像分割和数字图像处理逐渐被应用于变化监测。近年来,深度学习在建筑物识别、土地利用制图等领域广泛应用。
卷积神经网络是一类包含卷积计算,并且含有深层次结构的深度前馈神经网络,是深度学习的代表算法之一[11]。卷积神经网络可自动提取目标特征,并发现样本的集中特征规律,有效解决手动提取特征效率低下、分类准确率低等不足。卷积神经网络广泛应用于目标识别、图像分类等领域,但在轨道交通保护区监测的实际运用中,仍存在提取建筑物精度低、速度慢等问题,建筑信息识别效率不能满足工作需求。因此,研究通过遥感影像的变化检测,对轨道交通保护区监测区域进行预处理,将处理结果进行人工判读以及卷积神经网络深度学习分类,可实现区域内的变化识别。
2017 年,中国共产党北京市委员会、北京市人民政府发布的《北京市城市总体规划(2016—2035年)》明确北京市发展的重要指导思想之一:“协调地上地下空间的关系,促进地下空间资源综合开发利用”,其中第53条明确指出:“坚持先地下后地上、地上地下相协调、平战结合与平灾结合并重的原则,统筹以地铁为代表的地下交通基础设施,统筹以综合管廊为代表的各类地下市政设施,统筹以人防工程为代表的各类地下安全设施,统筹以地下综合体为代表的各类地下公共服务设施,构建多维、安全、高效、便捷、可持续发展的立体式宜居城市”[12]。由此,城市轨道交通保护区变化监测工作成为重中之重。
因此,以北京地铁为例,结合其实际需求,研究利用卷积神经网络、语义分割2种方法,对北京地铁运营有限公司下属16 条线路(非全北京市,即1 号线、2 号线、5 号线、6 号线、7 号线、8 号线、9 号线、10 号线、13 号线、15 号线、房山线、昌平线、亦庄线、S1 线、八通线、首都机场线)的城市轨道交通保护区内违规施工行为进行监测,并将信息上报至相关部门,保障地铁运行安全,从而有效解决传统监测人工消耗大、低效率以及现有算法工程化中的薄弱环节。
研究数据主要包括以下2个部分:
(1) 源自2021 年第3 季度(2021 年7—9 月)、第4季度(2021年10—12月)北京市地铁运营有限公司下属16条地铁线路的“北京二号”卫星高分辨率遥感影像。影像多光谱波段分辨率为0.8 m,数据处理级别为L4A,数据位深为8 bit,文件格式为Tiff,坐标系为CGCS2000,采用高斯克吕格投影;采用其标准4波段进行真彩色合成得到遥感影像彩色合成图进行本文的建筑信息识别。
(2)北京市地铁运营有限公司及其下属分公司提供的《北京地铁安全保护区内外部工程配合管理工作汇表》。
基于深度学习,从遥感影像中面向对象提取建筑物,算法采用4 模块架构体系,包括主干特征提取模块、区域推荐与特征截取模块、对象预测模块、语义分割模块。算法总体技术路线见图1。
图1 算法总体技术路线
本算法使用 ResNet101 作为主干特征提取网络,基于ResNet101 网络提取的4 层特征,经逐层采样,获得5 层特征金字塔(FPN)作为共享特征层。主干特征提取流程见图2。
图2 主干特征提取流程
要从遥感影像中找到建筑物位置,首先需要找到包含建筑物的外矩形框,再在外矩形框执行语义分割,预测建筑物对象具体掩膜。但是,在1幅遥感影像上可以有无数个矩形框,如何找到包含建筑物的矩形框是其关键。算法使用特征金字塔获得的5层共享特征层作为输入,构建区域建议卷积网络预测特征层上每块特征的预选框上是否包含建筑物。区域推荐流程见图3。
图3 区域推荐流程
虽然通过区域推荐卷积网络模块获得建议框,但建议框仅为粗略的估计,该范围是否包含建筑物,还需根据建议框从共享特征层截取其局部特征,才可用于精细的对象分类、角点调整及掩膜预测。对象分类预测使用全连接神经网络,全连接神经网络要求输入节点数相同,考虑建议框范围不一,其截取共享特征层局部特征的维度也不统一。因此,采用双线性内插法,将截取的共享特征层局部特征统一长宽维度为:7×7,即可顺利输入对象分类预测全连接神经网络进行分类预测及角点调整。特征截取流程见图4。
图4 特征截取流程
区域推荐卷积网络模块仅能粗略估计预选框是否包含建筑物,一些特征与建筑物类似的其他地物也可能被推荐为建议框。因此,还应根据建议框截取共享特征层的局部特征,并据此使用更有效的预测分类方法,预测建议框是否真的包含建筑物。算法使用目前在分类任务表现最好的全连接神经网络预测分类,通过共享特征层局部特征截取与局部特征维度统一,将获得的二维特征图拉直为一维列向量,即可作为全连接神经网络的输入。预测建议框内是否真实包含建筑物,每个建议框通过全连接神经网络输出1个值,再使用Softmax 函数激活,如果激活后的值接近1,则说明该建议框内部确实包含建筑物,反之则预测建议框不包含建筑物;同时,考虑建议框并非恰好是建筑物对象的外包围矩形,因此算法还在全连接神经网络设计了1 个建议框角点调整参数输出,每个建议框输出1 个一维向量,向量包含4个值,分别调整建议框左上角xy坐标和右下角xy坐标。
基于建筑物目标检测方法可获预测框,即建筑物存在位置的外矩形,但无法精确获得建筑物对象的轮廓,主流的基于深度学习预测图像对象的方法是语义分割。目前,深度学习语义分割模型多由编码器和解码器组成,其中编码器可理解为通过传统卷积神经网络对原始图像进行下采样,获取高维图像特征的过程。直观表现是特征图分辨率减少、通道维数增加。解码器则通过反卷积层和反池化层,将尺寸较小的高维特征层进行上采样,恢复成原始图像的尺寸,对原图像内部对象进行像素级预测,使其尽可能分类拟合出分类对象的轮廓,以达到对象像素级预测效果。语义分割模型的训练方式和卷积神经网络一样,前向传播预测分类、反向传播回归拟合,训练语义分割模型即根据损失函数调整编码器和解码器内部参数,使模型通过编码器和解码器后可以预测拟合出分类对象轮廓。典型的语义分割模型有FCN、U-Net、VGGNet、PSPNet等。
对象预测与语义分割流程见图5。
图5 对象预测与语义分割流程
设定损失函数及损失权重(见表1);设定训练模型参数,模型参数设置见表2;算法初步训练结果见图6。
表1 损失函数及损失权重
表2 模型参数设置
图6 初步训练结果
在白名单数据库建设研究中,基于“北京二号”遥感卫星获取的亚米级遥感影像,通过该研究算法识别遥感影像中保护区内的建筑信息,并根据北京地铁运营有限公司提供的地铁线网数据,分别生产16 条地铁线路及其站点的矢量数据,并根据地铁线路实际情况,分别建立地上32.5 m、地下52.5 m、过河102.5 m的缓冲区。整合所有数据后,生成保护区专题地图。根据2021 年第3、4 季度的影像变化,结合建筑信息识别的变化,分析保护区内现有施工情况。同时,对比北京地铁运营有限公司提供的安全保护区内外部工程配合管理工作汇表,分析是否存在违规施工行为。白名单数据库建设流程见图7。
图7 白名单数据库建设流程
以北京地铁10 号线为例,对算法研究应用结果进行展示(见图8)。
图8 北京地铁10号线算法研究应用成果
结合图8展示内容可知,总体上建筑信息识别的应用效果较好,对于保护区内建筑部分的内容基本均可识别,但对于保护区内建筑边界的识别效果不够明晰,特别是受到植被、道路等要素的干扰后,效果较差,算法仍存在较大改善空间。
2021 年第3、4 季度北京地铁所辖线路保护区监测的结果为:共计54 处用地类型变化,总面积200 753.79 m2。保护区用地类型变化统计见表3。
表3 保护区用地类型变化统计
由表3 可知,在所有线路中北京地铁10 号线用地类型变化情况较多,在保护区后续监测中应成为重点。同时,由于本次试验间隔较短,仅使用保护区2021 年第3、4 季度的高分影像进行对比,部分区域未发现明显变化。从表3也可看到,部分区域变化情况多,但变化面积反而较小,可能是本次试验重点研究了保护区内的用地变化情况,对保护区外的区域并未涉及到,在后续工作中须进一步明确。
将监测结果与北京市地铁运营有限公司提供的北京地铁安全保护区内外部工程配合管理工作汇表对比,选取部分区域进行结果展示(见图9—图11)。
图9 分钟寺—成寿寺监测区监测结果
图11 首经贸—丰台站监测区监测结果
根据图9—图11 展示的北京地铁10 号线部分成果可以发现,在影像上存在向北京市地铁运营有限公司报备后再进行施工的工程,也存在有施工行为但未向北京市地铁运营有限公司报备的情况。针对该类未报备情况,将所有信息记录后,统一反馈至北京市地铁运营有限公司,再通过现场踏勘调查等方式确认情况是否属实,为北京地铁的安全运营提供支撑。
关于该算法部分研究情况,对算法试验的过程及最终效果进行总结发现,目前算法仍有较大改善空间,未来计划从5个方面改善算法,提高算法的应用效果:
(1)使用多源训练数据增加鲁棒性。
(2)使用批训练方法(batch>1)避免震荡和过拟合。
(3)尝试256/512/1 024 尺寸训练数据,对比多尺度训练数据效果。
(4)尝试调整多任务损失权重,优化模型。
(5)当模型稳定后尝试解冻主干特征提取网络进一步优化模型。
关于白名单数据库建设的研究情况,根据试验结果,监测效果较理想。但是,在试验过程中,对影像监测结果与地铁提供的报备表进行核查的效率较低,如何提高效率或减少环节,有待进一步思考。
21 世纪以来,我国城市地下空间的开发数量迅速增长。地铁作为地下空间的重要组成部分,其安全面临传统威胁与新兴风险相互交织、偶发性节点破坏与系统性危机并存的复杂情况。随着我国城市轨道交通建设规模不断扩大,确保运营安全工作将是我国城市轨道交通行业面临的重中之重。将遥感监测应用于识别城市轨道交通保护区内的建筑施工行为,可为保障城市交通安全添砖加瓦。但是,相关研究仍不够深入,应在未来的工作中继续寻求更优的解决方案。