陈 凯 雷少刚 杨星晨 史运喜 陈树召
(1.国家能源集团包头能源李家壕煤矿,内蒙古 鄂尔多斯 017000;2.中国矿业大学矿山生态修复教育部工程研究中心,江苏 徐州 221116)
矿山开采方式包括露天开采和地下开采。地下开采通过构建井筒和巷道等方式进行地下作业,往往会对其周边原本稳定的岩土结构造成巨大影响,继而引发地表形变[1]。研究表明,地表形变会造成井工矿区植被退化[2]。植被退化成为了矿山生态环境质量下降的主要方面。因此,及时地进行植被调查对矿区生态修复工作具有重要意义。
植物物种调查是植被调查工作的基础。由于其高效、准确的优点,利用遥感的方式进行植物物种识别得到了广泛的应用。例如,Lucas等[3]利用机载高光谱影像对美国密西西比州Horn岛进行了植物种类识别;Hakkenberg等[4]综合高分影像、机载高光谱影像和激光雷达在森林地区实现了物种分类并完成了植物多样性制图。但是,现有研究大多基于高光谱遥感数据,有些甚至需要融合激光雷达数据。而这些数据(高光谱、激光雷达)成本高,数据源少。尤其是在偏远的矿区,更是难以获取合适的影像数据,因此难以普及。将RGB相机搭载于无人机(Unmanned Aerial Vehicle,UAV),不仅成本低廉,而且操作简单,因此便于在矿区推广应用。但是,目前基于UAV-RGB进行植物分类的研究较少,发展新的植物分类技术具有较好的应用前景。
将机器学习技术应用于遥感图像分类,是目前研究的热点。例如,黄雨菲等[5]利用U-net深度学习方法识别不同滨海湿地植物种类的精度可达95.67%,总体精度较其他分类方法提高6.67%~13.67%;杜保佳[6]利用随机森林、卷积神经网络和支持向量机3种方法对植物群落分类,同样取得了较好的效果。但是,将机器学习方法应用于RGB影像的研究尚不多见,尤其是针对矿区植被类型。
另外,对植被生理参数进行分析也是植被调查工作的重要内容。以往研究表明,叶绿素含量是早期识别和评价植被健康状况的关键诊断指标,可较好地反映植被退化程度[7]。因此,基于遥感技术,分析地表沉陷对植物叶绿素含量的时空扰动规律,可及时发现生态质量退化区,有效地指导矿山生态修复工作。
综合现有研究的不足以及实际需求,本文以内蒙古李家壕矿为例,使用机器学习技术,提出了一种基于RGB相机的矿区典型植物分类方法。随后,在多期分类结果的基础上,分析了2种典型植物的叶绿素含量的时空变化规律,以期为矿山生态环境的精准修复提供指导。
以内蒙古鄂尔多斯市的李家壕矿为研究区,该矿的开采方式为井下开采。矿区属于干旱-半干旱气候,降水量小但蒸发量大。年均降雨量为348.3 mm,然而年均蒸发量为2 506.3 mm。矿区内原生植被稀疏,以草地为主,其中大部分为针茅。乔灌类植被较少,多为人工种植的柠条、樟子松、杨树等。研究区生态环境脆弱,原有的生态系统在矿山开采过程中受到影响和破坏,目前部分区域已开展生态修复工作。
1.2.1 无人机数据
选择晴朗无云的天气获取无人机影像,影像获取时间、相片数量、航高、空间分辨率和影像重叠度如表1所示。无人机型号是大疆公司生产的PHANTOM4 RTK,包含红绿蓝3个波段。根据地形条件、开采进度和精度要求,设计无人机飞行航线,包括飞行范围、飞行高度和重叠度。在11∶00到13∶00之间获取数据,以尽量减少来自大气的干扰和太阳高度角的变化。利用Pix4Dmapper软件对影像进行预处理,生成正射影像图。为了提高影像空间位置的精度,我们在研究区均匀布设了20个像控点,以完成影像的精配准工作。
表1 无人机影像参数Table 1 UAV image parameters
1.2.2 植被数据
为了对植物分类结果进行验证,我们分别对各类地物类型选取一定数量的样本,样本选取过程中尽可能地避免混入其他地物像元,以保证统计结果的准确性。共选取杨树样本39个,樟子松样本38个,柠条样本40个,针茅样本40个,裸地样本36个。我们对选择的样本进行定位,定位设备为华测公司生产的X5工程型RTK产品。
研究区的主要植物种类有针茅、柠条、杨树、樟子松等。因此将地物类型分为6类,包括柠条、针茅、杨树、樟子松、裸地以及其他。
由于无人机数据仅包含红、绿、蓝3个波段的反射率信息,仅凭光谱信息难以实现植被种类的区分。因此,为了充分挖掘RGB影像中的潜在信息,本文提出将影像的纹理特征以及密集匹配点云计算的几何特征引入到分类工作中。综合光谱信息、纹理信息和几何特征,借助机器学习算法,实现植物种类的识别。
无人机RGB影像具有高空间分辨率,其纹理信息比较丰富,因此可以借助不同地物间的纹理差异来提高分类的精度。图像的纹理特征提取方法已经十分成熟,各种理论方法层出不穷[8]。本文选取了著名的灰度共生矩阵[9]。其定义为灰度图像中特定方向θ上间距为d的2个灰度值同时出现的联合概率分布。实验中采用ENVI5.3软件对RGB影像进行处理,分别获得红、绿、蓝3个波段的4个纹理特征,包括方差、相异性、信息熵和二阶矩。其中,滤波窗口大小设为5×5,空间相关性矩阵X和Y的变化值设为1,灰度化级别按照默认设置。
点云的3D特征体现点云的分布结构,同时也反映了植被的三维结构特征。本文采用软件Cloud-Compare2.12.4提取了包括高斯曲率以及特征值相关特征在内的共计5个点云几何特征。特征值相关特征是基于邻域内所有点的协方差矩阵所求的3个特征值计算所得,3个特征值分别记作L1、L2、L3,并且L1>L2>L3。具体包括各向同性、曲面变化率、球体指数和垂直度等4个特征。
选取变异系数[10]来反映各样本的上述20种特征的离散程度。地物样本的某一特征的变异系数越小,则表示此特征对于该类地物的代表性越强。但能否有效地将该类地物与其他地物类型区分开来,仅统计各特征的变异系数并不够。针对某一特征,还要统计各地物类型之间的差异性。因此选取差异系数[11]来反映各地物类型在某一特征的差异程度,差异系数越大,表示该特征用于区分地物的效果越好。变异系数和差异系数的计算:
式中,V为变异系数;S为标准差;M为均值;DW为类间差异系数;M1为第一类地物的均值;M2为第二类地物的均值。
本文选取了神经网络、支持向量机以及随机森林3种机器学习方法。神经网络是用计算机模拟人脑的结构,用大量的处理单元模拟人脑神经元[12]。神经网络通常由输入层、隐藏层和输出层构成,通过损失函数和梯度下降法不断调整参数,最终确定分类模型。支持向量机[13]是一种基于统计学习的分类方法,其核心思想是通过非线性映射将原始空间转换到一个高维特征空间,将原始空间中的非线性可分问题变成高维特征空间中的线性可分问题,从而在高维特征空间中寻找最优的分类面。随机森林[14]本质上属于机器学习中的集成学习,它的基本单元是决策树,每棵决策树都是一个分类器,其核心思想是将所有树的分类结果进行投票输出。
高空间分辨率的无人机影像中包含大量与植被冠层相关的信息,所以可以利用遥感植被指数来表征植被冠层的叶绿素含量。本文影像数据仅包含红、绿、蓝3个波段,故选用与RGB相关的植被指数。前人研究表明,红波段和蓝波段与叶绿素含量密切相关,已有一些植被指数被证明是切实可行的,如BRRI[15]和Ikaw[16]。经过对比,我们最终选择了BRRI指数:
式中,B为蓝光波段的反射率;R为红光波段的反射率。BRRI的值位于0、1之间,值越大代表冠层叶绿素含量越高。
根据植被类型的地面调查结果,在影像中提取针茅、柠条、樟子松、杨树、裸地的光谱特征、纹理特征以及几何特征,计算各特征的变异系数以及不同地类间的差异系数。以柠条为例,表2为柠条20种特征的变异系数以及柠条与其他地类间的差异系数。可以看出,柠条各类特征的变异系数大小不一,其中高斯曲率的变异系数最大,为103.85%,绿波段信息熵的变异系数最小,为2.09%。此外,柠条与樟子松的绿波段二阶矩差异系数最大,为1 104.93%,柠条与针茅的绿波段相异性差异系数最小,为0.08%。综合了所有地类各特征的变异系数以及每一地类与其他地类各特征的类间差异系数后,最终选定红、绿、蓝3波段的二阶矩以及点云几何特征中的高斯曲率、各向同性、曲面变化率和球体指数7个特征。加上红绿蓝3个光谱波段,共计10个特征。
表2 柠条各特征的变异系数以及柠条与其他地类各特征的类间差异系数Table 2 The coefficient of variation of various characteristics of Caragana korshinskii and the coefficient of inter class differences between Caragana korshinskii and other land types %
选取最佳的特征后,我们采用3种机器学习的方法(神经网络、支持向量机、随机森林)对植物类型进行分类。本研究综合了RGB相机的光谱信息、纹理信息和点云的3D特征(即植被的结构信息)。首先仅采用光谱特征进行分类,然后采用光谱+纹理特征的方式,最后采用光谱+纹理+3D几何特征的方式,分类结果如图1所示(以7月13日的影像为例)。随后我们使用总体分类精度和Kappa系数对分类结果进行评价(表3)。总体而言,支持向量机是3种分类方法中效果最好的。同时,结果也表明,采用多特征融合的方法确实能够获得更好的分类结果。以支持向量机为例,仅使用光谱特征,其总体分类精度为80.57%,当在光谱特征中加入纹理特征和3D几何特征后,总体分类精度提高了9.45%,达到90.02%。由于无人机数据易于获得,未来可以利用多期遥感影像提取植物的物候信息。将物候信息融合到现有方法中,或许可以进一步提高物种分类精度。另外,可以尝试更多的机器学习算法,将遥感分类与人工智能更好地结合。
图1 分类结果Fig.1 Classification results
表3 精度评价Table 3 Accuracy evaluation
采用多特征融合的手段,使用支持向量机对获取的全部9期无人机影像进行分类,并计算BRRI指数。在研究区选取一条垂直于开采方向的样线(图2),结合分类结果,提取了样线上针茅和柠条2种植物的BRRI指数。根据开采沉陷情况,分别统计了中性区、压缩区、拉伸区和自然区域的BRRI指数,并计算退化系数,以反映植被的退化程度:
图2 样线以及中性区、压缩区、拉伸区Fig.2 Transect and neutral zone,compression zone and stretching zone
退化系数的值越低,代表植物受到的胁迫越严重。BRRI和退化系数的时空变化如图3所示。在调查初期,退化系数的值在1附近,说明自然区和沉陷区的植被叶绿素含量基本一致,此时植物尚未受到扰动。根据井下开采数据,该工作面在6月15日掘进至样线所在的位置。但是从图3可知,在6月15日之前,植物就出现了退化的趋势,这是开采的超前影响所致。对于同一区域,针茅的退化系数均低于柠条,说明灌木比草本更能抵抗开采带来的胁迫。对于同一物种,中性区的退化系数最高,其次是压缩区,拉伸区的退化系数最低。这说明拉伸区的植被退化最严重,应该作为生态修复的重点区域。图中显示,一段时间后退化系数会逐渐上升。这说明植被正在逐渐恢复,但是其退化系数仍然小于1,即开采区植物的叶绿素含量仍然低于自然区。
图3 BRRI指数和退化系数的时空变化Fig.3 Temporal and spatial variations of BRRI index and degradation coefficient
通过分析矿区典型植物的叶绿素含量的时空变化,发现位于拉伸区的植物受到的胁迫最严重。这可能是由于地表形变的原因,拉伸区更容易产生地裂缝,而地裂缝会造成土壤含水量的缺失[17]。该研究区属于干旱半干旱地区,水分是影响植物生长的限制性因素,缺水更容易导致植被的退化,直观的表现则为叶绿素含量的下降。因此,地裂缝应作为矿区生态治理的重点对象,而拉伸区则为生态修复的重点区域。研究发现,相比于柠条,在同样的环境下针茅受到的胁迫更大。这可能是因为柠条的根系更为发达,即使生长于裂缝区,也不易断裂(图4(a))。而针茅在地表形变剧烈的地区更容易发生根系断裂,进而死亡(图4(b))。本文结果表明,在工作面未开采到植被样线所在的位置时,植被叶绿素含量已经出现了下降。这说明开采引起的超前影响就足以导致植被的退化。采后40 d时,掘进面已经超过植被样线约320 m(开采速度约为8 m/d)。此时植被叶绿素含量虽然有所升高,但是依然低于自然区域的水平。这说明不论是在时间维还是空间维,矿山开采对植被的影响都是存在的,需要采取相应的保护与修复措施。从7月10日开始,该工作面采取了一系列生态修复措施,如治理裂缝,给植被浇水等。可以看到,7月13日的退化系数得到了明显的回升,说明这些生态修复措施起到了较好的效果,应继续坚持。
图4 地裂缝对植被根系的损伤Fig.4 Damage of vegetation roots caused by ground fissures
考虑到经济成本以及数据源的可获取性,将RGB相机搭载于无人机上,是一种在矿区进行植被遥感调查的有效手段。由于其操作简单且成本低廉,因此易于在矿区得到大范围推广。基于无人机获取的RGB影像,本文提出了一种针对矿区典型植物的遥感分类方法。该方法融合了影像的光谱信息、纹理信息和点云的3D特征,使用3种机器学习分类算法,实现了矿区典型植物的分类。研究发现,多特征融合可以显著提高分类的精度,最佳的机器学习算法为支持向量机,其总体分类精度可达90%,基本可以满足矿区植物调查的需求。通过对植物叶绿素含量的时空变化进行分析,发现沉陷拉伸区的植被更容易出现退化,其次是压缩区和中性区。相比于针茅,柠条更能抵抗地下开采带来的扰动,适合作为矿区生态修复的先锋物种。