摘要:高光谱图像具有图谱合一的特点,充分利用矿物在图像中的空间信息和光谱信息,将有利于实现高光谱图像矿物填图任务。提出了一种基于张量块分解的高光谱图像矿物填图方法,利用张量块分解模型对高光谱图像进行三维分解,得到每种矿物的空间分布及其光谱曲线组合。该方法保持了矿物在原始三维高光谱数据中的空-谱约束关系,在矿物填图领域体现出了独特优势。通过仿真和实测的高光谱图像实验,验证了方法的有效性。
关键词:高光谱 ;矿物填图;张量块分解;空间信息;光谱信息
一、前言
高光谱图像具有“图谱合一”的特性,同时记录了被观测地物的光谱和空间信息。矿物填图是一种专用于确定岩矿物质组成的填图技术,利用高光谱遥感手段进行矿物填图能够充分发挥图谱特征在岩石矿物识别方面的独特优势,可以实现对矿物的精细识别和定量提取。高光谱矿物填图技术在地质矿产勘查中逐渐发挥了重要作用,已成为当前国内外遥感地质应用领域研究的一个热点[1]。
目前,主流的高光谱矿物填图技术主要分为三种[2]:基于全局光谱曲线匹配技术、基于局部光谱特征参数匹配技术和基于深度学习的方法。基于全局光谱匹配矿物填图技术应用广泛,其核心思想是度量光谱曲线之间的相似度,常用的度量方法包括:光谱夹角度量(Spectral Angle Measure,SAM)、光谱相关系数度量(Spectral Correlation Measure,SCM)、光谱信息散度度量(Spectral Information Divergence Measure, SIDM)等。基于局部光谱特征参数匹配的矿物填图技术主要是根据矿物光谱曲线的局部反应的特征参数进行矿物特性分析,从而确定矿物的类别,常用的局部光谱曲线特征参数包括:光谱吸收带的波长位置、对称度、宽度、深度、斜度和偏斜度等,光谱吸收带最大吸收位置、光谱斜率、面积和吸收指数等。
作为基于深度学习的矿物提取方法近几年来的研究热点,自编码网络、卷积神经网络、残差网络、长短期记忆网络等作为典型的网络模型被应用于高光谱图像矿物分类中,与传统方法相比,在分析提取矿物潜在特征时表现出了较大优势,能够提高矿物提取精度[3]。
现有的大部分方法都是将矿物的光谱独立看待,仅分析矿物的光谱特性[4]。然而,高光谱数据是一个三维立方体数据,除了光谱特性外,矿物的空间分布还构成了其空间特性。矿物填图的结果是既能指示出某种矿物的空间分布,还要能够给出该矿物的光谱特征。
如果能够同时利用高光谱数据的光谱和空间特性进行矿物填图分析,将非常契合矿物填图的根本目标。基于此,提出了一种基于张量块分解模型的高光谱遥感图像矿物填图方法。
二、张量块分解的基本原理
张量块分解(Block Tensor Decomposition) [5]是一种应用非常广泛的张量运算理论。
(一)张量块分解的定义
一个三阶张量X∈RI1×I2×I3 (I1 、I2 、I3分别代表三个维度的大小)经过块分解之后,得到一组秩为rank-(Lr,Lr,1)(Lr为前两个维度的秩)的子项之和的形式。每个子项是由一个矩阵和一个向量外积组成,如下式:
其中,矩阵Mr∈RI1×I2 的秩为Lr,向量sr的维数为RI3 ,R为分解得到的子项个数。图1展示了三阶张量的块分解示意图。
如果进一步将矩阵Mr进行分解,得到:
其中,矩阵Ar∈RI1×Ir 和Br∈RI2×Ir的秩都为Lr。
(二)张量块分解的求解过程
研究人员在2008年提出了一种交叉最小二乘方法(Block Tensor Decomposition-ALS) [6],用于解决三阶张量块分解的数学问题,具体过程如下:
对于一个待分解的三阶张量X,其优化的目标函数定义如下:
其中,X̂为经过张量块分解后,得到的估计数据,可由公式(1)计算得到。
同理可得以下表达式:
上述公式可以采用交替迭代的思路进行求解,即先固定其中两个矩阵,迭代求解另外一个矩阵。收敛后,再固定另外两个矩阵,迭代求解第三个矩阵。如此反复,直到最终收敛。具体实现由以下三个最小二乘的子优化问题组成:
公式(7)-(9)的求解过程可以描述为:首先给定三个因子矩阵的初始值A0、B0和S0,进行迭代优化。在迭代到第k+1次时,固定Bk和Sk,然后更新得到Ak+1。接着,固定Ak+1和Sk,更新得到Bk+1。同理,固定Ak+1和Bk+1,更新得到Sk+1。如此进行下去,直到算法收敛。
为了更加形象地展示利用张量块模型进行矿物填图的数学过程,图2给出了相应的示意图。图2(a)展示了由三种不同矿物分布组成的一个高光谱图像数据,不同矿物分别用不同的颜色方块进行区分。图2(b)展示了三种矿物所对应的光谱曲线。理想情况下,高光谱矿物填图的最终目标是想要得到如图2(c)— (h)所示结果,它们分别清晰地展示了每种矿物的空间分布及其对应的光谱曲线,而张量块分解模型与高光谱矿物填图过程非常匹配。因此,本文选用张量块分解模型对高光谱数据进行处理,以期得到理想的矿物填图结果。
三、基于张量块分解的高光谱图像矿物填图方法
本文提出了一种基于张量块分解的高光谱图像矿物填图方法,具体的步骤如下:
1.利用一个X∈RI1×I2×I3表示原始的高光谱图像三维立方体,I1 、I2 和I3分别代表图像的高度、图像的宽度和波段个数;
2.对该数据实施三阶张量块分解,经过分解后,得到多个子项Mrosr (r=1,2,…,R),每个子项为一个矩阵Mr和一个向量sr的外积,如公式(1)和图1所示;
3.由于张量分解是特征变换过程,每个子项中的向量sr为原始光谱曲线的特征变换曲线。为了达到利用原始光谱曲线填图的目的,本文取出每个Mr中能量最高的像元原始光谱的平均值作为该矿物对应的光谱曲线。
四、实验结果分析
(一)数据介绍
1.仿真数据
仿真数据是通过从美国地质勘探局(United States Geological Survey)标准光谱库(Spectroscopy Lab)中选取的3条不同地物所对应的标准光谱曲线按照设计的空间分布所生成的,如图3所示。图3(a)中展示了被选的3种地物的光谱曲线,分别记为光谱1,光谱2和光谱3。设计像元分布如图3(b)所示,并将三种光谱曲线填充到对应的区域,形成三维的高光谱放在数据。其中,B为图像的背景区域,中间方框区域内的上面8个像元为第一种矿物的分布,记为T1,下面8个像元为第二种矿物的分布,记为T2。
2.实测数据
实测数据来源于美国内华达州的Cuprite矿区高光谱图像数据,该数据覆盖光谱区域为:400-2500nm,实验所用的数据是去除了噪声波段后的辐射能量数据。本部分实验截取了150×150大小的区域,如图4所示,图像中包含了3种主要矿物。
(二)实验结果与分析
1.仿真数据结果
仿真数据的实验结果图如图4所示。图5展示了两种矿物(T1和T2)经过张量块模型分解后,得到其对应的像元的空间分布结果。图5(a)中像素能量主要展示了矿物T1的空间分布信息,而图5(b)中像素能量主要展示了矿物T2的空间分布信息。
2.实测数据结果
图6中给出了实测数据的实验结果图。从图中可以看出,本文提出的方法较好地完成了矿物填图实验,分别找出了3种矿物的空间分布及其对应的光谱曲线。
五、结语
本文提出了一种基于张量块分解的高光谱遥感图像矿物填图方法。该方法通过张量块分解直接对原始的三维高光谱数据进行处理,这种处理方式保留了原始数据矿物的空间分布及其光谱曲线之间的原始结构信息,体现了该方法在矿物填图方向上的独特优势。在仿真和实测高光谱图像数据上分别进行了实验分析,实验结果充分验证了提出方法的有效性。
参考文献
[1]白杨林,吕凤军,苏鸿博,等.高光谱遥感蚀变矿物信息提取研究综述[J].遥感信息,2023,38(01):1-10.
[2]朱玲,李明,秦凯,等.矿物高光谱解混进展研究综述[J].遥感信息,2020,35(03):15-23.
[3]魏黎.基于Hyperion高光谱数据的植被覆盖区岩矿蚀变信息提取[J].国土资源导刊,2024,21(01):83-89.
[4]Qinjun Q., Miao T., Liufeng T., et al. Semantic information extraction and search of mineral exploration data using text mining and deep learning methods[J]. Ore Geology Reviews, 2024, 105863: 1-15.
[5]Kolda T G, Bader B W. Tensor Decompositions and Applications [J]. SIAM Review, 2009, 51(03): 455–500.
[6]Lathauwer L De, Dimitri N. Decompositions of A Higher-order Tensor in Block Terms – Part III: alternating least squares algorithms [J]. SIAM Journal of Matrix Analysis Application, 2008, 30(03): 1067–1083.
基金项目:湖南省自然资源厅科技计划项目(项目编号:2023-31)
作者单位:湖南工程职业技术学院
责任编辑:张津平、尚丹