董桓宇 陈善学 陈雯雯
(重庆邮电大学通信与信息工程学院 重庆 400065) (重庆邮电大学移动通信技术重庆市重点实验室 重庆 400065)
高光谱图像解混是高光谱图像处理的一个重要的方向,其对地物成分和光谱特性的体现,使其受到越来越多的关注。混合像元分解时,关于端元和丰度都是未知的,而非负矩阵分解受初始的端元和丰度影响比较大,因此初始化所用的端元提取算法和丰度估计算法也是十分重要的。常用的端元提取算法有最大体积法N-Finder[1]和顶点成分分析(Vertex Component Analysis,VCA)[2]等。丰度估计较常用的算法有全约束最小二乘法(Fully Constrained Least Squares,FCLS)[3-4]等。
非负矩阵分解(Nonnegative Matrix Factorization,NMF)由于其算法复杂度较低、简单易实现,又有模型简明、实际意义明确、易于改进等优点,受到了国内外研究人员的追捧。非负矩阵分解算法由Lee等[5]提出,并给出了乘法迭代规则。Hoyer[6]提出了基于非负矩阵分解的稀疏编码方式,并予以证明,并重点说明了L1稀疏约束非负矩阵分解(L1-SNMF)的情况。并且以上的方法在近年依旧散发着活力。Feng等[7]也提出了将L1稀疏约束引入深度网络的算法。He等[8]结合了总变差,为再权重稀疏非负矩阵分解算法添加了分段平滑性。陈善学等[9]提出了用正交非负矩阵分解结合L1/2稀疏约束非负矩阵分解(SONMF)的算法。江子特等[10]还针对基于Fan模型的Fan-NMF进行了研究。除非负矩阵分解之外,高光谱图像解混方法也是近年来的研究热点,例如刘万军等[11]还提出基于最大体积单体的端元子集优选方法,既可以作为比较成熟的解混算法,也可以作为性能较优的端元提取算法从而进一步优化解混算法。由此可见解混仍旧是近年来比较热门的研究课题。
虽然文献[9]所提出的方法极大弥补了传统基于NMF线性解混方法对高光谱数据表达不足的问题,取得了非常好的效果,具有算法简单易实现、解混效果好和分解效率高、物理意义明确等优点,但仍存在一些不足。RONMF将在SONMF基础上进行改进和创新,在一些情景下使解混效果更优。
线性混合模型(Linear Mixing Model,LMM)是一种重要的混合模型,具有简单明了的数学特性和一定的物理意义,很多研究都建立在线性混合模型之上。在一般情况下,像元的反射率可以近似地看作端元的线性混合:
R=AS+n
(1)
式中:R为像元反射率;A为端元反射率矩阵;S为丰度矩阵,地物丰度满足非负性与全加性;n为噪声干扰。
文献[5]提出非负矩阵分解,并给出了乘法迭代规则。构建基于欧氏距离的目标函数:
(2)
A←A.*(RST)./(ASST)
(3)
式中:.*表示哈达玛积。
S←S.*(ATR)./(ATAS)
(4)
再权重稀疏非负矩阵分解算法(RSNMF)[12]是一种改进的L1稀疏非负矩阵分解算法,在数理上,其具备L1和L0两种范数稀疏非负矩阵分解算法的优点。用非凸的对数和(log-sum)惩罚函数作为权重约束,构建目标函数:
(5)
式中:λ为调节参数;N为像元数;K为波段数;eps为误差补偿。对数和惩罚函数比L1范数有更多潜在的稀疏奖励。接下来就引出了再权重约束,构建目标函数:
(6)
式中:⊙表示矩阵的对应位置元素的乘积;Y表示图像数据矩阵;W为非负权重矩阵,作为由丰度矩阵计算得到的用于下一次迭代的通解。W元素表示为:
(7)
乘法更新规则为:
A←A.*(RST)./(ASST)
(8)
S←S.*(ATR)./(ATAS+λW)
(9)
关于论证RSNMF与L1-SNMF和L0-SNMF的稀疏性,在文献[12]中举了一个简单且有趣的例子,并被文献[8]延用。
假设y=As0=[1,1,2]T并且有:
关于L0稀疏的解为s0=[0,1,0]T,关于L1稀疏的解为s0=[1/3,0,1/3]T。如果我们引入权重向量w=[3,1,3]T,则式(6)中加权重L1范数的解和L0范数的解是一样的。
最早提出正交约束的正交非负矩阵(ONMF)分解算法的是Choi[13]。在此之前Ding等[14-15]就已经做了关于ONMF与K-means等价的研究和ONMF与kernel K-means之间的关系进行了分析,为Choi提出正交约束的ONMF做了铺垫,以下简称ONMF。文献[9]使用Gram-Schmidt正交化方法。将ATA∝I作为约束条件构建目标函数:
(10)
式中:α为正交回归参数。乘法更新规则为:
A←A.*(RST+2αA)./(ASST+2αAATA)
(11)
S←S.*(ATR)./(ATAS)
(12)
由于某些端元光谱曲线是相近的,比如tree和grass等,因此希望尽量保证端元独立性。文献[14-15]已经证明了正交非负矩阵分解等价于K-means聚类,可以很好地保证端元独立性。由于丰度具有非负性和全加性,因此稀疏性约束非常适合用于丰度约束,但由于约束项的不同,使得稀疏约束解混效果不同,RONMF采用再权重稀疏非负矩阵分解的方法对丰度进行稀疏性约束。RONMF构建目标函数为:
(13)
则乘法迭代规则更新为:
A←A.*(RST+2αA)./(ASST+2αAATA)
(14)
S←S.*(ATR)./(ATAS+λ(1./(S+ε)))
(15)
式中:ε表示误差补偿。
在文献[12]的基础上进一步对L1/2范数和再权重L1范数的稀疏性进行比较,图1所示是L1/2范数和再权重L1范数惩罚函数随丰度变化的惩罚量级变化。
图1 稀疏性对比
算法1RONMF算法
输入:高光谱图像R,像素点数P,I行J列,波段数L。
步骤1使用N-Finder或Hysime初始化端元矩阵A,然后用Fcls初始化丰度矩阵S。
步骤2使用式(14)更新端元矩阵A。
步骤3使用式(15)更新丰度矩阵S。
步骤4一直重复步骤2、步骤3更新,直到达到最大迭代次数,或满足迭代要求。
数据采用美国地质调查局的JasperRidge2场景,100×100像素的数据区域,移除波段为1~3、108~112、154~166、220~224,剩余198个波段。图2为场景的一个波段。
图2 场景第12个波段
RONMF参数:根据文献[8-9,12],α设置为0.2,λ设置为0.01,ε设置为0.01。使用光谱角距离(Special Angle Distance, SAD)、均方根误差(Root Mean Square Error, RMSE)作为实验结果的评价标准。
表1和表2是再权重L1范数稀疏约束非负矩阵分解(RNMF)、总变差再权重L1范数稀疏约束非负矩阵分解(TVRNMF)、L1/2范数稀疏正交约束非负矩阵分解(SONMF)和再权重稀疏正交非负矩阵分解(RONMF)四种算法的解混端元对比。可以看出,本文算法总体而言性能最佳,与RNMF和TVRNMF相比较具有相对较大的优势,与SONMF相比较性能优越性不是很明显。在图3真实端元与RONMF解混端元对比中也可以看出RONMF解混端元与真实端元基本重合。而土壤和路的端元波形更相近,SONMF和RONMF解混效果要更好一些,这是因为正交约束部分对端元独立性增强的作用。
表1 场景的4端元光谱角距离
表2 场景的4端元均方根误差
(a) 树的端元光谱对比(b) 水的端元光谱对比
(c) 土壤的端元光对比(d) 沥青路的端元光谱对比图3 端元对比
图4是四种算法四个端元的丰度图,第一行为RONMF算法,第二行为SONMF算法,第三行为TVRNMF算法,第四行为RNMF算法,第五行为真实地物的丰度。从丰度上直观观察四种算法都有不错的效果,但是RONMF对比度明显一些,效果更佳。在土壤和路,TVRNMF和RNMF丰度相对模糊一些,RONMF和SONMF丰度清晰一些,解混效果更佳。
图4 四种算法四端元丰度
本文提出一种结合再权重L1范数稀疏约束和正交约束非负矩阵分解的解混算法,利用正交约束增强端元独立性,利用再权重L1范数稀疏约束增强丰度的稀疏性,针对线性非负矩阵的非凸性造成容易陷入局部最优解的问题进行了改进,并与SONMF进行了对比分析。再权重L1范数稀疏约束与L1/2范数稀疏约束,都是增强的稀疏约束方法,构成的惩罚函数凸性更强,两种方法各有胜场。根据文献[8],L1/2范数稀疏约束作为Lq范数稀疏约束中的一员,q值仍旧是关键问题,并且Lq范数稀疏约束更适合于低信噪比的模型,而再权重L1范数稀疏约束对这一问题有针对改进。并且稀疏性上再权重L1范数稀疏约束比L1/2范数稀疏约束更接近于L0范数稀疏约束,也更适用于地物丰度较高的情况。因此在JasperRidge2场景和类似场景,RONMF比SONMF有更好的解混表现。