郭丁,李姗姗,陈宗信,王力
1.中国空间技术研究院,北京 100094;2.国家国防科技工业局重大专项工程中心,北京 100101;3.电子科技大学资源与环境学院,成都 611731
近年来,随着高分辨率对地观测计划重大专项的实施和空间基础设施重大工程的建设,中国对地观测卫星实现了从20 世纪末的技术试验阶段和21 世纪初的试验应用阶段到当前的应用服务阶段的重大转换(童旭东,2016;赵文波,2019)。当前中国卫星对地观测系统数据应用成效显著,为国际用户特别是“一带一路”区域用户提供了高质量的影像数据产品和技术服务(郭仁忠等,2018;顾行发等,2018;童旭东,2018)。
然而,中国遥感卫星系统建设仍存在应用效益不显著、用户满意度不高等问题,整体建设水平亟待提高(顾行发,2018)。如何精准评估现有卫星的能力并找准系统建设发展的短板弱项,对复杂的对地观测系统进行科学合理规划和布局,进而推进系统建设从数量规模向质量效益的转变,是当前卫星系统任务效能的分析与评估领域亟待解决的关键问题(刘峰,2017;赵程亮等,2017)。随着对地观测系统效能分析工作不断深入开展,由于系统构成的复杂性和应用需求的多样性,导致在评价标准的确立上存在很大的不确定性,相应评估结果的指向也往往模糊不清,决策支撑作用不够明显(刘建业等,2019)。因此,开展遥感卫星系统任务效能分析评估的方式方法,做好遥感卫星系统任务效能分析评估,具有现实必要性和紧迫性。
作为对地观测系统任务效能分析评估的关键,需求满足度分析需要考虑多部门需求和现有对地观测系统的观测能力对多部门需求的满足情况,以支撑整个对地观测体系的整体性、综合性、长远性规划论证(梁桂林等,2018)。面对数以千计的用户需求同时要顾及日渐庞大的现有对地观测体系,传统人工统筹论证的综合方法越来越不适用,定量化的自动或半自动需求综合方法亟待研究(尤扬,2008)。
遥感监测需求结构化表达是后续对需求进行分析的前提。马万权等(2014)将遥感观测需求进行分解,提出建立对地观测需求预处理模型,但是该模型不能表达出用户的完整需求。巫兆聪等(2015)在构建了四维需求模型后,再利用模糊综合评估方法对光学和微波两类遥感卫星对地监测效能进行评估;潘勇等(2015)通过分析遥感卫星覆盖能力,综合出一种新型的效能评估算法,并在具体应用上使用了该算法,卓有成效。国外的研究也不少,Nepal 等(2010),Mandal 和Mandal(2018)和Tian 和Yan(2013)用模糊综合法开展对地观测应用效能评估,效果显著。在需求数据的选择上,考虑到自然资源监测是遥感对地观测中的最关键应用,且其需求多样,是需求满足度评估的理想研究领域。
目前,有关自动化需求综合算法的研究较少,而且缺乏自动化需求综合结果评价的方法和指标。针对上述问题,本研究基于层次分析法开展自然资源遥感监测的需求建模与评价研究,以可见光近红外类型的自然资源遥感监测需求为主要研究对象,通过剔除现有观测体系能够较好满足的部分需求,再进行对比分析,从而得到自然资源遥感监测主要需求的参数和指标;根据得到的需求指标进行需求建模,引入层次分析方法,使用基于层次分析的凝聚层次算法,对建模后的自然资源需求进行需求综合;最后对需求满足度进行评估,运用效能评估的方法,对需求综合后的结果进行评价,从而验证对自然资源遥感监测需求进行建模及综合的可行性和必要性。
自然资源调查领域主要包括林业部门、地质部门、农业部门、水利部门和海洋部分等,这些部门的用户在卫星遥感上的需求描述方式各异且指标要求不一(方臣等,2019)。考虑到需求表达的复杂性和准确性,本研究主要针对光学遥感应用需求进行需求分析,而对微波遥感和激光雷达等需求不做研究。经过需求指标的分析,这里提取出最广泛,最基本的,最能反应用户遥感需求的4个需求指标作为用户需求的通用指标,这些指标包括空间分辨率,光谱分辨率,波段范围和量化等级;其中空间分辨率代表空间尺度,光谱分辨率和波段范围代表光谱范围及其间隔,量化等级代表辐射分辨能力(巫兆聪等,2018)。含有4个变量的四元需求模型如下:
式中,B代表波段范围,R是空间分辨率,S为光谱分辨率,D代表量化等级。在波段范围的表达上,用户需求波段上限为B_max,需求波段下限为B_min,需求波段范围为区间[B_min,B_max]。
在自然资源遥感需求数据集合中,数据不同维之间量纲和取值上下限差异很大,波段范围在为几百上千纳米左右,空间分辨率常取个位或者十位数,量化等级常取8—12 bit。由于自然资源调查需求数据各异,导致数据均值和标准差相差过大,若要对建模后的需求进行需求综合,数据预处理是必不可少的。本研究采用z-score 归一化方法对数据进行预处理,将数据取值通过数学公式进行转换到一个规范的区间内,便于后续的数据处理和分析。基于z-score 归一化方法的数据处理公式如下:
式中,xk为输入数据,yk为z-score 归一化后的结果,xmean为数据输入xk的平均值,xσ为数据输入xk的标准差。
经过z-score 归一化方法处理后的数据,仍然存在需求来源广泛、条目众多、描述方式各异和指标要求不一的情况下。本研究采用凝聚层次算法开展需求综合,将用户需求中较为相似的需求条目进行合并,减少冗余、多余的数据。凝聚层次算法是层次分析的一种,这种方法自下而上,把每一个数据看成是一个簇,按照一定的聚类条件,将不同的样本进行合并,最终形成一个簇,或者达到聚类的个数。每个簇是层次结构的根,在合并过程中其找出两个最接近的簇也即根据某种相似性度量,接着合并它们,形成一个簇。因为在每次迭代的过程中都需要将两个簇进行合并操作,同时要求每个簇中至少包含一个对象,因此凝聚层次算法最多的情况下需要进行n次迭代操作。
在相似性度量方面,本研究采用平均相似度来衡量聚簇间的相似性。凝聚层次算法通过归一化预处理、设定聚簇的数量、计算不同聚簇间的相似度、计算合并后新聚簇与其他聚簇间的相似度、计算聚簇中心的需求向量、评估并调整聚类结果6个步骤来进行需求综合。
卫星对地观测设施是否能满足自然资源调查领域的需求,是对满足程度的量化计算和结果评价,属于效能评估的一种。常见的评价方法有需求AHP 分析法、模糊层次综合法(FAHP)和灰色白化函数聚类等(刘莉等,2003;刘丽轻等,2011);其中模糊层次综合法采用模糊综合评价法和层次分析法相结合的评价模式,该方法采用层次分析法确定因素集,然后运用模糊综合评判确定评价效果(沈继红等,2011)。该方法在需求满足度评价中对不确定性因素考虑比较全面,因此采用FAHP评价法进行需求满足度的评价。
FAHP 评价法首先根据对象自身特点及性质将待评估对象分解为多个层次,然后将它们结合成一个层次化结构模型,最后在逐层分析之后,确定不同的对象分解层次对于评估对象的重要程度(即权重)(尤扬,2008)。该方法是目前应用广泛的一种效能评估方法,其优点是能够避免评估指标属性的不确定性,能够以定性和定量相结合的方式来处理复杂的决策问题。FAHP 方法主要计算过程如下。
2.4.1 判断矩阵一致性检验及权重向量计算
(1)确定评估指标相对权重标度。模糊层次综合法运用1 到9 间的整数表达两个指标间的重要性关系,重要性关系的表达及含义如表1所示。
表1 指标间的重要性关系Table 1 Relation of important among different indicators
(2)构造权重判断矩阵。
(3)计算指标权重与一致性检验。一致性是指判断思维的逻辑一致性,在实际构造判断矩阵时满足所有相互关系的逻辑一致性难度较大,因此允许指标相互关系间存在一定程度的不一致性,即允许判断矩阵有一定的错误。在判断矩阵一致性的过程中,修正因子RI的取值如表2所示。
表2 修正因子取值Table 2 Correction factor value
若求得判断矩阵的CR 值<0.1,即判断矩阵构造合理,满足一致性要求,此时计算得出的指标权重向量W可取。否则应重新构造判断矩阵,重新计算权重向量。
2.4.2 评估因素与评语集
评估因素集是影响需求满足度的需求指标与参数。本研究采用波段范围、空间分辨率、光谱分辨率、量化等级这4个基础需求指标来描述自然资源监测遥感需求,并以此建立需求向量模型,因此评估因素集U 取需求模型中的4个基础需求指标(项伟等,2018)。
评估因素u1为需求综合后聚簇中心需求的波段范围Bcl与原始需求波段范围Bre交集的长度与Bre的比例,显然u1取值为[0,1]。
而u2,u3,u4分别取聚簇中心需求的空间分辨率,光谱分辨率,量化等级,单位与需求模型中相同。
评语集V指对对象的评价,常用优、良、中、差4 种评价等级来描述,分别对应10、8、6、2 的评分。
2.4.3 基于需求模型的模糊隶属度函数构建
通过构建的评估因素集可知,u1表示聚簇中心需求波段对用户需求波段的覆盖率,其满足度和u1取值同增长,越大越好,可知波段范围属于第一类隶属度函数。而u2,u3,u4(空间分辨率、光谱分辨率、量化等级)是越接近最理想值,越符合用户的期望,而高于或低于理想值对于满足度都有影响,例如过高的量化等级会大大增加数据量,对数据处理和分析带来不便(巫兆聪等,2015)。因此,它们都属于第二类隶属度函数。基于上述分析,本研究依照需求指标的自身的特点和函数情况,构造合适的模糊隶属度函数。
2.4.4 模糊层次综合结果合成
使用合适的模糊隶属度函数对数据进行计算,可计算出单个因素的模糊评价,该评价和4个评价等级相对应,可得出相应的评价等级(项伟,2018)。使用最大值合成法,对数据结果进行合成,将评价等级所对应的最大值分数作为该因素最终的评分结果(沈继红等,2011)。
自然资源调查用户对卫星应用需求十分广泛,包括林业部门、地质部门、农业部门、水利部门和海洋部门等领域的需求(方臣等,2019)。本研究通过分析典型自然资源调查应用中的实际需求,并对其波段下限、波段上限、空间分辨率、光谱分辨率和量化等级等数据指标进行抽取,构成对应的需求向量。具体的实际需求包括精准农业、农情监测、水资源、地形图制作、矿产勘探、水土流失监测、湿地监测、植被指数计算、荒漠化监测、城市调查和水利利用等。通过上述实际需求构建本研究的93 条实验数据,并对其进行结构化表达及建模,除去需求编号外,剩下五维需求构成五维向量,分别为波段下限,波段上限,空间分辨率,光谱分辨率和量化等级。数据来源具体如下表所示。
表3 自然资源数据来源表Table 3 The data source of nature resources
由于五维输入变量量纲差距很大,影响结果准确性,所以在进行需求综合前还需进行z-score归一化处理,具体原理和方法见2.2 节需求数据预处理。
近年来,中国遥感卫星发展迅猛,卫星遥感进入高分时代,卫星观测体系也已基本成型。目前,中国在轨且常用的光学载荷高分卫星有高分一号、高分二号、高分四号、高分五号和高分六号,这些高分卫星的观测能力如表4所示。
表4 高分卫星的观测能力表Table 4 The observation ability of High-resolution satellite
本研究使用层次分析中的凝聚层次算法对实验需求进行建模后的需求综合。经过需求综合后,93 条原始五维需求数据被分成了若干聚簇,需求聚类综合后的结果为五维向量,聚簇中心的需求即代表着聚簇内所有需求。
由表4和表5可知,原本93条需求向量,经过两种算法处理后只剩下14 条,需求综合的效果非常明显。需求综合的层次结构如图1 和图2 所示,分别为截断后的部分层次树和完全层次树。层次树图中,横轴代表需求编号,纵轴代表z-score 归一化后的数据相对距离。经过基于层次分析的算法处理后,原始需求数据逐一分层,并将每一条数据归入到一个聚簇中。聚簇中心需求即代表着聚簇当中所有的需求。
图1 截断后节点数为14的部分层次树Fig.1 The partial hierarchy tree for node 14
图2 完全层次树Fig.2 Complete hierarchy tree
表5 凝聚层次算法下需求综合结果Table 5 The integrated results for the analytic hierarchy process
用FAHP评价法对高分卫星满足自然资源调查需求的满足进行评估,结果如表6所示。
上述卫星应用需求满足度评估是在评语集为V={10,8,6,2}={优,良,中,差}下计算的,评估结果大于8 时可认为卫星应用需求满足度为优良。对结果进行分析,可知除R37、R43 和R93外,其余的自然资源调查需求满足度都大于8,说明高分卫星能较好的满足大部分自然自然资源调查用户的需求。R37、R43 和R93 的需求参数具体见表6,其中R37 的空间分辨率需求为1 m,R43和R93 的空间分辨率需求为750 m,且R93 的光谱分辨率需求为400—2200 nm,这说明高分卫星在高空间分辨率和低空间分辨率上的观测能力方面存在一定的劣势。另外R01、R09、R19 和R27 的需求满足度大于9,说明高分卫星中高分辨率遥感卫星体系较为完善,能很好的满足大部分该类型的自然资源调查需求。
表6 基于FAHP的需求满足度评估Table 6 The demand satisfaction assessment using FAHP
要验证实验的合理性,还需要从实例出发。本节以数据抽取实例中的数据实例对实验合理性及可行性进行验证。数据抽取实例中列举了4个不同需求来源的例子,需求编号及需求数据等如下表7所示。
表7 数据抽取实例对应需求数据Table 7 The demand data for the sample data extraction
如表8 所示,凝聚层次算法下,需求编号为R39的矿产搜索需求和需求编号为R56的湿地监测需求被同分到聚簇中心为R09 的聚簇,两个需求数据十分相似,只在波段上限上有所区别,因而被分到同一聚簇中,归为一类需求。所在聚簇的聚簇中心需求R09 的空间分辨率为30 m,与原始需求15 m 的要求有些许区别,因而需求满足度不算高,只有7.34,但其余四维需求均能满足,因而用需求R09去代表需求R39和R56是可行的。数据抽取实例中的地形图和水土流失,在实验需求数据中分别为R64和R07,在经过需求综合后,他们都被归入到聚簇中心为R37 的聚簇中。R07 和R37十分相似,只在量化等级需求上有所差别,因而需求满足度较高,为9.65,而R64和R37在空间分辨率上和量化等级上都有区别,所以需求满足度稍低,为7.72。在经过评价算法对于需求满足度的计算后,可以看出R37 的需求数据能较好的代表R64和R07的需求。
表8 凝聚层次算法下需求综合结果Table 8 The result derived by the Hierarchical Clustering
综上所述,实例中的矿产搜寻需求和湿地监测需求被归为了一类,都可由同一聚簇中心需求去表达,因为他们对遥感数据的需求十分相似,被归为一类再统一表达,去除冗余需求是合理且可行的。这表明聚簇中心需求都能满足簇内大部分需求。通过分析用户需求间的相似程度,合并高度相近的需求条目,从中提取出数量较少、彼此间差异较大的共性需求和代表性需求,这是本实验的目的所在,而需求满足度的计算和实例展示,都可验证研究方法的可行性和合理性。
本研究利用基于层次分析的凝聚层次算法,以93 条自然资源调查需求为数据输入,经z-score算法归一化处理后,采用凝聚层次法对其进行需求综合并抽取出14 条需求综合数据,最后利用模拟层次综合法评估高分卫星对自然资源调查的需求满足度。试验结果表明93 条数据中19 条需求数据的需求满足度大于9,82条需求数据的需求满足度大于8,需求满足度评“优良”率为88%;11条需求数据的需求满足度小于6,需求满足度评“差”率为12%。从应用领域上来看,高分卫星能满足大部分农业、林业、海洋和水资源等领域的资源调查工作,但是在某些领域如小流域水土流失监测、荒漠化监测、生物量估算、生态评价、环境评价和承载力计算等领域的对地观测能力亟待提升。
通过实验可知,对自然资源需求进行综合是可行的,需求综合的结果能较好的代替其余需求,这使得遥感需求种类大大减少,对卫星观测能力设计和遥感产品的生产等都有着较大的影响。另外自然资源遥感调查需求分析与需求综合是一个复杂的现实问题,本文的研究还存在一些不足之处,后续的研究可以使用精度更高的聚类算法,并把需求分析应用到遥感对地观测的所有需求领域,使需求综合结果能更好的满足原始需求。