多源异质信息下区域干旱危险性的DT型关联分析方法

2020-03-20 08:58罗党胡燕
关键词:旱灾关联度分辨率

罗党, 胡燕

(华北水利水电大学 数学与统计学院,河南 郑州 450046)

旱灾的形成受多种因素的影响,形成机理复杂多变。旱灾数据不同频、信息多源并且其量化表征方式不同、各影响因素间时滞且存在交互作用等是目前存在的主要问题。针对农业干旱灾害数据呈现的贫信息、不确定、异构等特点,深入分析由致灾因子危险性到旱灾损失的动力机制,科学识别干旱灾害数据的多源信息与不确定性表现形式,并在信息不丢失或者有效度量信息损失的基础上,创建规范的数据融合表征方法、动态演化模式,简化运算规则,提高模型分辨率,是文中统一描述、物理解析与科学管理农业旱灾系统不确定性信息的关键,也是开展农业旱灾系统一系列量化分析模型探究的关键。在一定的区域与不同的时间内,旱灾影响因子的数据来源涉及水文数据、遥感数据以及气象数据,表现为不同的数据特征,具体可分为实数、区间灰数、三参数区间灰数等类型,这是学者们目前未曾深入研究的方面,之前有学者提出的模型对这类旱灾风险问题已不再适用。且多指标面板数据中不同指标的不同对象在不同时刻下异构性数据是信息充分挖掘与建模实践的根据,其接近性测度是衡量面板数据表征的干旱灾害影响因素指标的动态性发展的重要基础,故对此进行相关研究是有必要的。

一般的经济体系、农业体系等抽象体系都包罗多种决定该抽象体系发展态势的不同要素。通过现有技术虽已获得大量数据,但大数据的灰度较大,再加上一些人为的原因,造成现实存在的问题用数理统计的计算方式解决不再奏效,而灰色关联分析方法突破了数理统计方式解决此类问题的局限。灰色关联分析是分析体系中不同因素关联程度的有效途径[1],也是灰色系统理论中十分活跃的分支。其基本思想是把相关因素的离散行为观测值经过非曲线插值的方式转化为分段连续的折线,从而根据折线的几何表征构造关联模型。并通过折线几何形状判断序列之间的关联度,几何形状相似水平越小,关联度越小[2]。20世纪80年代末,许多学者基于原始灰关联模型,在理论研究领域中,对模型做进一步的改善,提出了B型[3]、T型[4]、C型[5]等灰关联模型。随着科技的进步以及多种因素的交叉出现,学者们对关联模型做了更深层次的研究,以满足当前实际生活的需求。钱吴永等[1]分析具有复杂数据结构特点的探究对象,将基于一般向量空间的灰色关联度的计算方式拓展到矩阵空间。罗党等[6]考虑了指标发展速度、速率变化和发展水平变化,建立基于面板时空特征的灰色关联模型。刘震等[7]通过线段在空间中的斜率,构造新的网格相关系数,得到了网格灰色关联方法。崔立志等[8]用个体和时间两个维度衡量发展速度和增长速度指数的相近程度,将传统的向量空间拓展到矩阵空间。张可等[9]通过分析面板数据格式,提出扩展的以矩阵为基础的灰色绝对关联度。罗党等[10]通过从时间维度和对象维度引进指标的总位移差、一阶斜率及二阶斜率差构造关联模型。耿率帅等[11]在综合考虑指标发展趋向、指标权重和时间权重的基础上,提出了用于解决面板数据局限的可能度函数模型。申健民等[12]针对关联度区分较低以及存在下限等问题,提出了指数函数的关联度。这些研究已经在社会、经济、军事、农业等很多领域发挥了其应用价值,但这些模型只是针对某一问题进行解决,当多个问题同时存在时,这些模型将不再适用。因此,这些关联模型仍需做深层次的改进,需基于以下问题进行改进:①静态数据指标选取不当,导致丢失部分原始信息;②当基于面板数据的指标类型为区间灰数、三参数区间灰数、实数交叉出现时,原有的关联模型不能有效解决新出现的问题;③计算不同对象在同一指标下的关联度大小时,分式型的分辨率较低,会降低结果的准确率。

探究农业旱灾系统,发现以上关联模型存在的缺陷也是目前旱灾风险研究未能有效解决的问题,且具有灰色多源异质性特征的旱灾指标数据可以充分表达原始数据信息,根据不同指标类型,将原始数据分别转化为不同的矩阵形式,并对应地将每一类矩阵分别进行极差变换统一量纲;确定理想指标向量,基于接近性视角构造发展水平总位移和发展速率总位移,表征干旱灾害影响因素指标的动态发展水平,这样简化了模型计算步骤;将分式型函数转化为指数型函数来提高关联模型的分辨率,并对不同的指标进行赋权,基于此,构造了分辨率较高的DT型关联模型。并通过实例分析以及对比分析证实了此关联模型的有效性以及可行性,拓展了模型的适用范围,解决了现有模型未能解决的问题,为农业旱灾风险调控提供了理论与实际决策的基础。

1 预备知识

1.1 混合面板数据表征

面板数据是考虑了对象、指标、时间3个维度的数据,因此可表征为对象维度矩阵、指标维度矩阵、时间维度矩阵。探究发现,导致旱灾的因素指标数据具有不同的类型,因此,本文从指标维度矩阵方面进行研究。由于指标类型复杂多变,可能有实数型、区间灰数型、三参数区间灰数型混合出现的情形以及实数型、区间灰数型、三参数区间灰数型单独存在的情形或其他情形。因此,当面板数据中指标维度不同时,面板数据数值表现出不同的类型。

(i=1,2,…,I)。

(1)

1)导致旱灾的因素指标在面板数据中表现为实数的情况。对于实数ui(s,t),对其进行极差变换,效益型指标:

(2)

成本型指标:

(3)

其中:

i=1,2,…,I;s=1,2,…,S;t=1,2,…,T。

(4)

成本型指标:

(5)

其中:

i=1,2,…,I;s=1,2,…,S;t=1,2,…,T。

(6)

成本型指标:

(7)

其中:

i=1,2,…,I;s=1,2,…,S;t=1,2,…,T。

由于不同指标元素的量纲不同,若对其进行比较,需对其进行统一量纲处理。因此,对不同类型的指标进行极差变换,则处理后的数据取值全在[0,1]跨距内,达到量纲统一的要求。

在此,理想指标向量需从量纲统一之后的元素中选取,简化了计算步骤,并且可以清晰地反映理想指标与影响因素指标之间的关系。

1.2 数据处理

(8)

(9)

i=1,2,…,I;s=1,2,…,S;t=1,2,…,T-1。

(10)

(11)

i=1,2,…,I;s=1,2,…,S;t=1,2,…,T-1。

定义3和定义4中考虑了发展水平以及发展速率两个方面,且Δ1(s)、Δ1′(s)从接近性视角测度了影响因素指标序列与理想因素指标序列的相互关系,当Δ1(s)越趋于零时,表明指标bi与理想指标的发展过程越接近;当Δ1′(s)越趋于零时,表明指标bi与理想指标的发展速率越接近。

(12)

(13)

i=1,2,…,I;s=1,2,…,S;t=1,2,…,T-1。

(14)

(15)

i=1,2,…,I;s=1,2,…,S;t=1,2,…,T-1。

定义5和定义6中区间灰数的下限和上限分别考虑了发展水平和发展速率两个方面,当Δ2(s)比较大时,则表明指标bi与理想指标的发展过程相偏离;当Δ2′(s)比较大时,则表明指标bi与理想指标的发展速率相偏离。其中α为偏重系数(一般取α=0.5)。

(16)

(17)

i=1,2,…,I;s=1,2,…,S;t=1,2,…,T-1。

(18)

(19)

i=1,2,…,I;s=1,2,…,S;t=1,2,…,T-1。

定义7和定义8中三参数区间灰数的下限、最可能值、上限分别考虑了发展水平以及发展速率两个方面,当Δ3(s)=0时,表明指标bi与理想指标的发展过程相同;当Δ3′(s)=0时,表示指标bi与理想指标的发展速率一致。其中α为偏重系数(一般取α=0.5)。

定义3—8中,指标值的选取以及发展水平、发展速率的定义不仅考虑了影响因素指标与理想指标之间的相互关系,衡量了指标发展的动态变化,且发展水平总位移、发展速率总位移有效地将区间值联系起来,简化了计算步骤。可根据具体问题具体分析得到偏重系数α确切的取值。

2 DT型关联模型

2.1 模型构建

在考虑关联度分辨率问题时,存在关联模型在计算同一指标不同对象时,分辨率结果不是最理想的问题。由于ex≈1+x在x取非常小的数值时成立,并且ex曲线具有光滑性,由其构建的关联模型的分辨率高。因此,用指数e-x取代分式1/(1+x)构建混合面板数据的关联模型,用以克服原关联模型的不足。

(i=1,2,…,I;s=1,2,…,S)。

(20)

(i=1,2,…,I;s=1,2,…,S)。

(21)

(i=1,2,…,I;s=1,2,…,S)。

(22)

定义10(DT型关联模型) 设在某一时刻t,对象as在指标bi下,定义ρs0为综合关联模型,

(s=1,2,…,S)。

(23)

式中ω′1、ω″2、ω‴3分别为实数、区间灰数、三参数区间灰数三种类型的指标所对应的权重。

权重的确定大致分为主观赋权法、客观赋权法以及主客观综合赋权法。主观赋权法主要依据决策者的知识、主观经验,可采用的方法有层次分析法以及Delphi法等;客观赋权法主要根据原始数据之间的关系确定权重,可采用的方法有CRITIC法、标准离差法、熵权法、变异系数法等;主客观综合赋权法则依据决策者经验以及原始数据之间的关系共同确定权重,可采用构造多目标规划模型将两种权重综合处理的主客观集成赋权等方法确定权重;当信息为黑箱时,即在信息完全不确定的情况下,权重可取ω1=ω2=…=ωI=1/I,即取等权。

2.2 模型性质

性质1当x≤2.5时,由分式1/(1+x)构造的关联模型的分辨率小于由指数e-x构造的关联模型的。

证明:首先求出分式1/(1+x)和指数e-x的导数,分别为-[1/(1+x)2]和-e-x,然后再求其导数的绝对值。因此,这里只需要讨论比较其导数绝对值的大小关系,就可以判断分式1/(1+x)和指数e-x构造的关联模型的分辨率大小。其导数的绝对值如图1所示。

图1 分别由1/(1+x)与e-x构造的灰关联模型的分辨率比较图

从图1中可以看出:当x≤2.5时,实线和虚线的对应值相差较大,这表明,由指数e-x构造的灰关联模型分辨率高于由分式1/(1+x)构造的灰关联模型分辨率;而当x>2.5时,实线和虚线的对应值十分接近,则说明由指数e-x和分式1/(1+x)构造的灰关联模型分辨率没有明显的区分,这将给结果带来一定的误差。

性质2DT型关联模型满足:

1)规范性:0<ρs0≤1;

2)对称性:ρs0=ρ0s;

3)可比性;

4)非唯一性:在权重不同的情况下,ρs0的值会出现某些差异;

5)接近性。

已知e-x中x越大,则e-x越小。因此,对于

证明1)由于Δ1(s)、Δ1′(s)、Δ2(s)、Δ2′(s)、Δ3(s)、Δ3′(s)都是大于或者等于零的数,所以,

因此,有

3)混合面板数据中实数、区间灰数以及三参数区间灰数3种类型的指标经过极差变换以及发展水平、发展速率的作用后,最终都会变成实数。又由于各指标量纲最终统一。因此,DT型关联模型具有可比性。

性质3DT型关联模型适用范围为:实数、区间灰数、三参数区间灰数类型的发展速率作为公式的分母且不为零。

证明由于对原始数据进行极差变换时,会出现等于零的情况,因此,实数类型:

2.3 模型算法

步骤1根据不同类型的极差变换公式将对应原始数据行为矩阵做极差变换操作,消除量纲;

步骤2求出成本型理想指标向量或效益型理想指标向量;

步骤3分别求出各指标的发展水平总位移以及发展速率总位移;

步骤4分别求出不同对象所对应指标的关联度;

步骤5针对不同的指标设定相应的权重,求出不同对象所对应指标的DT型关联度,即综合关联度;

步骤6根据所得结果,分别比较它们之间的大小关系,得出关联序。

3 实例分析

3.1 研究概况

我国旱灾频发,不仅给农业生产带来重大损失,而且已经严重影响了我国社会经济的发展。随着社会的进步,人类活动的不断增加,以及环境气候的变化,我国干旱灾害发生的频率和发生的强度明显增加[13]。特别自20世纪80年代末以来,旱灾影响范围已经由农业扩展到生态、工业等领域,造成较大的损失及影响。

河南省地势西高东低,中部地区是旱灾多发的区域。农业干旱灾害数据由遥感监测、田间试验、现场调查、统计资料等不同信息源的数据构成,具有异构与混频的特点,从这一特征出发,根据农业干旱致灾机理,对农业干旱灾害系统进行不确定分析,分析导致农业干旱灾害的因素。

文中将河南省中部地域作为研究目标,通过分析气象、水文、农业干旱的演化过程以及形成机理,综合气象干旱、水文干旱、土壤含水量3种影响指标,利用熵组合权重法[14]综合计算指标层的权重。其中,气象干旱选取同一城市的年均降雨量以及年平均气温作为指标,其数据类型为区间灰数;水文干旱则选取同一城市的水资源总量作为指标,其数据类型为实数;土壤含水量采用遥感数据中同一城市土壤相对含水量作为指标,数据类型为三参数区间灰数,具体对象选取郑州、开封、许昌、平顶山、漯河5个地市。

3.2 旱灾风险分析

依据所得数据,把各对象所对应的不同指标原始数据转换为面板数据行为矩阵,分别如下:

由于降雨量、水资源总量以及土壤相对含水量属于效益型指标,而气温属于成本型指标。将混合面板数据矩阵中两类数值不同类型的指标按照对应公式进行极差变换,所得矩阵分别如下:

根据上述矩阵求出的理想指标向量,然后求出各类型的发展水平以及发展速率,并计算同一指标不同对象的DT型关联度,得到它们的关联序。结果见表1。

表1 不同对象的关联度及DT型关联度及关联序

指标值越接近理想指标,Δ1(s)、Δ1′(s)、Δ2(s)、Δ2′(s)、Δ3(s)、Δ3′(s)的值越小,对应的关联度就越大。因此,DT型关联模型所得关联度越大,导致干旱灾害的因素指标造成的波动就越小。

由表1可知:不同对象在同一指标下的排列顺序具有一定的差异,导致了各对象(不同地区)对不同指标的敏感性不同,即不同的地区在相同指标下的干旱灾害危险程度不同。由ρ40≻ρ30≻ρ20≻ρ10≻ρ50可以看出,平顶山的干旱灾害危险性最小,漯河的干旱灾害危险性最大。各个对象(5个地区)所对应指标的排序分别如下:降水量指标,许昌=平顶山≻漯河≻开封≻郑州;气温指标,漯河≻郑州≻平顶山≻开封≻许昌;水资源总量指标,开封≻郑州≻平顶山≻许昌≻漯河;土壤相对含水量指标,郑州≻许昌≻漯河≻开封≻平顶山。从上述排序可以看出:许昌地区平均气温较高,漯河地区水资源总量相对较少等。因此,依据上述关联度可分别针对不同区域采取相应的防御措施。

为了进一步验证本文所构造DT型关联模型的有效性,将文中所得结果与文献[15-17]的进行对比分析,具体见表2。

表2 DT型关联模型的结果与其它文献的结果对比

由表2知:4种方法得到的最高干旱灾害危险性与最低干旱灾害危险性结果是一致的,验证了文中模型的有效性。并且文中模型所得结论符合河南省干旱灾害危险性情况,这进一步说明了用此模型进行干旱灾害分析的可行性。将文中所得结论与文献[15-17]的结论对比可以看出:这4种方法所得结论总体上具有一定的相似性,即这4种方法在体现所选对比城市的干旱灾害危险程度上几乎一致;但与文献[15]的结果相比较可以看出,郑州和开封2市干旱灾害危险程度的强弱排列顺序不同,这可能是文献[15]把原始数据转换为核与灰度的过程中以及在运算过程中丢失部分信息造成的;文献[16]的原始数据是根据每个决策者提供的决策信息所得,具有一定的主观性,并且在汇总信息方面容易造成信息缺失,因此,导致开封和许昌2市的干旱灾害危险程度的强弱排列顺序有差异;文献[17]的结果虽然基于原始数据构建模型,但模型计算精度不高,且影响因素指标序列与理想因素指标序列之间的投影值计算量非常大,不利于实际工作的进行;文中的方法对多源异质性数据的处理,最大限度地减少了旱灾影响因子信息的损失,与文献[15-17]中所采用的方法相比,文中的方法充分利用了原始数据信息的价值,提高了原模型的精度,简化了计算步骤。

4 结语

文中通过设置面板数据指标类型,以此来解决导致农业旱灾的影响因子指标类型不唯一的问题,有效解决了面板数据的指标维度数据类型单一的问题,并且充分表达了原始信息的内容,基于接近性视角,通过理想指标向量构造发展水平总位移以及发展速率总位移,衡量了干旱灾害指标的动态发展情况,简化了计算步骤。将原来的分数型关联度转换为指数型关联度,提高了关联模型的分辨率,使得旱灾危险性分析结果更加合理。基于此,构造了基于混合面板数据的较高分辨度的DT型关联模型。并讨论了新的关联模型在x≤2.5时,分式型1/(1+x)的关联模型的分辨率小于指数型e-x的关联模型的分辨率,以及关联模型的规范性、对称性、可比性等性质。将此关联模型应用到河南省中部5个市的干旱灾害危险性分析中,并将分析结果与其他文献的进行对比,证实了DT型关联模型的有效性和可行性。通过模型所得结果进行干旱灾害危险性分析,为农业旱灾风险提供理论依据,并在信息不丢失或者有效度量信息损失的基础上,更加精准地解决了干旱灾害影响因子数据呈现贫信息、不确定、异构等特点且现有模型不再适用的问题。

猜你喜欢
旱灾关联度分辨率
基于熵值法与灰色关联度分析法的羽毛球技战术综合评价分析
基于生成对抗网络的无监督图像超分辨率算法
基于熵权法改进的TOPSIS法和灰色关联度分析的压榨脱水过程优化研究
气候变暖背景下云南省旱灾风险区划研究
中国制造业产业关联度分析
中国制造业产业关联度分析
总统求雨
谢文骏与刘翔110m栏分段成绩与总成绩的灰色关联度对比分析
ARM发布显示控制器新品重点强化对分辨率的支持
陈鸾凤