多源异质信息下区域干旱危险性的DT型关联分析方法

2020-03-20 08:58罗党胡燕

华北水利水电大学学报(自然科学版) 2020年1期

罗党，胡燕

(华北水利水电大学数学与统计学院,河南郑州 450046)

旱灾的形成受多种因素的影响，形成机理复杂多变。旱灾数据不同频、信息多源并且其量化表征方式不同、各影响因素间时滞且存在交互作用等是目前存在的主要问题。针对农业干旱灾害数据呈现的贫信息、不确定、异构等特点，深入分析由致灾因子危险性到旱灾损失的动力机制，科学识别干旱灾害数据的多源信息与不确定性表现形式，并在信息不丢失或者有效度量信息损失的基础上，创建规范的数据融合表征方法、动态演化模式，简化运算规则，提高模型分辨率，是文中统一描述、物理解析与科学管理农业旱灾系统不确定性信息的关键，也是开展农业旱灾系统一系列量化分析模型探究的关键。在一定的区域与不同的时间内，旱灾影响因子的数据来源涉及水文数据、遥感数据以及气象数据，表现为不同的数据特征，具体可分为实数、区间灰数、三参数区间灰数等类型，这是学者们目前未曾深入研究的方面，之前有学者提出的模型对这类旱灾风险问题已不再适用。且多指标面板数据中不同指标的不同对象在不同时刻下异构性数据是信息充分挖掘与建模实践的根据，其接近性测度是衡量面板数据表征的干旱灾害影响因素指标的动态性发展的重要基础，故对此进行相关研究是有必要的。

一般的经济体系、农业体系等抽象体系都包罗多种决定该抽象体系发展态势的不同要素。通过现有技术虽已获得大量数据，但大数据的灰度较大，再加上一些人为的原因，造成现实存在的问题用数理统计的计算方式解决不再奏效，而灰色关联分析方法突破了数理统计方式解决此类问题的局限。灰色关联分析是分析体系中不同因素关联程度的有效途径[1]，也是灰色系统理论中十分活跃的分支。其基本思想是把相关因素的离散行为观测值经过非曲线插值的方式转化为分段连续的折线，从而根据折线的几何表征构造关联模型。并通过折线几何形状判断序列之间的关联度,几何形状相似水平越小，关联度越小[2]。20世纪80年代末，许多学者基于原始灰关联模型，在理论研究领域中，对模型做进一步的改善，提出了B型[3]、T型[4]、C型[5]等灰关联模型。随着科技的进步以及多种因素的交叉出现，学者们对关联模型做了更深层次的研究，以满足当前实际生活的需求。钱吴永等[1]分析具有复杂数据结构特点的探究对象，将基于一般向量空间的灰色关联度的计算方式拓展到矩阵空间。罗党等[6]考虑了指标发展速度、速率变化和发展水平变化，建立基于面板时空特征的灰色关联模型。刘震等[7]通过线段在空间中的斜率，构造新的网格相关系数，得到了网格灰色关联方法。崔立志等[8]用个体和时间两个维度衡量发展速度和增长速度指数的相近程度，将传统的向量空间拓展到矩阵空间。张可等[9]通过分析面板数据格式，提出扩展的以矩阵为基础的灰色绝对关联度。罗党等[10]通过从时间维度和对象维度引进指标的总位移差、一阶斜率及二阶斜率差构造关联模型。耿率帅等[11]在综合考虑指标发展趋向、指标权重和时间权重的基础上，提出了用于解决面板数据局限的可能度函数模型。申健民等[12]针对关联度区分较低以及存在下限等问题，提出了指数函数的关联度。这些研究已经在社会、经济、军事、农业等很多领域发挥了其应用价值，但这些模型只是针对某一问题进行解决，当多个问题同时存在时，这些模型将不再适用。因此，这些关联模型仍需做深层次的改进，需基于以下问题进行改进：①静态数据指标选取不当，导致丢失部分原始信息；②当基于面板数据的指标类型为区间灰数、三参数区间灰数、实数交叉出现时，原有的关联模型不能有效解决新出现的问题；③计算不同对象在同一指标下的关联度大小时，分式型的分辨率较低，会降低结果的准确率。

探究农业旱灾系统，发现以上关联模型存在的缺陷也是目前旱灾风险研究未能有效解决的问题，且具有灰色多源异质性特征的旱灾指标数据可以充分表达原始数据信息，根据不同指标类型，将原始数据分别转化为不同的矩阵形式，并对应地将每一类矩阵分别进行极差变换统一量纲；确定理想指标向量，基于接近性视角构造发展水平总位移和发展速率总位移，表征干旱灾害影响因素指标的动态发展水平，这样简化了模型计算步骤；将分式型函数转化为指数型函数来提高关联模型的分辨率，并对不同的指标进行赋权，基于此，构造了分辨率较高的DT型关联模型。并通过实例分析以及对比分析证实了此关联模型的有效性以及可行性，拓展了模型的适用范围，解决了现有模型未能解决的问题，为农业旱灾风险调控提供了理论与实际决策的基础。

1 预备知识

1.1 混合面板数据表征

面板数据是考虑了对象、指标、时间3个维度的数据，因此可表征为对象维度矩阵、指标维度矩阵、时间维度矩阵。探究发现，导致旱灾的因素指标数据具有不同的类型，因此，本文从指标维度矩阵方面进行研究。由于指标类型复杂多变，可能有实数型、区间灰数型、三参数区间灰数型混合出现的情形以及实数型、区间灰数型、三参数区间灰数型单独存在的情形或其他情形。因此，当面板数据中指标维度不同时，面板数据数值表现出不同的类型。

(i=1,2,…,I)。

(1)

1)导致旱灾的因素指标在面板数据中表现为实数的情况。对于实数ui(s,t)，对其进行极差变换，效益型指标：

(2)

成本型指标：

(3)

其中：

i=1,2,…,I;s=1,2,…,S;t=1,2,…,T。

(4)

成本型指标：

(5)

其中：

i=1,2,…,I;s=1,2,…,S;t=1,2,…,T。

(6)

成本型指标：

(7)

其中：

i=1,2,…,I;s=1,2,…,S;t=1,2,…,T。

由于不同指标元素的量纲不同，若对其进行比较，需对其进行统一量纲处理。因此，对不同类型的指标进行极差变换，则处理后的数据取值全在[0,1]跨距内，达到量纲统一的要求。

在此，理想指标向量需从量纲统一之后的元素中选取，简化了计算步骤，并且可以清晰地反映理想指标与影响因素指标之间的关系。