吕靖,齐海迪,李宝德
(大连海事大学,交通运输工程学院,辽宁大连 116026)
海运是当今世界上最重要的跨国运输方式,对世界贸易与经济的发展起到了至关重要的作用。然而,以海盗和海上恐怖主义为主的非传统安全风险成为困扰海上运输安全的主要问题[1]。其中,海盗袭击事件影响的范围最为广泛,一旦发生,不仅会造成财产损失,还会对船上人员的生命安全产生巨大威胁,甚至还有可能对通航、环境等产生不利影响。因此,如何根据现有信息,构建合理准确的海盗风险预测模型,在海盗袭击时,给出海盗袭击的风险等级,使相关方迅速采取有效应对行动,减少严重损失显得尤为重要。
针对海盗袭击事件的研究主要围绕海盗袭击事件的海军护航策略博弈、预警等,如朱乐群等[2]根据演化博弈理论建立海军护航下海盗袭击决策的非对称演化博弈模型,并对近年来索马里海盗活动情况进行模拟。孙茂金等[3]采用决策树方法并以东非海域海盗事件为研究对象进行海盗袭击后果预警,结果表明,预测结果远优于随机猜测。
为综合利用人类在决策过程中的不确定信息和定性知识,YANG 等[4]通过在传统的IF-THEN 规则中加入置信框架,首次提出置信规则库(Belief Rule Base,BRB)。随后,置信规则库被广泛应用于不同领域的决策研究。随后,考虑置信规则库的前提属性数量和属性值过多会产生“组合爆炸”的问题,LIU 等[5]提出扩展置信规则库(Extended Belief Rule Base,EBRB),并应用于预测和评估领域。叶菲菲等[6]针对交通运输业中环境治理成本规划问题,提出基于数据包络分析和扩展置信规则库的环境治理成本预测模型。杨隆浩等[7]引入参数优化和数据包络分析,分别提出扩展置信规则库的规则生成方法和规则约减方法,并应用于桥梁风险评估。
综上所述,海盗袭击事件风险预测方面的研究并不多,本文提出基于扩展置信规则库联合优化方法对海盗袭击事件进行风险预测,为相关方制定应急决策方案提供参考依据。
EBRB 系统是一个基于扩展置信规则的预测和推理系统,目前大多被用来做预测和评估。假设EBRB 系统中有M个前提属性Ui(i=1,…,M),每个前提属性有Ji个参考值Ai,j(j=1,…,Ji),以及一个结果属性D,结果属性有N个参考值Dn(n=1,…,N)。EBRB 系统的第k(k=1,…,L,L为总规则数)条扩展置信规则Rk为
EBRB 系统构建的关键步骤是利用专家知识确定规则中前提属性Ui(i=1,…,M)的所有参考值Ai,j(j=1,…,Ji)的效用值u(Ai,j),结果属性D所有参考值Dn(n=1,…,N)的效用值u(Dn),以及每个前提属性的属性权重δi(i=1,…,M)。但EBRB 系统由于缺乏信息、知识或数据,这种依靠决策者主观确定参数的方法会存在着一定的不合理性,因此本文提出一种新的联合优化方法,同时优化EBRB系统中的基本参数个数和数值。EBRB 系统的联合优化过程如图1所示。
图1 EBRB系统联合优化过程Fig.1 EBRB system joint optimization process
1.2.1 基于Relief F算法的EBRB系统结构优化
Relief F 算法由Relief 算法演变而来,Relief 算法是一种多变量过滤式特征选择算法,也是一种基于样本学习的特征权重算法。Relief算法通过考察特征在同类近邻样本与异类近邻样本之间的差异来度量特征的区分能力。若特征在同类样本之间差异小,而在异类样本之间差异大,则该特征具有较强的区分能力。Relief算法只适用于两类数据问题,因此Kononenko[8]提出适用于多类别分类问题的Relief F算法。海盗袭击事件的风险等级属于一个多分类的问题,因此采用Relief F 算法对其进行关键属性提取具有一定的适用性和有效性,Relief F算法的伪代码如表1所示。
表1 Relief F算法Table 1 Relief F algorithm
表1 中,xrl为第l(l=1,…,m)次从原始样本集中随机抽取的样本;为的A个同类最邻近样本,a=1,2,…,A;为来自于异类的A个的最邻近样本,ac=1,2,…,A;diff 为两样本在前提属性Ui上的差,对于离散性属性Ui有
对于连续性属性Ui有
Relief F 算法计算第i(i=1,…,M)个属性Ui的权重公式为
当计算得出所有属性权重,给定一个阈值进行关键属性选择或者是按照权重降序排列并选择权重最大的前若干个属性。通过Relief F算法提取出关键属性,能够降低EBRB 系统的计算复杂度,提高系统的效率,实现对EBRB系统的结构优化。
1.2.2 基于差分进化算法的EBRB系统参数优化
在提取出关键属性后,本文采用参数学习方法来确定EBRB系统中的基本参数的最优值,具体参数优化的数学模型[9]如下。
假设EBRB 系统中有M个前提属性和1 个结果属性,前提属性各有Ji(i=1,…,M)个参考值的效用值u(Ai,j),j=1,…,Ji;i=1,…,M,结果属性有N个结果参考值的效用值u(Dn),n=1,…,N。同时有T组数据,假设EBRB系统对数据推理的结果为f(xt),EBRB的参数优化模型为
式中:bli、bui分别为第i个前提属性取值的下限、上限;bl、bu分别为结果属性取值的下限、上限。
为了得到目标函数中的参数最优取值,本文利用差分进化算法进行迭代求解,具体步骤伪代码如表2所示。
表2 差分进化算法Table 2 Differential evolution algorithm
为了确保系统预测的准确性,需要通过专家知识和历史数据构建基础EBRB系统,基本流程如图2所示。从图2 可知,EBRB 系统包括了两部分,即扩展置信规则(EBRB)和证据推理(ER)过程。通过这两部分,EBRB 系统能够为每个输入数据生成输出。
图2 EBRB系统风险预测过程Fig.2 EBRB system risk prediction process
1.3.1 EBRB系统构建过程
利用历史数据构建EBRB的过程如下:
Step 1 通过1.2节的联合优化方法确定基本参数的数量和取值。
Step 2 利用基于效用值的转换方式计算置信度分布。
这一步是将海盗袭击事件的历史输入输出数据转换为扩展置信规则的置信分布[10],输入数据的置信分布为
同理,通过输出数据yk和式(14)可以得到输出数据的置信分布为
Step 3 利用相似度度量计算规则权重[11]。
假设在EBRB系统中共有L条扩展置信规则,输入输出数据的置信分布分别如式(13)和式(16)所示,则第k(k=1,…,L)条规则的前提属性相似度SRA 和结果属性相似度SRC 分别为
第k(k=1,…,L)条规则的不一致性度为
最后,第k条规则的权重为
根据上述步骤可将海盗袭击事件的历史数据转化为EBRB 系统中的扩展置信规则,至此,海盗袭击事件的扩展置信规则库构建完成。
1.3.2 EBRB系统预测过程
基于1.2.1节建立的EBRB系统,海盗袭击事件的风险等级预测步骤如下。
Step 1 计算每条规则的激活权重。
计算输入数据xi和第k条规则的匹配度[11]为
相应地,输入数据x=(x1,…,xM)对第k条规则的激活权重[5]为
wk >0 代表第k条规则被激活。
Step 2 用ER算法集成所有激活规则。
利用ER 算法[12]将所有激活权重大于0 的规则集成,得到结果属性置信度为
根据效用值[u(Dn);n=1,…,N]预测海盗袭击事件的风险等级,计算预测结果为
为验证本文提出的基于扩展置信规则库联合优化海盗袭击事件风险预测模型的有效性,选取Global Integrated Shipping Information System(GISIS)数据库统计的2011—2020年的海盗袭击事件作为基础数据集,其中2011—2019年的数据作为历史数据建立EBRB 推理系统并进行结构和参数学习,2020年数据作为测试数据验证本文所提出方法的有效性。
根据海盗事件的已有研究[13],海盗袭击事件是由于船舶、海盗、环境三者之间相互作用而发生的,这三者之间不同的作用导致海盗事件结果演化不同。其中,船舶影响因素包括船舶类型、航行状态,以及船舶的反海盗措施;海盗影响因素包括海盗人数,是否持有武器;环境影响因素主要包括时间、沿岸政治环境,以及海上犯罪威胁情况等。海盗事件发生可能造成的结果有人员伤亡、财产损失、通航影响以及环境影响。因通航和环境影响并不常见,且鉴于人员伤亡和财产损失结果所选择的输入指标相同,因此两者的预测过程具有相似性,考虑到篇幅原因,本文将人员伤亡等级作为海盗事件的风险预测输出属性。根据上述海盗袭击事件风险影响因素分析,建立如表3所示的海盗袭击事件风险预测输入输出指标体系。
表3 风险预测指标体系Table 3 Risk prediction index system
IMO(国际海事组织)发布的GISIS数据库中的《Piracy and Armed Robbery》详细地记录了海盗事件的发生报告,包括船舶类型、航行状态、反海盗措施、海盗人数、是否持有武器、发生时间、发生海域、沿岸国家、人员伤亡、财产损失等;沿岸国家政治环境数据取自PRS(政治风险服务)集团发布的国家风险指数。
首先,对于本身就是定量数据的属性,无需定量化处理,如海盗人数和沿岸国家政治环境。其次,可以用定量化数据来衡量的属性,本文将2020年各船舶类型遭受海盗袭击的次数作为船舶类型这一属性的量化数据;同理,将2020年海盗事件发生在各个时段的统计次数作为时间这一因素的量化数据;海上犯罪威胁情况衡量了某一海域发生海盗及恐怖主义事件的风险大小,根据2020年该区域的海盗活动总次数作为衡量依据。
对于定性化描述数据,包括航行状态、反海盗措施、是否持有武器以及人员伤亡,根据数据不同的特点进行量化。GISIS数据库记录船舶的航行状态有行驶和停泊两种,用0-1 变量将这两种状态量化。GISIS数据库对反海盗措施是利用定性语言来描述的,对数据进行仔细分析后,本文依据采取的反海盗措施个数进行量化。同理,根据海盗持有武器的种类对是否持有武器定量化描述。人员伤亡属性也为语言型的描述,对数据分析后,依据关键字进行量化[1],人员伤亡属性的关键字为人质、轻伤、重伤、失踪/死亡。根据水上交通事故分级标准[14]和对海盗事件数据集的分析,人员伤亡等级划分方式如表4所示。将数据处理后,数据集各指标的描述性统计如表5所示。
表4 人员伤亡等级Table 4 Casualty level
表5 描述性统计Table 5 Descriptive statistics
筛选发生在2011—2019年间的200 件数据完整的海盗袭击事件作为历史数据集,20 件发生在2020年的海盗袭击事件作为测试集。设定Relief F算法中的抽样次数m为80次,近邻数据个数A为8个,运行次数N为20 次。在使用差分进化算法进行参数优化的过程中,设定迭代次数S为300 次,待优化参数为19 个,变异因子F为0.5,交叉因子CR为0.8。
2.2.1 关键属性提取结果
利用Relief F算法对输出属性人员伤亡的关键输入属性进行选择,表6 为各属性权重的计算结果。结果表明,反海盗措施、海盗人数、是否持有武器这3个属性的权重明显高于其他几个属性,对于海盗袭击事件而言,海盗的武装力量和船舶的反海盗措施对结果的演变起着重要作用[13]。因此本文提取这3个属性作为人员伤亡属性的关键属性,以实现对EBRB系统的结构优化,提高计算效率。
表6 属性权重Table 6 Attribute weight
2.2.2 参数优化结果
首先,根据专家知识和数据的描述性统计,确定各输入和输出属性的参考值等级Ai,j,各属性的参考值等级皆为{低,一般,较高,高},以及初始参数值,包括输入和输出属性的效用值u(Ai,j)(j=1,…,Ji;i=1,…,M),u(Dn)以及输入属性的权重δi,具体如表7所示。
表7 初始参数值Table 7 Initial value of parameters
接下来,利用差分进化算法进行参数优化。平均绝对误差(MAE)的变化如图3所示,可以看出,MAE随着迭代次数的增加而减小,并逐渐收敛,在迭代233次时达到最优。这意味着EBRB系统参数的值,包括输入属性权重和输入、输出属性参考值的效用值均为最优值,最优参数如表8所示。
图3 参数优化过程Fig.3 Parameter optimization process
表8 最优参数值Table 8 Optimal value of parameters
2.2.3 风险预测结果及分析
为了证明此方法的准确性,对2020年海盗事件人员伤亡风险等级预测,结果如图4 和图5所示。很明显,联合优化方法的预测结果与实际情况更相符。同时,从误差图可以直观的看出,联合优化EBRB 系统的误差基本控制在0.5 以内,而EBRB 系统在多数情况下误差都超过了1.0,联合优化的方法能够将初始EBRB 系统的预测准确性提高60%。
图4 2020年人员伤亡等级预测值Fig.4 Prediction of casualty levels in 2020
图5 2020年人员伤亡等级预测误差Fig.5 Prediction error of casualty levels in 2020
为了更加直观地体现两种方法的差异,表9给出两种方法的平均绝对误差(MAE)、均方根误差(RMSE)和均方误差(MSE),可以看出,联合优化的EBRB方法在各个指标上都明显优于初始EBRB。
表9 不同EBRB模型的性能比较Table 9 Comparison of performance of different EBRB models
为进一步比较联合优化EBRB 系统在海盗事件风险预测方面的优越性,将现有两种风险预测方法,即人工神经网络(BP-ANN)和自适应神经模糊推理系统(ANFIS)与本文提出的模型进行对比分析。其中,BP-ANN在风险评估领域得到了广泛应用,而ANFIS与EBRB系统预测模型都属于规则推理范畴。
以MAE、RMSE、MSE 等评价指标对比模型预测效果,结果如表10所示。联合优化EBRB系统的MAE 值为0.1839,相比于其他两种预测方法的准确性分别提高了95.1%和186.7%;联合优化EBRB系统得到的RMSE、MSE也明显小于其他风险预测模型,说明联合优化EBRB系统能够有效避免在海盗事件风险预测中出现误差较大的情形。
表10 不同方法性能比较Table 10 Comparison of performances of different methods
本文提出一种基于扩展置信规则库联合优化的海盗袭击事件风险预测模型。首先利用Relief F算法进行结构优化,以去除冗余指标,提取出关键属性,结果表明,海盗的武装力量和船舶的反海盗措施对海盗袭击事件后果的严重程度起着关键作用;之后采用差分进化算法进行参数优化,以减小误差。应用该方法对海盗事件人员伤亡风险等级预测能够明显减小预测误差,提高EBRB系统的预测精度。并与BP 神经网络、ANFIS 等预测方法对比,本文方法能够将预测准确性分别提高95.1%和186.7%。研究结果一方面可以为我国建立实时的海盗风险预测体系提供方法指导,另一方面能够为相关方及时展开应急活动提供有效依据,为打击海盗做出重要贡献。