一种新的证据冲突识别与调整方法

2022-08-25 08:57:16谈敏佳
上海交通大学学报 2022年8期
关键词:冲突证据融合

D-S(Dempster-Shafer)证据理论由Dempster于1967年首次提出,后经Shafer进一步发展和完善,由于在不确定性推理和信息融合方面具有较大优势,该理论方法已被广泛运用于各领域,如信息融合、多属性决策以及模式识别等.然而,在证据高度冲突的情况下,融合结果会出现悖论问题,如何有效降低证据冲突,将有利于提高证据融合结果的可信度.

针对上述问题,不少学者都进行了研究,其成果主要分为两大类.一类是修改经典证据理论的组合规则,重新分配冲突,文献[8]将冲突信任函数分配给未知项,以减小冲突的影响;文献[9]提出了一种改进的广义证据融合规则;文献[10]利用证据的时间权威性换算和冲突度的加权分配方法改进了证据组合规则.另一类是不改变证据规则,先处理冲突数据再进行证据融合,文献[11]利用距离函数和Tsallis熵来组合冲突证据;文献[12]利用证据间相互支持度和相似度,提出了一种迭代修正的冲突证据改进方法;文献[13]利用Pignistic距离衡量证据间的冲突,同时结合证据间相似度、支持度、确定度、决策度以及可信度确定证据的权重以分配证据冲突.前面所述方法主要针对证据冲突处理,而有效识别高度证据冲突是提高冲突处理精度的关键.为此,现有研究引入证据不确定度来确定加权因子,同时结合传统证据冲突与Jousselme信息距离重新度量证据冲突,并在此基础上引入最大差异度来确定一种证据冲突识别方法.

对于一个企业的市场营销策略的制作要求来说,它需要最真实并且准确的数据来作为制作的依据,因此,在市场营销策略制作之前企业对市场具体情况的了解程度就显得尤为重要。综上所述,企业应当专门建立一个市场调研小组,对市场上的消费需求有一个明确的了解,对自己同类别的竞争对手实力和历史有一个充分的认识,以及对市场的整体发展方向有一个具体的分析。市场调研小组前期所收集到的这些数据对于企业市场营销策略的制作起到关键性的作用,它可以帮助企业对市场的消费者做出细分,确立出自身企业的发展方向与目标,从而提高企业市场营销策略的针对性和有效性。

然而,文献[14]所提方法存在一些不足之处,后文将给出详细分析,此处不赘述.综上考虑,先以传统证据冲突的加权平均值作为识别指标,确定了一种证据冲突识别方法,针对识别结果,再引入可信度和不确定度确定权重系数,结合传统证据冲突和Jousselme信息距离,确定了一种证据冲突调整方法.本研究可以在一定程度上识别证据冲突,从而改善过高证据冲突带来的影响.

1 证据理论及其在车联网 (VANET)中的应用

(1)

式中:为证据冲突系数,其决定着证据融合结果的可信度当→1时,认为证据间存在高度冲突,此时证据融合结果的可信度逐渐降低,甚至会出现悖论;当=1时,认为证据之间完全冲突,此时证据融合规则完全失效;当=0时,认为证据间完全一致,证据融合结果完全可信,以下以实例说明两种证据的冲突问题设识别框架={,,}中有两条证据:()=1,()=0,()=0和:()=0,()=1,()=0,则由式(1)可知=1,表明证据和之间完全冲突,证据融合规则失效;若两条证据分别为:()=09,()=01,()=0和:()=0,()=01,()=09,则由式(1)可知,=099,表明证据和之间高度冲突,此时由证据融合结果()=0,()=1和()=0可知,的支持程度最高,而和的支持度都为0显然,这与和分别对和的支持度最高相悖,从而说明证据高度冲突会使证据融合结果出现悖论.

VANET属于分布式自组织通信网络,具有辅助驾驶、避免碰撞以及偏离警告等功能,旨在保障交通安全以及提高交通效率.为了保障车联网环境下的行车安全,需要在严格确保交通安全信息传输的同时具备高可靠性和低时延性条件,然而,各车辆节点主要依据自身需求竞争信道传输交通安全信息,随着车辆节点的增多,节点信息间的干扰和冲突也随之凸显.

由于证据理论具有高可靠性和低时延性等优势,已有研究将其应用到车联网中.文献[18]结合D-S证据理论,提出了一种自适应负载状态的车联网信道接入算法.文献[21]针对可能存在的节点恶意行为导致的网络性能下降问题,构建了基于D-S证据理论的信任模型,并将该模型应用于贪婪周边无状态路由(GPSR)算法以甄别恶意节点.文献[22]结合柯西方程、Bajraktarevic均值的权值函数以及D-S证据理论,提出了一种适用于车联网中的交通安全信息证据理论融合算法.已有研究虽然通过引入证据理论达到了一定的研究目的及效果,但对于可能出现的证据冲突问题缺乏考虑,而证据冲突可能会影响研究结果,为此,有必要优先考虑可能存在的证据冲突问题,这样才能使研究结果更加可靠.

AUC是指ROC曲线下的面积。使用AUC值作为评价标准是因为很多时候ROC曲线并不能清晰的说明哪个分类器的效果更好,而作为一个数值,对应AUC更大的分类器效果更好。AUC一般均在0.5到1之间,AUC越高,模型的区分能力越好。

2 现有证据冲突识别方法及不足

2.1 现有证据冲突识别方法

针对上述问题,为了识别高度证据冲突,现有研究先利用基于信息熵的不确定度重新度量了证据冲突,再利用最大差异度确定了证据冲突识别方法,具体如下.

[设计意图:根据文本特点,让学生先读文章的开头和结尾,再读文章中间部分,有利于激发学生的阅读期待,帮助学生用较短时间把握文章主要内容,理清文章脉胳;让学生根据板书练习概述课文主要内容,减缓了概述坡度,有利于将概述能力的培养与训练落到实处。]

(1) 证据冲突度量.

(=1, 2, …,)为识别框架下证据对应的任意证据焦元,则可以确定基于信息熵的不确定度(或内部冲突度),为了使度量更具有可比性,采用最大信息熵进行归一化处理,并且规定0ln(0)=0,数学表达如下式所示:

(2)

由式(1)可知,=1(=1, 2, 3),由式(2)~(6)可得对应的新度量证据冲突=0,显然,原有的完全证据冲突经重新度量后变成了无证据冲突,其识别结果为无证据冲突,与实际结果相悖,从而说明了研究不足带来的第1个问题.

(3)

设()和()是识别框架下的任意两个BPA,则其Jousselme 信息距离可以表示为

(,)=

根据《内蒙古自治区水资源综合规划》成果,扎赉特旗多年平均地下水资源量为3.539 8亿m3,地下水资源模数约为 3.11 万 m3/(a·km2)。 采用面积—倍比法,将扎赉特旗多年平均地下水资源量折算到相应论证单元,项目区论证范围总补给量计算结果为19077.1万m3/a。将《内蒙古自治区水资源综合规划》中地下水资源量折算到相应论证单元,计算成果见表2。将面积—倍比法计算成果与均衡法计算成果相比较,可以看出,本次各论证单元地下水资源量计算结果与水资源综合规划面积折算成果相差误差为1.3%~8.8%,误差不大,故认为均衡法计算的各论证单元地下水资源量计算结果准确、合理。

(4)

,〉=

(5)

式中:〈,〉为两向量的内积;||为求模.

对任意的证据和,则基于传统证据冲突(即证据冲突系数)和Jousselme 信息距离重新度量的证据冲突为

=+

(6)

(2) 证据冲突识别.

综上所诉,在治疗急性脑梗塞中,应用阿司匹林与氯吡格雷联合治疗效果显著,其可以有效改善患者神经功能,提高治疗效果,促进患者痊愈,安全可靠,值得临床积极推广。

2.2 现有证据冲突识别方法的不足

(2)人工挖孔环节:定位放线→开挖第1节桩孔土方→浇筑第1节护壁混凝土→架设垂直运输架→孔内送风检测有害气体→逐层开挖土方→成孔清底检查验收。

设识别框架={,,}中有3条证据:()=1,()=0,()=0和:()=0,()=1,()=0以及:()=0,()=0,()=1

记和分别为和的不确定度,且满足≥,对其进行归一化处理后,可得到其对应的加权因子和,+=1且≥,如下式所示:

设识别框架={,,},证据、和满足如下关系:

()=0011,()=0978,

分析结果表明,所提方法能够有效地识别并调整完全冲突,从而较大地提高证据融合结果的精度,也说明了所提方法优于现有研究方法.

()=0453,()=0154,

()=0393

()=0617,()=0131,

()=0252

结合式(1)~(7),可以依次求出、、、、以及,结果如表1所示.

3 新的证据冲突识别与调整方法

3.1 证据冲突识别

(1) 识别指标的确定.

识别指标是有效识别高度证据冲突的关键,为了确定合适的识别指标,以传统证据冲突为基础,首先依次求出 对应的 ,紧接着求出各 的加权值,然后对各 的加权值求和即可得出加权平均值,最后以作为证据冲突识别指标,具体过程如下.

设有条证据,其中证据和任意证据之间的冲突为 ,则证据冲突识别指标为

(8)

(2) 证据冲突识别方法.

基于确定的,将全体 与作比较,当 <时,表明证据与证据之间无高度证据冲突;当 ≥时,表明证据与证据之间存在高度证据冲突,需要被重新调整.

3.2 证据冲突调整

(1) 综合可信度的确定.

针对需要被调整的证据冲突 ,引入基于信息熵的不确定度和基于相关系数的证据信任度,进而确定综合可信度,具体过程如下.

是识别框架上的任意两个BPA,同时设为条证据中的第条证据,则可求出之间的相关系数以及证据的信任度,分别如下式所示:

式中:为证据间的可信度,反映的是证据与其他证据间的信任度.

设证据的不确定度和信任度分别为,则的综合可信度

=1-+

(11)

式中:1-∈(0,1),为证据焦元内的确定度(即可信度),且越小,表明证据焦元内的冲突越小,其可信度也就越大.

(2) 权重系数的确定.

(12)

式中:的综合可信度.

显然,综合考虑了证据内和证据间的可信度,用该值来确定权重系数,相比以单一的不确定度来确定权重系数,其信度更高.

()=0487,()=0234,

(3) 证据冲突调整方法.

针对识别出的高度证据冲突,首先按照对应的证据冲突类型确定相应的权重系数,然后利用式(4)和(5)求出相应的,最后按照式(6)对这些证据冲突加以重新调整.

4 改进方法的应用分析

以下通过应用分析说明所提证据冲突识别与调整方法的具体操作流程,同时验证该方法在证据冲突识别和调整方面的有效性.

第四,动物园并未配备麻醉枪,但是麻醉枪在本案中是否起到关键作用?就算有麻醉枪,是否能对老虎起效?在本案中,因为麻醉枪对于老虎并不能起到显著的作用,所以在本案中无法起到关键作用。但是基于本案中参考对象是老虎,麻醉枪对于其作用不大,是特殊个体,所以应该仍列入参考范围之内。

基于实例1,由式(1)和(8)可以求出 以及,并将全体冲突值 用矩阵形式展现,记为

随着机器视觉技术、3 G技术、电子技术的不断发展以及人们对农产品可视化生产程度和农产品质量安全水平要求的不断提高,农产品生产过程全程可视化监控已经逐渐成为精准农业的一个热门发展方向[1]。农产品生产过程中传统物理量参数的监控已经无法满足现代农业的发展趋势。

=[]=[0 0 0]

′=[]=[05 05 05]

同理可求得对应现有研究新度量的冲突=0 (=1, 2, 3),显然,原有的完全证据冲突经重新度量后变成了无证据冲突,其识别结果为无证据冲突,与实际结果相悖.

()=0011

车联网的交通安全主要依靠各车辆节点的信息,证据理论与车联网结合,可以高效地融合多节点信息,提高车联网精度,但在证据融合过程中,高度证据冲突会导致融合结果与实际相悖,因而首要任务就是降低高度证据冲突.设、、为车联网中3种车辆节点信息,现获取了这3种车辆节点信息的6组证据~,如下所示.

如图1所示,本文采用位于低折射率电介质基片上的高折射率电介质单元来组成电介质超表面结构。衬底由金属平面支撑,因此这种电介质超表面工作在反射模式。电介质单元和衬底的介电常数分别为6.5和2.65。这两种材料的损失都可以忽略不计。电介质元件是良好的电介质谐振器,可以产生由Mie共振引起的电偶极子响应。

()=0533,()=0213,

()=0254

()=0151,()=0737,

()=0112

()=0532,()=0121,

收集2015年1月~2017年4月就诊于我院门诊病理确诊的鼻咽癌患者(78例)及慢性鼻咽炎患者(135例)。所有鼻咽癌患者均经病理证实为鳞癌,且未行放疗和化疗等治疗。其中鼻咽癌患者:男性57例,女性21例,年龄18~72岁,中位年龄43岁;慢性鼻咽炎患者:男性115例,女性20例,年龄10~68岁,中位年龄38岁。根据2002年AJCC对鼻咽癌诊疗指南中分期标准,详细记录患者临床分期、T分期、淋巴结转移、复发情况。

()=0347

()=0627,()=0159,

()=0214

在《奶奶的星星》一文中,世界给“我”的第一个可怕的印象,是奶奶告诉“我”死了就再也找不到奶奶了,在死亡的威胁中,颤栗不已。《钟声》中的B问爷爷有关死的问题:“死了是不是就再也回不来了?”《一种谜语的几种简单的猜法》中,得了癌症的孩子尚不知自己的悲剧命运,还快乐地欣赏那将要“肆无忌惮”地开放的“死亡之花”。死亡就是这样的残酷无情,哪怕是天真无邪不谙世事的鲜活而可爱的小孩子,它也不稍动仁慈恻隐之心。

(3)将“套路”与新思路有效结合,实现解题效率的最大化。还有些情况下单一应用“套路”或构建新思路都难见成效,我们可以尝试将它们“融为一炉”。

()=0279

华堂村的桃形李种植仍沿袭一家一户在自家土地上各自种植、各自养护管理、各自销售的传统生产方式,基本没有相应的种植和养护设施,雨、旱、冰、霜都会给桃形李种植带来严重影响;没有统一的产前、产中、产后服务,养护管理粗放,生产水平落后,工效低,成本高.特别是病虫害防治也是每家每户各自购药、施药,没有统一的操作方式与方法,既影响防治效果,还出现了成品果农药残留量难以控制的问题.

()=0597,()=0265,

()=0138

(1) 所提方法的操作流程.

先由式(1)和(8)依次求出6组证据间的以及,并将全体证据冲突值 用矩阵形式展现,记为

=

结合识别方法可知,、、、、以及均为需要被调整的证据冲突.

再由式(2)和式(9)~(11)依次求出以及,结果如下式所示:

=[]=

[0922 0688 0873 0833 0952 0849]

=[]=

[0900 0526 0854 0873 0902 0887]

=[]=

[0978 0838 0982 1040 0949 1038]

由表2可知,经过调整后,原有的高度证据冲突都大幅度下降,全部处于以内.

(2) 两种方法对比分析.

为了验证所提方法的有效性,选取降低程度和平均偏差作为评价指标,如下式所示:

=(-)

(15)

式中:为所提方法的证据冲突值或现有研究方法的证据冲突值对于,为;为对应的传统证据冲突值且=对于,为;为且=

先分别计算出、和,再结合式(15)计算出-和-之间的以及-和-之间的,结果如表3所示.

从的角度,-之间的都位于10%以内,相比之下,-之间的除了为2.40%以外,其余的都基本位于20%至35%之间,大幅度地超过了-之间的从角度,-之间的除了为 -4.60% 以外,其余的基本位于0.9%至16%之间,相比之下,-之间的较稳定,基本位于 -2.3%至 -23% 之间.

分析结果显示,基于所提方法调整后的证据冲突降低程度更大,且与之间的平均偏差更小(均为负值),这表明了所提方法的调整效果更好,调整结果更快地收敛到以内.

再将全体传统证据冲突、现有研究证据冲突以及所提方法证据冲突以二维散点图表示,如图2所示.

由图2(a)可知,以为基准,存在部分传统证据冲突值高于且较为离散;由图2(b)可知,在基于现有研究方法重新度量的证据冲突中,超出的证据冲突虽有所改善,但仍存在部分证据冲突值高于;由图2(c)可知,经过所提方法识别并调整后,超出的证据冲突得到了大幅度改善,基本处在以内;此外,调整后的证据冲突值都相对集中,离散性较低.分析结果进一步表明,所提方法不仅识别精度更高,而且能够有效改善高度证据冲突.

5 结语

以降低程度和平均偏差为指标,对比分析了现有研究方法和所提方法,同时分析了3种证据冲突的散点分布情况,结果验证了所提方法能够有效识别并调整证据冲突,且调整结果的收敛性更好.

限于文章篇幅,此处仅考虑了两个证据间的高度(完全)冲突问题,后续将在此基础上进一步研究3个及以上证据间的高度(完全)冲突问题.

猜你喜欢
冲突证据融合
耶路撒冷爆发大规模冲突
环球时报(2022-04-16)2022-04-16 14:38:15
村企党建联建融合共赢
今日农业(2021年19期)2022-01-12 06:16:36
融合菜
从创新出发,与高考数列相遇、融合
“三宜”“三不宜”化解师生冲突
井冈教育(2020年6期)2020-12-14 03:04:32
《融合》
现代出版(2020年3期)2020-06-20 07:10:34
对于家庭暴力应当如何搜集证据
红土地(2016年3期)2017-01-15 13:45:22
手上的证据
“大禹治水”有了新证据
手上的证据