车联网环境下基于时空类大数据分析的联盟博弈
车联网环境下,车辆、传感器及执行器等收到的信息有着容量大、变化多、速度快等特点,使得传递的信息具有时空特性。因此,数据的成功传递大部分依赖中继节点的行为表现。采用合作和非合作贝叶斯联盟博弈(BCGs)和自动学习机(LA)来分析中继节点的行为表现。其中,LA安装在每个车辆上充当博弈者。最初,每个博弈者任意从策略空间选择某一策略,且任意策略的选择概率相同。随着博弈的进行,博弈者会继续运动(前进、后退或保持不动)。每个自动学习机都定义了3个属性Cid、V和PU。Cid是联盟的id,V是由贝叶斯定理确定的条件概率,PU是博弈者使用的支付工具。
合作/非合作联盟算法是每个博弈者选择合作或非合作策略。博弈中,用有向非循环图(ADG)来代表博弈者及博弈者与其它博弈者的关系。每个博弈者的属性都搭配ADG边缘,且支付工具由公式计算。支付工具会根据合作和非合作策略的选择来进行调节。两种情况下,如果支付比率小于设定的门限值,则博弈者得到奖励;否则得到处罚。支付工具由此不断更新。最后,计算出每位博弈者的奖励和惩罚数量比。筛选出比值最大的那个策略,这有助于建立纳什均衡。
合作模式的分析。在使用合作路径时,每个博弈者共享奖励和控制策略,从而形成联盟。基于其它博弈者获取的信息,每个博弈者选择控制策略。每个博弈者信息的交换取决于信息传递到车辆的概率时间和在中继节点等待的概率时间。这些概率通过单位时间内成功传递的信息占总发送信息的比值来计算得到。
非合作模式的分析。在非合作模式下,每个博弈者的策略目的是,根据置信概率和其它博弈者与行为概率向量有关的策略来获取PU的最大值。置信度是使用各种动作执行的条件概率来表示的。每个博弈者通过使用贝叶斯定理和其它博弈者行为表现来不断更新置信度。在所提出的方案里,可以通过使用置信概率来获得多纳什均衡点,这些点可以控制3种信息的中转传递。仿真结果表明,相比空间知识不完整策略,凭借空间知识完整的策略获得纳什均衡点的概率就会增加,而且吞吐量也会增加;所提出的方案在节点行为、商榷时间、学习率和行为数量等方面有较好的表现。
刊名:IEEE Internet of Things Journal(英)
刊期:2013年
作者:Neeraj Kumar et al
编译:谢秀磊