林烨婷,陈忠辉,冯心欣,郑海峰
(福州大学 物理与信息工程学院,福建 福州 350116)
移动群智感知是一种新的感知模式,它将普通用户的移动设备作为基本感知单元,利用网络媒介,通 过有意识或无意识的协作,实现感知任务的分发以及感知数据的收集,完成大规模的、复杂的社会感知任务[1]。受限于感知任务参与者数量不足和提供数据质量不高,群智感知的发展受到了严重的影响,因此需要设计任务分配机制和激励机制[2]。而在实际的激励机制选择中,云平台遇到了新的问题。现实生活中参与群智感知的用户类型和能力存在差异,例如出租车与公交车,其日常行驶路线有很大不同,前者行驶路线分散,且热门地点出现的频率高,后者行驶路线跨度大,且仅在几条固定的路线行驶。于是在收集数据时,两种类型的车辆上传的数据有很大的特征差异。在设计激励机制时,要考虑到用户类型差异,才能使用户利用率提高,云平台收益最大化。激励机制的设计是群智感知研究的关键,可以利用如博弈、拍卖、契约理论等方法来设计激励机制[3]。
信息采集过程依据一种群智感知模式,如图1所示。具体步骤如下。
(1)在信息传输采集系统中,由一个云平台公布若干采集任务。介绍任务内容并公布不同任务相对应的报酬给若干个手机用户。
(2)有一些手机用户,例如手机用户1、3、5响应,表示对其有兴趣,之后手机用户会使用自己的手机采集信息并将收集到的信息上传至云平台。而手机用户2、4由于某些约束则不参加任务。
(3)手机用户完成任务后,会得到步骤(1)所宣称的报酬,用于弥补完成任务的损耗和奖赏上传信息的贡献。该报酬实际上是与手机用户递交的结果相关的。
图1 传感过程图
用户递交的结果好坏实际上取决于步骤(2)中用户传输数据的信息传输速率,表达式如下:
(1)
其中B为带宽,N为高斯噪声的功率,S为用户移动设备的传输功率,S∈{SH,SL},云平台公布的采集任务包含使用高功率SH传输的任务和使用低功率SL传输的任务两种,命名为SH任务和SL任务。用户可根据选择的任务类型来选择发射功率。由于信息采集过程受云平台处理速度限制,信息传输速率并不是越快越好,考虑如图2所示的信息传输速率密度图,本文设置一阈值Xd,并定义两种结果,将大于Xd的Xi定义为好结果,将大于Xd的Xi统计平均值X1定义为其带来的收益;将小于Xd的Xi定义为坏结果,将小于Xd的Xi的统计平均值X0定义为其带来的收益,于是X1>X0,X={X0,X1},Xi∈X,i∈{0,1}。
图2 数据传输速率密度分布图
利用契约理论,将群智感知转换为契约关系,则云平台为委托人,手机用户为代理人[4]。委托人的任务是设计出一个获取代理人私人信息的有效合同。
该数据采集过程中存在1个委托人和n个异构化代理人,将其根据成本函数的不同(下面会进行说明)划分为好类型代理人与坏类型代理人。好类型代理人的比例为θG,坏类型代理人的比例为θB,且θG+θB=1。收益函数定义为收入减去成本,代理人的收益函数如下[5]:
EV=u(w(t))-C(t,S)
(2)
其中w(t),t∈{G,B}为代理人的报酬,与其类型相关。u(w(t))为代理人的收益,u(·)为效用函数,代理人为风险规避型用户,其效用函数为凹性,效用随货币收益增加而增加,但增加率递减,即其二阶导数小于零。其反函数为w(t)=u-1。C(t,S)为代理人成本函数,根据代理人类型分为两种C(G,S)=v(S),C(B,S)=cv(S),如图3所示,不失一般性,将函数定义为线性的,其中c>1。v(S)为行动成本函数,与其实际传输功率相关。如图定义SH>SL,所以v(SH)>v(SL)。对于相同的行动成本,坏类型代理人需要更多成本,这也是坏类型代理人命名的原因。
图3 代理人成本函数图
风险中性委托人的收益函数如下:
(3)
通过式(2)和式(3)的对比,发现委托人和代理人之间存在利益冲突,为了最大化委托人的效益,并让代理人按照契约执行,本文需要设计一个契约。其策略是对于t类型代理人,令其完成S任务,并给与其报酬w(t),另一类型代理人则完成另一种任务。将所提出的这样一组(任务,报酬)组合称为契约,记为{(S,w(t))|∀t∈G,B,S∈SH,SL}。最优契约需要达到的目标是令委托人的效益最大化,可表示为:
(4)
该目标同时要满足两个条件:
(5)
(2)某类型的代理人会对应选择委托人为其类型提出的报酬而非其他类型的报酬,则最优契约还需要满足激励相容约束(IC约束),这意味着,某类型代理人选择为其设计的契约方案和选择另一个契约方案,对其收益进行比较,若前者较大则不会伪装,否则该类型会伪装为另一类型,可表示为:对于任何类型代理人,有
u(w(t))-C(t,S)≥u(w(t′))-C(t,S′)
∀t≠t′,S≠S′
(6)
S′为t类型代理人完成t′类型代理人任务时的功率。
于是可将最优契约求解问题构造成一个带有约束的最大化问题。契约按两种方案讨论,方案1:好类型代理人完成SH任务,坏类型代理人完成SL任务。方案2:好类型代理人完成SL任务,坏类型代理人完成SH任务。首先,以方案1为例进行求解分析。
在对称信息场景中,委托人可观测到代理人的类型,代理人会如实上报自身类型信息,于是契约可由以下带有约束的最大化问题求解。
(7)
s.t.
(8)
(9)
当设计方案2契约时,参照方案1的推导。
在对称信息场景下,委托人应按方案1还是方案2发布契约实际上取决于其收益,方案1中委托人收益为:
EU1=θG(π(SH)-w(G))+θB(π(SL)-w(B))=
方案2中委托人收益为:
EU2=θG(π(SL)-w(G))+θB(π(SH)-w(B))=
在不对称信息场景中,由于信息的非对称性,委托人在签订合同时不能观测到代理人的类型,但知道代理人类型的统计信息。代理人为了提升个人利益,存在隐瞒真实信息的行为。为了解决该问题,委托人需激励代理人披露其特征,这一机制也被称为显示原理。可由以下最大化问题求解:
(10)
s.t.
(11)
(12)
u(w(G))-v(SH)≥u(w(B))-v(SL)
(13)
u(w(B))-cv(SL)≥u(w(G))-cv(SH)
(14)
(15)
v(SH)-v(SL)≤u(w(G))-u(w(B))≤c(v(SH)
-v(SL))
(16)
由于收入不变,为了最大化委托人的收益,应压制两种报酬到最大程度,于是坏类型IR约束(16)为紧约束,约束(16)中取较小的紧约束,即为:v(SH)-v(SL)=u(w(G))-u(w(B)),于是好类型契约即为以下方程组的解。
求解得:
当设计方案2契约时,参照方案1的推导。在激励好类型代理人完成SL任务时,无法同时激励坏类型代理人完成SH任务,即两种类型的IC约束是矛盾的,于是该方案在该场景下无解。
结论2:在不对称信息场景下,方案1最优契约为:
在不对称信息场景中,若发布结论1中方案1契约,好坏类型代理人均会选择坏类型代理人对应契约,这导致委托人的收益减小并且无法分辨用户类型。于是需要激励好类型用户,提高给其的报酬,但提高的程度需要让好坏类型代理人收入差控制在v(SH)-v(SL)与c(v(SH)-v(SL))之间,避免矫枉过正而让坏类型代理人因此而隐瞒真实信息。多支付的报酬作为委托人获取代理人私人信息承担的信息租金。效率更高的好类型代理人收益增加了(c-1)v(SL)。
如图4所示,当好类型用户比例θG不变时,随着噪声N增大,委托人收益EU递减。在N<0.152时,当噪声功率N不变时,好类型用户比例θG递增,委托人收益EU递增,好类型用户雇佣得越多,委托人收益越大。在N>0.152时,则相反。
图4 噪声对委托人收益的影响
结合实际情况分析,在环境安静、噪声较小的情况下,好类型代理人有更大的概率得到清晰图片,能给委托人带去更多贡献。雇佣越多好类型用户,委托人收益越大。但在雨天等噪声较大情况下,由于雷声和雨衰,信道条件差、信噪比小,代理人均难以得到优秀质量图片,由于好类型代理人需要更高的报酬,雇佣越少好类型用户,委托人收益越大。
如图5所示,当好类型用户比例θG不变时,随着代理人成本v(SH)增大,委托人收益EU递减。在v(SH)<10时,如果噪声功率v(SH)不变,则好类型用户比例θG递增,委托人收益EU递增。好类型用户雇佣得越多,委托人收益越大。在v(SH)>10时,则相反。
图5 代理人成本对委托人收益的影响
结合实际情况分析,当好类型代理人使用包月流量套餐传输数据时,所付出的成本较低,其最优契约报酬即委托人支出也较低,雇佣越多好类型用户,委托人收益越大。当好类型代理人使用按流量计费模式传输数据时,相较于包月流量套餐,所付出的成本较高,其最优契约报酬也较高,雇佣越少好类型用户,委托人收益越大。
如图6所示,当好类型用户比例θG不变时,随着好坏结果分界线Xd增大,委托人收益EU先增大后减小,在Xd=5.3×107处达到最大值。在4.65×107 图6 好坏结果分界线对委托人收益的影响 结合实际情况分析,分界线可理解为委托人的要求,当要求在一个较低的范围时,随着要求的逐渐提高,好坏结果的对应收入增大,委托人得到的收益增大。当要求在一个较高的范围时,随着要求的逐渐提高,代理人越来越难以达到好结果。委托人得到的收益减小。对于离线服务,如路线信息采集服务,委托人对及时性和信息采集速率要求不高,好坏类型代理人均能递交好结果。由于好类型报酬更高,雇佣越少好类型代理人,委托人收益越大。但对于在线服务,如实时交通流采集服务,委托人对及时性和信息采集速率要求较高,好类型递交好结果的优势明显,雇佣越多好类型代理人,委托人收益越大。最后,对于极高的质量要求,好坏类型代理人都难以达到,雇佣越少好类型代理人,委托人收益越大。 本文利用契约理论提出了应用于群智感知的激励机制,有效解决了在不对称信息场景下,委托人无法观测到代理人类型信息而产生的问题。并结合仿真与实际情况分析了外界因素对委托人收益的影响,仿真结果表明本文的方法是可行、合理且与实际相符的。在下一步的研究中,将结合群智感知中存在的其他问题优化契约。 [1] 刘鲁滨, 朱燕民. 基于群智感知的噪音收集展示系统[J]. 计算机工程, 2015, 41(10):160-164. [2] 吴垚,曾菊儒,彭辉,等.群智感知激励机制研究综述[J].软件学报, 2016, 27(8): 2025-2047. [3] 袁桂霞, 周先春. 移动群智感知网络中基于QoS感知与协作竞争的机会传输机制[J]. 计算机工程, 2016, 42(8): 73-79. [4] Li Yuqing, Zhang Jinbei, Gan Xiaoying, et al. A contract-based incentive mechanism for delayed traffic offloading in cellular networks[J]. IEEE Transactions on Wireless Communications, 2016, 15(8): 5314-5327. [5] Zhang Yanru, Song Lingyang, Pan Miao, et al. Non-cash auction for spectrum trading in cognitive radio networks: contract theoretical model with joint adverse selection and moral hazard[J]. IEEE Journal on Selected Areas in Communications, 2017, 35(3): 643-653.4 结论