摘  要: 分布式路由算法广泛应用于认知无线电网络(CRNs)。为此,分析多跳CRNs的路由问题,利用无中心的Markov决策过程(DEC?POMDP)建立问题模型,并确保次级用户对主级用户的干扰少于预定阈值,进而控制端到端时延。最后引用多智能体学习算法解决此问题模型,进而形成基于多智能体学习的路由(MALR)。实验结果表明,提出的路由能够控制时延,并降低了干扰率。

Abstract: The distributed routing algorithm is widely used in cognitive radio networks (CRNs). The distributed cooperative multi?agent routing problem in multi?hop CRNs is analyzed. The decentralized partially observable Markov decision process (DEC?POMDP) is used to establish the problem model, which can guarantee that the interference from secondary user to primary user is lower than the predefined threshold, and control the end?to?end delay. The multi?agent learning algorithm is introduced to deal with the problem model, so as to form the multi?agent learning?based routing (MALR). The experimental results show that the proposed routing can control the delay and reduce interference probability.

0  引  言

随着无线应用业务的拓展,对无线频谱要求越来越高。当频谱是空闲时,注册用户(也称为主用户,Primary Users,PUs)具有频谱优先接入权。认知无线电网络(Cognitive Radio Networks,CRNs)是解决注册频谱的重新使用問题[1?2]。在CRNs网络内,在不干扰PUs用户传输的条件下,次级用户(Secondary Users,SUs)可以接入已注册频谱。与传统无线网络类似,CRN存在集中网络或分布式(自组网络)形式。在集中网络中,单一基站提供频谱接入和SUs的单跳通信。在分布式网络中,SUs能够与网络内其他用户以多跳方式进行通信。与传统的多跳无线网络不同,CRNs中的路由设计存在挑战,在设计CRNs路由时需要考虑多个因素。首先,路由协议应考虑PUs活动的真实模型。其次,CRNs具有分布式特性。由于SUs不可能使用共同控制信道接收关于网络的分布式信息,仅使用局部信息决策路由,所以路由必须具有分布特性。第三,SUs流量的路由性能严重受到CRNs环境因素的影响,特别是PUs的活动状态和其他SUs的流量。因此,应着重考虑CRNs快速环境变化[3?6]。为此,本文考虑分布式协作多代理的CRNs路由问题。此问题的约束就是因SUs传输导致的PUs的数据包丢失数必须少于预定阈值。为此,利用马尔可夫调制泊松过程(Markov Modulated Poisson Process,MMPP)模拟PUs活动,建立问题模型,再引用多智能体学习求解,从而建立稳定路由。实验数据表明,提出的MALR(Multi?Agent Learning?Based Routing)路由能够有效地降低时延,并控制干扰率。

1  问题描述

1.1  系统模型

5  结  语



