黄鑫权,高 瞻,王志文,赵 勇,林 刚
(1.解放军理工大学 通信工程学院,江苏 南京 210007;2.解放军理工大学 通信工程学院 国家短波工程中心,江苏 南京 210007)
基于滑动窗的时域非相关信誉值机制
黄鑫权1,高瞻2,王志文1,赵勇1,林刚1
(1.解放军理工大学 通信工程学院,江苏 南京 210007;2.解放军理工大学 通信工程学院 国家短波工程中心,江苏 南京 210007)
协作频谱感知是认知无线电通信的重要环节,频谱感知数据篡改(Spectrum Sensing Data Falsification,SSDF)是协作频谱感知面临的严重安全威胁。SSDF攻击方式逐渐呈现智能化的趋势。变策略SSDF攻击行为是一种新的智能攻击方式,它通过改变自己的攻击参数,时而伪装成诚实用户,时而发起SSDF攻击,对协作频谱感知会造成更严重的破坏。而目前针对SSDF攻击方式的传统检测算法,都假定其攻击参数始终保持不变。为了应对变策略SSDF攻击方式,提出了一种基于滑动窗的时域非相关信誉值机制,能够在攻击时刻开始之后,迅速准确检测出恶意用户。
认知无线电;协作频谱感知;变策略SSDF攻击;信誉值机制
认知无线电提高了授权频谱的利用率,通过频谱感知,机会接入授权频段[1]。其主要实现方式为,在主用户(授权用户)不使用授权频段时,次级用户机会接入该频段,当主用户重新使用该频段,次级用户立即放弃使用该频段,并切换到其他未被使用的授权频段。这种机会接入授权频段完成通信过程的次级用户称为认知用户。
频谱感知是认知无线电通信中至关重要的环节,通过感知主用户是否使用授权频段,进而机会接入授权频段[2-3]。由于无线环境中存在着阴影效应和多径衰落[4]的影响,导致单个认知用户频谱感知精确性大大降低,为此,需要多个认知用户进行协作频谱感知[5]。每个认知用户独立进行频谱感知,并将感知结果通过公共信道发送给融合中心,由融合中心完成最终的融合判决[6]。协作频谱感知技术提高了频谱感知的精确性,但是也带来了新的安全威胁——频谱感知数据篡改(Spectrum Sensing Data Falsification,SSDF)攻击方式。恶意用户(攻击者)通过篡改上报给融合中心的数据,破坏认知网络的正常运行[7]。
目前针对SSDF攻击方式的检测算法有很多,主要有信誉值机制下的检测算法和异常数据检测算法[8-11]。在信誉值算法中,通过统计每个认知用户上报数据与融合判决的差异性,对不同用户的信誉值进行奖励或惩罚。在异常数据检测算法中,通过计算每个认知用户历史上报数据关于某一维度的矢量距离,进而将网络中的认知用户通过聚类方法划分成两类。然而大部分现有安全检测算法都假设恶意用户的攻击参数是不变的,在实际情况中,为了实现目的,恶意用户会采取更加智能的恶意行为,最典型的就是变策略SSDF攻击,在这种攻击行为下,恶意用户通过改变攻击参数,在诚实行为和恶意行为之间进行切换,使得传统的信誉值和异常数据检测算法均不能有效地检测出恶意用户。
目前针对变策略SSDF攻击,已取得了初步的进展,在文献[12]中提出了增强信誉度机制,能在攻击时刻开始之后准确地检测出恶意用户,防止了恶意用户通过长时间积累信誉值进行伪装。但是该信誉度算法的检测时间仍有待提高。本文提出了基于滑动窗的时域非相关信誉值检测机制,首先取消信誉值的时域相关性,进而通过规划时间窗,观察该时间窗内历史上报数据与融合判决存在差异的时隙的次数,最后用先验错报概率的似然比作为惩罚的累加因子,构造每个时隙的信誉值。所提新型信誉值算法能够准确地检测出采用变策略SSDF攻击行为的恶意用户,比文献[12]所提的增强信誉度具有更大的信誉值分辨度和更短的检测时间。
在本章中,我们将分析和讨论协作频谱感知模型,其次,我们建立变策略SSDF攻击行为的模型。
1.1协作频谱感知模型
图1是一个认知无线网络中的协作频谱感知模型。Pu代表主用户,Fu代表融合中心。CRu代表网络中的认知用户,其中用深色代表恶意用户,浅色代表诚实用户。通常主用户与每个认知用户的距离远大于融合中心到各个认知用户的距离,所以我们可以假设认知用户与融合中心进行通信的公共信道是无损信道。
图1 协作频谱感知模型
主用户对授权频段享有优先权,只有当主用户不使用该频段的时候,认知用户才能机会接入该频段。我们使用H0表示主用户处于空闲状态,并用P0表示发生的概率,用H1表示主用户处于使用状态,并用P1表示其发生的概率。则主用户可以表示为Pu~(P0,P1)。
每一时隙,认知用户首先进行宽带频谱感知,分析主用户是否在使用授权频段,文中假设所有认知用户采用能量检测算法完成频谱感知。其次认知用户采用硬判决的方式完成本地判决,即本地判决结果u隶属于集合A={0,1},其中0代表主用户并未使用授权频段,1代表主用户正在使用授权频段。由于存在多径衰落和阴影效应,本地判决结果是一个概率性事件。单个认知用户的虚警概率Pfa定义为主用户处于空闲状态而判决结果为1的事件发生概率,其表达式如式(1)所示:
Pfa=P(u=1|H0)
(1)
单个用户的漏检概率Pmd定义为主用户正在使用授权频段,而判决结果为0的事件的发生概率,其表达式如式(2)所示:
Pmd=P(u=0|H1)
(2)
所以对于每一个认知用户,我们可以使用判决特性矩阵B表示判决特征,如式(3)所示:
(3)
每一个认知用户得到本地判决结果之后,通过公共信道将其上报给融合中心,融合中心采用融合准则得到融合判决结果并广播给网络中的认知用户。融合中心采用“K/N”的融合准则,N是网络中认知用户的总数,如果网络中有K个认知用户上报相同的感知结果,则我们将这个结果视为融合判决结果,文中令K>N/2 。
1.2变策略攻击模型
(4)
式中,第一个下标u表示篡改之前的判决结果,第二个下标v表示篡改之后的判决结果,矩阵中的每一个元素表示将u篡改为v的概率。文中假设恶意用户的攻击特性矩阵已知。
(5)
式中,第一个下标s表示主用户的状态,用0和1分别表示H0和H1,第二个下标v表示上报给融合中心的判决数据。A表示用户的属性,用H表示诚实用户,用M表示恶意用户。矩阵中的每一个元素表示主用户的实际状态为s,而上报数据为v的概率。对于诚实行为,其上报特性矩阵为:
(6)
对于恶意行为,其上报特性矩阵为:
(7)
对于变策略SSDF恶意行为,恶意用户通过改变自己的攻击特性矩阵Puv使自己伪装成诚实用户,即使得:
(8)
当积累一定信任值时,在时隙T发动攻击,即使得:
(9)
因此我们可以构建如下数学模型来表示变策略SSDF恶意行为:
(10)
式中,Q表示变策略SSDF恶意用户的上报特性矩阵。在本文中,我们假设网络中的恶意用户采用一致策略攻击,即每个恶意用户的恶意行为是完全一致的。
2.1传统信誉值算法的局限性分析
传统的信誉值机制中,初始时隙,融合中心规定所有认知用户的信誉值相同。每一个时隙,融合中心根据“K/N”的融合准则得到当前时隙的融合判决,并和每个认知用户当前时隙的上报数据进行比较,若某认知用户的上报数据与融合判决相同,则其信誉值增加某个常量,相反则减少某个常量。
(11)
2.2典型抗变策略SSDF攻击的信誉度机制
(12)
(13)
该增强型信誉度机制能在攻击时刻之后准确检测出恶意用户,该算法的信誉值依据时间窗内的诚实行为的进行积累,而变策略SSDF攻击正是通过伪装诚实行为进行积累信誉值,而且该算法的检测时间仍需进一步缩短。
(14)
(15)
(16)
为了减少算法的复杂度我们简化上式,如式(17)所示:
(17)
式中,第二项的分母和分子项分别由式(18)和式(19)计算得出。其中,P00,P01,P10,P11均为攻击特性矩阵中的参数。
P(Di|H)=P1Pmd+P0Pfa
(18)
P(Di|M)=P1[(1-Pmd)P10+PmdP00]+
P0[(1-Pfa)P01+PfaP11]
(19)
图2 统计错报时隙示意
基于所提信誉值机制,计算当前时隙每个认知用户的信誉值,并选出信誉值低于门限η的认知用户,使其上报结果不参与下一时隙的融合判决。
具体算法步骤如算法1所示:
算法 1 :基于滑动窗的非相关信誉值机制。
采用“K/N”融合准则得到当前时隙的融合判决结果;
采用文中信誉值机制计算每个认知用户的信誉值:
fori=1:N
下一个时隙,不让认知用户CRi的上报数据参与融合判决
end
end
重复步骤1
在仿真中考虑有一个融合中心,20个认知用户,其中6个恶意用户,a=20。每个认知用户采用能量检测算法完成本地感知,并得到硬判决结果。每个认知用户的虚警概率Pfa和漏检概率Pmd分别为Pfa=0.2和Pmd=0.1,即判决特性矩阵如式(20)所示:
(20)
仿真中,我们令恶意用户的攻击参数P01和P10分别为P01=0.8和P10=0.8,即恶意用户的攻击特性矩阵如式(21)所示:
(21)
令时间窗的长度大小为20个时隙,仿真的总时隙为100个时隙,恶意用户攻击开始时刻为第70个时隙。门限值设置为14。
仿真主要仿真了两种算法,第一个是文中提出的信誉值算法,用Algorithm 1表示,其次仿真了文献[12]所提的增强信誉度算法,用Algorithm 2表示。
图3所示为Algorithm 1算法下,诚实用户和恶意用户信誉值随时隙的变化情况。在攻击时刻开始之前,恶意用户表现为诚实行为,所以其信誉值和诚实用户相似,在攻击时刻开始之后,恶意用户的信誉值经历了先迅速下降后平稳的阶段。其信誉值下降的原因是因为滑动时间窗中的诚实行为的历史数据越来越少。
图3 Algorithm 1的信誉值随时隙变化情况
图4为所提信誉值算法下恶意用户的检测概率随时隙的变化曲线。我们定义恶意用户的检测概率为检测出的恶意用户占总恶意用户数目的比重。从图中可以看出,在攻击开始时刻之前,恶意用户表现诚实行为,所以恶意用户的检测概率为0,在攻击时刻开始之后,所提算法能够迅速检测出恶意用户,在短短几个时隙内使得恶意用户的检测概率接近1。
图4 恶意用户检测概率
图5所示为两种算法下恶意用户的信誉值随时隙的变化曲线。从图中可以看出,当攻击开始时,文中所提算法使得恶意用户的信誉值比文献[12]中所提信誉度算法更快下降到门限值以下,能够更快地在攻击时刻开始之后检测出恶意用户。
图5 两种算法下恶意用户信誉值的对比
在门限值确定的情况下,诚实用户和恶意用户的信誉值差距越大,正确检测出恶意用户的能力越强。我们定义信誉值的分辨度为诚实用户的信誉值与恶意用户信誉值的差值。图6为算法Algorithm 1和算法Algorithm 2下信誉值分辨度随时隙的变化情况。从仿真图中可以看出,在攻击时刻开始之后,两种算法的信誉值分辨度迅速上升,最后达到平稳阶段,文中所提算法使得信誉值分辨度比文献[12]中所提算法上升得更快且幅值更高。
图6 两种算法信誉值分辨度
最后,我们还仿真了融合中心融合判决结果的错误概率随时隙的变化情况,如图7所示。从图中可以看出,所提信誉值算法降低了融合中心判决结果的错误概率。
图7 融合判决错误概率
针对变策略SSDF攻击,文中提出了基于滑动窗的时域非相关信誉值算法。在该算法中,首先取消了传统信誉值的时域相关性,避免了恶意用户通过伪装诚实行为而积累信誉值。并且,依据恶意用户错报频率多的特性,采用将主观错报时隙的先验似然比作为信誉值的惩罚累加因子,使得攻击时刻之后,恶意用户的信誉值小于诚实用户而迅速准确区分开来,同时也降低了融合中心判决结果的错误概率。
[1]罗丽平,秦家银.认知无线电研究进展及应用前景[J]. 科技导报,2012(03):74-79.
LUO Li-pin,QIN Jia-yin. Research Progresses and Application Perspectives in Cognitive Radio [J]. Science & Technology, 2012(03):74-79.
[2]张莹,滕伟,韩维佳等.认知无线电频谱感知技术综述[J]. 无线电通信技术,2015(03):12-16.
ZHANG Ying,TENG Wei,HAN Wei-jia,et al. Review of Spectrum Sensing Techniques in Cognitive Radio Networks [J]. Radio Communications Technology,2015(03):12-16.
[3]王志文,徐以涛,江汉等. 基于USRP平台的宽带频谱感知系统设计与实现[J].通信技术,2015,48(06): 750-754.
WANG Zhi-wen,XU Yi-tao,JIANG Han,et al. Implementation of Wideband Spectrum Sensing based on USRP Platform [J]. Communications Technology,2015,48(06): 750-754.
[4]吉晓东,张士兵,高月红.认知无线电中衰落环境下的能量检测性能分析[J].电讯技术,2010(02):26-32.
JI Xiao-dong,ZHANG Shi-bing,GAO Yue-hong. Performance Analysis of Energy Detection for Cognitive Radio in Fading Channels [J]. Telecommunication Engineering,2010(02):26-32.
[5]王学敏,刘江涛,刁德全.认知无线电频谱感知综述[J].数字技术与应用,2015(07):27-28.
WANG Xue-min,LIU Jiang-tao,DIAO Dei-quan. Review of Spectrum Sensing Techniques in Cognitive Radio Networks[J].Digital Technology and Application,2015(07):27-28.
[6]WANG Qian,YUE Dian-wu,YAN Qiu-na. Optimal Fusion Rule for Cooperative Spectrum Sensing in Cognitive Radio Networks[J]. Journal of China Universities of Posts and Telecommunications,2012(05):58-65.
[8]ZENG Kun,PENG Qi-hang,TANG You-xi. Mitigating Spectrum Sensing Data Falsification Attacks in Hard-Decision Combining Cooperative Spectrum Sensing[J]. Science China:Information Sciences,2014(04):192-200.
[9]LI Fang-wei,LIU Fan,ZHU Jiang,et al. Reputation-based Secure Spectrum Situation Fusion in Distributed Cognitive Radio Networks[J].Journal of China Universities of Posts and Telecommunications,2015(03):110-117.
[10]ZHAO Jun-hui,LI Fei,YANG Tao. Weight Sequential Log-Likelihood Ratio Detect Algorithm with Malicious Users Removing[J].Journal of China Universities of Posts and Telecommunications,2013(02):60-65.
[11]SU Wen-gui,LIAO Yang. A Jury-based Trust Management Mechanism in Distributed Cognitive Radio Networks [J]. 中国通信,2015(07):119-126.
[12]马骋娉,唐亮,卢云波等.基于增强信誉度的联合频谱感知算法研究[J].计算机应用研究,2014(06):1804-1807,1815.
MA Cheng-ping,TANG Liang,LU Yun-bo,et al. Study on Robust Cooperative Spectrum Sensing Algorithm based on Enhanced Reputation [J]. Application Research of Computers, 2014(06):1804-1807,1815.
黄鑫权(1993—),男,硕士研究生,主要研究方向为认知无线电、频谱感知安全;
高瞻(1976—),男,博士,副教授,主要研究方向为认知无线电、无线通信、数字信号处理;
王志文(1991—),男,硕士研究生,主要研究方向为认知无线电、宽带频谱感知;
赵勇(1986—),男,硕士研究生,主要研究方向为认知无线电、通信对抗、移动通信;
林刚(1990—),男,硕士研究生,主要研究方向为无线通信、频谱预测。
A Time Unrelated Reputation Mechanism based on Sliding Windows
HUANG Xin-quang1,GAO Zhan2,WANG Zhi-wen1,ZHAO Yong1,LIN Gang1
(1.College of Communications Engineering;2.National Shortwave Engineering Center,College of Communications Engineering,PLA University of Science and Technology,Nanjing Jiangsu 210007,China)
Collaborative spectrum sensing,as an important part of cognitive radio,is faced with fairly serious security threat-SSDF (Spectrum Sensing Data Falsification) attack. Nowadays SSDF gradually exhibits an intellectualization trend,and SSDF mode, with variable strategies, is a novel intelligent attack, and by changing its parameters,the attackers pretend to be honest users and lauches SSDF attacks, thus causing serious damage on cognitive radio network. However, most traditional detection algorithms assume that the attack parameters of SSDF keep invariable. To handle the SSDF attcack with variable parameters, a time unrelated reputation mechanism based on sliding window is proposed, which could detect malicious users quickly and accurately when the attackers start their malicious behaviors.
cognitive radio;collaborative spectrum sensing; SSDF attack with variable parameters; reputation mechanism
10.3969/j.issn.1002-0802.2016.03.011
2015-10-02;
2016-01-20Received date:2015-10-02;Revised date:2016-01-20
TN92
A
1002-0802(2016)03-0306-06