一种基于时空相关性的虚假数据判断方法*

2018-10-09 03:15堃,单洪,马
火力与指挥控制 2018年8期
关键词:线性时刻传输

卢 堃,单 洪,马 越

(国防科技大学电子对抗学院,合肥 230037)

0 引言

无线传感器网络(Wireless Sensor Network,WSN)是通过传感器节点和驱动设备等组成的,用来监控和管理物理系统,应用范围十分广泛。无线传感器网被列入21世纪最有影响力的技术,并和塑料电子学、仿生人体器官被称为全球未来的三大高科技产业[1]。然而,无线传感器网络,特别是战场无线传感器网络,经常会被布置在敌对环境中,这大大增加了其被攻击者妥协的可能性。攻击者可通过被妥协节点注入虚假数据,这些虚假数据的传输将影响正常数据传送的需求,消耗有限的网络资源,造成部分网络临时或永久瘫痪,同时引发错误警报,影响用户决策[2]。因此,如何从多个数据中判断出虚假的数据成为一个重要问题。

本文参考文献[3-4]依据传感器网络节点采集数据所具有的时空相关性,建立两个线性回归模型,通过相似性判断来识别出虚假数据,同时降低数据传输能耗。

1 虚假数据判断方法

1.1 系统模型

本文基于如图1的分簇路由结构,其中节点16是汇聚节点,节点 10、12、5、11、9 是簇头节点,其他节点是簇内节点。传感器节点不自主移动。

1.2 方法概述

部署在监测地区的传感器节点按照图1方式自组织形成无线传感器网络,簇内节点感知、采集并传输所需的环境数据给簇头,由于同一簇内的节点在地理位置上的分布是比较接近的,因此,它们采集到的数据也具有一定的空间相关性,即到达同一个簇头节点的数据应当是满足一定线性关系的,这个关系与节点的地理位置有关。本文中不需要考虑如何与地理位置有关,只要找到该线性关系即可。所以本文拟通过对每周期收集到的数据作线性相关分析,通过线性相关与否,判断本周期所采集到的数据中是否存在虚假数据。

另一方面,由于同一个传感器节点感知数据具有周期性变化规律和时间相关性,因此,可以看作是一个以采样时间t为自变量,其对应的感知数据d为因变量的分段线性函数关系。王玲等[5]就此特性提出了分3个阶段的处理算法TCDCP用于数据压缩与优化,其第1阶段根据时间序列中的采集数据建立一元线性回归模型;第2阶段使用自适应调整采样时间的思想,在感知数据满足该模型时,实时自适应地调整节点的采样频率;第3阶段根据监测数据的变化,反馈误差信息,实时调整回归预测模型。本文在此算法的基础上提出新增一个阶段,即将回归预测模型的改变与历史数据相比较,通过比较判断引起这种变化的原因,是虚假数据的干扰,还是监测数据确实发生了变化。从而判断是否是该节点产生了虚假数据。

方法的模型框架如图2所示。

方法的相关参数及其含义如表1所示。

表1 主要变量及其含义

1.3 节点回归模型

对于一个簇头CH,其簇内共有n个节点,分别用{n1,n2,…,nn}来表示。从开始到 t时刻,簇头共收到感知数据。

其中,dij表示第i个节点在时刻j采集到的数据。

其中,t表示采集时间,b表示该直线的截距,a表示该直线的斜率,ω表示采集时间t所对应的预测值。所以,。

如果在某一时间段内,ε<μ则说明该时间段内的感知数据符合M的预测,WSN节点不发送监测数据,大大降低了参与网内传输的数据量。如果在某一时间段内ε≥μ,则说明M无法满足数据预测的需求,需要更新时间序列,对模型进行调整,生成新的

簇内节点建立一元线性回归模型后,将当前回归模型的参数与该时刻t感知的数据一同发送给簇头节点。

簇头节点为每一个簇内节点生成一个表格E,按照一定时间宽度记录该时间段内的期望值,这个时间宽度的划分,按变化率进行划分,当的变化幅度达到φ时,划入下一时间段。

簇头节点同时保存上一时刻t-1时各节点的值,生成表格 L。

1.4 簇头构建相关性模型

1.5 簇头通过模型分析

若t时刻获得的数据线性不相关,则针对簇内的n个节点,依次对其进行如下操作:1)获取该节点i当前时刻t的回归模型参数。2)首先将该与簇头存储的 L表中节点 i的值比较,若相等,则说明回归模型在t时刻未发生改变,跳步骤3),否则,跳步骤4)。3)将当前时刻t带入回归模型,计算结果ω。若则认为该数据正确,否则认为该数据虚假,即当前节点i为被妥协的恶意节点。4)查表,时刻t对应的时间段内回归模型参数的历史期望记为,若差值在阈值v之内,则认为此变动是正常的,即该数据是正确的,否则,认为当前回归模型的变化是非正常情况,认为数据dit是虚假的,即节点i是被妥协的恶意节点。

2 仿真与分析

2.1 性能分析

该方法需要解一个n元线性方程组,其计算复杂度较高,但是这里的n表示的是一个簇内节点的个数,在簇内节点数较少的情况下,该方法的计算复杂度在可接受范围之内。其次,实际上一般只需要在每个网络初始布置的时候进行一次计算,此时,传感器节点刚刚播撒,一般认为被捕获可能性不大,数据较为可信,此后,只在环境发生较大变化时才会再次计算。再者,传感器节点的绝大部分能量消耗都来源于无线通信,1 bit信息传输100 m距离消耗的能量大约与执行3 000条计算指令相当[6-7]。本方法虽然在一定程度上增加了计算量,但相比于其他方法并未增加无线通信传输次数和数据量,大大降低了传输能耗,因而,从总体上来说,能量消耗是较小的,适用于无线传感器网络。

2.2 仿真实验

为验证本文所提出的方法,利用Matlab仿真软件对其进行仿真。

由于方法主要针对WSN节点的采样控制和数据处理,不涉及网络拓扑等因素,因此,利用Matlab仿真工具能够有效地反映方法特性,达到仿真实验的要求。仿真实验的数据来源为Berkeley.Intel研究小组部署的真实传感器网络监测的l号节点、2号节点和4号节点的时间-温度数据。节点的选取是随机的,其中3号节点由于实验数据过少而不予使用。传感器节点按照图3方式布置在实验室中。

首先对实验数据进行预处理。所获得的数据是按照如图4格式存储的,将其导入Matlab后,要通过对其进行预处理,得到可以处理的数值类型数据,为了获得更多实验数据,进行同时刻感知数据的处理,以分钟作为精确度区分时刻。

分别用红色、绿色和蓝色的曲线表示1号、2号、4号节点采集的感知数据,从图5中可以形象的看到,它们保持着一定的比例关系,是线性相关的。

通过拟合,找到3个节点感知数据的近似比例关系。d2=1.025d1,d4=1.035d1,其中 di表示第 i个节点的感知数据。拟合结果如图6和图7,横坐标为用数值”hhmmssxx”进行表示的时间,纵坐标表示温度,黑色曲线表示按照表达式拟合的结果。可以从图中看到,黑色曲线与绿色曲线保持着大致相同的走向,误差基本维持在一定范围内。通过簇内数据线性关系的分析得到关系向量。

实验所采用的数据精确到了分秒,但是本方案提出的方法需要使用同一时刻的数据进行比对,同时由于实时性要求不强,允许一定时间上的误差。所以将实验数据处理为按照分钟作为精确度来划分的数据,这样就可以获得同一时刻下的多组数据。代入42组相同时刻下3个节点采集的实验数据,计算y值,如图8所示,。所以,可以将阈值λ设为0.17±0.05。

利用前面获得的数据建立起检测虚假数据的模型。现将实验数据中的部分数据更改作为虚假数据,来检测本方案性能。在当前阈值选择下,分别对个别原始数据进行0.01、0.03、0.05范围的更改,如将 19.235 改为 19.236、19.232、19.240。我们发现,在改动范围较小时,本方案难以检测出虚假数据的存在。这一问题的存在与时间精确度的选择和向量S的取值带来的误差有关。而当数据变化值达到0.05时,一般可以检测出存在虚假数据,如表2所示。

表2 更改数据发现情况

3 结论

充分利用WSN节点采集数据具有的时空相关性,结合线性回归模型,结合分簇的层次型网络拓扑结构,提出了一种基于时空相关性的WSN虚假数据判断方法。在该方法中,簇头节点收集数据,利用向量S判断当前时刻收集的数据中是否存在虚假数据,如果判定存在虚假数据,则根据簇内节点的一元线性回归模型的变化情况逐一判断该节点传输的数据是否虚假。对该方法的性能分析和实验验证表明,该方法能够发现网络中存在的虚假数据,其具体性能与阈值的设定和向量S的值有较大关系。另外,该方法适用于具有周期性变化规律和时空相关性的应用环境,相关性越强,方法的性能越好。该方法要求一定的计算量,但是不需要在节点之间多次传输数据来进行数据的相似性证明,大大降低了数据传输的能量消耗。

猜你喜欢
线性时刻传输
冬“傲”时刻
二阶整线性递归数列的性质及应用
轨道交通信号系统无线传输应用
捕猎时刻
5G高新视频的双频段协同传输
5G 16K虚拟现实视频传输关键技术
线性回归方程的求解与应用
牵引8K超高清传输时代 FIBBR Pure38K
非齐次线性微分方程的常数变易法
线性回归方程知识点剖析