李同锋+杜秀娟+牛昆
摘 要: 无线传感网络数据融合能够有效减少传感节点的数据通信量,减少节点的能量消耗,延长了网络的寿命。本文提出了节点分层算法,在层内传感节点加入了具体的数据融合算法,利用拉依达准则对节点收到的数据进行异常数据检测,在上层节点利用主成分分析对剩余数据进行数据融合。通过仿真实验得出该算法数据融合结果准确率好。
关键字: 无线传感网络; 节点分层算法; 拉依达准则; 主成分分析
中图分类号: TN711?34 文献标识码: A 文章编号: 1004?373X(2014)20?0011?03
Wireless sensor network data fusion in layer based on hierarchy
LI Tong?feng, DU Xiu?juan, NIU Kun
(Computer School of Qinghai Normal University, Xining 810005, China)
Abstract: Data fusion of wireless sensor networks can effectively reduce the data traffic among sensing nodes and energy consumption of nodes, and prolong the life of networks. A node hierarchical algorithm is proposed in this paper. The specific data fusion algorithm is added into the sensing node inside layer. The Pauta criterion is utilized in the algorithm the to detect the abnormal data which are received by nodes. The principal components analysis (PCA) is adopted to fuse the remaining data. The simulations experiment indicates this algorithm has a high data fusion accuracy.
Keywords: wireless network sensors; node hierarchical algorithm; Pauta criterion; principal component analysis
0 引 言
无线传感网络(Wireless Sensor Networks)是由大量廉价的微型传感器节点随机散落在检测区域中,传感器节点之间通过无线通信的方式自发形成的一个多跳自组织网络系统,它综合了嵌入式计算技术、分布式信息处理技术、通信技术以及传感技术。节点之间能够协作地感知,采集和处理网络覆盖区域中感知对象的信息,并将信息发送给一个或多个基站[1]。无线网络被广泛应用到国防、工业、智能家居等重要的领域。
在WSN中,传感节点的体积比较小,由电池提供能量,通常没有设备进行充电,因此,节点的节能是无线网络设计的首要目标之一。节点因数据的采集,计算以及与其他节点、基站的通信而耗尽自身能量,从现在使用最广泛的通信模型中,我们可以看出,传感节点发送数据包时,发送方会因与接收节点间通信距离的增大而迅速增大。那么如何减少网络数据的通信量,提高资源的利用率,延长网络节点生存时间,是WSN数据融合研究的重要方面之一[2]。 数据融合(Data Fusion)技术是无线传感网络重要的技术之一,在无线传感网路中,运用一定的准则对多个传感节点的数据加以分析,整合,形成比一个传感节点更加准确的信息[3]。数据融合技术能够有效地减少网络中传输的数据,节省节点的能量,因为数据在传输中所消耗的能量要远远大于数据在节点中计算所消耗的能量。
1 相关数据融合工作
基于Bayes估计的多传感器数据融合技术[4],通过样本信息和先验信息来推出后验分布,然后推断出要检测的目标。基于统计理论信息融合技术[5],采用的是统计理论,用高等数学方法求解具有多变量约束条件的极值问题,从而得到最小方差的信息融合结果。基于神经网络技术[6],将簇设计成人体大脑神经网络模型,利用神经网络提取特征数数据,然后发到汇聚节点,进而提高数据采集效率。还有LEACH,TEEN,APTEEN[7]等路由融合算法,其中LEACH算法将整个网络进行分簇,在簇头进行数据融合,从而减少了网络传输的数据量,但是却没给出具体的融合算法。而TEEN[8]是对LEACH算法的改进,设置了硬阈值和软阈值两个参数来决定是否发送数据,但TEEN适用于实时应用系统,而不适用于周期采集数据的应用环境。APTEEN[8]算法是由Manjeshware等人结合LEACH算法和TEEN算法开发的,除了结合了TEEN算法和LEACH算法优点外,还提出了三种查询概念:历史数据的查询,当前网络的一次查询和持续监控某一时间的连续查询。还有用数学的方法进行多传感器的数据融合,比如基于分组的技术[9],无线网络含有数据缺失的数据融合算法[2],其主要就是通过感知的数据时空相关性,对传感节点中缺失的数据进行线性插补,但如果很多数据丢失时,只能估测出区间的平均值,造成数据的不准确性。相关研究还有基于神经网络的数据融合算法[10],基于误差等级的数据融合算法[11],基于移动和网络代理的数据融合算法[12]等。本文提出了节点分层算法(Hierarchical Algorithm Of Nodes),通过莱茵达准则对传感节点收到的数据进行异常值分析,除去数据中的异常数据。在剩余数据中,利用主成分分析进行数据融合。通过仿真实验,该算法效果较好。
2 HAN算法
在考虑节能的情况下,检测区域内的传感节点无需直接与基站(Base Station,BS)进行相互通信,而是采用分层的思想,节点逐层转发数据。假设M个无线传感节点随机分布在检测区域内,BS放在检测区域以外的某个固定位置,其能量是可以补充的。网内传感节点部署后不再移动,各个传感节点间的地位以及它们各自的处理能力是相似的。传感节点的发射功率是自行调整的并且知道自己的位置。网络初始化时,BS以大小为R的传输距离向检测区中的传感节点发送Hello包(其中,R远远大于BS到检测区域的距离),该包包括基站BS的层次级别值(ID of Level,LID),初始化值LID=0。在R范围内的所有传感节点收到此包后,节点就会把自己的LID值在收到的LID值的基础上加1。把LID=1的所有传感节点设置为第一层。接着,处于第一层的各个传感节点将自己的LID值放到广播包中广播给其他节点,其他节点收到后按上述方式把自己的LID号加1。依次类推,直到检测区域内的所有节点都拥有了自己所在的层次。如图1所示,箭头表示发射半径。
由于,传感节点随机分布在检测区域中,那么节点的位置就具有随机性,在彼此通信范围内,发送节点与接收节点间距离有的很近,有的很远。那么,在分层时,就会存在同一个节点在不同时刻收到多个包含LID值的广播包。上一层节点收到下一层广播的信息包,相应节点不做处理,会引起分层的混乱。如图2所示。
图1 节点分层示意图
图2 检测区域某3个节点分布
假如,1号传感节点将自己的LID=1,放入信息包广播其广播范围内的2,3号节点。因2,3号节点与1号节点的距离不同,那么,3号节点在未收到1号节点的广播包时,2号节点早已发出了自己的广播包,一段时间后,3号节点在不同时刻收到两个不同的LID值广播包。为了避免分层的混乱,采用了如下策略:3号节点比较两个LID的大小,LID1 3 异常值检测 部署在检测区域中的传感节点,经网络初始化分层后,节点周期性的采集检测区域中的信息,此时,监测区域中所有节点都有了自己的数据。传感节点会把采集的数据逐层传到最上层的节点,再由上层节点传到BS,数据在传输的过程中会做相应的处理。 在检测区域中,由于检测环境存在着不确定性,那么,传感节点难免会采集到一些干扰数据。再加上地理位置相邻的传感器节点采集区域的相互重叠,导致了在彼此采集的数据中存在着大量的冗余数据,即数据之间存在一定的相关性。而此时传感节点如不对数据加以分析,剔除干扰的信息而直接将这些数据直接进行数据融合,势必造成融合结果的不准确性。如不进行数据融合而直接传给其上层节点,会因数据量的庞大造成额外能量的损耗,不利于节点的节能。因此,传感节点在数据融合之前,首先对数据进行可信分析,除去干扰数据(异常数据)。本节中引入了拉依达准则对数据进行异常数据处理。多个传感节点对监测区域中某一目标进行检测,X1,X2,…,Xn为某个节点所在层以下的各个节点传来的数据,假设它们都服从正态分布。此节点对收到的数据先进行平均值[x=1nxi] 。其中i=1,2,…,n。每一个数值与平均值做差mi=Xi-[x]。然后在计算出均方根偏差[δ=inm2in-1]。如果满足|Xi-[x]|>3δ,则认为Xi 为异常数据,应予以删除。 根据上面所述的算法,如图3所示,5号与6,7号传感节点处在不同层,在彼此的传输半径之内具有相邻的地理位置,节点与节点的采集范围势必会相互交叉重叠,因此它们采集的数据中存在着大量的冗余,此时,如一层中某一个节点(如6号)因自身质量出现故障问题,把一异常数据传给5号节点。如果,5号节点在收到6号传来的数据时,不加以异常值分析,而直接进行数据融合,反而会异常值的存在造成结果准确度下降。因此,在数据融合之前进行异常值的分析是有必要的。 图3 传感节点数据传输路径 4 节点数据融合 由于上层节点收传感节点发来的大量含有冗余的数据。此时,在发给BS节点之前,进行相应的数据融合,融合时采用了主成分分析的方法。主成分分析是将多个变量通过线性变换的形式,找出几个重要的综合因子来代表原来大量的数据的信息。设收到的成员节点的数据在内存中是以矩阵的形式存在的。设: [M=x11x12 …x1jx21x22 …x2jxi1xi2 …xij] 式中:i为层内传感节点;j为传感节点采集周期。那么,上层节点做以下计算: (1) 计算收到数据的平均值和平均偏差: [xm=1pxpm, C=xpm-xm];p=1,2,…,i; m=1,2,…, j (2) 协方差矩阵[S]为i×i的方阵: [S=CTC×1j-1] (3) 求出协方差的特征值和特征向量,|[S]-λI|=0,i个特征值λ1≥λ2≥…≥λi≥0,对应特征值λi的相应的单位特征向量[uk]=([u1],[u2],…,[ui]),k=1,2,…,i。其中,[uk]×[uk+1]=0。 (4) 选择q个主分量,q (5)[yi]=[uTi]×[x],[x]为M中的每一列。 5 仿真结果和分析 本文实验采用文献[13]中的实验数据,假设10个传感器对同一目标进行检测,测量数据如表1所示。 表1 测量数据
本文在Matlab 7.6.0环境下进行实验,根据上面算法,首先对异常值检测,发现并不存在异常数据。数据的平均值为0.959 0。平均偏差C=[0.041 0 0.031 0 0.021 0 0.011 0 0.001 0 -0.459 0 0.071 0 0.541 0 ]。协方差S=[1j-1]×C×CT=0.609 7。S相应的特征值和特征向量分别为0.609 7和1。所以,y融合=1×1.00=1.00。如通过基于综合支持度的数据融合的融合结果为0.942 5。通过融合结果可见,加入了基于主成分分析算法,减少了数据量的发送,减少了冗余数据,提高了融合结果的准确性。
6 结 语
本文结合分层算法,在节点中加入了具体的数据融合算法,减少了数据量的传输,达到了一定的节能效果,从仿真中,具体加了融入数据,融合结果的准确性有所提高。在以后的工作中,将进一步完善数据融合的延迟时间及数据的准确性。
参考文献
[1] 雷昕,鄢楚平.无线传感网络网络数据融合技术的研究仿真[J].计算机工程与设计,2008,29(18):4669?4671.
[2] 林蔚,尹娟.无线传感网络含有缺失数据的数据融合研究[J].计算机工程与应用,2012,29(11):4824?4826.
[3] 回春立,崔莉.无线传感网络中基于预测的时域数据融合技术[J].计算机工程与应用,2007,43(21):121?125.
[4] 吴小俊,曹奇英.基于Bayes估计的多传感器数据融合方法的研究[J].系统工程理论与实践,2000(7):46?48.
[5] 胡学骏,罗中良.基于统计理论的多传感器信息融合方法[J].传感器技术,2002,21(8):38?43.
[6] 孙凌逸,黄先祥.基于神经网络的无线传感器网络数据融合算法[J].传感技术学报,2011,24(1):122?127.
[7] 李敏,罗挺,周俊.一种无线网络动态成簇数据融合算法[J].计算机系统应用,2011,20(7):61?64.
[8] 李晓维,徐勇军,任丰原.无线传感网器网络技术[M].北京:北京理工大学出版社,2007.
[9] 曾黎,蒋沅.多传感器数据融合的数学方法研究[J].云南民族大学学报:自然科学版,2010(5):321?324.
[10] 俞黎阳,王能.无线传感网络中基于神经网络的数据融合模型[J].计算机科学,2008(12):43?47.
[11] 钱菲菲,秦宁宁.无线传感网络中误差等级融合算法[J].计算机应用研究,2012(3):1008?1011.
[12] 李志宇,史浩山.一种基于网络和移动代理的无线传感网络数据融合算法[J].传感技术学报,2008(7):1222?1236.
[13] 王威,周红军,王润生.多传感器数据融合的一种方法[J].传感器技术,2003,22(9):39?40.
本文在Matlab 7.6.0环境下进行实验,根据上面算法,首先对异常值检测,发现并不存在异常数据。数据的平均值为0.959 0。平均偏差C=[0.041 0 0.031 0 0.021 0 0.011 0 0.001 0 -0.459 0 0.071 0 0.541 0 ]。协方差S=[1j-1]×C×CT=0.609 7。S相应的特征值和特征向量分别为0.609 7和1。所以,y融合=1×1.00=1.00。如通过基于综合支持度的数据融合的融合结果为0.942 5。通过融合结果可见,加入了基于主成分分析算法,减少了数据量的发送,减少了冗余数据,提高了融合结果的准确性。
6 结 语
本文结合分层算法,在节点中加入了具体的数据融合算法,减少了数据量的传输,达到了一定的节能效果,从仿真中,具体加了融入数据,融合结果的准确性有所提高。在以后的工作中,将进一步完善数据融合的延迟时间及数据的准确性。
参考文献
[1] 雷昕,鄢楚平.无线传感网络网络数据融合技术的研究仿真[J].计算机工程与设计,2008,29(18):4669?4671.
[2] 林蔚,尹娟.无线传感网络含有缺失数据的数据融合研究[J].计算机工程与应用,2012,29(11):4824?4826.
[3] 回春立,崔莉.无线传感网络中基于预测的时域数据融合技术[J].计算机工程与应用,2007,43(21):121?125.
[4] 吴小俊,曹奇英.基于Bayes估计的多传感器数据融合方法的研究[J].系统工程理论与实践,2000(7):46?48.
[5] 胡学骏,罗中良.基于统计理论的多传感器信息融合方法[J].传感器技术,2002,21(8):38?43.
[6] 孙凌逸,黄先祥.基于神经网络的无线传感器网络数据融合算法[J].传感技术学报,2011,24(1):122?127.
[7] 李敏,罗挺,周俊.一种无线网络动态成簇数据融合算法[J].计算机系统应用,2011,20(7):61?64.
[8] 李晓维,徐勇军,任丰原.无线传感网器网络技术[M].北京:北京理工大学出版社,2007.
[9] 曾黎,蒋沅.多传感器数据融合的数学方法研究[J].云南民族大学学报:自然科学版,2010(5):321?324.
[10] 俞黎阳,王能.无线传感网络中基于神经网络的数据融合模型[J].计算机科学,2008(12):43?47.
[11] 钱菲菲,秦宁宁.无线传感网络中误差等级融合算法[J].计算机应用研究,2012(3):1008?1011.
[12] 李志宇,史浩山.一种基于网络和移动代理的无线传感网络数据融合算法[J].传感技术学报,2008(7):1222?1236.
[13] 王威,周红军,王润生.多传感器数据融合的一种方法[J].传感器技术,2003,22(9):39?40.
本文在Matlab 7.6.0环境下进行实验,根据上面算法,首先对异常值检测,发现并不存在异常数据。数据的平均值为0.959 0。平均偏差C=[0.041 0 0.031 0 0.021 0 0.011 0 0.001 0 -0.459 0 0.071 0 0.541 0 ]。协方差S=[1j-1]×C×CT=0.609 7。S相应的特征值和特征向量分别为0.609 7和1。所以,y融合=1×1.00=1.00。如通过基于综合支持度的数据融合的融合结果为0.942 5。通过融合结果可见,加入了基于主成分分析算法,减少了数据量的发送,减少了冗余数据,提高了融合结果的准确性。
6 结 语
本文结合分层算法,在节点中加入了具体的数据融合算法,减少了数据量的传输,达到了一定的节能效果,从仿真中,具体加了融入数据,融合结果的准确性有所提高。在以后的工作中,将进一步完善数据融合的延迟时间及数据的准确性。
参考文献
[1] 雷昕,鄢楚平.无线传感网络网络数据融合技术的研究仿真[J].计算机工程与设计,2008,29(18):4669?4671.
[2] 林蔚,尹娟.无线传感网络含有缺失数据的数据融合研究[J].计算机工程与应用,2012,29(11):4824?4826.
[3] 回春立,崔莉.无线传感网络中基于预测的时域数据融合技术[J].计算机工程与应用,2007,43(21):121?125.
[4] 吴小俊,曹奇英.基于Bayes估计的多传感器数据融合方法的研究[J].系统工程理论与实践,2000(7):46?48.
[5] 胡学骏,罗中良.基于统计理论的多传感器信息融合方法[J].传感器技术,2002,21(8):38?43.
[6] 孙凌逸,黄先祥.基于神经网络的无线传感器网络数据融合算法[J].传感技术学报,2011,24(1):122?127.
[7] 李敏,罗挺,周俊.一种无线网络动态成簇数据融合算法[J].计算机系统应用,2011,20(7):61?64.
[8] 李晓维,徐勇军,任丰原.无线传感网器网络技术[M].北京:北京理工大学出版社,2007.
[9] 曾黎,蒋沅.多传感器数据融合的数学方法研究[J].云南民族大学学报:自然科学版,2010(5):321?324.
[10] 俞黎阳,王能.无线传感网络中基于神经网络的数据融合模型[J].计算机科学,2008(12):43?47.
[11] 钱菲菲,秦宁宁.无线传感网络中误差等级融合算法[J].计算机应用研究,2012(3):1008?1011.
[12] 李志宇,史浩山.一种基于网络和移动代理的无线传感网络数据融合算法[J].传感技术学报,2008(7):1222?1236.
[13] 王威,周红军,王润生.多传感器数据融合的一种方法[J].传感器技术,2003,22(9):39?40.