文献[11]提出一种大规模传感器网络中近似K-中位数计算方法。K-中位数是指,给定一个集合S,在集合S中找出第K小的值,n为S集合的大小。文献[12]提出基于采样的( ε,δ)-近似聚集算法。通过采样,可使得到的结果误差在ε界限内的概率不大于δ。文献[13]则在对一小部分传感器节点数据采样至融合中心后,再估计感知环境,并指导网络资源分配。具体地讲,融合中心根据估计的感知环境情况,有选择地激活某些节点,从而满足一定的误差界限。这种动态采样方法可以有效节省能量开销。文献[14]提出一种在线算法,在给定能量开销上界的情况下最小化近似比误差。该种算法是基于区域采样,将网络划分为多个不重叠的区域,并通过计算近似聚集结果来满足事先设定的能量预算。文献[15]采用基于卡尔曼滤波的估计方法来自动动态地调整采样速率,从而降低传输量,提高估计精度。文献[16]提出一种近似随机的采样方法。这种方法只采样与网络规模成比例的部分节点,由此而达到接近随机采样方法的效果及精度。








Krishnamurthy 等人研究数据流系统中聚集查询的数据共享问题[46]。研究者们主要解决处理诸如 min、max、sum 以及 count 等聚集查询。在其所研究的问题中,数据流至少需要被扫描一次,并分成多个碎片。只有被多个查询重叠覆盖的碎片才可以得到共享。


无线传感器网络(Wireless Sensor Networks)通过大量部署在监测区域内的传感器节点采集网络覆盖区域内感知对象的信息,并通过多跳的无线通信方式将收集处理后的信息提供给终端用户。路由算法是数据收集的基本问题,所有数据都需要通过路由方法发送至基站进行相关处理。传感器网络中具有多种路由协议,包括 Gossiping 协议[47]、SPIN 协议[48]、Directed Diusion协议[49]、Rumor 协议[50]、LEACH协议[51]等等。在数据收集过程中,使用较多的路由协议作为树状路由和地理路由等。而在无线传感器网络中,地理路由协议则使得数据包可以通过多跳无线传输到达指定地理位置附近的节点,因而具备了广泛的应用前景。目前,已经实现了很多关于地理路由算法的研究工作,其基本过程大体一致,都是在贪心模式失败时转入周边模式。


在传感器网络的众多应用中,数据收集需要传输大量的感知数据。大量感知数据通过路由方法转发给 sink 节点,必然引起数据冲突。数据冲突不但会导致重传,从而降低吞吐量,而且还会导致数据丢失。TDMA方法是一种能够在高负载网络中避免冲突,提高吞吐量的有效方法[52-54]。现今已经涌现了许多关于TDMA的工作,这些工作的目的都在于如何减少TDMA时间槽数或者设计分布式TDMA算法[55-57]。但是这些研究工作却都是针对一般数据通信而设计的TDMA算法。文献[58]研究基于TDMA的数据收集问题。给定一棵路由树及其对应的干扰图,每个节点都要向基站发送数据,目标是找到最小的时间槽数,使得所有节点数据都能发送到基站。文献 [58] 证明了这个问题的复杂性,并给出两个算法。一个是基于节点的调度算法,另一个是基于分层的调度算法。该文献还对提出的算法进行了分析,但并未给出近似比。此外,减少数据冲突,提高网络吞吐量的另一个有效方法则是采用多信道技术。多信道通信中,不同的信道将互不干扰。通过多信道机制,尽可能地使得多个链路在同一时间进行通信,从而提高网络的吞吐量。现在已经获得了大量多信道调度问题的研究工作成果。文献[59-61]研究聚集操作的多信道调度问题。文献[62-64]探讨了多信道MAC协议。文献[65] 实现了在网络中建立多棵树,每棵树使用不同的信道,以此来提高网络的吞吐量。文献[66]则研究了多信道快速数据收集过程的吞吐量与延时的权衡问题。

已有的多信道研究中都选择信道间频距足够大的信道,以保证信道间正交无干扰。但是这种选择却会导致可利用的信道数减少。有研究表明,适当减小频距,增加可用的信道数,能够提高网络的吞吐量。在数据收集过程中,一般均以树状路由进行数据传输。研究中需要考虑如何进行 TDMA 以及多信道调度,使得网络中所有节点的数据能够以最短的时间到达树根的问题。同时,还需考虑信道间发生干扰时,如何使得因信道间干扰而造成的数据丢失最少的问题。

已有大量的工作表明多信道复用可以极大提高网络的吞吐量[67-69]。近年来已开发了很多的多信道传输协议,例如 MCMAC[70],TMMAC[71],MMSN[63]等。然而,这些工作使得为网络中每一条链路分配时间槽,实现彼此之间互不干扰成为可能。其实针对数据聚集网络中的多信道调度问题,只需要对所构建路由树上的链路,而不是网内所有链路进行时间槽分配即可实现与完成。

全网数据收集与数据聚集问题表现了一定的相关性[72],但是并不完全相同。全网数据收集算法的目标是收集网内所有节点的原始数据,而数据聚集算法却是收集聚集结果。最小化延时是数据收集问题的一个研究内容[102-103]。Gandham 等人提出一调度算法[73],算法实现需要 3N 个时间槽。其中,N 为节点个数。Yu 等人提出另一调度算法[74],实现需要24D+ 6Δ+ 16个时间槽。其中,D是网络的直径,Δ是最大节点度数。这些工作的目标都是减少延时,使得数据最早发送到基站。Wu 等人又提出一多信道数据收集协议 TMCP (Tree-based Multi-Channel Protocol)[65]。该协议将网络划分成多个子树,树间使用不同的信道,而树内使用相同的信道。其目标是减少树内的干扰。

文献[60]中,算法首先建立一棵路由树;其次为每个节点分配信道,使其下的所有孩子节点都以这个信道发送数据;为树内链路分配时间槽,使得彼此之间互不干扰。在分配信道过程中,算法优先分配信道给那些干扰最严重的节点,这一分配方式是集中式的,并不适合在传感器网络中应用。文献[60]中,算法的上界为 maxΔ2 + 1,其中Δ2是网络形成的图中2跳内邻居节点的个数。令Δ(G)为图的度,则文献[60]中的算法上界为O(Δ(G)2)。

文献[66,71]针对 UDG 网络和非 UDG 网络提出两种调度算法。算法中,针对 UDG 网络所提出的算法上界为 8μαΔ(T)。其中,μα是与方格大小有关的函数,Δ (T)是所构建路由树的度。针对非UDG网络所提出的算法上界为O(Δ(T) log n)。其中,(T)是所构建路由树的度,n是网络中的节点个数。这两种算法都是集中式的。





