王丽丽
(广东省工商高级技工学校 韶关 512200)
当前,各类新应用被大量开发,在一定程度上也因此改变了流量的产生与传输形式,有很大比例的流量都是受用户驱动影响而形成的获取类应用,这对建立在端到端通信基础上的TCP/IP网络架构造成了明显挑战。为满足用户需求并更好地适应各类应用的发展,需要进一步提高互联网架构运行安全性、移动性并提高可扩展性。例如,有学者通过研究构建了以信息内容作为核心要素的新型网络架构[1~4],因此可以将这类架构统一看成是建立在信息数据基础上的网络结构(ICN)[5~7]。考虑到随着网络流量的大幅上升,网络带宽需要承受的压力将会持续增加,ICN可以为各个网络节点配备缓存功能,使用户更加贴近内容,从而显著降低网络流量。采取不同的缓存策略时,网络中的内容分布状态也会存在明显差异,最终反映为网络流量的变化。在ICN中所采用的最初缓存策略为LCE,在这种情况下网络所有节点都将缓存从外部接收到的数据,从而引起缓存冗余的显著增加。针对这一缺陷,国内外的许多学者分别给出了不同的缓存机制[8~10]。当前所采用的缓存机制面临着下述问题:从缓存的位置层面分析可以发现,通常是对全局角度进行研究,采取缓存的策略可以更好地适应局部用户所需满足的要求;同时,各节点使用同样的替换策略则会引起缓存内容的同质化问题。相关研究结果显示[11~13],Internet网络拓扑结构具有明显的社团特征,对于某一社团而言,具有更大重要度的节点一方面更易被社团中其他节点访问到,同时也更易被社团外部节点访问[14~15]。在此基础上,本文给出了关于社团感知的缓存以及对应的缓存替换策略(SCCNC),各种流行度的内容可以在网络中形成更为合理的分布状态。本文选择以编码替代移除的缓存替换策略,在保持原先节点缓存空间的前提下,进一步增加缓存内容的多样性并提高缓存的命中率。
本文利用节点社团重要度来获得ICN网络内各个数据的缓存位置。在此网络邻接矩阵中总共含有c个比其它特征值更大的特征值,可将其视为对网络社团结构进行量化的关键指标。可以把网络社团强度表示成kcP=lgΠk-1λ。再通过摄动理论求解出节点社团重要度的近似解Pk:
式(1)的c代表网络社团的数量,vi代表以网络路由器作为节点,以物理链路作为边组成的邻接矩阵对应的第i个特征向量,其中,vik是特征向量vi所包含的第k个元素。当Pk越大时,表示节点k的重要性越高,因此其它节点就越易访问上述节点。当网络包含的节点数为n以及社团数为c的情况下,跟式(1)应先计算各节点社团重要度,此时只需求解代表网络节点关系的邻接矩阵特征向量与特征值便可。考虑到实际情况下的大多数网络都属于稀疏网络,因此可以通过Lanczos与QL算法来求解得到稀疏对称矩阵的特征向量与特征解对应的时间复杂度是O(nm),此处n代表网络节点个数,m代表边数,所需的计算量不大,可以进行实际应用。
使用SCCNC时,应选择社团作为单位,并且按照每个节点各自的社团重要度采取相应的缓存替换策略。当节点的社团重要度越高,缓存流行度越低时,就越易被替换,从而使缓存可以在时间与空间层面上都形成合理的分布状态。
令社团i中的Nj节点对应的社团重要度是Iij,该社团的平均节点重要度等于Ici。在缓存被全部占用之后,先通过LRU算法完实现缓存内容的排序过程,同时建立对应的缓存序列。转移第k个内容的概率是
上式的α是归一化因子,应满足下述条件:
在缓存被替换之后,假定内容p为等待后续移除的内容,当缓存含有的原始块数量为n时,采用随机网络编码的方式处理这些原始块,同时产生1个编码块并对其进行缓存,之后将n个原始块全部移除。通过这种方式可以释放出由n-1个块所占据的缓存空间,并且还可以继续保留所有内容块的原始信息。
本实验进行仿真测试的网络拓扑通过BRITE拓扑生成器得到,该网络总共含有的节点数为100个,链路的带宽等于1Gb/s,节点度平均值等于4。先利用BRITE生成不同的网络拓扑,之后再开展仿真测试获得相近的结果。此网络使用的路由机制是Dijkstra算法,首先对内容服务器存入4000个1 Gb的数据内容,把各内容依次划分为100个内容块,并以10个内容组成一代。选择代内随机线性网络编码的方式,编码与解码都只出现在同代内容块中。数据内容的流行度符合Zipf分布规律,并且用户请求内容属于一种泊松分布规律。
1)平均下载时间。指的是各用户在发送出首个Interest至此用户完成最后1个内容块的接收时所经历的时间。
2)缓存命中率。指的是缓存响应Interest的概率,可将其作为评价缓存性能的关键指标。当缓存的命中率增大时,则表示网络具备更高的缓存效率。
4)下载跳数减少率β(t)。此处的hi(t)代表内容块i在缓存命中节点后至请求者所经历的所有跳数之和,Hi(t)代表内容块i由内容服务器至请求者的总跳数。当内容块i请求取决于内容服务器响应时,存在hi(t)=Hi(t)。
5)传输流量。指的是从首个用户发送Interest开始至最终用户接收到最后内容块时在网络中传输的所有Data包内容。从图1中可以看到各种参数条件下所选择的四种缓存方案得到的平均下载时间。可以明显看到,上述各种机制对应的平均下载时间在α增大后都出现了减小的现象,如图1(a)所示。出现这一情况的原因是当α增大后,用户将会形成更加集中的偏好性,此时用户将会把发送的各项请求全都集中于某一特定内容,导致此类内容占据的网络缓存不断增加,从而更加靠近用户。随着用户请求的增加,同样会引起网络缓存的上升,因此,各种机制对应的平均下载时间都将随用户请求数的上升而下降,结果如图1(b)所示。根据图1可知:SCCNC机制具备较大的优势,此优势对于小的α参数以及用户数比较少的情况将会表现得更加明显。对于SCCNC而言,当把原始块缓存到可具有较高社团重要度的节点上时,将会导致此类节点更易被别的节点进行访问。
图1 四种缓存方案平均下载时间对比
从图2中可以看到各缓存方案对应的跳数减少率。可以明显发现,SCCNC表现出了比其他方案更优的跳数减少率。这是由于,SCCNC的所有节点都可以按照各自节点重要度不同采取相应的缓存替换策略。当缓存被全部使用后,可以通过编码代替移除来实现缓存空间的释放,并保留原先的内容块数据。
图2 4种缓存方案跳数减少率对比
1)本文提出了一种具有社团感知缓存策略(SCCNC)的信息中心网络,选择以编码替代移除的缓存替换策略,在保持原先节点缓存空间的前提下,进一步增加缓存内容的多样性并提高缓存的命中率。
2)SCCNC机制对于小的α参数以及用户数比较少的情况将会表现得更加明显。当把原始块缓存到可具有较高社团重要度的节点上时,将会导致此类节点更易被别的节点进行访问。SCCNC表现出了比其他方案更优的跳数减少率。