徐京薇,谢人超,黄 韬,刘 江,杨 磊
(1.北京邮电大学 网络与交换技术国家重点实验室, 北京 100876;2.中央电视台, 北京 100020)
基于神经网络算法的ICN网络传输控制研究
徐京薇1,谢人超1,黄韬1,刘江1,杨磊2
(1.北京邮电大学 网络与交换技术国家重点实验室, 北京 100876;2.中央电视台, 北京 100020)
摘要:随着全球数字媒体的深刻变革,互联网用户关注的重点逐渐向如何快速获取信息转移,而不关注信息的存储位置。现在的TCP/IP网络协议架构却无法适应当今内容应用需求的迅速发展。为了适应这一互联网的转变,以信息为中心的新型网络架构信息中心网络(information-certric networking, ICN)受到了广泛关注。网络时延的动态变化反映了网络路径的负载特征,对时延的精确预测是实施网络拥塞控制、路由选择的重要依据。在ICN中,由于网络缓存机制导致时延的不确定性,为网络传输控制带来了挑战。通过对ICN网络的经典架构命名数据网络(named data networking, NDN)网络时延模型进行建模,采用了神经网络算法进行时延预测,设计了基于预测时延的转发策略机制,创新地在NDN网络组件转发信息表(forwarding information based, FIB)上新增接口信息Stat,以实现转发路径的动态选择。仿真结果表明,该设计机制能够有效地提升网络传输控制性能。
关键词:未来网络;信息中心网络;神经网络;时延预测;转发策略
0引言
当前,互联网已经成为当今世界上影响最广泛、增长最快、市场潜力最大的技术和产业[1]。互联网用户的需求逐渐改变,从主机之间的通信逐步演进为主机到网络的信息重复访问。用户关注的是信息本身,而不是信息的存储位置[2-3]。但现在的TCP/IP协议架构却无法适应应用需求的发展。为了彻底地解决这些问题,研究者们一直在试图研究设计出全新的互联网架构。信息中心网络(information centric networking,ICN)正是被研究者们研究这一思想的典型代表[4-5],并且逐渐被人们认为是最有前途的一种方案。不同于传统的基于IP地址进行数据传输的互联网体系架构,ICN体系架构是以用户所关心的内容或者信息为中心,致力于将内容作为未来互联网络体系结构的细腰展开设计。
ICN的研究主要起源于美国和欧盟。主要研究项目包括内容中心网络(content centric networking, CCN)[6]、命名数据网络(named data networking, NDN)、面向数据的网络架构(data-oriented network architecture, DONA)[7]、信息网络(network of information, NetInf)[8]等。NDN是ICN的一种典型代表方案。由于NDN完全以内容命名进行路由,能更好地体现出信息中心的特性,因此,本论文将以NDN为代表展开研究。
在NDN网络中,需要研究的关键技术问题包括信息命名、路由转发、缓存策略、传输控制等。而传输控制性能的优劣将直接影响NDN的传输效率[9]。虽然当前研究学者针对NDN网络的传输控制进行了广泛的研究,转发策略方面有智能洪泛转发策略(smart flooding)、洪泛转发策略(flooding)和最优转发策略(best route)[10]等代表性转发策略,但是这些策略在设计过程中并未考虑时延因素的影响。
然而,ICN网络由于其缓存机制的存在,时延不确定性非常大,而时延是传输控制中的流量、拥塞等方面的重要因素,是反映传输控制性能好坏的最关键的因素。因此,在NDN网络通过预测时延来进行设计转发策略可以提高网络传输控制性能[11-14],对NDN网络传输控制有着非常大的意义。因此,本论文创新地利用预测的时延进行转发策略的设计,以提高网络传输控制特性,通过预测能力较强的神经网络预测时延,并且对预测时延进行分析、判断,可以提前了解网络状况,动态选择转发路径,从而达到网络传输的最优化目的。
1NDN概述
NDN网络中,通信是由接受者主导的,是通过交换兴趣包和数据包来进行通信的。兴趣包和数据包的标示是通过特殊命名规则来实现。用户向网络中发送一个带有数据名字的兴趣包,路由器通过识别这些名字来向数据包转发兴趣包。一旦兴趣包到达了一个想要数据包的节点,该节点则会返回一个包含名字和数据的数据包,这样可以绑定2个节点的信息,如图1所示[7]。路由器会根据兴趣包转入的节点路径进而转发数据包。
图1 NDN网络中的兴趣包和数据包Fig.1 Interest packet and data packet in NDN
为了完成兴趣包和数据包的转发工作,NDN网络中包括3个组件:转发信息库(forwarding information base,FIB)、内容存储库(content store,CS)和未决请求表(pending interest table,PIT)。图1中,这3个组件,同样作为转发策略(neural network based delay prediction,NNDP)模块能够决定是否、何时和向哪儿转发每个兴趣包。
图2 NDN网络转发模型Fig.2 Forwarding model in NDN
图2描述了NDN网络中的兴趣包和数据包的转发策略[9]。当兴趣包到达一个路由器,该路由器首先检测其CS中是否包含跟该兴趣包命名匹配的数据包。如果存在,则直接将CS中的数据包沿着该兴趣包的输入接口发向返回;如果没有,则在该路由器的PIT中检测是否含有该兴趣包的名字。如果该兴趣包的名字在PIT中已经存在,这说明在之前已经有其他消费者具有相同名字的兴趣包被该路由器接收,同时已经从该路由节点转发出去。因此,不需要再次转发,路由器新增一个该兴趣包的输入接口到这个已存在的PIT条目中。如果PIT中不存在该兴趣包的名字,则将该兴趣包添加到PIT中,同时,根据FIB进一步转发兴趣包。当路由器接收到返回的数据包,使用数据包的名字来查找PIT内容,如果发现一个命名匹配的PIT条目,路由器则将该数据包转发到PIT记录的兴趣包的接口,缓存数据同时删除PIT条目。否则,数据包则被将会被丢弃。每个兴趣包都被设定有一个生存期,当生存期到期时,PIT条目则会自动被删除。
由于NDN缓存策略的存在,导致NDN网络中的时延波动非常大。因此,本文提出了基于神经网络的时延预测,同时在FIB组件中增加了Stat组件来完成转发策略的设计。
2基于神经网络的时延预测
由于NDN网络仍然处在理论研究阶段,没有真正地实施到现实的网络中,因此,针对NDN网络的特性进行了时延模型的设计,同时,应用2种神经网络算法进行时延预测,得到了比较理想的结果。
2.1神经网络算法概述
人工神经网络是一种通过模仿生物神经网络的工作特征,来进行分布式信息处理的算法数学模型。神经网络是目前具有非常强大的预测功能的一种算法模型。一个完整的神经网络是由输入层、隐含层和输出层组成,而每一层都是由多个神经元组成的。
2.2NDN混合网络的时延模型建模
网络中时延的变化受到了网络中用户数量、链路状态等因素影响,是不确定的。但每天的时延总体具有一定规律。因此,为了更好地模拟出现实NDN网络中的时延数据,本文对NDN网络时延模型进行了建模。
(1)
(1)式中:
D1=D0-k4·t+k5·sin(k6·t)+rand1
(2)
D2=k7·D1+k9·f1(b1,T1)+rand2
(3)
(4)
(1)-(4)式中:D0为时延的初始值;t为时间;f1为突变的函数;f2为跳变的函数;b1和b2为函数的宽度;T1和T2为函数的周期;rand为随机函数;k1-k10根据时间t变化的参数,保证了时延变化的随机性。
D1考虑到NDN网络缓存机制,时延在一段时间内会呈下降趋势。但网络中仍然会受到网络用户数的变化而有一定的不影响整体趋势的波动;D2考虑到网络中的用户数量的突然增大导致时延急剧上升,并在短时间内,时延又恢复正常;D3考虑到NDN网络中的缓存机制的存在,数据包可能突然变化缓存地点,导致时延变化呈跳变;Dh为混合模型,将D1-D3随机混合,以便NDN网络模型的训练。
2.3基于NDN混合网络时延模型的神经网络设计
为了可以更好地进行时延预测,应选取最佳的神经网络架构和神经网络参数。
本论文选取的是预测效果比较好的BP神经网络和Elman神经网络进行对比,同时神经网络参数参考文献[14]的研究结论(当神经网络结构为输入层单元为5,单隐层单元为8,输出单元为1时,时延预测性能最佳),最终综合得到了在NDN网络下具有最佳预测效果的BP神经网络结构。
仿真方法如下:根据Dh混合时延模型,参考一般网络时延大小,产生了10 000个数据样本输入,其中,50%数据用于训练网络;50%数据用于验证网络。用原始数据D0与预测数据Dy来计算误差,见(5)式。
(5)
根据Dh混合时延模型对2种网络预测性能进行对比分析,发现在BP神经网络的时延预测性能要优于基于Elman的神经网络,如图3a所示。对比BP神经网络在单隐层为8和10的误差,可以发现,在单隐层单元数为10时,误差均比单隐层数为8的小。
应用Dh混合时延模型的数据,训练好了BP神经网络。图3b是原始数据和预测数据的对比图。通过对比可以发现,在时延数据为突变的时候,预测有一定的误差。总体来说,BP神经网络具有很好的预测性。因此,本文选取BP神经网络进行后续的时延预测。
BPElman0.4290.5410.3670.4680.4360.5480.5310.6550.3730.4860.3140.3940.4810.5990.4810.6040.3690.464单隐层单元为10单隐层单元为80.5330.5720.4860.5130.3600.3720.4870.5160.4910.5180.4930.5230.3870.4080.4960.5240.4310.449
a 误差对比
b BP神经网络预测效果图
3基于预测时延的路由转发策略算法
3.1存储转发模型
通过第2节训练好的神经网络预测出来的时延来选择转发的路径。本文创新地在FIB表中增加一个接口信息Stat,用简单的数字来表示状态,在转发时,通过简单地比较每条路径的接口内容来判断走哪条路径。
同时在节点存放时延表,其中包括5个历史时延数据(D1-D5)和根据神经网络预测的时延数据。FIB表中增加了的Stat接口信息内容是根据预测出来的时延数据的大小来进行改变的。
3.2基于预测时延的转发算法
图4是整个NDN网络中的转发流程。由于新增了Stat接口,在有可转发路径的前提下,判断有几个拥有命名指向的数据包的路径。如果只有一个,则向这个方向转发兴趣包,如果有多个,则判断Stat里面的数据来执行转发策略。
图4 NDN网络转发流程图Fig.4 Forwarding flow chart of NDN
3.2.1NNDP
1)向Stat接口内容最小的方向转发数据。
2)如果有相同的Stat接口内容,则向所有最小的接口转发。
3)转发结束后,删除D1中的时延,并且依次将时延数据向左移动,同时将新的返回的实际时延存放在D5中,同时预测第6个时延。当更新Stat之后,如果改变了转发接口,则将时延表中的历史时延数据改成新路径的时延数据。
3.2.2Stat更新方法
1)对于相同的兴趣包的接口,状态0只存在一个。且0为最小的Stat。
2)当新增一个兴趣包接口时,对应的Stat全部都为1。
3)如果所有的Stat都为1,则向所有端口转发。转发后,每个Stat存放返回的时延,并且在时延表中存放当前最小的时延。将时延进行排序,最小的为0,依次增大,数字不重复。对于相同大小的时延,根据FIB表中的位置,将处于更上面的时延值处理为Stat更小的值。
4)如果预测的时延超过T1(超时值的m1倍),则立即令所有的Stat为1。当预测的时延超过T2(超时值的m2倍),则向Stat等于1的路径转发,如果返回的时延小于T2,则将Stat为0和为1的2个数值互换。如果预测的数据仍然超过T2,则令所有的Stat为1。其中,m1,m2都是根据网络具体情况来定的。
5)当更换路径时,将5个历史时延均存为更换的路径返回的时延,以避免前一个路径的时延的影响,同时减少本地时延表存储压力。
4仿真验证
4.1网络拓扑
本文中使用了Matlab仿真NDN网络,网络结构如图5所示。这里的网络结构选用相对比较简单的二叉树型结构。网络说明如下。
图5 二叉树型NDN网络结构Fig.5 Binary tree network architecture in NDN
1)网络中的结点0为用户,发送不同的兴趣包(仿真是设定随机请求1-5命名的兴趣包,代表5个数据包)。
2)节点1-15分别是网络的中间路由,拥有CS(可以存储数据包)、Stat(表示向哪个方向发送数据包)。
3)在最上面的节点1中存放5个最近返回的时延值,并且预测下一个时延,根据预测的时延应用第3节的算法,来进行链路1-2和链路1-3的选择。
4)由于是二叉树结构网络,则设定Stat只有1,2,3这3个值。1代表向2个方向发送数据;2代表向节点2发送数据;3代表向节点3发送数据。
5)在NDN网络中,每个节点应该存有CS(缓存数据包)、PIT和FIB。为了简化网络,我们令网络初始化的时候,每个端节点,即节点8-15,同时拥有这5个数据包,这样每个节点都拥有2个方向可选路径,且一直都会拥有,这样可以减少PIT。并且由于Matlab不支持多线程,无法实现同时网络中存在2个数据包发送的情况,因此,每次发完一个数据包等回来时候再发下一个数据包,则不需要PIT存在。由于二叉树的结构,节点数除以2向下取整即可以找到父节点,也即节省了FIB(只存有新增的Stat)。因此,网络中只拥有CS和FIB。
6)评测网络的好坏,是用发出去的第一个兴趣包开始,直到最后一个数据包返回的平均网络时延来评测。网络每次发送100个兴趣包,兴趣包的命名是随机从1-5中抽取的。
7)缓存机制:每个节点最多CS缓存3个数据包,每次新到一个数据包,如果CS表中不存在,则让新到的数据包排在最上面,依次向下降更新;如果有,则不更新CS表。
8)时延大小:每2个节点间的时延大小是按照上面所用的混合模型产生的。由于节点1-2和节点1-3是网络中最容易产生拥塞的地方,所以,在每次发送100个包的时间里,这2条链路的时延设定为D3,呈跳变的模型。链路2-4,2-5,3-6,3-7设定为D2,呈突变的模型。链路4-8,4-9,5-10,5-11,6-12,6-13,7-14,7-15设定为D1,呈线性向下带波动模型(后50个包翻转该模型,即改为线性向上带波动模型)。
4.2仿真结果
根据4.1节的规定,应用Matlab软件,仿真了NDN网络。每次发送100个兴趣包,内容1-5随机。图6是统计了某一次网络中发送每一个包返回的时延的大小。总共有100个包。
其中,original为没有应用预测算法的网络,即直到超过Timeout才重新发送数据选择最好的链路的时延曲线。NNDP代表网络中加入了本文的算法之后的网络平均时延曲线。网络的超时Timeout设定为0.033 6 s,即为图6中最上面的点状线。m1·tout和m2·tout分别表示为Timeout的m1倍和Timeout的m2倍(这里m1=0.8,m2=0.6)。其中,有3次不符合整体趋势的误差,跟整体仿真相比,可以忽略。
由图6中可以发现,经过本文的算法之后的网络时延比没有应用本算法的网络时延要小。尤其是在网络时延到0.8倍Timeout时候,会比没有应用本算法时候的时延少很多。
图6 仿真时延对比图Fig.6 Simulation comparison chart of time delay
图7是仿真了100次100个数据之后,每次仿真的平均时延。计算这100次的2种网络的平均时延,可发现应用算法之后的总平均时延也要比没有应用算法的平均时延小很多。
图7 仿真网络平均时延对比图Fig.7 Simulation comparison chart of average time delay
通过图6和图7这2种网络时延的评估方法,可以发现,应用算法之后的网络平均时延比没有应用NNDP算法的时延小很多。因此,可以得出结论:本文的NNDP算法可以一定程度地提高网络的性能,减少网络拥塞的产生。
5结束语
本文设计了NDN网络时延模型,训练2种神经网络,并且进行了预测性能的对比,发现2种神经网络都可以很好地预测出时延,但BP神经网络略好于Elman神经网络。本文同时应用预测出来的时延,设计了转发策略的算法,并且通过仿真NDN网络,进行算法的评估,发现算法可以提高网络的性能。
在未来的工作里面,可以通过应用更好地仿真平台,如用ndnSim来验证本文的算法的优劣,同时可以改进算法中的参数m1和m2,来更好地优化算法。同时,应用ndnSim可以更好地设计网络时延模型。除此之外,可以深入研究更多的神经网络,寻找最好的可以预测时延的神经网络。同时可以对比其他非神经网络的算法进行时延预测,为NDN网络性能提高寻找最好的预测方法。
参考文献:
[1]CNNIC,第35次中国互联网络发展状况统计报告[EB/OL].(2015-01-10)[2016-03-05] http://www.cnnic.cn/gywm/xwzx/rdxw/2015/201502/W020150203456823090968.pdf.
CNNIC,35 times China Internet network development state statistic report [EB/OL].(2015-01-10)[2016-03-05] http://www.cnnic.cn/gywm/xwzx/rdxw/2015/201502/W020150203456823090968.pdf.
[2]黄韬,刘江,霍如,等. 未来网络体系架构研究综述[J]. 通讯学报, 2014,35(8):184-197.
HUANG Tao,LIU Jiang,HUO Ru,et al. Survey of research on future network architectures[J]. Journal on Communications, 2014,35(8):184-197.
[3]夏春梅,徐明伟. 信息中心网络研究综述[J]. 计算机科学与探索,2013, 7(6):481-493.
XIA Chunmei, XU Mingwei. Survey of Information-Centric Networking [J]. Journal of Frontiers of Computer Science and Technology,2013, 7(6):481-493.
[4]XYLOMENOS G, VERVERIDIS C N, SIRIS V A. A survey of information centric networking research[J]. IEEE Communication Surveys,2014,16(2):1024-1049.
[5]AHLGREN B, DANNEWITZ C, IMBRENDA C. A survey of information centric networking[J]. IEEE Communication Magazine,2012,50(7):26-36.
[6]JACOBSON V, SMETTERS D K, THORNTON J D, et al. Networking named content[C]//Proceedings of the 5th International Conference on Emerging Networking Experiments and Technologies (CoNEXT ’09). NewYork, NY, USA:ACM, 2009: 1-12.
[7]KOPONEN T, CHAWLA M, CHUN B G. A data-oriented (and beyond) network architecture[J]. International Computer Science Institute,2007(7):27-31.
[8]DANNEWITZ C, KUTSCHER D, OHLMAN B, et al. Network of Information(NetInf)-An Information Centric Networking Architecture[J]. Computer Communications, 2013, 36(7): 721-735.
[9]ZHANG L, AFANASYEV A, BURKE J. Named Data Networking[J].ACM SIGCOMM COMP COM, 2014, 44(3): 66-73.
[10] 薛锦,张栋,唐滨.命名数据网络中主动探测的转发策略研究[J].计算机工程与应用,2014,50(18):89-93.
XUE Jin, ZHANG Dong, TANG Bin. Research on active detection forwarding strategy for Named Data Networking[J]. Computer Engineering and Applications, 2014, 50(18):89-93.
[11] 王宏伟,杨雨,张智华. 网络时延预测研究[J].电脑知识与技术,2011,10(7):2363-2365.
WANG Hongwei, YANG Yu, ZHANG Zhihua. Research of Internet Time Delay Predicting[J]. Computer Knowledge and Technology, 2011,10(7):2363-2365.
[12] 宋杨,涂小敏,费敏锐.基于FARIMA模型的Internet时延预测[J]. 仪器仪表学报, 2012, 33(4):757-763.
SONG Yang,TU Xiaomin,FEI Minrui. Internet time-delay prediction based on FARIMA model [J].Chinese Journal of Scientific Instrument, 2012, 33(4):757-763.
[13] 田中大,高宪文,李琨.基于KPCA与LSSVM的网络控制系统时延预测方法[J]. 系统工程与电子技术, 2013, 35(6):1281-1285.
TIAN Zhongda, GAO Xianwen, LI Kun. Networked control system time-delay prediction method based onKPCA and LSSVM [J]. Systems Engineering and Electronics, 2013, 35(6):1281-1285.
[14] 胡治国,张大陆,侯翠平,等.基于随机神经网络的多步网络时延预测模型[J].计算机科学,2009,36(7):85-112.HU Zhiguo, ZHANG Dalu, HOU Cuiping, et al. Multi-step Network Delay Prediction Model Based on RNN [J]. Computer Science,2009, 36(7):85-112.
DOI:10.3979/j.issn.1673-825X.2016.04.015
收稿日期:2016-03-08
修订日期:2016-04-12通讯作者:徐京薇kelly_xujw@bupt.edu.cn
基金项目:国家自然科学基金青年科学基金(61501042);北京邮电大学青年科研创新计划专项(2015RC10);北京市科技新星计划项目(Z151100000315078);产学研转化项目(201502012)
Foundation Items:The National Natural Science Foundation of China(61501042); The BUPT Special Program for Youth Scientific Research Innovation(2015RC10); The Beijing Nova Program(Z151100000315078); The Industry, Education and Research transformative project(201502012)
中图分类号:TP939
文献标志码:A
文章编号:1673-825X(2016)04-0539-06
作者简介:
徐京薇(1993-),女,河南开封人,北京邮电大学硕士研究生, 主要研究方向为未来网络体系架构,内容中心网络。E-mail:kelly_xujw@bupt.edu.cn。
谢人超(1984-),男,福建南平人,博士,北京邮电大学讲师,主要研究方向为未来网络体系架构、内容中心网络、无线通信网络。
黄韬(1980-),男,重庆人,博士,北京邮电大学副教授,主要研究方向为未来网络体系架构、软件定义网络、内容中心网络。
刘江(1983-),男,河南郑州人,博士,北京邮电大学讲师,主要研究方向为未来网络体系架构、软件定义网络、内容中心网络。
杨磊(1974-)男,硕士,高级工程师,主要研究方向为电视台制、播、存储媒资、传输相关技术及应用。
(编辑:刘勇)
Research for transport control in ICN based on neural network algorithm
XU Jingwei1, XIE Renchao1, HUANG Tao1, LIU Jiang1, YANG Lei2
(1.State Key Laboratory of Networking and Switching Technology, Beijing University of Posts and Telecommunications,Beijing 100876, P.R. China; 2. CCTV, Beijing 100020, P.R. China)
Abstract:With a profound change in the global digital media, current Internet users gradually show great concern for how to get information quickly, rather than the storage location of information. However,the TCP/IP network protocol architecture is unable to adapt to the rapid development of the application demand today. Thus, the new network architecture of information-centric (information-centric networking, ICN) has received the widespread attention. The dynamic changes of the network time delay reflects the load characteristics of the network path, so the accurate prediction of time delay is important to the implementation of network congestion control and routing. In ICN, the uncertainty of time delay, due to network caching mechanism, brings new challenges for the network transmission control. Therefore, in the NDN (named data networking) network which belongs to ICN delay model modeling, time delay prediction algorithm and neural network are used in this paper to design the forwarding strategy based on the predicted time delay mechanism, adding interface Stat into component forwarding information based in NDN innovatively, so as to realize the dynamic choice of forwarding path. The simulation results show that the designed mechanism can effectively improve network transmission control performance.
Keywords:future network; information centric networking; neural network; delay prediction; forwarding strategy