郑羽洁,李 熹
(1.广西经济管理干部学院 计算机系,广西 南宁 530007; 2.广西民族大学 信息科学与工程学院,广西 南宁 530006)
分布式网络传感器节点信息分发与聚合传输控制协议研究*
郑羽洁1,李 熹2
(1.广西经济管理干部学院 计算机系,广西 南宁 530007; 2.广西民族大学 信息科学与工程学院,广西 南宁 530006)
提出一种分布式网络传感器节点信息分发与聚合传输控制协议,该协议可以增强在智能测量方面应用中的传输控制协议性能.所提出的新协议作用于远端设备和传输控制协议聚合连接之间,从智能测量设备中利用分布式传输控制协议连接接收信息,然后将之可靠聚合到一个传输控制协议连接中传送至管理服务器端.仿真显示,所提协议可以提供更大的数据业务动态支持范围、提高传输控制协议连接冲突控制的效率.
冲突控制; 网络可靠性; 传输协议
智能测量系统的重要特征之一是具备大量的离线部署的智能测量设备.这些测量设备一般以很低的速率生成测量数据,比如每分钟200字节.数据生成的规律可能是周期触发或事件触发.数据包由应用服务器进行采集用于数据处理和决策制定.由于智能测量设备数量众多,总体产生的数据量也非常大,而可用于这种数据传输的带宽往往十分有限,因此需要保证端到端数据传输的可靠性.[1-5]
传输控制协议(Transmission Control Protocol, TCP)的设计目的就是为了满足端到端的传输可靠性的.但是,在智能测量领域中传输可靠性遇到的问题特点是在智能测量通信中协议的冲突控制的有效性.在智能测量中,每个测量终端传输速率并不高,但是却要求即使出现冲突,传输的速率也不可以减少.业务数据量并不是来自单一的数据速率的一个终端,而是来自大量的不同测量终端,每个测量终端传输速率都不算高.[6-10]有效的传输控制协议的缺失导致智能测量网络中存在较高的丢包率和很低的吞吐量,严重制约着智能测量的应用.[11-16]
文中提出基于TCP的改进控制协议:分布式网络传感器节点信息分发与聚合传输控制协议(Transmission Control Protocol for Distributive Sensor Nodes Information Distribution and Aggregation, TCP-IDA),增强了冲突控制部分的性能.TCP-IDA改变了传统智能测量中智能测量设备和传感器通信均通过同一个服务器的分离的TCP会话的通信方式,提出了将不同的控制信息数据集中于TCP-IDA一个协议下进行聚合.
智能测量系统的结构包含数量众多的实体单元,进行双向的端到端通信.图1给出了智能测量系统通信传输的结构示意图.
图1 智能测量的结构示意图
Fig.1 structure of smart metering
智能测量系统由大量的测量终端组成,这些测量终端通过无线通信方式建立连接,可能通过一跳或者多跳方式与通信站连接,从而建立信息传输的通路.对于远端分布的测量终端,可能配置中继放大器加强信号强度.当测量终端分布的区域达到一定的预先设定的面积大小后,在这片区域中会设置一个区域信息收集终端,负责将区域内的终端信息汇聚再发往更核心的服务器处理.这样信息一层一层地汇聚,最终汇聚在一个应用服务器上,该应用服务器再进行信息的处理和决策制定等工作.智能测量的终端数量根据具体应用变化非常大,有可能是几百,也有可能达到百万.终端一般完全支持TCP/IP协议,并且支持双向的通信.为使建模分析更专注于协议性能,本文假设传输中的信道是完全理想的,因此产生的传输错误都来自信息冲突.
每次传输的数据量大小可能从几十比特到几百比特,大小取决于具体携带信息内容和系统采用的安全传输策略,越高的传输策略级别对应所需的传输数据量也越大.每完成一次成功传输,测量终端都会发送一条对应的状态信息.由于智能测量应用本身所关注的是最原始的信息情况,而不是经过预先综合的结论,因此在数据传输过程中无法进行信息压缩以减少信息冲突的风险.
下面将TCP-IDA进行数学建模,用来进行后续的协议性能分析,同时也用于支持TCP-IDA内部的参数优化.比如设置多少个聚合节点最优等.模型在不同通信层都进行了建模,包括传输层、应用层等.同时考虑了网络容量、传输试验、排队和测量终端数量、聚合器数量等网络方面的特性.通过该模型重现智能测量业务的全过程,并对负载、丢包率和端到端时延进行指标统计.负荷基于数据源的吞吐量,根据TCP源处理的数据比例计算.丢包率是基于网络缓冲溢出产生的丢包计算的.端到端时延是指数据包发出到接收的所用时间.
图2给出了TCP-IDA的模型示意图.智能测量网络业务传输可分为两个步骤.第一步骤由测量终端和TCP-IDA聚合器之间的TCP连接承载,第二步骤由TCP-IDA聚合器到应用服务器之间的TCP连接承载.在TCP-IDA模型中,首先将源产生的业务数据建模为网络参数函数,包含丢包率和时延参数.随后,参数进一步合并为业务负荷函数.根据源产生的网络负荷初值,可以结算出网络参数值.得到的数据用于计算网络实际可提供负载值.随着迭代进行,每次丢包率和时延的值均会自动更新,直到具体数值不再变化时,迭代停止,最终的数值即模型输出的系统性能参数值.
图2 TCP-IDA模型示意图
第一步骤完成测量终端到聚合节点的通信.这个步骤中,测量终端根据区域位置分成不同的组,每个组与同一个TCP-IDA聚合器通信.聚合器获取测量终端信息的瓶颈建模成一个队列栈.网络性能参数通过配置队列栈的参数可以实现一一对应.
在第二步骤中,每个区域的数据在对应的TCP-IDA聚合器已经被汇总,并发往应用服务器.传输的建模方式与第一步骤一致.第二步骤的平衡点在于TCP-IDA总到达率γt稳定下的稳态第二步骤丢包率Pa和时延d2.
下面通过假设给定的聚合器数量,计算对应的策略业务的丢包率和时延,从而建立起以聚合器数量为自变量的第一步骤的丢标率函数、时延函数.
假设TCP连接一直处于激活状态,因此不需要重复TCP连接的建立过程.并且将ACK信令响应功能关闭.考虑到策略数据生成速率很低,具有较长的空闲间隔,所以数据生成的过程建模为开关过程.假设测量终端静默时间的均值是Toff秒且服从参数为α=1/Toff的指数分布.测量终端传输时间的均值是Ton秒且服从参数为β=1/Ton的指数分布.
当测量终端处于传输状态时,TCP会话传输的冲突窗口大小为w.无论采用何种TCP方式,测量终端冲突窗口不会大于2,因为:1)数据量很小,即Ton很小;2)Toff很大,导致了冲突窗口有足够的时间恢复到初值.因此这个开关模型可以表达普遍的数据生成和传输的方式.建立的马尔科夫模型如图3所示.
图3 测量终端马尔科夫模型
图3中的状态序号对应了冲突窗口的数值大小.状态间的传输概率代表成功传输或者传输失败的比率.当数据生成的频率非常低的时候,模型停留在状态1的可能性大,当数据生成频率高的时候状态停留在状态2的可能性增大.
通过求解马尔科夫过程稳态来得到对应的稳态概率:π1,π2,π0和πidle.概率π1和π2分别表示状态1和状态2的传输,每个数据源的平均业务可以表示为:
λi=δπ1+2δπ2
(1)
区域内总的业务量可以表示为:
(2)
下面进行第二步骤的稳态建模.
第二步骤的稳态模型相对于测量终端稳态模型来讲更为复杂,对应的稳态过程模型如图4所示.
图4 第二步骤马尔科夫模型
状态序号对应着冲突窗口大小数值.例如,状态S对应每RTT内传输S个字段.状态0代表超时,无数据传输.
图4的状态转移可描述如下:
在冲突窗口大小为w的情况下,全部会话成功传输的概率表示为qw(1-Pa)w,其中Pa是在聚合器上的丢包率.
状态转移代表冲突窗口加大,转移率为δqw.
假设丢包是相互独立的事件,第i个会话在窗口大小为w时产生丢包的概率表示为:
当状态小于4时,任何会话产生丢包都会使得状态转移到状态0,转化率为δ(1-qw).
状态序号大于14的状态转移与状态14的状态转移具有相同的规律.
从FR状态转移到其他状态的状态转移稳态概率为δ.这样的状态转移将同时启动TCP重置机制.FR状态不传输实际数据.
从状态0转移到其他状态的状态转移稳态概率为τ=1/(Tr+4σ)=1/5Tr=δ/5.
与测量终端不同的是,聚合节点没有空闲状态(idle状态).假设测量终端传输概率为Pactive=Ton/(Ton+Toff),那么n个同一区域的测量终端的传输概率表示为:
Pidle=(1-Pactive)n
(3)
例如,如果Ton=0.1秒且Toff=1分,同时n为10000,那么Pidle=5.8×10-8.
下面进一步计算聚合节点的负载γt.通过求解马尔科夫稳态方程求解πs,其中s是状态s.
令γj表示第j个聚合节点的负荷,则:
(4)
其中,Ws是状态s的冲突窗口大小.求和项计算冲突窗口的均值.连乘得到总的负荷.那么,传输到第二步骤的总的负载表示为:
(5)
其中,NA表示聚合节点数量.
本文通过NS2编程环境搭建了TCP-IDA协议模型,并与数学计算结果对比验证.重点关注输入有误负载、丢包率和端到端时延.
在测量终端建模环节,首先NS2计算Pm和RTT时间长度,为计算网络吞吐量λt做储备.将步骤一计算得到的Pm和RTT输入到步骤2中,得到吞吐量λt.图5给出了实际网络测试和NS2搭建的仿真软件结果之间的差异.对应的参数为1Mbps带宽和50ms传输时延,测量终端生成数据的激活时间均值是100ms,静默时间均值是1分钟.从图中可以看到,当测量终端数量增长时,算法测试结果与实际结果基本一致.
图5 第一步骤马尔科夫模型吞吐量吻合度
对于TCP-IDA的聚合器稳态马尔科夫过程的验证方式与上述方式类似.图6中给出的聚合器稳态测试和仿真数据中,仿真的输入值是上一步骤计算得到的吞吐量负载值.从图中可以看出,仿真和试验测试结果的差异控制在2%以内,较符合实际情况.
图6 第二步骤马尔科夫模型吻合度
图7给出了与上述吞吐量测试配置同样参数情况下,不同的聚合器数量下对应的吞吐量和端到端时延.可以看到当聚合器数量过少或者过多时都将引起两项指标性能的下降.因此对于具体网络应用时,可以先根据预计部署的网络规模和相关参数,应用本文所提的TCP-IDA协议进行仿真计算,得到最优的聚合器配置数量,从而达到优化的网络传输性能.
图7 TCP-IDA丢包率及时延
智能测量网络业务量增大是导致无线传输性能下降的主要因素,主要的症结在于业务量增大则产生TCP冲突的次数增多,从而无法有效完成大量智能测量设备同时传输的需求.本文提出了一种分布式网络传感器节点信息分发与聚合传输控制协议(TCP-IDA),通过两步骤建模方式,将智能测量的信息向聚合节点、聚合节点到应用服务器的传输过程分别建模为不同的马尔科夫过程,并求解最优稳态解下的聚合节点数量,从而实现对智能测量网络性能的优化.本文通过仿真验证了所提出的理论模型与仿真结果吻合,且通过改变聚合节点的数量可以寻求适合网络特征的最优的聚合节点数量.
[1] S Arora,JW Taylor. Forecasting electricity smart meter data using conditional kernel density estimation [J]. Omega, 2016,2(1): 59-62.
[2] 赵文杰. 网络化智能测控技术研究 [J]. 山东工业技术, 2016(1):149-150.
[3] 刘浩然,花卉. 现代测控技术的发展及实践 [J]. 科学与财富, 2015, 8(1):1-13.
[4] Creaco, Enrico,Kossieris, Panagiotis,VamvakeridouLyroudia, Lydia,Makropoulos, C.,Kapelan, Zoran. Parameterizing residential water demand pulse models through smart meter readings [J]. Procedia Enginnering, 2014, 12(8):91-123.
[5] 邢宁哲,纪雨彤. 基于分布式探针的电力数据通信网综合监测方法 [J]. 电力信息与通信技术, 2016(1):77-81.
[6] 姚国栋,丑武胜. 基于CANopen的分布式两轴倾角测量器设计 [J]. 单片机与嵌入式系统应用, 2016(1):31-38.
[7] 杨子健. 现代测控技术浅析 [J]. 科学导报, 2016(1):3-6.
[8] AR Lodder,T Wisman. Artificial Intelligence Techniques and the Smart Grid: Towards Smart Meter Convenience While Maintaining Privacy [J]. Social Science Electronic Publishing, 2016,2(1):113-124.
[9] SS Grid. Analysis: Smart Meter and Smart Grid Problems [J]. Local Smart Grid Security, 2013, 7(13):88-91.
[10] 尹浩,李峰. 互联网性能测量技术发展研究 [J]. 计算机研究与发展, 2016(1):4-13.
[11] 张飞朋,陈琳,张京京. 面向大规模复杂网络测量和性能瓶颈分析方法 [J]. 计算机科学与探索, 2016, 2(1):8-21.
[12] R Al-Otaibi,N Jin,T Wilcox,P Flach. Feature Construction and Calibration for Clustering Daily Load Curves from Smart Meter Data [J]. IEEE Transactions on Industrial Informatics, 2016:1-10.
[13] 王玥. 区域分布式能源的智能微网能源管理研究 [J]. 科技创新与应用, 2016(4):18-21.
[14] A. Kipping,E. Trømborg. Modeling and disaggregating hourly electricity consumption in Norwegian dwellings based on smart meter data [J]. Energy and Buildings, 2016, 1(1):8-27.
[15] 方禾,许力,苏彬庭,等. 多信道无线网络中窃听与干扰攻击的对抗策略 [J]. 四川大学学报:工程科学版, 2016(1):13-23.
[16] 顾硕. WAGO作分布式模块化的引领者 [J]. 自动化博览, 2016(1):4-6.
[17] R Cardell-Oliver,J Wang,H Gigney. Smart Meter Analytics to Pinpoint Opportunities for Reducing Household Water Use [J]. Journal of Water Resources Planning & Management, 2016, 1(2):78-89.
[责任编辑 苏 琴]
[责任校对 黄招扬]
Research on a Novel Transmission Control Protocol for Distributive Sensor Nodes Information Distribution and Aggregation
ZHENG Yu-jie1,LI Xi2
(1.DepartmentofComputerScience,GuangxiEconomicManagementCadreCollege,Nanning530007,China;2.CollegeofInformationScienceandEngineering,GuangxiUniversityforNationalities,Nanning530006,China)
A Transmission Control Protocol for Distributive Sensor Nodes Information Distribution and Aggregation (TCP-IDA) is proposed in this paper. TCP-IDA works on remote terminals and transmission control protocol connections. TCP-IDA utilizes distributed transmission control protocol to abstract information from smart metering devices, and aggregates the information into a single transmission control protocol which sends the information to management server. Proved by simulation, TCP-IDA could provide great range of dynamic varying for data service, and it could also upgrade the efficiency of transmission control protocol for congestion control.
congestion control; network reliability; transmission control
2016-10-15.
郑羽洁(1979-),女,广西桂林人,硕士,广西经济管理干部学院计算机系副教授,研究方向:智能数据分析处理,算法分析.
TP393.04
A
1673-8462(2016)04-0067-06