张桂玉,马 睿,白露莹,邓木明,赵 锴(.中讯邮电咨询设计院有限公司,北京 00048;.国家电网公司信息通信分公司,北京 0076)
传统IP 网络的主要特点是统计复用和尽力而为,虽然在链路带宽利用效率和开放性上与其他传输方式相比有很大的优势,但是存在时延抖动不可控、拥塞导致丢包等问题,因此无法保证特定需求对网络要求的“及时”和“准确”;事实上,有很多行业应用需要网络提供可确定的带宽、时延、抖动等服务,确定性网络就是在这种背景下提出的,它的理念是通过精准控制为特定应用提供质量准时、准确的信息传输保证,而电力领域一直是确定性网络研究的重点领域。
确定性网络是指给承载的业务提供确定性业务保证能力的网络。确定性网络采用一系列协议和机制,通过网络切片、显式路由、资源预留、时钟/频率同步、周期映射、门控优先级队列调度、帧抢占、流量过滤和整形、多发选收等技术,分别保障确定性带宽、确定性转发路径、有界时延、有界抖动、高可靠等QoS 指标。目前的主要技术包括灵活以太网(FlexE)技术、时间敏感网络(TSN)技术、DetNet/DIP等。各类技术的总体架构如图1所示。
图1 确定性网络技术架构
MAC 层以下的确定性网络技术,一般是基于时分复用调度不同业务至多个不同的子通道实现业务的“管道”隔离,当前主要采用灵活以太网(FlexE)技术。FlexE 是承载网实现业务隔离承载和网络分片的一种接口技术,在IEEE 802.3 定义的标准Ethernet 技术基础上,通过在MAC 与PHY 层之间增加一个FlexE Shim层,实现了MAC 与PHY 层解耦,打破两者强绑定的一对一映射关系,实现M个MAC 可映射到N个PHY,从而实现了灵活的速率匹配。例如把100GE PHY 池化为20 个5GE 时隙,而业务口可以灵活地从20 个5G 时隙资源池中申请独立的带宽资源。由于重用了现有IEEE 802.3定义的以太网技术,使得FlexE架构得以在现有以太网MAC/PHY 基础上进一步增强。FlexE 实现了链路捆绑、子速率和通道化3种应用模式,承载各类不同速率需求业务;能够与SDN 技术结合实现对L1层的传输控制,实现网络带宽的自动调整,FlexE 在城域网/广域网有着广泛的应用。
a)时延/抖动确定。FlexE 通过PHY、MAC 层协同调度,实现时隙交换以保证时延、抖动的确定性。
b)带宽确定。FlexE 增加时分复用Shim 层实现MAC 层与PHY 层解耦,得到更灵活的物理通道速率,支持链路捆绑、子速率和通道化3种应用模式,可按需为业务划分切片带宽,承载各类速率需求业务,从而保证带宽的确定。
c)转发路径确定性。基于业务的时延、抖动、可靠性等性能指标要求,通过SRv6 policy 隧道技术,为确定性业务计算1条或者多条确定性的转发路径。
d)技术局限性。当前支持的切片最小带宽为5G,对于某些应用会造成带宽浪费。
L2 层的确定性网络技术是指MAC 层及以上技术,目前业界采用的主要是“时间敏感网络(TSN)技术”,其特点是按照时间片进行流的调度,解决同一管道内不同流传输的冲突,保证确定性业务流的实时传送。TSN由一系列技术标准构成。其主要分为时钟同步、数据流调度策略(即整形器)以及TSN 网络与用户配置3个部分相关标准。TSN 通过IEEE802.1AS(时钟同步)、IEEE802.1Qbv(时隙控制)、IEEE802.1Qbu&IEEE802.3br(帧抢占)、IEEE802.1CB(冗余数据传输)等技术保证二层局域网络端到端的确定性时延、抖动和带宽。TSN 可以达到10 μs 级的周期传输。TSN 在以太网技术基础上,通过时钟同步、数据调度、网络配置等机制,提供局域网内的确定性数据传输能力。
a)时延/抖动确定性。每个节点都有对应的同步时钟和数据队列,时钟用于同步计算,队列用于处理数据优先级,包括针对高动态数据的快速通道方式和抢占式机制。各机制协同,为数据提供确定的传输时隙,实现有界、低时延传输。
b)带宽确定性。采样IEEE802.1Qbv(时隙控制)、IEEE802.1Qbu 和IEEE802.3br(帧抢占)等保证带宽的确定性。
c)转发路径确定性。结合生成树算路(RSTP/MSTP)以及对交换机端口VLAN 的控制,可以为确定性业务流创建确定性转发路径。
d)存在的主要问题。TSN 技术需要逐流维护状态,但在大规模网络的汇聚节点存在性能和可扩展性方面的原因无法实现逐流控制的问题,因此目前还不适用大规模网络。
L3 层的确定性网络技术主要包括确定性网络(DetNet)、确定性IP(DIP)、指定周期排队转发(CSQF)等技术,旨在实现IP 网络从“尽力而为”的转发到“准时、准确、快速”的转发。DetNet/DIP/CSQF 主要应用于城域网/广域网组网场景,在排队转发机制上使用TSN定义的技术,在传统IP 的基础之上引入周期转发的思想,可通过控制每个数据包在每跳的转发时机来减少微突发,消除长尾效应,结合SRv6 算路技术实现确定性转发路径,最终实现端到端时延和抖动的确定性。
a)时延/抖动确定性。DetNet/DIP 主要面向广域网,排队转发机制基于TSN 技术进行改良,并基于L3协议定义方案,在统计复用的基础上提供确定性时延和抖动。
b)带宽确定性。结合FlexE 的硬切片特性实现带宽物理隔离;结合SRv6切片的软切片特性实现带宽逻辑隔离。
c)转发路径确定性。基于业务的带宽、时延、可靠性等性能指标要求,通过SRv6 policy 隧道技术,为确定性业务计算1条或者多条确定性的转发路径。
d)存在的主要问题。DetNet 技术只实现了L3 层的可靠性保障,尚未实现转发时延控制,其时延保障仍需要L2 层引入TSN,增加了部署难度,且标准尚未成熟;DIP 技术对TSN 机制加以了改进,但仍然没解决转发设备的时间同步、大规模逐流调度等难题。
确定性网络产业除上述技术及标准发展以外,主要包括产业提供者(芯片、设备、设施和管理供应商)、产业建设者(确定性网络建设者和服务商)和产业使用者(各行业应用客户)。
确定性网络提供者主要为整个产业和生态发展提供相应的软硬件基础设施,其中芯片厂商提供具备相关确定性能力的基础硬件,如支持确定性网络技术的网络芯片、FPGA、NP、CPU/GPU/TPU、DSP 等设施;基于基础硬件,设备商提供具备确定性转发能力的整机设备;针对设备及由设备组成的网络,管控系统提供者提供对确定性设备和网络的管理和控制能力。确定性网络的提供者涉及确定性网络产业的基础环节与技术研发环节,掌握着行业的核心技术,决定了确定性网络创新和发展速度,是行业发展的关键。
2.1.1 芯片的产业发展情况
确定性网络技术的芯片制造商主要是网络芯片制造商如博通、高通、微芯科技等;此外,NP(Network processor)提供商在支持网络转发能力的同时也支持可编程能力,可更好地支撑确定性网络技术平滑演进(如英伟达旗下ezchip);CPU、GPU、TPU 企业推出在端侧支持确定性能力的产品(如英特尔、ARM、英伟);DSP芯片主要提供确定性网络相关技术的基础能力集成和供给,如TI、ADI等。
未来随着确定性网络技术相关标准的不断完善,芯片的发展将与确定性网络技术规划更好的匹配,实现低成本芯片解决方案,更好地支撑确定性网络整个生态的发展。
2.1.2 设备的产业发展情况
确定性网络的主流设备厂商包括华为、中兴、新华三、思科、东土科技等,这些厂商涉及无线/有线接入、局域/广域网等多种场景及技术,各厂商涉及程度不一,同时高校以行业应用者身份根据自身研究及需求也推出了相应的产品。
随着未来确定性网络应用的试点和规模落地,设备提供商将在转发、控制及运维等方面的关键技术上进行突破,提供更加全面、可落地的解决方案。
2.1.3 管控系统的产业发展情况
现有管控主要分为2类,一类由设备厂商提供,一般只负责本厂设备相关的管理和控制,无法实现异厂商的管控;另一类一般由第三方提供,与厂家设备无关,通过转发和控制的解耦,实现多厂商的统一管控。确定性网络建设者也参与到管控系统的研发和使用的过程中,目标是提供跨不同厂商的管控能力,目前电信运营商及网络水平较高的研发机构已在此方面形成了产品及突破。
确定性网络建设者主要包括电信运营商、其他广域网服务商;直接参与2B建设的设备商如华为、中兴、新华三等;还有各行各业拥有较大规模自建广域网络的企业比如国家电网、中国高铁等。当前这些企业正在积极进行试点工作,其试点主要围绕各行业实际应用,解决异厂商的互通性问题,从而降低用户使用门槛,以较低成本为应用者提供全场景的端到端确定性解决方案。
需求是推动技术产生和发展的源动力,确定性网络产业的最终使用需求和使用场景是确定性网络技术得以发展和进步的基础。工业制造、电力行业、能源行业、医疗行业、港口运输、装备制造及车联网等各行各业都开始进行确定性网络实际应用试点。未来随着确定性网络各类技术发展和演进,结合各行业应用者的应用需求和场景,生态伙伴不断优化、改进和创新确定性网络整体方案,确定性网络应用将支撑和驱动未来确定性网络的规模化落地实践。电力网络在确定性网络技术方面的需求是本文讨论的重点。
3.1.1 配网差动保护应用场景
我国电力系统用来实现高电压线路传输大容量电能,但也存在许多风险,一旦发生安全事故,易导致大面积的用电问题,因此,需要运用电力系统“继电保护装置”的配网差动保护技术判断故障,并快速切断故障区域。具体应用为:配网差动保护各侧保护终端都通过通信通道将本端的电气测量数据发送给对侧,同时接收对侧发送的数据并加以比较,判断故障位置是否在保护范围内,并决定是否启动将故障切除。差动保护要求两端需持续发送电流且同时到达,并通过比较差异判断是否启动故障保护,因此为保证误切不超过一定的偏差,对端到端承载网络的时延、抖动均有较高要求;同时由于配网故障发生是随机的,配网差动保护需要持续实时传递数据来判断和检测线路是否发生故障,因此具有持续上行带宽流量需求,对带宽资源保障要求也很高。总的来说配网差动保护对网络的主要要求是:通信时延严格保持一致,带宽确定且无抖动。
分相电流差动保护系统模型如图2 所示,其业务指标要求如表1所示。
表1 分相电流差动保护业务指标要求
3.1.2 视频会议应用场景
由于会议视频传输的是实时的图像和语音业务,对网络的要求较高。为了能够保障会议的通信质量,传输网络需能够提供足够带宽且传输线路稳定,要能够保证没有拥塞和低误码率。
一般说来,视频会议系统的承载网络应避免出现如下情况。
a)传输网络不稳定,误码率高。
c)时延抖动大。
d)丟包率大。
e)地址设定没有统一的规范。
为了使建成后的视频会议系统具备良好的效果,承载网络应具备如下特点。
a)传输网络稳定,误码率<10-7。
b)端到端的时延要求,视频会议的通用时延建议小于200 ms,100 ms内最佳。
c)网络抖动的要求,由于音频/视频的传输为实时的交互,对网络抖动的要求较高,建议保持在小于50 ms。
d)丟包率的要求,网络上的丟包率不可高于1%。
而湘西地区红色文献,笔者以为,是该地区近现代革命史的重要载体,是在中国共产党的领导下,湘西本土人民在长期的革命斗争中所形成的伟大的革命精神及其物质媒介。不仅涉及该地区该时段的有关历史、政治、经济和文化、教育等方面的各种载体的文献资料,而且还应涵盖其原始文献的衍生物,亦即在此基础之上整理、研究形成的各种形式的成果。
e)稳定的带宽要求。
视频会议系统的拓扑如图3所示。
图3 视频会议系统拓扑示意
以上2 种应用对网络要求较高,因此传统电力行业广泛应用基于SDH 的网络技术承载,SDH 采用时分复用(time division multiplexing,TDM)的同步数字传输技术,为线路保护提供了高质量的通信服务。然而,TDM 系统缺乏灵活性,由网管统一配置,不支持业务通道智能多故障自愈保护,多业务传输场景无法有效利用带宽。因此本文提出采用基于端到端的确定性网络技术实现以上2种应用业务的承载方案。
3.2.1 总体思路
综合考虑确定性网络技术的成熟情况、适用情况及生态发展情况,端到端确定性方案选择了TSN 和FlexE 2 种确定性网络技术,结合IPv6+系列技术(SRv6、实时检测),形成跨局域网和广域网的端到端确定性方案,方案组网示意如图4所示。
图4 端到端确定性组网方案
端到端确定性组网方案的实现机制分为局域确定性网络方案、广域确定性网络方案和端到端确定性网络方案。
3.2.2 局域网确定性方案设计
3.2.2.1 局域网采用TSN交换机组网
时钟同步方案,采用精准时钟同步协议(PTP)(802.1AS 标准),使局域网内所有设备的调度周期和步调保持一致。
3.2.2.2 数据流分类方案
基于业务报文的vlan、源/目的MAC、报文优先级(802.1p)等字段,对确定性业务流进行分类,把指定的业务流绑定到确定性转发队列。
3.2.2.3 业务流转发路径
结合生成树算路(RSTP/MSTP)以及对交换机端口vlan 的控制,可以为确定性业务流创建确定性转发路径,满足带宽和时延的要求。
3.2.2.4 业务确定性指标保证
根据各业务包大小、发包频率、设备转发速率,设置TSN 门控队列开关时间,可在每一个转发周期内为确定性业务提供独享的转发队列和时长,确保报文有序、按时到达,满足时延和抖动的要求。
3.2.3 广域网确定性方案设计
广域网确定性方案设计主要包括如下几个方面。
a)FlexE 切片网络设计。为重要的业务创建FlexE网络切片,基于业务对带宽、网络可靠性等需求,划分切片网络、设定切片网络上每条链路的FlexE 带宽或时隙。
b)FlexE 切片网络IGP 路由设计。IGP 可采用ISIS 或者OSPF 协议,打通FlexE 设备间的loopback 路由,用于SDN管控设备及PE设备间建立BGP邻居。
c)确定性转发面设计。业务转发采用SRv6 隧道,经过的链路、节点是确定的,从而时延、抖动也是确定的。可通过SDN 控制器为确定性业务流计算多条SRv6等价路径,在链路故障时实现无差别的路径切换,时延、抖动在切换前后几乎保持一致。
d)业务控制面设计。采用BGP EVPN 作为统一的业务控制面板,支持L2 VPN、L3 VPN 控制面板的统一,简化网络协议。
3.2.4 端到端确定性实现
通过拼接确定性局域网与确定性广域网,实现端到端的确定性。
在局域网与广域网的拼接段采用直连的方式,拼接段的时延、抖动是确定的。
3.3.1 模拟差动保护业务测试
测试拓扑如图5所示。
图5 差动保护业务测试组网拓扑
测试步骤如下。
a)搭建测试组网环境。
b)在TSN 交换机上设置不同业务的优先级以及门控调度机制,BE流量设置最低优先级。
c)为被测业务流1、2 设置端到端的通路,业务流1 为高优先级业务,模拟差动保护业务流;业务流2 为普通BE 流量,模拟背景流/干扰流;业务流1 和业务流2 通过TSN 交换机不同的端口进行接入,通过同一条中继链路(trunk)转发;且在Flex E 中通过不同切片进行转发。
d)在PE1 和PE2 设备间配置FlexE 切片,该切片可能经过多个路由器。
e)数据网络分析仪向TSN 交换机1 的2 个千兆端口分别发送满带宽流量,业务流1和业务流2。
从测试结果来看,模拟差动保护业务流收发正常,数据网络分析仪观察到无丢包,业务流的时延、抖动都在预期范围内,符合电力行业对该业务的SLA 要求。
3.3.2 模拟视频会议业务测试
测试拓扑如图6所示。
图6 视频会议业务测试组网拓扑
测试步骤如下。
a)搭建测试组网环境。
b)在TSN 交换机上设置不同业务的优先级以及门控调度机制,BE流量设置最低优先级。
c)为视频业务流和背景流设置端到端的通路,视频业务流和背景流通过TSN 交换机不同的端口进行接入,通过同一条中继链路(trunk)转发,且在FlexE 中通过不同切片进行转发。
d)在PE1 和PE2 设备间配置FlexE 切片,该切片可能经过多个路由器。
e)数据网络分析仪向TSN 交换机1 的1 个千兆端口发送满带宽背景流量。
f)视频会议终端设置、测试仪配置及打流检测。
g)2 台视频会议终端配置好IP 地址,成功发起视频会议呼叫。
h)测试仪背景流/干扰流配置。
从测试结果来看,在网络未启用端到端确定性能力(TSN 局域网关闭802.1qbv,FlexE 广域网上所有流量共切片传输)的情况下,视频会议有明显的卡顿;网络启用端到端确定性能力后(在局域网为视频业务流设定门控调度队列、在广域网为视频业务流划分独立切片网络及指定转发路径),视频会议非常流畅无卡顿。
采用本文的确定性网络技术方案进行业务承载时,视频画面清晰流畅,可满足电力行业对于视频会议业务的要求。
确定性网络技术作为近年来网络研究的热点,无论从技术标准、技术实现还是产业生态都还不够完善和成熟,但是有越来越多的国内外企业、标准组织、产业联盟都已经看到了该技术的价值,也都在积极地进行确定性网络技术的研究和实践,在不久的将来,确定性网络技术一定会有更大的应用和发展,并更好地为包括电力行业在内的越来越多的应用提供精准确定的网络服务。