王斌 王旭东
【摘 要】近些您,随着社会发展,带动了我国科学技术的进步。现阶段,“新基建”带来数据中心发展的新契机,数据中心作为运营商打造云网一体化新型基础设施的重要组成部分,为5G+AI时代的新兴应用提供强大的技术底座。重点分析面向云网融合发展的数据中心网络的新需求,对超大规模组网、超低时延无损网络、业务端到端统一承载等关键技术进行探讨;最后,给出一种大规模云数据中心组网和承载方案,并对其中的关键技术领域进行验证。
【关键词】大规模数据中心;云网融合;无损网络
引言
随着我国互联网、物联网技术的高速发展,全新的工业大数据时代已然到来。这一新时代驱动着我国电力系统向着信息化、智能化方向不断迈进。作为电力系统关键参与者之一的水电站,其运行过程中产生了大量且种类繁多的设备运行、管理数据及生产数据,分析、挖掘此海量数据,结合数学模型、专家经验等,提取高层级分析、评价信息及决策支持信息,建设智能水电站,具有重大现实意义。本文正是基于此目的,分析我国水电站智能一体化数据平台实际应用的技术路线。
1阐释传统的数据中心网络的框架
当前阶段,我国传统的数据中心网络架构主要由分级互联架构和大二层架构组成。此架构是现阶段运用商使用的主要网络结构,可以实现IDC业务的对外销售及规模小的资源池等等。其中,分级互联架构就是传统的接入交换机、汇聚交换机及核心交换机组成。而汇聚交换机下面的网络是一个独立的分区网络,不同区域的网络要想互相访问就需要经过第三层的核心交换机才能实现。而核心交换机和汇聚交换机都是利用堆叠等虚拟技术来实现,进行保证业务安全可靠完成。DC内南北向流量可以提供互联网访问的功能,能够承载上百台服务器。
大二层架构主要是大数据、云计算等使用的一种网络架构,是指资源池化逻辑大二层网络架构。资源池被虚拟后,有些迁移需求就会让流量大量的增长。所以,为了满足需求,很多新网络技术就应运而生,他们都在数据中心组网旗下,有TRILL(多链接透明互联)和SPB(最短路径桥接)等。这些都可以借助路由来计算大二层组网计算,能够扩展虚拟局域网。随着科技的发展,虚拟化数据中心的规模也在持续增大,主要部署方案由VXLAN的大二层网络架构组成,其结构也近扁平化。这个架构能够承载上千台服务器,主要是融合资源虚拟化、存储网络及IP网络融合的资源池。随着科技的快速发展,其承载业务类型也在不断增加,传统数据中心网络也遇到了很多技术难点,需要在后续的探究下,不断地攻破。一是数据网络中心的业务需求更加丰富,带来了新的挑战,需要根据业务情况提供差异化的网络承载,不是以往以带宽这种核心驱动,因此,高效运营存在着技术挑战。二是对于选择关键技术和网络架构方面,规模的可拓展性方面弱。
2一体化平台的系统架构及技术特点分析
2.1报表服务、数据补召、断点续传、实时数据服务等都属于后台服务模块中的服务
每个服务模块依据数据存储模块存储的历史数据与运算模板,遵循设定好的数据关系算法运算出结果,并将运算结果保存到数据存储模块,方便客户端获取相应服务。实际上,客户端的服务模块就相当于三层数据平台结构当中对数据进行展示的一层,这一层当包含有对实时数据进行展示、对数据进行补召,对设备进行统计、对模式进行管理、对生产进行实时化检测、对数据进行自动化填报、对趋势进行分析等一系列功能。另外,客户端服务模块中对数据进行展示的那一部分将会在获取运算结果后,以比较多样化的方式彻底展示给用户。
2.2企业上云要求数据中心网络具备云网融合能力
云计算的发展加速了企业的数字化转型,企业上云是大势所趋。对于中小企业,不仅能减小成本投入,还能缩短业务上线周期。随着产业互联网的加速发展,政府、大中企业客户也成为云计算市场增长的主要拉动力量。对于政企大客户而言,更倾向于使用混合云成为上云的主要路径,一些敏感企业数据仍保留在私有云或者专属云中。目前,运营商纷纷开展云专网、云专线、SD-WAN等云网融合业务,加强云网基础设施统一规划建设。与大网协同,公有云、私有云、混合云等连接对数据中心网络提出了更高的要求。随着云计算应用及混合云、多云的普及,要求数据中心网络具备云网融合能力,能够简化管理、自动开通、灵活部署,满足云网融合业务“一点受理、自动开通、统一运维、自助随选”等新型业务需求。
2.3超大规模组网
云数据中心发展迅速,数据中心一般情况下要作为单一资源池,为十万台服务器服务。要满足超大规模组网的可靠性和扩展性,同时要考虑自动化管控、架构设计等。主要采用IP-CLOS架构、基于EBGP的大规模路由组织及“SDN+OpenStack”云网一体管控。
2.4AI等新兴技术应用对数据中心提出超低时延无损需求
随着深度学习算法的突破,人工智能技术发展步入了快车道。深度学习依赖海量的样本数据和强大的计算能力,也推动高性能分布式存储和高性能计算的发展。高效的AI训练需要非常高的网络吞吐来处理大量的数据,大量的数据将会在计算、存储节点之间传送。通常情况,在低于10%链路带宽利用率的低负载流量环境下,流量突发引起的网络的分组丢失率也接近1‰,而这1‰的分组丢失在AI运算系统中直接带来的算力损失接近50%。随着业务负载增加,数据中心分布式“多打一”流量逐步增多,网络分组丢失也越来越严重。分组丢失和时延引起的网络重传会进一步降低网络的吞吐量,使模型训练的效率大大下降,甚至导致训练的失败。
服务器技术的快速发展带动了数据中心计算、存储能力的飞速提高,随着存储介质读写速度和计算能力的提升,数据中心网络通信时延成为性能进一步提升的瓶颈。特别是面向HPC、分布式存儲、AI应用等新型业务场景,传统数据中心以太网架构因拥塞易出现分组丢失带来的网络传输瓶颈异常凸显。构建零分组丢失、超高吞吐、超低时延的无损网络,是未来数据中心网络的一大典型需求及特征。
结语
我们预测未来电力系统必将朝着智能化方向发展,建设智能水电站已成为水电行业迫切的现实需求,这是在技术进步和全世界分布式能源、新能源被发掘开采后的必然趋势。工业大数据时代的到来必将推动水电站智能一体化数据平台的建成,从而改变水电站各自动化系统间无直接交流的现状,避免沦为信息孤岛的情况,该平台将以其高效快捷的数据整合处理功能和开放自由的体系结构消除电厂之间的信息断层,实现信息共享。基于此数据平台,可提供给用户系统、全面的分析结果。通过本文的分析,为该平台的搭建提供了理论上的借鉴。
参考文献:
[1]王宇航,洪林.大数据时代智能一体化数据平台在水电行业的应用[J].水电厂自动化,2016(3):73-75+78.
[2]孙毅,蔡杰.智能水电厂一体化平台数据建模[J].水电厂自动化,2018,39(1):59-61.
[3]陈运清,雷波,解云鹏.面向云网一体的新型城域网演进探讨[J].中兴通讯技术,2019,25(2):2-8.
(作者单位:辽宁省信息中心)