刘骏
当前各行业的领军企业都在进行数字化转型,希望在转型过程中构建全新竞争力,云计算、大数据和人工智能成为核心支撑技术,越来越多的企业希望利用AI助力决策、重塑商业模式与生态系统来重建客户体验。
近日,“网络新引擎AI赢未来”为主题的华为网络春季新品发布会在北京召开。会上,华为网络产品线总裁胡克文发布了业界首款面向AI时代的数据中心交换机CloudEngine 16800,这也是自2012年发布CloudEngine 12800之后的大更新。
拥抱AI时代 实现网络重构大升级
从整个AI发展历程来看,当前正处于弱人工智能阶段(机器学习),但企业在AI方面投入连年增长,这是因为看到了AI潜力巨大、未来的应用场景十分广泛,不仅可以整合到应用中,还可以用于数据增强分析。数据是AI成功落地的关键,IT基础设施是支持数据的核心点,因此AI需求变化将影响存储、计算和网络等产品发展方向。
“Gartner认为AI驱动数据中心网络变革即将开始。”Gartner研究总监陈勇在分享中讲到。同时他给了两方面支撑点,一方面,AI业务运行对网络交换机提出了新诉求;另一方面,AI驱动网络部署运维的重构。
对于数据中心网络真实需求到底是怎样?平安科技网络产品团队总监丘子隽作为企业客户代表进行了分享,随着数字化转型的推进,平安科技在网络方面同样面临着挑战,一方面数据中心中接入交换机的接口逐渐升级到25G,AI驱动服务器端口迈向更大带宽和更高吞吐,而分布式存储也提出了低时延、零丢包要求;另一方面,传统网络问题只能靠人工判断,难以保障100%不出错误,而借助大数据、AI使能的智能运维,不仅能够快速解决网络故障,而且能够驱动数据中心从自动化走向网络自治。
极速前进 华为主动出击探索网络新商机
“我们虽然起步晚一点,2012年才起步,但是在过去的6年里,我们增长是最快的,以82%的复合增长率连续6年增速全球第一,已經在全球6400多个企业成功商用部署。”华为网络产品线总裁胡克文说道。
在云计算时代,华为凭借CloudEngine 12800在数据中心网络领域打出一片天地,当下我们正进入一个万物感知、万物互联和万物智能的智能世界,数据中心从云时代向AI时代演进成为必然。
于此同时,我们也清楚看到,AI算力深受数据中心网络性能的影响,成为AI商用进程的关键瓶颈,当前传统以太网1/1000的丢包率,将导致数据中心的AI算力只能发挥50%;同时,在数字化转型提速驱动下数据量暴增,预计全球每年新增数据量从2018年的10 ZB猛增到2025年180 ZB(即1800亿TB),现有100 GE为主的数据中心网络已无法支撑数据洪水的挑战。随着数据中心服务器规模的增加,以及计算网络、存储网络和数据网络深度融合,传统人工运维手段已难以为继,亟需引入创新的技术提升智能化运维的能力。
在此时机,华为轮值董事长徐直军发布人工智能发展战略,那么AI时代的数据中心交换机需要哪些特征?在本次发布会上,胡克文给出了答案,他指出,“AI时代的数据中心交换机具有3大特征:内嵌AI芯片、单槽48×400 GE以及向自动驾驶网络演进的能力。”
内嵌AI芯片 真正实现0丢包100%发挥AI算力
华为CloudEngine 16800是业界首款搭载了高性能AI芯片的数据中心交换机,第一次为交换机装上智能引擎,胡克文强调“AI芯片非常难,但是因为难,才有价值,所以我们坚决把它进行突破。”
华为独创的iLossless智能无损交换算法,能够对全网流量进行实时的学习训练,并根据不同业务流量模型的特点动态设置最优的网络参数,更精准地控制流量,实现百万流和基于应用的队列自适应,能使不同场景的全局网络自动优化,保证数据中心网络在传输无丢包基础上达到最高的吞吐量,这样的智能无损数据中心网络克服了传统以太网丢包导致的算力损失,将AI算力从50%提升到100%,数据存储IOPS(Input/Output Operations Per Second)性能提升30%。
满足超宽需求 单槽位48×400GE整机768X400GE
华为CloudEngine 16800全面升级了硬件交换平台,在正交架构基础上,突破超高速信号传输、高效供电和超强散热等多项技术难题。具体而言,为了实现超高速互联,华为采用新型亚微米无损材料及高分子键合技术的制作工艺,将电信号的传输效率提升30%,满足100~400 G全生命周期兼容和能力演进;在高效供电方面,华为采用磁吹灭弧和大励磁技术实现毫秒级快速切换,21个电源模块就可以实现原来40个模块所达到的供电能力和可靠性,电源空间节省50%。线路板上采用矩阵磁和高频磁技术,使得单位空间的供电效率提升90%。
华为CloudEngine 16800作为一款超高密度的产品,散热也成为重要指标。华为不仅采用独有的碳纳米导热垫和VC相变散热技术,还采用了业界首创的混流风扇,单比特功耗下降50%,更绿色节能。
华为CloudEngjne 16800单槽位可提供业界最高密度48端口400 GE线卡,单机提供业界最大的768端口400GE交换容量,交换能力高达业界平均水平的5倍,满足AI时代流量倍增的需求。
使自动驾驶网络秒级故障识别、分钟级故障自动定位
自动驾驶网络需要有三大要素,第一个是AI算法,华为拥有20+iNetOps智能运维算法,可以识别出多种组网模式;第二个是Telemetry,通过数据能够让算法毫秒级判断故障;第三是“边缘AI”,即设备级的智能化水平,使交换机具备60%故障推理和本地执行能力,再加上意图和自动化能力,使得自动驾驶网络加速到来。
iNetOps智能运维算法 构建核心竞争力
华为iNetOps智能运维算法,支持72大类典型故障,可实现秒级故障原因分析、分钟级故障自动定位,故障自动定位率达到了90%,未来华为将继续深挖KPI动态基线、故障识别及根因分析等算法。
此时,华为率先发布面向AI时代的数据中心交换机CloudEngine 16800,不仅第一次让交换机拥有AI大脑,而且也是践行华为公司整体AI发展战略,同时也成为了华为全栈全场景AI解决方案的一个重要组成部分,相信华为能够引领城数据中心网络全面进入AI时代。