单祥茹
新冠疫情让很多行业处于停滞状态,然而有一个行业却迎来了发展的高光时刻,那就是视频直播。可以说,现在互联网流量中的大部分为视频流。来自Mhojhos Research的分析数据显示,全球视频流的市场规模在2019年约为426亿美元,预计2020年至2027年的复合年增长率将达到20.4%。其中,直播视频流约占市场的60%,预计到2026年,全球直播视频流总市值将达到940亿美元(如图2左图)。庞大的视频直播流量,对现有数据中心的处理能力带来巨大挑战。
赛灵思数据中心事业部视频产品营销总监Aaron Behman在最近的一场线上媒体活动上给出了这样一个示例,他说:“虎牙直播是一家美国上市公司,也是中国排名第一的游戏直播平台。在2019年第四季度,该公司带宽成本上升40%,达到3240万美元,其中的主要原因包括用户规模的增长,以及部分用户希望提高视频质量这一需求。对于虎牙直播这样的大型游戏直播平台而言,当前面临的最大挑战就是带宽,节省带宽就等于节省成本。”
上述示例告诉我们,最大限度地降低供应商的带宽和编码的比特率,将会为其带来巨大的成本节约。
视频直播领域的痛点
在找到有效地降低供应商运营成本解决方案之前,我们不妨先看一下视频直播平台内部的运转情况。来自Twitch发布的技术博文提出,在视频直播领域存在一个“普拉多原则”(图3左红色区域),即20%的视频流吸引了80%的观众。因此,这个领域的矛盾点在于,既要降低供应商的管理带宽成本还要实现更高的视频质量(VQ)。与之相对应的是图3 右蓝色区域,它包含了大量的直播视频流,但这些直播收视率较低,供应商必须要注意保持最低成本。目前的主要做法是,通过控制通道的数量并尽可能提高密度。综合来看,在视频直播领域,能够实现高密度转码是供应商当前面临的最大痛点。
赛灵思推出实时服务器参考架构应对视频转码最新需求
赛灵思CEO Victor Peng在两年前发布了数据中心优先战略,两年后赛灵思在市场中的表现如何呢?据赛灵思数据中心事业部中国区高级销售总监钟屹(William Zhong)介绍,2020年6月17日是赛灵思新财年的开始,在刚刚结束的2020财年第四季度(Q4FY20),公司的业务与上个财年同期相比增长了77%,在超大规模数据中心这一市场的增长幅度更是惊人。
随着视频流量呈指数级增长,数据中心服务器的架构优化成为重中之重。为此,赛灵思推出了实时服务器(RT Server)参考架构转码版。并且双管齐下,基于这个新型的参考架构,重点打造了两款视频实时转码一体机,以最低的成本和最高的机架密度提供业界最佳的视频质量,助力当今服务提供商以每通道最低成本提供视频质量和比特率优化的多种类型应用,例如电子竞技与游戏直播平台、社交与视频会议、远程直播教育、远程医疗和视频直播等,并较基于软件的架构或者固定架构解决方案,都能显著降低总拥有成本(TCO)。
Aaron Behman表示:“赛灵思实时视频一体机专门为边缘和本地计算密集型工作负载量身定制,该类型工作负载往往对视频通道密度、吞吐量和时延具有严格要求,新款一体机采用经过优化的硬件架构和软件,可提供业界最高通道密度和最低时延。此两款新设备为业界提供了集成不同赛灵思 Alveo数据中心加速器卡的两种预配置选项——高通道密度视频转码一体机和超低比特率视频转码一体机。”
视频实时转码一体机助力实现高品质低成本的视频直播
两款一体机之一的高通道密度视频实时转码一体机,专为实现每通道成本最小化而开发,可集成多达8张Alveo U30数据中心加速卡。新款Alveo U30加速卡可以满足外形小巧加速卡实现高密度视频处理的需求。Alveo U30基于功耗优化型的全可编程片上系统(SoC)Zynq UltraScale+ MPSoC,集成了用于超高清视频的视频编解码器和图形引擎。U30卡同时支持H.264和HEVC(H.265)编解码器,并且每卡能传输多达16个1080p30通道。
U30的优势主要体现在:首先,它是行业密度最高而且每通道成本最低的解决方案。其次,它是一个灵活应变的解决方案。由于它不适用任何FPGA的资源,所以它能够对于未来的各种用例和可能性都保持一个开放的架构,能够支持未来的工作负载,包括机器学习和人工智能。
另一款超低比特率优化的视频转码一体机,专为实现高质量直播视频而开发,有助于降低带宽成本。该机可搭载多达8张Alveo U50加速器卡。Alveo U50卡基于赛灵思 UltraScale+架构并采用高效的75瓦小型封装,内置8GB HBM2、100GbE网络和PCI Express 4.0。 Alveo U50支持多达7个全高清1080p60通道,另外还提供8个完整的ABR阶梯,全部采用x265中等预置。
這两款新型一体机均采用FFmpeg框架而构建,为系统开发者提供了通用的API,方便他们快速替换现有软件和基于GPGPU转码器基础设施。软件合作伙伴无需FPGA 经验,可专注于构建在标准FFmpeg层之上运行的应用。HEVC编解码器以组件化的方式从头开始重新构建,以便于提供更强的编解码器控制(低至帧级),支持系统集成商调整帧率控制,并精细调节其他参数以优化视频质量和比特率,从而适应特定的最终应用。自适应计算器件具备ASIC解决方案所无法比拟的独特的灵活性优势。两种新一体机都可以在1080p30分辨率和x264中级(Medium)预置条件下,将H.264 x264的成本、占板面积和功耗降低4倍。
赛灵思RT Server参考架构采用经过优化的硬件架构和软件协议栈构建而成,从门级(gate-level)到软件和AI堆栈,全面助力实现特定工作负载的性能最大化。这两款新型一体机均采用 1RU机柜安装规格,支持完整的Docker容器和Kubernetes管理功能,能够轻松实现扩展部署。
ISV合作伙伴计划有利于大规模商用部署
据Aaron Behman介绍,慧与公司(Hewlett Packard Enterprise, HPE)已在HPE ProLiant服务器上认证通过Alveo U50和Alveo U250加速器卡。HPE ProLiant DL380 Gen 10和HPE ProLiant DL385 Gen 10 Plus服务器是率先采用赛灵思FPGA的HPE服务器。HPE将成为首家提供基于Alveo U50的比特率优化型视频实时转码一体机一级服务器OEM厂商。Alveo卡通过HPE服务器的认证,意味着使用Alveo平台为云端和本地工作负载加速的OEM服务器合作伙伴和 ISV应用的数量的进一步的扩大。
赛灵思的另一增值经销商Wo w z a已将Wowza Streaming Engine媒体服务器集成到基于赛灵思RT Server参考架构的一体机中。这种基于网络的GUI应用,使得用户可以通过易用直观的方式对直播视频进行管理。该集成预计将在今年第三季度完成并提供。
赛灵思与AMD一直有着非常密切的合作关系,这次的RT Server主要基于AMD EPYC进行合作。那么,赛灵思本次推出的产品是否也可以加速英特尔服务器呢?Aaron Behman的回答是肯定的,基于英特尔芯片的Wistron Transformer G2E产品,就可以采用U30去加速。相对于GPU加速,赛灵思解决方案的最突出优势就是功耗低,据Aaron Behman介绍,总功耗只有英伟达解决方案的1/5。
赛灵思实时服务器,是一种新型一体机,专门针对目前市场上非常火爆的视频直播、视频流的转码,从功耗、成本、时延各个方面为视频直播市场带来一个前所未有的核心价值主张。