郭涛
RDMA(远程直接内存访问)编程高手一展身手的机会又来了。5月3日,HPC Adisory Council(国际高性能计算咨询委员会)宣布,面向全球大学生的第五届RDMA编程挑战赛即日启动。
从2013年首次举办到现在,大赛已经连续第5年举办,吸引了越来越多来自全球高校的学生组队参加。从首届比赛的20余支参赛队到2016年超过百支队伍参赛,大赛在国内甚至全球范围内声誉日隆,受到了国内外相关领域的专家和企业的关注。
大赛发起人——HPC Adisory Council亚太区主席刘通介绍说:“在往届比赛中,作为颁奖嘉宾的国外知名大学的教授,在颁奖现场就直接向获奖的大学生发出邀请,希望他们能到国外继续深造。另外,一些获奖的学校还在大赛后接下了许多RDMA的编程项目”。
作为一种先进的网络数据传输方式,RDMA技术除了在高性能计算领域得到广泛应用以外,近几年还在人工智能、云计算、大数据和高频交易等领域引起强烈关注。与传统的网络相比,RDMA可以更加显著地提升应用的效率。因为它允许网络中的计算机直接从内存里交换数据,而不涉及任何一台计算机的处理器、高速缓存或操作系统。
在网络中,传统的TCP/IP的通信能力受到极大限制。而在高性能计算领域,RDMA一直倍受青睐。现在,随着云计算、大数据、人工智能的兴起,海量数据的处理、快速的网络传输已经成了用户的必然需求。RDMA的应用也从高性能计算领域逐渐向更多需要高速传输的领域拓展。刘通表示,如今,RDMA已经是一种在行业中普遍使用的标准化的技术,而不再是阳春白雪。NVIDIA的深度学习一体机支持RDMA,Mellanox可以提供支持RDMA的成熟网络设备,书生云超融合一体机未来的发展方向也是利用RDMA突破TCP/IP的瓶颈。
如今在中国十分火爆的人工智能、深度学习成了RDMA新的用武之地。为了追求更高的效率和传输性能,越来越多的人工智能、深度学习软件平台开始向RDMA移植。RDMA编程大赛也与时俱进,去年大赛的题目就是TensorFlow在RDMA上的优化。
TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习系统。TensorFlow是将复杂的数据结构传输至人工智能神经网中进行分析和处理的系统。TensorFlow可被用于语音识别或图像识别等多项机器深度学习领域。TensorFlow完全开源,任何人都可以使用。
今年,大赛将继续关注人工智能这一热点,将另一款有发展潜力的人工智能软件MXNET的RDMA优化作为题目。
刘通表示:“人工智能已呈现出强劲的发展势头,如何利用高性能计算推动人工智能的发展是近年来业界聚焦的热点。本届大赛的竞赛题目将紧贴世界超算产业的发展趋势,重点围绕人工智能、深度学习的理论框架、实践模型与未来发展趋势展开,强调赛题与实际应用相结合”。
本次大赛由HPC Adisory Council主办,获得了美国阿贡国家实验室、圣地亚哥超算中心、中国高性能计算专业委员会、China Grid等单位和组织的支持,京东、科大讯飞、旷视科技、Mellanox、NVIDIA、商汤科技等厂商也表示将为大赛提供各种支持。比如,京东承诺,将其自有的机器学习平台开放给参赛的学生使用。
大赛除了推动RDMA技术的开发和应用以外,还是一个选拔RDMA相关技术人才的重要平台和渠道,不仅为学生择业提供了帮助,也为企业培养和储备了大量专业人才。
有高性能计算领域的专家指出,多年以前,在大学时学习高性能计算、GPU等技术的学生毕业时很难找到对口的工作。但是现在情况已经改变,云计算、大数据、人工智能等领域的人才紧缺。RDMA编程大赛可以发现和输出更多相关的专业人才。
来自阿里的专家表示,人工智能的发展需要具有综合素质的专业人才,他们不仅要了解深度学习的框架,以及建模和训练,更要掌握相关领域的基础知识,包括计算、存储、网络、算法等,要深入本质,而不要浮于表面。
本次大赛从即日启动,10月举行颁奖典礼,历时5个月左右。为了鼓励参赛选手,本次大赛还增设了特等奖一名,资金为5万元。大賽主办方希望今年有更多院校参赛,不断提升大赛的影响力。