本刊记者 薛士然
开发视觉导向机器学习应用,80%的工作可以扔给Xilinx了!
本刊记者 薛士然
谷歌宣布开源TensorFlow,微软开源了CNTK,百度宣布推出PaddlePaddle,亚马逊宣布会采用MXNet作为AWS的机器学习平台,而Facebook则同时支持两个深度学习框架(Torch和Caffe)。2016年是机器学习大热的一年,这种热度在2017年依然会持续。当业内还在探讨机器学习的时候,FPGA界的翘首Xilinx早已准备好了开发工具!
近日,Xilinx公司推出了 reVISION堆栈,借此也将Xilinx技术扩展至前景无限的视觉导向机器学习应用领域。Xilinx战略与营销高级副总裁Steve Glaser表示:有了reVISION堆栈以后,Xilinx能够完成开发机器学习解决方案当中80%的工作,客户只需要做完剩下的20%,就可以实现自己的应用,让不懂得硬件设计的人也能够享受到全可编程的优势。
大约在一年半之前,Xilinx推出了首个软件定义的编程环境,即SDSoC,主要针对Xilinx全可编程Zynq SoC芯片的用户,致力于让嵌入式应用领域大批不熟悉硬件编程的软件及系统工程师也能获益于这一软硬皆可编程的可扩展SoC 平台。虽然这一新的软件定义设计环境帮助客户提高了产率,但是并没有满足客户的预期,客户希望能够提供符合行业标准的库和框架,帮助他们缩短开发时间。
通过反复与客户沟通,Xilinx了解到他们目前的具体需求:第一,客户希望提高机器学习的智能性,并且系统要及时快速响应一切外部事件;第二,客户希望能够以非常高的效率使用非常先进的算法来运行智能化应用,而且成本和功耗都要非常低;第三,神经网络和算法都在不停变化,而且传感器的类型配置和组合也在不断变化,因此客户希望他们的系统能够非常便捷地实现升级,而且在万物互联的物联网世界,机器需要互联,甚至还要实现与云的连接。
针对这些细化的需求,Xilinx推出了reVISION的堆栈,完成了设计所需要的80%的工作,工程师只需要完成剩余的20%,大大缩短了开发周期,在此之前这个数字可是反过来的。不仅如此,reVISION堆栈还能够服务没有掌握硬件方面专业知识的工程师,帮助他们使用Xilinx技术轻松、快速地开发视觉导向的智能系统。
Steve补充道,如果使机器学习在80%到90%的应用中都得到使用,需要非常专业的具有硬件知识的工程师,但事实上很多公司都缺乏这方面的硬件人才,所以他们希望既能享受到硬件编程的优势, 又能够使用自己熟悉的软件编程的模式来满足新技术提出的性能要求,而reVISION恰好弱化了对于硬件知识的依赖。
据介绍,与同类产品相比(这里以英伟达的Tegra为例),reVISION机器学习效率提升了6倍,在计算机视觉领域的优势更加明显,达到40倍以上。在实时快速响应的系统当中,最重要的参数是时延,与其他同类竞争产品相比,reVISION的时延仅仅是同类产品的1/5。
除了在响应时间方面的巨大优势外,reVISION解决方案在可重配置性和可编程性方面也具有极大优势,其既支持硬件可重配置和可编程,也支持软件的可重配置和可编程。对于下一代机器学习来说,可重配置性至关重要,因为只有具有可重配置性,才能够持续升级到最新、最好的机器学习技术。
reVISION堆栈包括平台、算法和应用开发所需的丰富的开发资源,可支持流行的神经网络,包括AlexNet、GoogLeNet、SqueezeNet、SSD和FCN。此外,该堆栈还提供了库元素,包括CNN网络层的预定义的优化型实现方案,这也是构建定制神经网络所必需的。机器学习元素配合丰富的满足加速要求的OpenCV系列功能用于计算机视觉处理。对应用层开发来说,Xilinx支持业界标准的框架,包括用于机器学习的Caffe和用于计算机视觉的OpenVX。reVISION堆栈还包括Xilinx及第三方提供的开发平台,诸如各种类型的传感器。
Steve强调,reVISION消除了向广泛视觉导向机器学习应用扩展的障碍,而且加上可重配置加速堆栈,reVISION扩大了机器学习应用直接从端到云的开发和部署。
reVISION的使命就是要将原来各个分散的嵌入式视觉系统进化为视觉导向的自主系统,例如工厂机器人成为视觉引导的协作机器人,装备摄像头飞行器成为“感应与躲避”和可以自动驾驶的无人机,物理显示和HMI成为增强现实和抬头显示器,前视汽车摄像头成为无人驾驶汽车,视频安全摄像头成为自动监控系统,医学成像与人眼应用成为自动医疗诊断系统。reVISION的推出,铺平了机器学习广泛应用的道路, 智能时代将加速到来!