特约通讯员 周 祺
人工智能芯片让手机看懂图片
特约通讯员 周 祺
专门设计用来运行复杂神经网络的芯片可能会让个人设备学会感知世界
“深度学习”这一强力人工智能方式未来将可能应用在智能手机上。
来自普渡大学(Purdue University)的研究人员正在努力将一种芯片的设计进行商业化,使手机处理器能够利用名为“深度学习”的人工智能方式。尽管深度学习所展现出的力量激发了包括谷歌、Facebook、百度在内的公司对该技术进行投资,但到目前为止,对深度学习的应用还仅限于高性能大型计算机集群。谷歌开发出软件能够学习识别Youtube视频中的小猫,实验中需要16000个处理器。
普渡大学教授欧金尼奥•库洛切罗(Eugenio Culurciello)表示,用更加小巧和节能的方式实现深度学习,可能导致能够理解图片和视频内容的智能手机和其它移动设备的出现。库洛切罗正从事该项目的研究。在去年12月于内华达召开的神经信息处理系统大会(Neural Information Processing Systems conference)上,普渡大学的研究团队在展示中将一个协处理器连接至传统的智能手机处理器上,可以让手机运行深度学习的软件。软件能够探测到人脸和街景中的标签部分。协处理器的设计在现场可编程门阵列(FPGA)上测试,FPGA是一种可编程、可重构的芯片,可用来测试新硬件的设计,而无需投入大量成本来制造全新的芯片。
普渡大学的原型远没有谷歌的小猫识别系统那么强大,但却显示出了新型硬件如何让深度学习更广泛的应用成为可能。“人们需要这种应用。”库洛切罗说。“可能你会有几千张看都不会再看的图片,而我们现在并没有合适的技术来处理所有这些内容。”
库洛切罗说,像谷歌眼镜这样的设备同样可能从这一技术中获益,得以理解其捕捉到的大量图片。一个人的图片和视频可能使用文字也能搜索得到,比如“红色的车”或者“晴天和妈妈在一起”。同样地,新型应用也可能会在其识别到特定的人、物体或场景时做出反应。
深度学习软件的工作原理是,通过一个分级式的多层虚拟神经网络来过滤数据,单个神经的结构很简单,但彼此连在一起就能表现复杂的行为。用计算机不足以运行这些网络,因为它们和传统软件有很大的不同。
普渡大学开发的协处理器专门设计用来运行多层神经网络,并将其用于处理连续的影像流。在测试中,面对同样的任务,原型机的工作效率是图形处理器的15倍。而且库洛切罗认为,对该系统的改进可以将工作效率提升至现在的10倍。
纳拉扬•斯里尼瓦萨(Narayan Srinivasa)是HRL实验室神经与应急系统研究中心主任,该实验室由波音公司和通用汽车公司共同所有。他说,使用协处理器来提高深度学习网络的效率是有道理的。因为在传统的计算机中,处理器和内存是彼此独立的硬件。相比之下,深度学习型神经网络和真正的神经网络在运行时,处理和记忆是彼此交织的。纳拉扬的研究集中于用更极端的方式来处理这个问题:用硅质神经和突触设计芯片来模拟真正的大脑。
普渡大学研究团队的解决方案没有体现出这种对计算机芯片工作原理的根本上的重构。这可能限制他们的设计成果对神经网络的运行效率,但也可能让其更容易在现实世界中应用。库洛切罗创立了一家名为TeraDeep的公司,将芯片的设计推向商业化。
库洛切罗说:“我们想把这种网络协议出售来实现商业化,这样,像高通、三星和苹果等大型制造商可以给他们的处理器加上这个功能,这样就能处理图片了。”纽约大学从事深度学习研究的先锋人物雅恩•勒坎(Yann Le Cun)出任TeraDeep的顾问,他最近刚开始领导Facebook的深度学习研究部门。
(来源:MIT Technology Review)