王莹
编者按:2017年6月,恩智浦第一次向媒体披露了融合MCU和应用处理器的跨界处理器——i.MX RT。在此后的12个月里,该产品有了很大发展,已与2500个客户合作开发项目,在中国有四个主要的大客户进入量产。今年,恩智浦还将宣布一款全Linux处理器--i. MX 6ULZ。那么,恩智浦开发新处理的思路是什么?
RT的发展计划
iMX RT家族于2017年6月问世,第一款产品是RT1050,主频600 MHz。RT1050有两个卖点,第一是它的性能,2017年发布时,宣称比最近的竞争对手还要多至少50%。另外价格也有优势。
2018年6月又宣布带来三款新品:RT1060,是RT1050的增强版,配置和性能都有进一步提高:RT1050的新封装是主要针对中国客户的大封装,可以降低PCB(印制电路板)的成本;RT1020价格会比RT1050再低30%,起价是2.18美元(注:1万片起),基于M7核,主频528 MHz,有加密、通信串口等。
未来还会推出更多的产品,例如今年底会推出RT系列的DSP芯片,可用于语音、人工智能、机器学习等的硬件加速。另外是加强连接款产品。还将推出RT和闪存封装在一起的芯片。还有RT1010,比1050便宜将近一半。
全Linux处理器
除了RT系列跨界处理器,在应用处理器方面,恩智浦2018年还针对中国市场推出高性价比的Linux处理器——i.MX 6ULZ,起价1.99美元,特点是全Linux,不是简化版本的,恩智浦提供全套的外设,包括高速USB、加密、高速处理器等。这是在此前的i.MX 6UIL产品之后的产品。
熱门问题
问:为什么恩智浦对RT很感兴趣?
答:因为仅做微控制器的厂商全世界大概有50家,每一家每年都出很多新产品,而且每家都做了二十几年,因此每天都会有新芯片诞生。那么,为什么每年还需要这么多新产品?因为MCU(微控制器)的应用太广泛了,每过几年就有一些新挑战,因此就会有一些新突破。因为顾客给你的压力是不同的,有些是价格,有些是功能,有些是性能,像Al、机器学习、深度学习等挑战。所以像我们做微控制器这么久,还是有很多新的地方可以去学习,这是非常特别的一个地方。
问:其他友商是不是也很容易往这个方向走呢?
答:市场上一看RT这么流行,大家也许会来跟随。所以对我们来说,不仅是把这个概念弄出来就可以,因为我们知道别人很快会学会,会继续有新的、不同的功能加进来。
其他对手可以学,但是对他们来讲是有一定难度的。因为RT不仅仅是把FlasH拿掉,它的架构、CacHe等整套系统是利用我们这么多年的经验,在MCU和MPU上面一时半会不容易学到这样的架构设计。
在研发过程中,我们跟很多顾客密切的合作:我们这样做,客户第一个想法是我这FlasH怎么办?我们向他们解释是否安全,性能是多少,每次都是价格最后谈,给客户的价钱他们不敢相信。所以我们有了这个经验以后就知道,应该会有一个这样的产品。而且我们已经卖LPC很多年,曾给苹果iPHone 1等很多美国消费类产品做过无FlasH的MCU,因此有很多经验。
问:RT为何很流行7
答:因为恩智浦LPC系列做无FlasH的微控制器已经很多年,已出售了很多这类产品。另外,我们既做MCU又做应用处理器,这样的企业在世界上没有几家。RT系列也称为跨界处理器,它的定位处于处理器和控制器之间,是把一个应用处理器的产品拿出来,把微控制器的核放进去。因为我们已经在LPC方面做了很多年的无FlasH产品,我们知道这里有什么挑战,有些什么困难一定要克服。第一就是运行内存(RAM)要大,第二是要安全,要求顾客把Flash拿在外面,一定要能加密,而且加密速度不能慢。所以我们得有一个突破,就是要很快把所有东西放进内存,让它去跑,还可以有一个Executional place(执行场所),很安全,这里有加密。这样顾客就无需考虑要不要有Flash。因为FlasH集成进芯片很贵,这是因为Flash要很多层,而逻辑制程(Logic process)不需要那么多层。这也是为什么RT系列与友商的商品相比价格差别较大。FlasH非常贵,现在大概加4M要几元钱,可是你买一个四串行外围接口FlasH (Quad SPI FlasH),在国内大概是0.12~0.15美元。
另外一个RT成功之处在于用微控制器的工程师过去几年压力很大,因为总是要加进不同的功能,其实非常困难。因为MCU的性能再加上FlasH,最高是400 MHz主频,可是要做这么多功能/性能,400 MHz足够吗?工程师有点担心,认为以后如果营销部门再继续要求,他们就得去学Linux、安卓。所以恩智浦的RT系列推出以后,从400 MHz提高到600 MHz。2019年将会出1 GHz的产品。工程师为此很高兴,因为无需应用处理器,价钱又低。
问:RT的推出,对MCU和MPU两个产品线会受影响吗?
答:现在我们MCU和应用处理器这两块传统领域都比市场成长快,RT成长更快。因此这三个种类都在成长。问:现在中国有四大客户已经量产RT系列了,他们量产的是什么产品?
答:主要是消费类电子,像家用的智能盒子,包括类似游戏机的遥控器,还有家电的控制界面,例如声控产品等。
因为在声音方面,RT有足够的能力可以把这些算法运行在本地,做语音识别和语音处理,包括一部分DSP(数字信号处理)的功能。
问:科大讯飞等本土公司也专门做语音芯片,你们的芯片也有语音识别功能,你们跟科大讯飞等是合作关系还是竞争关系?
答:合作关系。科大讯飞有自己语音的算法,已经把算法移植到i.MX RT,包括LPC里。具体地,科大讯飞的芯片是专用语音处理芯片。但是如果把算法移植到RT上,RT可以作为系统级的解决方案,而不仅仅是语音的解决方案,还包括网络连接、安全、云的处理等都可以实现。
在中国市场上,像科大讯飞、Rokid(若琪)都是比较领先的。我们也与R。kid合作,其算法可以移植到RT上来,做语音的识别。还有很多其他的语音和图形公司来找到RT,因为他们看到RT的性能非常好,对语音和图形都有很好的处理效果。
在图形方面,RT有2D图形加速器和LCD接口,这样对整个图形的显示都非常炫,会把图形的算法也植入进来。
问:你们是否会把GPU功能也移植进来?
答:在GPU方面,RT将来会有更高性能的一款产品出来。201 9年可以介绍一些更多东西,像DSP。因为M7去做这些事情的话,也可以做,但也许会比较耗电,或时间长一点,所以一些地方需要有专门的DSP。
实际上,RT是一个平台,有了这个平台以后,可以增加DSP的功能,也可以增加GPU等功能。这也是为什么RT这个平台对我们特别重要。如果没有一个平台,很难去增加其它东西:有一个很好的平台,有很多合作伙伴,尤其在国内有很多新公司,能够做算法等特别厉害的地方,我们就跟他合作。我们最主要是要把平台做好。
问:RT的RAM有多大呢?
答:RT1060有1MB RAM。很多顾客跟我们合作,是买一个RT1050,里面嵌入式RAM只有半兆B RAM,可是它旁边摆一个4MB的Q SPI FlasH,非常便宜,只有0.12~0.15美元。
上面所谈的4MB FlasH过去通常是嵌入式Flash,实际上,现在RT的概念是不需要这种嵌入式FlasH,把它放到外面,你在外面买一个4MB的FlasH是非常便宜的,但是你把4MB的FlasH放在MCU芯片里是非常贵的。
而且我们还有另外一种方法,只要买一颗的话没有问题,我们以后会把这个Q SPI Flash与RT放在一个封装里,所以价格还是特别低。
降低功耗与高性能兼顾
问:如何降低功耗?
答:主要是三部分,第一是我们选择的工艺,第二是我们会选择合适的IP,第三是选择比较适合的架构。
做起来有很多挑战,例如架构方面,不是一定要选Al0、A15就是最好的,在7ULP中,我们选了A7核和M4核,这样可以在性能和功耗之间有很好的权衡。再有,IP很不容易做,因为要在A7不需要的时候关掉,可是如果突然需要了,又要很快把A7激活。所以恩智浦今后会有更多一大一小核这类产品出来,7ULP中,A7是大核,M4是小核。
问: “大小核”架Jt向是怎么想到的呢?
答:我们做“大小核”的概念已经很久了,之前有一个产品是M3+ MO核,这次是我们第一次尝试“A+M”核。原来市场上没有这种产品,我们认为这应该很好。之所以有这款产品,因为从1999年开始,我们就试着尝试很多新东西。所以我们很早以前把M3和MO做在一起,M4和MO做在一起,刚开始顾客拿了以后不知做什么、怎么用、为什么摆一起,我们也不太晓得,但我们认为应该会有人去用。现在很多顾客用M4+MO。所以我们始终是对这个“大小”很有兴趣,恩智浦与飞思卡尔合并后,认为这种“大小”很好,干脆把A跟M加在一起,会怎么样?所以这都是一步步学习、改良而来的,并不是说哪天突然讲这两个加起来,因为突然加起来以后,我们绝对不晓得困难在哪里。例如A7与M4的操作系统就很复杂,因为是Linux与FreeRTOS的結合。
例如像ULP有一个A7和一个M4,每一个怎样去支持,仅这个就很难因为Linux、安卓都有。
另外当时这个想法出来以后唯一缺的是制程,因恩智浦的FD-SOI还没做完,FD-SOI工艺一出来我们就开始做。
问:什么时候用两个OS?
答:7ULP之所以达到非常低的功耗,因为可以关掉一个核。因此顾客需要两个核同时在跑,A7是Linux,M4是FreeRTOS。以手表为例,有些处理需要用Linux处理,例如图形界面;M4可以做一些连接,或者功能上的处理,例如连一些传感器。所以整个系统有专用的一个个区域,使整个系统的能效、功能更加优化。
我们会跟客户一起合作,让顾客了解我们设计的能力和特点。例如,我们内部有一些图形加速器,包括2D和3D的硬件,有的方式执行效率更高,速度更快,功耗会更省。具体地,即使是GPU,画同样一个东西,画的方法不同,所用的电量也不一样。例如只需要旋转90°,2D GPU就可以做,而且很省电;可是如果不是90°,3D GPU比较适合。