德州仪器(TI)医学成像应用经理 Dev Pradhan
不断攀高的医疗费用受到人们前所未有的关注,而医学成像处理器技术的发展给人们带来一丝希望。特别是对于更为便携、低功耗、高性价比和高成像质量的医学成像系统的需求,多处理引擎(每个引擎专用于其最适合的任务)系统的出现正逢其时。
基于一个硬连线、不可编程处理器或者一个专用图形处理器的成像系统,无法满足下一代便携式医学成像设备对灵活性、可扩展性以及功率效率的要求。相反,多核数字信号处理器(DSP),不管是具有 DSP内核和通用处理器(GPP)的异构片上系统,还是使用多个类似 DSP内核的同质片上系统,均是一种两全其美的方法,并能够克服医学成像面临的诸多挑战。新兴的医学成像系统反过来又会产生新的诊断方法和治疗方法,最终不断提高医疗保健的服务质量。
医疗保健正处于快速发展之中,而基于多核DSP的成像系统可有效地推动这种发展。
过去,由于成本和规模问题,高级医疗诊断系统的使用大多集中在人口密集的城市地区,因为这些地区拥有专业诊断医生以及技术人员。而嵌入式处理器技术方面的进展,让高质量和功能强大的医学成像系统变得更加便携并且具有更高性价比。如果偏远地区的小诊所里也配有高级医学成像设备,当地技术人员可以把诊断图像传送给城市医疗中心,由这些中心的专家给出诊断建议和实时远程支持,则可直接将医疗诊断服务带给偏远地区的患者,而不是将生命垂危的患者运送到某个医疗成像机构。
处理器能力的提高,在医疗领域引发了许多讨论。在一些情况下,这些问题看似相互矛盾。例如,许多医学专家呼吁提高成像质量的同时,又要求减少人体在来自于X光和核成像技术的有害辐射环境下暴露的时间。过去,只能通过增加辐射或者利用一些侵入性技术才能提高成像质量。
多核DSP成像系统的使用则提供了另一种替代方案。利用多核DSP,一些创新型高效成像增强技术(如边缘检测、对比增强、噪声过滤等)可以轻松地编程至一颗或者多颗DSP内核中,从而在不增加辐射水平甚至帮助降低患者辐射暴露的情况下,提高成像质量。
多核DSP强大的实时处理能力促进了诊断和治疗方法的创新。通过多核DSP的简单编程,可以更快地完成研究实验,并可开发和优化新的实时成像处理技术。例如,研究人员正在探讨如何应用超声波来无创检测甲状腺癌、烧灼创口、杀死小肿瘤。光学相干断层成像术(OCT)领域正在研究使用光波来进行各种诊断,包括耳部感染检测和一些更为复杂的诊断(如通过描述眼睛对糖尿病进行早期检测等)。这些传统成像技术的新应用,让其迅速转向真正的多核DSP产品。
今天的多核DSP通过降低功耗以及使用更小的体积,实现了高水平的系统集成。这就意味着,电路板上的处理器更少、电源更小、冷却要求更低,并且总系统成本更低。它让全世界更多的人受益于医疗保健,手术室、急诊室和救护车里可以配置更多的高级医疗设备,或许在某一天,这些设备甚至会出现在家庭中。
如图1所示,典型的医学成像处理链可以分为3个主要阶段:图像获取、图像调试和图像显示。
图1 典型超声波信号处理路径
同质多核DSP可提供计算密集型应用所需的处理能力,特别在图像获取后和图像显示前进行的图像调节和重建中。异构多核片上系统可分离GPP内核和DSP内核之间的系统管理/用户互动和图像显示准备功能。
所有5种不同类型的模拟波形(声音、光线、无线电、X光和核能)都已被用于医学成像系统中。成像系统接收模拟波,将其转换为数字信号,然后使用一套预定义前端处理参数和算法,基于事先确定的人体部位对原始数字数据进行解释。例如,心脏超声波设备具有一套与心脏和胸腔有关的前端参数,而OB/GYN超声波设备则使用参数和算法获取子宫胎儿的原始数据。
一般而言,图像获取面临的挑战是如何实时管理和处理大量的图像数据。为了满足这些需求,这一代多核DSP拥有几个高带宽I/O选项 (与智能DMA引擎一起使用),可以无缝地将来自模拟前端的图像数据存入片上或者片下内存进行处理。共用内存构架允许多颗内核对图像不同部分进行并行操作,或者对图像数据的相同部分按顺序执行不同的处理功能。这让设计团队可以灵活地搭建系统,并让使用相同图像获取系统完成多个成像应用变得更容易。
获取图像数据后,必须将之重建为一个或者多个可视图像。除此之外,成像系统还要对图像进行增强处理,以提高其清晰度。在以前的医学成像系统中,图像获取过程的质量是重建图像质量的一个限制因素。然而现在,高级信号调节算法可以过滤外来噪声和其他异常情况,从而增强显示受检查的人体组织和其他相关结构,帮助弥补这些局限性。实时完成这些信号调节算法,是DSP的真正优势所在。
在医学成像系统中,图像重建通常是最大的瓶颈。例如,典型的CT扫描要获取检查部位的许多切片图像,然后提交给系统,通过这些切片图像重建一幅合成图像。多核DSP通过让多颗DSP内核并行执行图像重建任务,大大缩短了图像重建所需的时间,从而打破了这种瓶颈限制。
多核DSP还赋予了系统可扩展性,可以在不影响图像处理和显示时间的情况下,将处理任务分配给多颗同类内核,从而或多或少地改进现有图像增强技术。
除此以外,当出现更新、更先进的成像增强算法时,DSP内核的可编程属性使其更容易获得升级,从而让设备可以在现有硬件平台通过软件升级。
医学成像系统的后端处理包括实际用户图像报告以及系统所有的操作员界面要求。由一颗GPP内核和DSP内核组成的多核异构处理器可相互协作,以提供不同功能所需的相应处理能力。图像在屏幕上显示之前,DSP内核可实现许多功能,如数据添写、量值估计、日志压缩、扫描转换等。
与此同时,GPP内核(如 ARM产品)可提供与 PC处理器等价的功能,但功耗却低得多。嵌入式ARM内核的平均功耗小于2 W,而大多数PC处理器的功耗均大于50 W或60 W。对于功耗和温度敏感的医学成像系统而言,节能是一个基本要求。GPP内核还可以运行拥有丰富功能的操作系统,例如Linux或者Windows CE等,它们构成系统操作员界面的基础,并让系统设计人员能够轻松地开发出差异化创新功能。
今天的多核DSP都是一些具有丰富功能的片上系统,片上已经集成了许多外围器件。这些外围器件通常包括以太网接口、存储器件、高清显示和其他连接。通过把这些外围接口的控制芯片集成到一个多核片上系统,可以同时减少系统的空间使用和成本。便携式医学成像系统有一些特殊的限制。
顾名思义,便携式系统体积要小。这样,实际部件(旋钮、开关和其他控制装置)通常受到限制。可编程多核片上系统允许系统开发人员使用智能控制进行设计,将操作员从设置大量成像和测量参数的工作中解脱出来。
例如,心脏诊断时只需进行一次选择设置,超声波成像系统便会自动加载参数、算法和其他处理资源,实现具体的成像应用。系统会捕捉和显示血流速度和动力的测量结果。这种自动化还让高级医疗成像系统可以部署在偏远的地区。这些地方的诊所里,专家技术人员很少。偏远诊所的技术人员可以利用这种智能系统获取图像和检查结果,然后将其发送给诊断专家。
开发任何精密、复杂的嵌入式系统(如医学成像系统),都会给设计团队带来许多挑战。一般而言,所有嵌入式系统都必须在严格控制功耗预算和体积的同时满足一些关键的性能需求。对现货硬件进行用户定制(通常不可避免),存在成本限制。由于可视程度有限,硬件和软件调试及测试常常很困难。
在多核处理器解决方案中资源更多,特别是有一些特殊功能,可以帮助缓解嵌入式系统设计面临的一些挑战。但也存在其他一些复杂性,例如内核间的负载平衡、内核间通信和共用资源管理等。德州仪器拥有超过10年的开发经验,提供开发与调试工具和软件构架,它们可以简化多核处理器与嵌入式系统的集成,特别是医学成像系统。
为了实现最佳性能,设计人员需要谨慎地划分任务,这样内核操作可实现对其他内核的最低依赖度。这种处理工作所要求的数据应存储于本地内存中,并以一种全局方式 (即所有内核之间)管理共享资源的使用。如果处理得当,使用多核处理器的系统相比使用多个离散处理器的系统将拥有巨大的优势。如数据访问更迅速、单元之间的通信延迟时间更短,及理论开销最小。
为了促进多核DSP开发,TI拥有几个多核软件构架和一套调试与描述工具,如图2和图3所示。
图2 TMS320C6472处理器的多核软件构架
为了让软件开发人员能够集中精力解决其应用中存在的一些重要问题,可使用一种能够同时提供硬件抽象和常见支持任务(如内核间通信、DMA资源分配、内存管理等)的中间件。必须对这些软件层进行优化,以用于具体硬件平台,这样它们便不会阻碍用户应用。
图3 多核DSP调试和执行描述
在图2所示的简单软件构架中,处理器内核编程被实时操作系统抽象化,通常有非常小的内存、一个低延迟任务切换调度程序和高效中断服务程序。通过原始寄存器读/写功能芯片支持库或者支持标准驱动器接口结构(如开、闭、读、写等)的底层驱动器,分两个层级抽象化外围器件。该构架中内核间利用TMS320C6472器件的共用内存构架实现快速、可预知通信;DMA资源管理通过软件库实现。这些服务对用户应用有效。
多核调试的一些重要需求包括所有内核间代码执行的系统级浏览;所有内存的相关可视性(共用和内核专用都包括在内);可在对一颗内核进行代码调试时,保持其余内核继续正常运行。当对应用进行优化时,需要理解内核的平均和峰值负载,知道数据传输瓶颈或者系统死锁,并捕获事件或者I/O事务的时间戳统计。这些多核调试和系统执行描述功能在TI的Code Composer StudioTM开发工具和数据分析可视化工具中获得较好的支持。
十多年以来,多核DSP已经在各行各业的各种应用中证明了它的价值。从无线基站到语音网关,多核同质DSP都是理想的选择,它可满足计算密集型信号处理要求,并且功耗预算更低、物理体积更小。
在一些应用中,有些任务的处理需求存在本质的不同,对处理能力的要求也不一样,而异构多核处理器让这种应用的实现成为可能。
这种方法并非提供解决现今嵌入式系统各种复杂信号处理需求的通用型办法,但是它为广大医学成像系统设计人员提供了众多业内最佳属性的组合:低功耗、可预知实时信号与数据处理、降低系统尺寸和成本的高集成度以及缩短产品开发时间的可编程能力。
通过提供完整的信号链,TI正让医学成像开发变得简单和低成本。欲了解更多详情并观看TI医学成像资源,请访问 www.ti.com/medicalimaging。