郑敏 吴刚 郑小松江西理工大学
视频处理芯片ADV212单粒子翻转影响分析及故障预案
郑敏 吴刚 郑小松
江西理工大学
ANALOG DEVICES公司生产的ADV212可以实现JPEG2000 静止图像压缩编码的集成运算,由于其为工业级COMS器件,若用在空间领域,属于单粒子效应的影响对象。文章针对此器件的内部结构和特性,具体分析了其在发生单粒子翻转时所受到的影响,并针对不同的错误类型提出对应的解决措施,形成完整的故障预案。
ADV212单粒子 翻转影响
AD(ANALOG DEVICES)公司生产的ADV212,可以实现JPEG2000 静止图像压缩编码的集成运算。单粒子翻转(SEU,Single Event Upset)是发生在具有单稳态或双稳态的逻辑器件和逻辑电路的一种带电粒子辐射效应。SEU 是单个高能粒子电离的结果或高能质子核反应的产物,会引起器件电性能状态的改变,造成逻辑器件或电路的逻辑错误。该效应是非破坏性的,可通过重写受影响单元(将其触发回所希望的状态)修正。ADV212是工业级COMS器件,如果用在空间领域,属于单粒子效应的影响对象。文章针对此器件的内部结构和特性,具体分析了其在发生单粒子翻转时所受到的影响,并针对不同的错误类型提出对应的解决措施,形成完整的故障预案。
如图1所示,ADV212内部包括一个专门的小波运算处理器(WAVELET ENGINE),三个熵编码器(EC1,EC2,EC3),一个片内的存储器系统(R AM,R OM),一个嵌入式R ISC处理器(EMBEDDED R ISCP R OCESSO R SYSYEM),内部总线DMA控制(INTE R NALBUSAND DMAENGINE),内部FIFO(包括相机数据FIFO(PIXEL FIFO),码流FIFO(CODEFIFO),特征数据FIFO(ATT R FIFO)),外部DMA控制器(EXTE R NAL DMACT R L),相机数据接口(PIXEL I /F)。小波运算处理器可以实现9 /7 不可逆小波,5/3 可逆和不可逆小波。熵编码器能支持JPEG2000 中除R OI 之外的部分。
在典型编码应用中,视频或相机数据从ADV212的像机数据接口输入。有效数据进入小波运算器进行5 /3 或9 /7 小波变换,得到的小波系数写入内部存储器。熵编码器对小波系数进行编码以适应JPEG2000 标准。
在编码模式下:
(1)小波运算器对输入的数据,进行小波变换,将小波系数写入内部存储器。每个子带被进一步分解为码块。使用者自己定义码块的尺寸,而小波处理器负责将子带分解为码块并写入内部存储器。随后熵编码器对这些码块进行编码。
(2)每个熵编码块根据小波系数码块的上下文联系,进行算术编码。
(3)嵌入式32-bit RISC处理器负责专门硬件功能的配置,控制和操作。
(4)存储器系统分为R AM和R OM。R OM用于存储不可更改的嵌入式处理器的程序固件。R AM内分为两个区,配置区和数据区。配置区开辟有16个直接寄存器(地址为0X00-0X0F)和32- bit 间接寄存器(地址为0X00000000-0XFFFFFFFF),用于存储ADV212的硬件算法的配置数据(包括基础硬件配置参数,程序固件,编解码参数),这些配置数据由使用者定义并写入。数据区的主要功能是存储小波系数数据,临时码块和特征数据,提供建立分解存储码流的临时工作区。
(5)内部DMA控制器可以进行高速的存储器对存储器的数据交换,以及存储器与功能模块之间的交换。
(6)FIFO用于写入相机数据(PIXEL FIFO),码流数据(CODE FIFO)和特征数据(ATT R FIFO)。使用普通读写操作,可以从HOST 接口直接访问这些FIFO,或者使用D R EQ/DACK 协议,通过外部hostDMA访问,或者通过专门的硬件握手协议进行访问。
PIXEL FIFO中发生翻转,则某些相机数据错误,错误位不固定。图像会发生点状错误,由于FIFO在不停地写入正确数据,所以可以恢复,可采用的措施有;
(1)在芯片内部结构中,操作系统的内核及预期不再更改的程序放在R OM区;
(2)可编程的初始化程序及系统中断向量驻留在R AM区;
(3)初始化配置ADV212所需的程序固件存储在外部器件中。
(4)在FPGA对ADV212的控制程序中,设计一个对于ADV212输出的监测信号,一旦ADV212发生单粒子翻转,停止工作,FPGA就可检测到这一情况,并重新对ADV212发送复位,使其重新配置。
3.1 内部R AM发生翻转
3.1.1 数据存储区发生翻转
数据存储区存放的是可能在编码变换过程任意阶段的数据,如果发生翻转,图像发生错误,错误类型没有规律,压缩输出的时钟和门控正常。由于数据存储区数据不停更新,所以可以恢复,因此不需外部干预。对应于表1中的A条款。
如果是标志字等数据发生错误,则相关码流无法解压,会暂时出现无恢复图像的现象。如果输出门控正常,对应于表1中的C条款。输出门控也可能异常,当AOS检测到门控异常时会复位,则会丢帧。由于数据存储区的数据不停更新,所以可以恢复,因此不需外部干预。对应于表1中的b 条款。
3.1.2 程序配置区发生翻转
程序配置区发生翻转,则某些配置数据发生错误,错误位不固定。可能引起配置失败,或配置成错误的工作状态,进而引起恢复图像错误。
(1)ADV212仍然可以工作,输出码流错误,输出门控异常,当AOS检测到门控异常时会复位,则会丢帧,错误状态无法自行恢复。地面帧同步器中不能找到该压缩板相应通道的对应标识。此时,需要通过下位机向压缩发出复位指令,使ADV212重新复位配置,则可恢复正常。对应于表1中的e条款所示。
(2)ADV212仍然可以工作,输出码流错误,输出门控正常,但输出码流无法解压,错误无法自行恢复,此时,地面帧同步器中该压缩板相应通道的对应标识正常,但无恢复图像。此时,需要通过下位机向压缩发出复位指令,使ADV212重新复位配置。则可恢复正常。对应于表1中的f 条款。
(3)ADV212仍然可以工作,输出码流错误,输出门控正常,解压恢复出错误图像,且不能恢复。此时,需要通过下位机向压缩发出复位指令,使ADV212重新复位配置。则可恢复正常。对应于表1中的d 条款。
(4)ADV212无法工作,无恢复图像,压缩有时钟输出,无门控和数据输出。当AOS检测到无门控时会复位,则会丢帧,地面帧同步器中不能找到该压缩板相应通道的对应标识。FPGA检测到ADV212无输出后,会重新给ADV212发复位指令,复位指令使ADV212重新配置,可以恢复正常状态,因此不需外部干预。对应于表1中的b 条款。
3.2 FIFO发生翻转
3.2.1 PIXEL FIFO发生翻转
PIXEL FIFO中发生翻转,则某些相机数据错误,错误位不固定。图像会发生点状或块状错误,错误的形状和出现频率没有固定规律。压缩输出的时钟和门控正常。由于FIFO在不停地写入正确数据,所以可以恢复,因此不需外部干预。对应于表1中的A条款。
3.2.2 CODE FIFO发生翻转
CODE FIFO发生翻转,则压缩码流中的数据错误,错误位不固定。恢复图像会发生点状或块状错误,错误的形状和出现频率没有固定规律: 如果是标志字等数据发生错误,则相关码流无法解压,会暂时出现无恢复图像的现象。压缩输出的时钟和门控正常。由于FIFO在不停地写入正确数据,所以可以恢复,因此不需外部干预。对应于表1中的A条款。如果是标志字等数据发生错误,则相关码流无法解压,会暂时出现无恢复图像的现象。如果输出门控正常,对应于表1中的C条款。输出门控也可能异常,当AOS检测到门控异常时会复位,则会丢帧。由于FIFO在不停地写入正确数据,所以可以恢复,因此不需外部干预。对应于表1中的b条款。
3.2.3 ATT R FIFO发生翻转
ATT R FIFO发生翻转,则某些配置数据发生错误,错误位不固定。可能引起配置失败,或配置错误进而引起解码图像错误。具体错误分析与3.1.2类似。
3.3 内部固定逻辑发生 翻转
ADV212内部的固定逻辑的区域包括小波处理单元,熵编码器EC1、EC2、EC3,外部DMA控制器,嵌入式R ISC处理器系统,内部R OM。这些区域发生翻转时,可能引起ADV212内部程序跑飞,无法正常工作或无法工作,错误情况具体分析与3.1.2类似,但是由于这些区域在翻转已发生后,无法通过外部重新写入触发恢复正确状态,因此不能自行恢复,也不能通过下位机发送复位指令恢复。
ADV212在断电之后,芯片内部的电场消失,辐射产生的载流子经过一段时间逐渐消散,此时重新加电,则芯片内部正常载流子恢复正常分布,ADV212可恢复正常工作状态。因此,内部固定逻辑发生翻转后,需要将压缩断电后一段时间后重新加电。对应于表1中的g,h,i 条款。
4 发生单粒子翻转后可采取的应对措施
表1给出ADV212发生单粒子翻转时的应对措施。5 总结5
JPEG2000 视频处理芯片ADV212越来越多应用于空间领域,成为空间领域图像压缩的主流发展方向。文章针对ADV212的内部结构和特性,具体分析了该芯片在发生单粒子翻转时所受到的影响,提出了可行的防护方法,并针对不同的错误类型提出对应的解决措施,形成完整的故障预案。对于该芯片在空间领域的应用具有重要意义。