王南天,钱彦岭,李 岳
(国防科技大学 装备综合保障技术重点实验室, 湖南 长沙 410073)
仿生自修复硬件多层结构模型*
王南天,钱彦岭,李岳
(国防科技大学 装备综合保障技术重点实验室, 湖南 长沙410073)
针对仿生自修复硬件细胞间信号传输复杂、效率低等问题,借鉴内分泌系统中激素的传输方式,提出基于片上网络和近邻连接的4层仿生自修复硬件结构模型,并以实现有限脉冲响应滤波器为例,对模型进行详细论述。基于该模型的自修复硬件,具有灵活的布线能力与良好的容错能力,表明该模型为高可靠性自修复硬件设计提供了新途径。
仿生硬件;自修复;内分泌;片上网络;近邻连接;有限脉冲响应滤波器
研制具有自修复能力的通用机器的构想,可以追溯到20世纪50年代。在20世纪90年代,Mange等为提高电子系统可靠性提出具有自修复能力的胚胎电子阵列(embryonic array),诸多学者相继进行了相关的研究[1-7],提出了POEtic[2]和ubichip[4]等仿生硬件。POEtic使用了两层冯·诺依曼近邻连接[8],而ubichip则使用了冯·诺依曼近邻和摩尔结构近邻连接[9]。基于近邻连接的结构,细胞只与附近相邻的细胞连接,故远距离信号传输慢且需要消耗较多细胞,自修复重构过程因为涉及多个细胞而比较复杂。总线结构[3]被引入解决远距离信号传输的问题,但存在总线时分复用而带宽较小的问题。此外,片上网络(Network on Chip, NoC)因为其高带宽、可扩展性好、灵活等特点[10]被应用到自修复硬件中[11-12]。
在内分泌系统中,主要有两种激素传输方式:循环分泌和旁分泌。循环分泌将激素分泌到血液中并通过血液循环系统传输到靶细胞,旁分泌则将激素分泌到组织液中并通过扩散到达靶细胞。基于旁分泌,激素能够通过扩散快速到达靶细胞,但是靶细胞不能够离得太远。而基于循环分泌,激素则可以到达几乎任意位置的靶细胞,但是会稍微牺牲速度。然而,在内分泌系统中,二者相结合,则体现出很好的效果。这为仿生自修复硬件的体系设计提供了新的思路。
在电子系统中,NoC[13]体现出灵活的信号传输特点,这和循环分泌具有一定的相似性,而近邻连接则传输速度快,这有类似旁分泌的特点。本文将NoC与近邻连接相结合,提出一个具有4层次自修复能力的硬件结构模型,并以实现广泛应用的有限脉冲响应(Finite Impulse Response, FIR)滤波器为例,对该模型进行详细介绍。
1.1近邻连接
细胞的近邻连接指细胞与附近细胞的一种连接关系。图1为与周围4个(上、下、左、右方向)相邻细胞连接的冯·诺依曼近邻连接结构。如果与周围8个(上、下、左、右、左上、左下、右上、右下方向)细胞连接,则称为摩尔近邻连接。
图1 冯·诺依曼连接Fig.1 Von Neumann connections
1.2片上网络NoC
有学者认为,NoC是指在单芯片上集成大量的计算节点PE以及连接这些资源的片上通信网络(On-Chip Network, OCN)[14],因而NoC包括计算和通信两个子系统。由计算节点PE组成的计算子系统完成广义的计算任务,PE可以是CPU、片上系统(System on Chip, SoC)、各种专用功能的IP核、存储器阵列或者可重构硬件等。通信子系统负责PE之间的连接与高速通信。图2为一个3×3 Mesh结构[13]的NoC网络,通信子系统用一系列通信节点R表示。需要说明的是,每个通信节点R不是只能够连接一个PE[10],如图中最右边一列每个R则连接了2个PE。
图2 3×3 Mesh结构NoCFig.2 NoC with 3×3 mesh structure
也有学者认为,NoC是一种片上互联技术[10],可概要的认为就是第一种观点中的OCN。本文中的NoC主要指后者,即OCN。
NoC(OCN)主要借鉴分布式计算系统的通信方式,用路由和分组交换技术替代传统的片上总线来完成通信任务,具有高带宽、低功耗、扩展性好等优点,且有利于解决单一时钟全局同步问题[10, 14]。
2.1模型层次
本文提出的硬件结构模型一共包含4个层次,从高到低依次为管理层、通信层、功能层和布线层,如图3所示。
图3 四层结构模型Fig.3 Four layers structural model
功能层是自修复硬件的计算部分。功能层包含多个二维均匀分布的功能细胞(记为F细胞或F)。每个F细胞执行一个特定的函数,所有F细胞相互协作完成预定整体功能,这和胚胎阵列中功能模块的作用相似。F细胞也可以被用作布线,增加布线的灵活性,这个将在下一节提到。
布线层提供了F之间的信息传输通道,由布线细胞(记为R细胞或R)组成。R细胞与胚胎阵列中的输入输出模块功能相似。如果将F细胞类比于生物系统中的细胞、F之间的信号比作细胞之间传输的激素,则可将布线层类比于组织液。
通信层由多个通过NoC连接的通信细胞(记为C细胞或C)组成,它可以类比于生物系统中的血液系统。每个C细胞与多个(数量是没有明确限制的,可以按照要求进行划分)F细胞和R细胞相连,它们共同构成1个组织(记为T)。在阵列(指基于该模型设计的自修复硬件)初始化时,通信层是负责传递硬件初始配置信息并初始化细胞(包括C细胞、F细胞和R细胞)。在阵列正常工作时则与布线层协作,完成F细胞之间的数据通信任务。F细胞的输出可以传输到C细胞并由其通过NoC传输到别的组织。目标组织的C细胞收到该输出后,由其传递给目标F细胞。这个机制非常有用:它使信号可以通过C层传输也可以通过F层传输,使布线和自修复的灵活性大大增强。在阵列自修复过程中,C细胞控制组织内修复。
管理层仅由1个管理细胞组成,简记为M细胞或M。它负责“管理”整个硬件并提供对外的借口。在阵列初始化时,它负责生成或者从外部接收阵列的初始配置信息,并传输给各个组织。在正常工作时负责阵列与外部的信息交换。在自修复时控制组织间修复和全局修复。M细胞不但直接与部分R细胞连接,也通过NoC网络连接。需要说明的是,所使用的NoC的拓扑结构没有严格要求,可以使用任何结构,比如图2所示的Mesh结构。
2.2自修复层次
本文提出的结构模型,一共包含4个自修复层次,从低到高依次是细胞内修复、组织内修复、组织间修复和全局修复。
细胞内修复指故障发生,细胞内使用的基于海明码的容错、多模冗余等容错方式能够直接纠正错误。这个过程使用的具体容错方式,已经有较多文献对其进行详细论述[15-16],本文不再详细讨论。这个过程只涉及单个细胞,是自修复的第一个层次。
组织内修复指当组织内的某(几)个细胞发生故障时,在C细胞的协调控制下,通过组织内细胞的重构、替换等方式完成的修复。该修复只涉及组织内部,和其他组织无关,其他组织不一定要停止工作。这是自修复的第二个层次。
组织间修复指当故障发生时,前两个层次都没法完成修复的情况下,在M细胞的协调控制下,多个组织之间通过细胞重构、替换等完成的修复。这个过程执行时,不涉及替换操作的组织一般暂停工作,以等待修复过程的完成,但是操作数据不会丢失。这是自修复的第三个层次。
全局自修复指前三个层次的修复方法无法完成自修复,或者完成自修复后阵列运行效率很低时,由M细胞从全局重新分配各细胞的功能。全局修复时,操作数据将丢失。本质上,全局自修复是一个具有约束条件的细胞分化、布局布线及初始化过程。这里的约束指故障细胞和组织不可用性。
基于多个层次的修复,在不同故障程度条件下使用不同的修复策略,可以在小故障时不停机,较大故障时仍可修复,增加硬件的可用性与可靠性。
3.1硬件结构
基于该模型,图4给出了一个包含3个组织(T01,T10,T11)的自修复硬件的结构,每个组织包含4个F细胞和4个R细胞,用粗实线划分。T00被M取代,故T00实际上不存在。M细胞及图中实心圆点所示的3个C细胞通过NoC相互连接,NoC拓扑结构属于NoC研究的范畴,不是本文关注的重点,这里选择Mesh结构。M也可与R20,R21,R12或与外部交换数据,如图中箭头所示。各种细胞都朝着2个方向按照物理位置依次编号,用下标区分。F细胞和R细胞的细胞交替放置,每个F/R细胞与周围的4个R/F细胞连接,如F23与相连R22,R33,R23,R13连接;R13与F12,F23,F13,F03相连。这种结构使F可以方便地与周围的8个F细胞通信,且其中4个具有2条通道,这可实现传输通道的备份,如F23可以直接与F13,F03,F12,F22, F32,F33,“F43”和“F24”(这两个加“”的F细胞在这个包含3个组织的阵列中是不存在的),F23与F22(4个中的1个)之间,可以通过R22或(和)R32通信。
图4 自修复硬件结构Fig.4 Structure of the self-healing hardware
3.2工作过程
一般地,N阶FIR滤波器可表示为卷积形式:
(1)
经过Z变换,滤波器的传递函数可表示为:
(2)
这里,我们取滤波器阶次为3,则该滤波器可表示为:
yn=hn*xn=h0xn+h1xn-1+h2xn-2+h3xn-3
(3)
可以将式(3)计算任务分解为式(4)~(8)所示的5个子函数:
f1:y0=h0xn
(4)
f2:y1=h1xn-1
(5)
f3:y2=h2xn-2
(6)
f4:y3=h3xn-3
(7)
f5:uk=y0+y1+y2+y3
(8)
将5个子函数f1~f5分别映射到F02,F12,F23,F32和F22,如图5所示,图中箭头表示的信号传输路径映射到相应的R细胞,如xn-2映射到R13。在后文中,执行fk功能的细胞Fij简记为Fij(fk)或者fk;类似地,传输某信号at的细胞Rkl简记为Rkl(at)或at。
图5 FIR滤波器的功能映射Fig.5 Function mapping of FIR filter
该(实现FIR滤波器的)阵列工作过程如下。M细胞产生或者从外部接收阵列的配置信息。当配置信息准备完成后,开始配置硬件,所有细胞的配置信息通过NoC传输到每个组织(实际上是C细胞),并由C细胞配置自己及其所在组织的4个F细胞和4个R细胞。配置完成后,阵列开始工作,xn从外接输入到M细胞,经R12传送到F02(f1);F02完成f1的计算后,正好延迟一个周期,xn变为xn-1,并将xn-1经R02传输给F12(f2),同时将y0经R12传给F22(f5);f2,f3,f4和f5依次执行,直到F22(f5)得到yn并经由R21传输到M细胞;最后,由M细胞将yn传到系统外。如果故障发生,将启用自修复,这个在下一小节论述。
需要说明的是,可以使用流水线技术来提高上述计算任务的整体速度。此外,文中没有太多地考虑FIR滤波器功能的分解及其到F细胞的映射,这些工作需要一些优化算法来支持,这是下一步需要研究的工作。
3.3自修复
在FIR滤波器运行的过程中,如果故障发生,则自修复过程将启动。
假设某时刻F32(f4)某位存储器由于某原因发生翻转,随后,其内部使用的扩基于展海明码的容错方式[17]能够自动纠正这个错误。从细胞外看,细胞F32(f4)并没有发生故障,这便是使用了细胞内修复。
随后,F32(f4)的又一位发生故障,扩展海明码将检测到该故障,但是无法纠正,于是将故障通知C11。C11经过分析后,发现可以按照图6所示的替换方式进行修复:由F33替换F32执行f4的计算任务;计算结果通过C11传输到F22(f5),如图中虚线箭头所示。
图6 组织内修复示例Fig.6 Paradigm of Tissue-in healing
图7 组织间修复示例Fig.7 Paradigm of Tissue-out healing
如果R21(yn)发生故障,且不能够通过细胞内修复完成自修复,则R21将通知C01,C01发现组织内修复也没办法完成自修复,C01则通知M细胞,请求组织间修复。M分析后,认为可以通过如图7所示的修复方式进行修复。方式(1):f5将计算得到的yn通过R23输出,并依次经由T01中的F31,R31,F30,R20传输到M,如实线箭头所示;在这其中,F31和F30被用作布线。方式(2):将计算结果yn传到C11(如长虚线箭头所示),并经由NoC传递到M,这便是NoC在工作时用作信号传输。可以发现,上述两种方式都牺牲了一定的时间:第一种方式,信号要从原来的经过1个细胞变为经过4个细胞,延迟明显增加。第二种方式,使用了NoC,也增减了延迟。
假设此时,滤波器的延迟已经到了可以容忍的最大值。如果再有故障发生,出现以下两种情况之一:①系统不能够通过前面三个层次的修复完成自修复,②通过前面三个层次的修复完成自修复后,延迟增加,系统延迟将不可接受,此时,将启动全局修复:将发生故障而不可用的几个细胞作为约束条件,重新完成阵列的功能分化、初始化等操作,以使阵列能够重新被配置成满足时间要求的FIR滤波器。
本文将近邻连接与NoC相结合,给出了一个4层自修复硬件结构模型,并以实现FIR滤波器为例,对其进行了详细的说明。基于该模型设计的自修复硬件具有灵活的信号传输能力与较强的容错能力,它为设计电子系统的高可靠性自修复硬件提供了一种新的方法。该模型所述金字塔形拓扑结构,可为分布式计算中处理器的分布提供参考。该模型也提供了一种将工业级甚至商业级的现场可编程门阵列(Field Programmable Gate Array, FPGA)用于高可靠性场合的低成本解决方案——使用少量高可靠性的军品级或者宇航级FPGA来管理并自修复大量低可靠性的工业级或商业级FPGA,这对宇航级、军品级FPGA购买较困难的中国,具有更重要的意义。
References)
[1]Mange D, Goeke M, Madon D, et al.Embryonics: a new family of coarse-grained field-programmable gate array with self-repair and self-reproducing properties[M]//Sanchez E,Tomassini M. Towards Evolvable Hardware: the Evolutionary Engineering Approach, 1996: 25-28.
[2]Moreno J M,Thoma Y,Sanchez E.Poetic: a hardware prototyping platform with bio-inspired capabilities[C]//Proceedings of the International Conference Mixed Design of Integrated Circuits and Systems, 2006: 363-368.
[3]Samie M, Dragffy G, Popescu A, et al.Prokaryotic bio-inspired system[C]//Proceedings of NASA/ESA Conference on Adaptive Hardware and Systems, 2009: 171-178.
[4]Upegui A, Thoma Y, Satiz′abal H F, et al.Ubichip, ubidule, and marxbot: a hardware platform for the simulation of complex systems[C]//Proceedings of ICES2010, 2010, 6274: 286-298.
[5]王南天, 钱彦岭, 李岳, 等.胚胎型在线自修复FIR滤波器研究[J].仪器仪表学报, 2012, 33(6): 1385-1391.
WANG Nantian,QIAN Yanling,LI Yue,et al.Study of embryonic type on-line self-healing FIR filters[J].Chinese Journal of Scientific Instrument, 2012, 33(6): 1385-1391.(in Chinese)
[6]李岳, 王南天, 钱彦岭.原核细胞仿生自修复电路设计[J].国防科技大学学报, 2012, 34(3): 154-157.
LI Yue, WANG Nantian, QIAN Yanling. Self-healing circuit design inspired by prokaryotic cell[J].Journal of National University of Defense Technology, 2012, 34(3): 154-157.(in Chinese)
[7]王敏, 王友仁, 张砦, 等.三维结构可重构阵列在线自诊断与容错方法[J].仪器仪表学报, 2013, 34(2): 650-656.
WANG Min, WANG Youren, ZHANG Zhai, et al.Online self-fault diagnosis and fault tolerant method for three-dimensional reconfigurable array[J]. Chinese Journal of Scientific Instrument, 2013, 34(2): 650-656.(in Chinese)
[8]Thoma Y, Tempesti G, Sanchez E.Poetic: an electronic tissue for bio-inspired cellular applications[J].Biosystem, 2004, 76(1/2/3): 191-200.
[9]Moreno J M,Madrenas J.A reconfigurable architecture for emulating large-scale bio-inspired systems[C]//Proceedings of IEEE Congress on Evolutionary Computation (CEC 2009),2009: 126-133.
[10]张媛媛, 孙光, 苏厉, 等.片上网络中低延时可扩展的路由器结构设计[J].传感器与微系统,2012,31(8):134-136.
ZHANG Yuanyuan, SUN Guang, SU Li, et al. Structure design of low-latency extensible router in network on chip[J]. Transducer and Microsystem Technologies, 2012, 31(8): 134-136.(in Chinese)
[11]Boesen m R, Madsen J.Edna: a bio-inspired reconfigurable hardware cell architecture supporting self-organization and self-healing[C]//Proceedings of NASA/ESA Conference on Adaptive Hardware and Systems, 2009: 147-154.
[12]Xu J Q, Dou Y, Lyu Q, et al. Etissue: a bio-inspired match-based reconfigurable hardware architecture supporting hierarchical self-healing and self-evolution[C]//Proceedings of NASA/ESA Conference on Adaptive Hardware and Systems (AHS), 2011: 311-318.
[13]王炜, 乔林, 汤志忠.片上网络互连拓扑综述[J].计算机科学, 2011, 38(10): 1-5,12.
WANG Wei,QIAO Lin,TANG Zhizhong.Survey on the networks-on-chip interconnection topologies[J]. Computer Science, 2011, 38(10): 1-5,12.(in Chinese)
[14]张岚.面向低功耗的NOC测试调度与映射方法研究[D].合肥:合肥工业大学, 2009.
ZHANG Lan.The research on NOC test scheduling and mapping method concerning low-power[D]. Hefei: Hefei University of Technology, 2009.(in Chinese)
[15]杨姗姗.胚胎型仿生硬件细胞电路设计与自修复方法研究[D].南京:南京航空航天大学, 2007.
YANG Shanshan.Research on the circuit design and self-repairing method of embryonic bio-inspired hardware[D]. Nanjing:Nanjing University of Aeronautics and Astronautics,2007.(in Chinese)
[16]杨姗姗, 王友仁. 胚胎型仿生电路中具有自修复性能的存储器设计[J].计算机测量与控制, 2009, 17(1): 164-167.YANG Shanshan, WANG Youren.Memory design in embryonic bio-inspired circuit with self-repairing properties[J]. Computer Measurement & Control, 2009, 17(1): 164-167.(in Chinese)
[17]王南天.基于原核仿生阵列的自修复技术研究[D].长沙:国防科学技术大学, 2011.
WANG Nantian.Research of self-healing technique based on prokaryotic bio-inspired array[D]. Changsha:National University of Defense Technology, 2011.(in Chinese)
Multi-layer structural architecture for bio-inspired self-healing hardware
WANG Nantian, QIAN Yanling, LI Yue
(Science and Technology on Integrated Logistics Support Laboratory, National University of Defense Technology, Changsha 410073, China)
Inspired by the circulatory secretion and paracrine of hormone, aimed at solving the problems such as low efficiency and complexity during the cellular communicating, a four-layer structural architecture for bio-inspired self-healing hardware based on NoC (network on chip) and neighborhood connections was proposed. A self-healing hardware realizing an FIR (finite impulse response) filter based on the architecture was brought in to explain the architecture in detail. The hardware shows flexible routing ability and good fault-tolerant ability. It indicates that the structural architecture provides a new approach to design a self-healing hardware with high reliability.
bio-inspired hardware; self-healing; incretion; network on chip; neighborhood; finite impulse response filter
10.11887/j.cn.201604013http://journal.nudt.edu.cn
2015-03-30
国家自然科学基金资助项目(51675523)
王南天(1986—),男,重庆人,博士研究生,E-mail:wangnant@126.com;钱彦岭(通信作者),男,研究员,博士,硕士生导师,E-mail:ylqian@nudt.edu.cn
TP330
A
1001-2486(2016)04-085-05