继电保护装置单粒子效应的测试方法与失效率研究

2023-01-12 03:11丁晓兵陈朝晖周兆庆
电力系统保护与控制 2022年24期
关键词:失效率中子继电保护

丁晓兵,陈朝晖,周兆庆,张 尧

继电保护装置单粒子效应的测试方法与失效率研究

丁晓兵1,陈朝晖1,周兆庆2,3,张 尧2,3

(1.中国南方电网电力调度控制中心,广东 广州 510530;2.国电南京自动化股份有限公司,江苏 南京 210003;3.南京国电南自电网自动化有限公司,江苏 南京 211153)

单粒子效应引发的存储器软错误对微机继电保护具有不可忽略的影响。介绍了粒子和高能中子的来源,以及中国部分城市的大气中子通量。讨论了对继电保护装置进行中子辐照试验的方案细节,以及根据实验数据求取现场环境下单粒子失效率的方法。从现有可靠性指标出发,推导得到继电保护装置单粒子效应的可接受失效率。将该指标和辐照试验得出的失效率相比较,可以判断装置是否满足现场运行要求。该方法对评价继电保护装置的单粒子失效率具有一定的参考意义。

继电保护;单粒子效应;软错误;加速中子辐照试验;失效率

0 引言

继电保护装置负责在电力系统故障时快速切除故障,其可靠性直接影响电力系统的稳定运行。近年来微机继电保护因存储器软错误(soft errors, SE)而导致的误动时有报道,如不加以防范将影响继电保护的正常功能,严重情况下可引起继电保护装置的拒动或误动。

排除设计、制造因素,长期运行中的芯片也会因为高能粒子撞击而发生数据改变,称为单粒子效应(single-event effect, SEE)。高能粒子有两类来源:一是芯片封装材料中残留的放射性杂质释放的粒子;二是宇宙射线与地球大气层作用而产生的中子[1]。单粒子效应包括单粒子翻转(SEU)、多位翻转(MBU)、多单元翻转(MCU)、单粒子功能中断(SEFI)和单粒子闩锁(SEL)等[2]。单粒子效应导致的软错误具有随机发生、事后不复现的特点。

文献[3]报道了一起SEU导致的继电保护误动。文献[4]提出了一种存储异常变位的容错设计方法,辐照加速试验表明该方法消除了SEE导致的定值变化、文件系统出错和装置宕机等异常。

本文介绍了中国主要城市大气高能中子微分通量,讨论了与保护装置中子辐照试验有关的问题,对中子源选择、测试对象和加速因子提出建议。根据加速试验的观测结果并结合现场辐射水平,推算保护装置现场运行中的单粒子效应失效率。该指标与继电保护装置故障可接受度比较,形成单粒子效应的量化评价结论。

1 单粒子效应对继电保护的影响

大气中子无处不在,其中高能中子(>10 MeV)是地面SEE的主要诱因[1]。影响高能中子数量的主要因素是海拔[5],中子对保护装置的影响因地而异。例如羊八井地区的中子通量是广州地区的10倍以上,如图1所示。

图1 羊八井、广州大气中子能谱

除了海拔,地面中子辐射水平还与经纬度和地磁刚度有关,根据文献[2]给出的近似公式可以推算出中国部分城市的地面中子辐射水平,如表1所示。

微机继电保护装置的存储器主要包括非易失性存储器和随机存取存储器。非易失性存储器有两类:一是NOR Flash用于存放程序;二是NAND Flash用于存放事件记录与录波。NOR Flash数据翻转后会造成程序加载失败,装置上电后无法自举。NAND Flash数据翻转会使保护事件信息丢失。

表1 中国部分城市高能中子(>10 MeV)通量

多数嵌入式系统的随机存取存储器(SRAM或DRAM)既存放代码也存放数据,数据翻转发生在代码段会使继电保护程序失控,造成误动、拒动的严重后果,发生在数据段则要视程序中有无冗余逻辑而具体分析,危害性相对较轻。

文献[3]建议微机继电保护装置系统采用双CPU(保护+保护)冗余架构模式,只有两个CPU都满足完整的动作出口逻辑后保护才能动作出口,从而显著降低SEE的不良后果。文献[4]通过冗余文件系统克服程序Flash的变位,利用FPGA并行计算的能力,在每个中断周期内校验RAM中的保护代码,并监视诸如定值、压板状态之类的关键数据。

芯片厂商通过在存储器硬件中添加纠错电路(error checking and correcting, ECC)实现单粒子效应防护。具备ECC功能的CPU/FPGA,可以实现位翻转的“纠一检二”。由于在1个字节中2个或2个以上的位翻转出现的概率较低,所以ECC被认为基本满足可靠性要求[1]。但ECC逻辑会耗费额外的资源,开启后RAM的可用容量会下降40%以上,读写速率会降低2%左右。

2 单粒子效应的测试方法

在器件选型阶段审核芯片的材料,就可实现对粒子的防范。评估单粒子效应的主要工作聚焦在中子辐照上。

单粒子效应最准确的评估方法是在高海拔地区进行实时测试(real-time test),但该方法需要利用大量并行设备来减少所需的测试时间[6-7]。用加速器可以在很短的时间内向测试对象注入20年以上的大气中子剂量,快速评估芯片、插件和装置的抵御能力[2]。可选的中子加速试验环境有14 Mev单能中子源和散裂中子源,散裂中子源的能谱类似于大气中子环境,测试效果更有说服力[8]。

2.1 测试对象选择

测试单粒子效应有面向元件和面向系统两种方法,前者测试芯片,后者测试整机。面向芯片的测试方法虽然相对成熟[9-10],但是存在以下不足。

1) CPU/FPGA内部的Cache和一些专用寄存器,本质上也是SRAM,也有位翻转的可能,但芯片在设计时未提供外部访问和控制的机制,从而无法测试。

2) 芯片级测试时嵌入系统只有部分电路工作,各元件之间的互动不充分。单粒子效应与器件工作温度有关,温度越高越显著。只有在整机中运行整机程序,才能让芯片达到真实的温升。

3) 很难从芯片软错误率(soft error rate, SER)推算系统的错误率。统计表明,器件每发生10个位翻转在系统级层面会输出1~2个错误[9],但二者的关系难以进一步明确。翻转发生在代码段中,发生的位置、时机不同造成的影响也不同。发生在数据段中可能会被三取二、多次采集多次判等应用逻辑消除。此外,保护装置采用何种双CPU冗余模式,对是否误动/拒动也有很大的影响。

4) 含氢元素丰富的高分子材料,如PCB中的环氧树脂会显著衰减中子的能量,继而降低SEE发生的概率[1-2]。当机箱中有多张PCBA时,这个衰减作用不可忽略。

综上,从工程实际的角度出发,推荐以继电保护装置整机作为单粒子效应的测试对象。

2.2 中子通量选择

散裂中子源的中子注量可以比大气水平高数千万倍,测试时间片一般为10~30 min。文献[4]中当中子通量达到大气强度的5×109倍时,持续10 min 实验后,发现改造前的装置几乎每次必然宕机。由此,必须选择合适的中子通量用于测试。

2.3 敏感方向选择

高能中子对装置整机的效应有角度依赖关系[2],散裂源输出的中子束聚焦在有限面积内[11]。因为在不同入射方向上,中子能量受金工件和插件的衰减程度有别,中子束流与芯片顶面法线方向角度大小影响测试的效果,所以试验中应调换装置和中子束流的相对位置以找到敏感方向。

3 单粒子效应失效率分析

因单粒子效应而导致继电保护运行异常,是客观存在的物理现象。ECC技术和冗余架构设计只能减少异常发生的概率而不能完全杜绝,工程上只要单粒子异常事件率小于某个程度即视为可接受[12]。

《DL/T 587-2016 继电保护和安全自动装置运行管理规程》中建议:微机保护装置的使用年限一般不低于12年[13-19],考虑裕度后放大到20年[20-21],推算出可接受失效率为

可推算继电保护设备运行中的单粒子效应失效率为

4 单粒子效应的评价方法

表2 异常事件的权重

用微机继电保护装置整机进行中子加速测试。关闭芯片的ECC功能,在10~30 min内向装置施加20年以上的海平面大气中子注量。试验时除了观察装置自检异常、宕机之外,还需加动作门槛90%量考察装置是否误动,加动作门槛110%量观察装置是否拒动。试验每个阶段完成后,调取装置定值和保护动作事件记录,观察是否有异常。最后电源重上电,观察装置能否自举。

5 结论

微机保护装置内存储器受到粒子轰击发生软错误,是一种客观存在的物理现象。继电保护从业人员从软件和系统架构的角度采取了多种加固措施,芯片设计中ECC功能也在逐步普及,但单粒子效应导致的保护装置异常仍然无法完全避免。

鉴于继电保护装置的重要性,有必要尽快形成继电保护装置单粒子效应的测试方法和可接受度标准,用于指导装置型式试验。本文推荐用装置整机进行高能中子加速试验,求取现场环境下装置的故障率和可接受失效率比较,形成具有工程实用价值的评价方法。该方法对于继电保护装置和电力系统的稳定安全运行具有参考意义。

[1] NICOLAIDIS M. 现代电子系统软错误[M]. 韩郑生, 毕津顺, 译. 北京: 电子工业出版社, 2016.

[2] JESD89A: measurement and reporting of alpha particle and terrestrial cosmic ray-induced soft errors in semiconductor devices[S]. Arlington: JEDEC Solid State Technology Association, 2006.

[3] 周浩, 石磊, 彭涛, 等. 一起继电保护装置单粒子翻转软错误分析及应对措施[J]. 电力系统保护与控制, 2021, 49(7): 144-149.

ZHOU Hao, SHI Lei, PENG Tao, et al. Analysis and countermeasures of single event upset soft errors in a relay protection device[J]. Power System Protection and Control, 2021, 49(7): 144-149.

[4] 李友军, 周华良, 郑玉平, 等. 继电保护装置存储异常变位的容错设计与应用[J]. 电力系统自动化, 2021, 45(7): 155-162.

LI Youjun, ZHOU Hualiang, ZHENG Yuping, et al. Error-tolerant design and application of relay protection device against unexpected memory bit change[J]. Automation of Electric Power Systems, 2021, 45(7): 155-162.

[5] GORDON M S, GOLDHAGEN P, RODBELL K P, et al. Measurement of the flux and energy spectrum of cosmic-ray induced neutrons on the ground[J]. IEEE Transactions on Nuclear Science, 2004, 51(6): 3427-3434.

[6] 张战刚, 雷志锋, 黄云, 等. 基于高海拔地区的大气中子单粒子效应实时测量试验研究[J]. 原子能科学技术, 2022, 56(4): 725-733.

ZHANG Zhangang, LEI Zhifeng, HUANG Yun, et al. Experimental study on real-time measurement of atmospheric-neutron induced single event effect based on high-altitude area[J]. Atomic Energy Science and Technology, 2022, 56(4): 725-733.

[7] ZHANG Zhangang, LEI Zhifeng, TONG Teng, et al. Tibetan-plateau-based real-time testing and simulations of single-bit and multiple-cell upsets in QDRII+ SRAM devices[J]. IEEE Transactions on Nuclear Science, 2019, 66(7): 1368-1373.

[8] 王勋, 张凤祁, 陈伟, 等. 中国散裂中子源在大气中子单粒子效应研究中的应用评估[J]. 物理学报, 2019, 68(5): 38-47.

Wang Xun, Zhang Fengqi, Chen Wei, et al. Application and evaluation of Chinese spallation neutron source in single-event effects testing[J]. Acta Physica Sinica, 2019, 68(5): 38-47.

[9] XILINX: device reliability report (second half 2020), UG116(v10.13)[R]. 2020.

[10] NGUYEN H T, YAGIL Y, SEIFERT N, et. al. Chip-level soft error estimation method[J]. IEEE Transactions on Device and Materials Reliability, 2005, 5(3): 365-381.

[11] 林倩, 黄奕铭, 张战刚, 等. 智能手机大气中子单粒子效应试验研究[J]. 电子产品可靠性与环境试验, 2021, 39(增刊1): 46-51.

LIN Qian, HUANG Yiming, ZHANG Zhangang, et al. Experimental study of atmospheric neutron induced single event effects in smartphones[J]. Electronic Product Reliability and Environmental, 2021, 39(S1): 46-51.

[12] 奥康纳, 克莱纳. 实用可靠性工程[M].金春华, 蓝晓理, 译. 北京: 机械工业出版社, 2020.

[13] 中国电力企业联合会.继电保护和安全自动装置运行管理规程: DL/T 587—2016[S]. 北京: 中国电力出版社, 2017.

China Electricity Council. Code for operating management of relaying protection and security automatic equipment: DL/T 587—2016[S]. Beijing: China Electric Power Press, 2017.

[14] 贺春, 陈光华, 王朋飞, 等. 高加速寿命试验在就地化保护装置可靠性研究中的应用[J]. 电力系统保护与控制, 2018, 46(20): 181-186.

HE Chun, CHEN Guanghua, WANG Pengfei, et al. Application of highly accelerated life test in reliability study of outdoor installation protection device[J]. Power System Protection and Control, 2018, 46(20): 181-186.

[15] 黄烽, 邓勇, 任晓辉, 等. 继电保护装置运行年限评价的研究[J]. 电力系统保护与控制, 2017, 45(22): 158-163.

HUANG Feng, DENG Yong, REN Xiaohui, et al. Assessment for service life of relay protection device[J]. Power System Protection and Control, 2017, 45(22): 158-163.

[16] 郭鹏, 王文焕, 詹荣荣, 等. 基于Petri网出现序列的继电保护业务模型[J]. 电力科学与技术学报, 2020, 35(4): 169-175.

GUO Peng, WANG Wenhuan, ZHAN Rongrong, et al. Research on model of protection relay procedure based on the Petri net occurrence sequence[J]. Journal of Electric Power Science and Technology, 2020, 35(4): 169-175.

[17] 杨胡萍, 黄煌, 何志勤, 等. 基于数据拟合的继保设备失效率调整因子模型[J]. 中国电力, 2021, 54(9): 96-101.

YANG Huping, HUANG Huang, HE Zhiqin, et al. Adjustment factor model of relay protection equipment failure rate based on data fitting[J]. Electric Power, 2021, 54(9): 96-101.

[18] 索江镭, 刘琨, 袁亮荣, 等. 继电保护静态模拟并行测试系统构建[J]. 广东电力, 2020, 33(10): 46-55.

SUO Jianglei, LIU Kun, YUAN Liangrong, et al. Construction of parallel test system for relay protection static simulation[J]. Guangdong Electric Power, 2020, 33(10): 46-55.

[19] 叶远波, 谢民, 陈晓东, 等. 基于故障率分析的继电保护系统状态检修策略[J]. 电力系统保护与控制, 2021, 49(7): 167-173.

YE Yuanbo, XIE Min, CHEN Xiaodong, et al. A condition-based maintenance strategy for a relay protection system based on failure probability analysis[J]. Power System Protection and Control, 2021, 49(7): 167-173.

[20] 丁毅, 陈新之, 潘可, 等. 基于电力专用多核异构芯片架构的低压保护测控装置设计[J]. 南方电网技术, 2020, 14(1): 58-64.

DING Yi, CHEN Xinzhi, PAN Ke, et al. Design of low voltage protection device integrated with measurement and control function based on power dedicated multi-core heterogeneous chip architecture[J]. Southern Power System Technology, 2020, 14(1): 58-64.

[21] BO Zhiqian, LIN Xiangning, WANG Qingping, et al. Developments of power system protection and control, Protection and Control of Modern Power Systems, 2016, 1(1): 1-8.

[22] 梁文武, 朱维钧, 李辉, 等. 基于粗糙集的智能变电站保护设备仿生故障诊断方法[J]. 电力系统保护与控制, 2021, 49(21): 132-140.

LIANG Wenwu, ZHU Weijun, LI Hui, et al. A rough set-based bio-inspired fault diagnosis method for smart substation protection equipment[J]. Power System Protection and Control, 2021, 49(21): 132-140.

[23] 张战刚, 雷志锋, 童腾, 等. 14 nm FinFET和65 nm平面工艺静态随机存取存储器中子单粒子翻转对比[J].物理学报, 2020, 69(5): 133-140.

ZHANG Zhangang, LEI Zhifeng, TONG Teng, et al. Comparison of neutron induced single event upsets in 14 nm FinFET and 65 nm planar static random access memory devices[J]. Acta Physica Sinica, 2020, 69(5): 133-140.

[24] 郑美松, 王子龙, 涂吉, 等. 可编程器件的选择性双模冗余加固方法[J]. 计算机辅助设计与图形学学报, 2016, 28(2): 356-362.

ZHENG Meisong, WANG Zilong, TU Ji, et al. A selective dual modular redundancy approach for FPGA hardening technique[J]. Journal of Computer-Aided Design & Computer Graphics, 2016, 28(2): 356-362.

Test method and failure rate of the single-particle effect of a relay protection device

DING Xiaobing1, CHEN Zhaohui1, ZHOU Zhaoqing2, 3, ZHANG Yao2, 3

(1. Dispatching Center of China Southern Power Grid, Guangzhou 510530, China; 2. Guodian Nanjing Automation Co., Ltd.,Nanjing 210003, China; 3. Nanjing SAC Power Grid Automation Co., Ltd., Nanjing 211153, China)

Memory soft errors induced by the single-particle effect have a non-negligible effect on microcomputer relay protection. This paper introduces the sources of Alpha particles and high-energy neutrons, as well as atmospheric neutron fluxes in some cities in China. The details of the neutron irradiation tests on relay protection devices and the method of obtaining the single particle failure rate in the field environment based on experimental data are discussed. Based on the existing reliability metrics, the acceptable failure rate of the single-particle effect of the relay protection device is promoted. Comparing this indicator with the failure rate obtained by the irradiation test, it can be judged whether the device fulfills the requirements of field operation. This method has a certain reference significance for evaluating the failure efficiency of single particles of relay protection devices.

relay protection; single-event effect; soft errors; accelerated neutron irradiation test; failure rate

10.19783/j.cnki.pspc.220310

南方电网公司重点科技项目资助(ZDKJXM20200056)

This work is supported by the Key Scientific and Technological Project of China Southern Power Grid Corporation (No. ZDKJXM20200056).

2022-03-10;

2022-04-28

丁晓兵(1979—),男,通信作者,硕士,高级工程师,从事电力系统继电保护管理工作;E-mail: dingxb@csg.cn

陈朝晖(1979—),男,博士,高级工程师,从事电力系统继电保护管理工作;

周兆庆(1973—),男,硕士,从事智能变电站及嵌入式平台技术研究。

(编辑 魏小丽)

猜你喜欢
失效率中子继电保护
VVER机组反应堆压力容器中子输运计算程序系统的验证
基于通信定位系统用模块的可靠性预计计算研究
(70~100)MeV准单能中子参考辐射场设计
3D打印抗中子辐照钢研究取得新进展
电气控制系统中继电保护器的整定方法
深入理解失效率和返修率∗
基于改进龙格-库塔法反舰导弹贮存寿命研究
电力系统及其自动化和继电保护的关系研究
物质构成中的“一定”与“不一定”
电力系统继电保护二次回路的维护与检修