雷达点迹提取软件健康管理设计与实现

2022-08-26 11:24班阳阳王伟光蔡文彬
雷达与对抗 2022年2期
关键词:点迹线程链路

班阳阳,王伟光,李 颖,蔡文彬

(中国船舶集团有限公司第八研究院,南京 211153)

0 引 言

雷达信号在经过系列处理后送至点迹提取软件进行点迹凝聚,然后输出目标点迹至数据处理器进行跟踪处理[1]。雷达点迹提取功能衔接着信号处理和数据处理,关系着整个雷达系统的功能是否能正常使用[2]。现有的点迹提取软件已经实现了模块化、精细化处理,但缺乏必要的健康管理,故障排查和定位时耗时较长,调试效率低下,可维护性较差,无法适应现代雷达系统智能化监测的需求[3],因此很有必要对点迹提取软件开展健康管理技术研究[4]。

软件健康管理思想旨在实现自动监测、诊断、预计和减缓由软件异常引起的不良事件[5]。本文以一型雷达系统点迹提取软件为例,研究适用于雷达系统点迹提取软件的健康管理技术,增加对整个软件的多维度状态监控、监测和分析措施,建立基于倒序追踪-分层排查(ROT-LTS)准则的在线状态监测体系、健康评估指标和故障诊断库,并开发了一套健康管理人机交互界面集成在雷达健康管理系统中。该系统实现了对点迹提取软件各个处理模块的在线状态监测和健康指标可视化显示,可根据故障诊断库快速定位故障模块及故障发生原因,便于问题排查和解决,极大地提高了软件调试效率和可维护性,满足工程使用需求。

1 点迹提取软件健康管理设计

点迹提取软件健康管理主要完成对点迹提取功能各个模块的应用级状态监测、故障分析和可视化显示,主要包括数据流异常监测、参数异常监测、线程异常监测、链路异常监测,并根据各异常信息进行健康评估和故障诊断,同时健康管理人机交互界面支持健康监测指标可视化显示以及异常数据一键式采集,具体如图1所示。

图1 点迹提取软件健康管理功能划分图

点迹提取软件健康评估与故障诊断以ROT-LTS为准则,对点迹提取软件运行时的健康状态进行评估,并在运行故障时进行辅助故障诊断,方便研发人员事后快速定位故障原因。点迹提取软件健康评价指标包括数据流包计数、参数合法性、CPU利用率及链路状态,具体如图2所示,不同指标对点迹提取软件的影响不同,需要通过大量试验数据进行分析和统计。不同的监测状态对应不同的故障情形,建立二者之间的对应关系,形成故障诊断库和应急解决预案,方便调测人员快速定位故障问题和找到合适的解决方案。

图2 点迹提取软件健康评价指标

1.1 数据流异常监测

点迹提取软件各个模块之间进行数据交互时,上一级输出模块会对输出数据进行自动连续打包编号,下一级接收模块在接收数据时会对数据包计数进行连续性判断。如果包计数不连续,则判定为数据流异常,同时将相邻输出和输入异常的模块状态信息上报至人机交互界面进行健康状态显示。调测人员可根据显示信息判定故障发生原因以及定位故障发生位置。

1.2 参数异常监测

点迹提取软件在接收信号处理输出的视频数据及显示控制软件发送的控制命令时,会对其中的具体参数进行合法性判断和代码级保护,以防止程序崩溃。同时将异常状态信息上报至人机交互界面进行健康状态显示,人机交互界面将显示具体的参数错误信息。

1.3 线程异常监测

点迹提取软件会监测和实时收集各个处理线程的CPU利用率,在任务过载时自动剪裁部分处理数据,防止出现程序崩溃;根据当前时间与上一包数据进入各个线程的时间差,判定当前线程执行处理任务的状态,据此可以判定上一级模块输出是否异常。线程异常信息上报至人机交互界面进行健康状态显示,在测试人员判定是程序逻辑出现异常导致线程进入死循环时,人机交互界面支持对该线程进行重启操作。

1.4 链路异常监测

点迹提取软件通过RapidIO和网络UDP发送点迹处理结果至其他分系统,在数据分发时监测发送返回状态和发送耗时。在返回结果异常或者耗时异常时,上报该信息至人机交互界面进行健康状态显示,测试人员可据此排查相关的软件配置和物理链路。

1.5 异常数据一键式采集

点迹提取软件健康管理系统支持对以上异常监测信息的数据和状态进行一键式采集,为测试人员进行线下分析、查找和定位问题提供历史数据,如图3所示。接收到人机交互界面发送的开始采集指令后,点迹提取软件会启动异常数据收集线程,采集当前满足异常条件的数据、状态,以及信号处理发送的原始视频数据和显示控制发送的历史操控指令。收集线程将异常数据按照约定格式打包之后,通过网络UDP发送至人机交互软件进行本地存储。异常数据收集线程在接收到人机交互界面发送的停止采集或者采集时长达到预设时间时,停止收集和发送异常数据。

图3 健康管理异常数据一键式采集流程图

2 点迹提取健康管理软件实现

点迹提取健康管理软件由点迹提取软件、人机交互软件和故障诊断库构成。点迹提取功能通常包括视频信号接收模块、距离凝聚模块、俯仰凝聚模块、方位凝聚模块和点迹输出模块[6],具体数据流如图4所示。

图4 点迹提取功能数据流图

在点迹输出异常时,根据人机交互界面显示的健康状态信息依次追踪点迹输出模块、方位凝聚模块、俯仰凝聚模块、距离凝聚模块和视频信号接收模块,分层级排查每个模块出现的相关异常信息, 根据异常信息状态和故障诊断库定位故障模块及故障原因。

2.1 视频接收模块健康监测设计

视频接收模块支持多个信号处理通道数据,该模块记录各个通道数据进入时间,通过当前系统时间与最新一包数据进入各个通道的时间差判定该通道状态,如果时间差超过阈值,则通道异常。同时,该模块接收上一级信号处理器发送的状态信息,包括其心跳信息和信号处理器视频输入状态信息。由故障诊断库可知,视频接收模块异常状态分为3种情况:

(1) 信号处理软件未启动,链路异常;

(2) 信号处理软件启动,信号处理器无数据输入,链路异常;

(3) 信号处理软件启动,信号处理器有数据输入,链路异常。

在上述异常状态中,(1)、(2)为上一级节点故障,(3)需要通过信号分析仪等手段排查信号处理器与点迹提取器之间的链路是否正常。

视频接收模块状态监测流程如图5所示。

图5 视频接收模块状态监测流程图

视频接收模块将数据打包计数后发送至距离凝聚模块,将该模块对应线程的CPU利用率实时发送至人机交互界面显示。

2.2 距离凝聚模块健康监测设计

距离凝聚模块对输入数据进行包计数连续性判断,依据故障诊断库,如果数据包计数不连续,则判定数据流异常,并将异常信息上报至人机交互软件。距离凝聚模块对输入的雷达参数(工作方式、扫描方式、方位码、仰角码等)进行合法性判断,超出阈值则判定为异常,且进行代码级保护,防止程序崩溃,将参数异常信息上报至人机交互软件。

距离凝聚模块获取视频接收模块输出数据进入当前模块的时间,并定时判断当前时间与最新一包数据进入当前模块的时间差。由故障诊断库可知,如果时间差超过阈值,则上报距离凝聚模块数据输入异常,据此判断视频接收模块输出是否异常;或者根据CPU利用率判断距离凝聚模块内部是否进入死循环,同时排查内部程序执行逻辑。其他模块的任务执行状态监测与距离凝聚模块相同。图6给出了模块A的流程。

图6 模块A任务执行状态监测流程图

距离凝聚模块将数据打包计数后发送至俯仰凝聚模块,并将该模块对应线程的CPU利用率实时发送至人机交互界面显示。

2.3 俯仰凝聚模块状态监测设计

俯仰凝聚模块对输入数据进行包计数连续性判断,依据故障诊断库,如果数据包计数不连续,则判定数据流异常,并将异常信息上报至人机交互软件。俯仰凝聚模进行连续俯仰波位跨度异常判断,在完成一个仰角归零后,判断相邻波位俯仰跨度是否异常。由故障诊断库可知,如果相邻波位俯仰跨度超过阈值,则会导致点迹在俯仰维凝聚时出现分裂,该异常信息会上报至人机交互软件。

俯仰凝聚模块将数据打包计数后发送至方位凝聚模块,并将该模块对应线程的CPU利用率实时发送至人机交互界面显示。

2.4 方位凝聚模块健康监测设计

方位凝聚模块对输入数据进行包计数连续性判断,依据故障诊断库,如果数据包计数不连续,则判定数据流异常,并将异常信息上报至人机交互软件。方位凝聚模块状态进行连续输出波位跨度异常判断,该模块记录上一次输出波位,判断与当前输出波位跨度是否异常。由故障诊断库可知,如果连续波位跨度超过阈值,会导致点迹输出模块扇区不连续,连续波位跨度异常信息会上报至人机交互软件。

方位凝聚模块将数据打包计数后发送至点迹输出模块,并将该模块对应线程的CPU利用率实时发送至人机交互界面显示。

2.5 点迹输出模块健康监测设计

点迹输出模块对输入数据进行包计数连续性判断,由故障诊断库可知,如果数据包计数不连续,则判定数据流异常,并将异常信息上报至人机交互软件。点迹输出模块异常包括FC链路异常、网络链路异常、扇区输出不连续异常等。

(1) FC链路监测

点迹输出模块通过RapidIO与FC板卡进行交互,将扇区点迹输出至数据处理器。在与FC板卡交互过程中,该模块监测完成1次交互前后所耗时间,依据故障诊断库,如果超过阈值,则报告FC链路异常。

(2) 网络链路监测

点迹输出模块通过网络UDP与交换机进行交互,将扇区点迹输出至终端显示器。在与交换机交互过程中,该模块监测完成一次交互前后所耗时间,依据故障诊断库,如果超过阈值,则报告网络链路异常。

(3) 扇区连续性监测

点迹输出模块记录上一次点迹输出扇区编号。依据故障诊断库,如果与当前点迹输出扇区编号不连续,则报告扇区输出连续性异常。同时排查FC链路和网络链路是否正常,因为输出链路堵塞会造成输出缓存区溢出,进而导致未输出点迹数据被覆盖而出现扇区不连续;如果输出链路正常,则可以判定点迹过滤模块输出的方位扇区不连续。

2.6 故障诊断库设计

故障诊断库的形成需要基于大量的试验数据进行验证和分析,建立各类故障状态组合与故障发生原因一对一或者一对多的映射关系,并生成可读性文图示意说明,供调测人员参考使用。

2.7 人机交互设计

本文以一型雷达系统点迹提取软件为例进行分析,该软件以MFC实现对各个模块的健康状态监测功能。如图7所示,指示灯绿色代表对应功能模块工作正常,指示灯黄色代表对应功能模块工作异常。

图7 各模块状态监测显示图

通过人机交互软件显示各个模块的状态可以很清楚地定位工作异常的功能模块,并根据故障诊断库分析故障发生原因,能有效排查和定位点迹提取功能的故障问题,在实际工程中使用效果较好。

3 结束语

本文针对当前点迹提取软件调试和维护存在的问题,设计了一套包括健康指标体系和故障诊断库的可视化健康管理系统,实现了点迹提取软件的应用级状态监测和可视化健康状态显示,提高了点迹提取软件的调试效率和可维护性。通过试验验证,该系统能够有效提高故障排查、定位和解决的效率,在软件调测中使用效果较好,满足实际工程需求,有良好的工程推广和应用价值。

猜你喜欢
点迹线程链路
天空地一体化网络多中继链路自适应调度技术
如何根据纸带上的点迹计算加速度
基于国产化环境的线程池模型研究与实现
一种基于特征加权的点迹质量评估方法及应用
空管自动化系统的多雷达数据处理与融合
浅谈linux多线程协作
基于数据包分割的多网络链路分流系统及方法
基于3G的VPDN技术在高速公路备份链路中的应用
线程池技术在B/S网络管理软件架构中的应用
高速光纤链路通信HSSL的设计与实现