董彦磊,关俊鹏,张建君,张云佐
1.中国电子科技集团公司第五十四研究所,河北石家庄 050081;2.石家庄铁道大学信息科学与技术学院,河北石家庄 050043)
信息技术领域是世界大国科技竞争的高地,数字经济的蓬勃兴起和智慧化社会的悄然来临,带来诸多严峻挑战的同时也带来千载难逢的发展机遇。无论是美国的Inmarsat,WGS,MUOS,AEHF,Spaceway,Starlink等[1-4],还是中国的中星、亚太、天地一体化信息网络等高低轨卫星通信系统[5-7],均反映出卫星通信系统的高速发展。同时,随着数字孪生城市等理念的提出[8],物联网、语义建模、人工智能等技术赋能与应用支撑平台的深度和广度全面拓展,功能、数据量和实时性大大增强,与数字孪生相关的大数据分析、知识学习、平行推演等能力更加成熟。从卫星通信系统发展趋势来看[9-13],高轨宽带、高轨移动、低轨星座等多卫星通信系统融合使用是大势所趋。通过对卫星通信系统的参数配置、设备故障信息、工作状态、业务质量等数据进行分析,可以有效掌握系统运行态势,评估系统性能,管理和优化卫星通信系统。虽然各卫星通信系统运维管理系统可以根据各自站内管理中心实时收集任务、资源和站型的运行状态,作为各卫星通信系统的运行态势进行呈现,但没有涵盖多卫星通信系统融合情境,并且由于底层设备不支持导致态势感知不全面、不精确[14]。因此,借鉴数字孪生理论技术,构建体系化精准态势,分析数字空间模型并进行态势分析非常必要。
现行的卫星通信系统运控、网控和站控3级架构下,态势分析主要位于运控级,能够站在顶层视角把控全局,便于对卫星的信道设备、用户的信道终端、卫星地面站信道设备等的健康状态进行集中的分析处理,但所需处理的数据量非常庞大,通过AHP,BP神经网络等传统技术[15]进行决策分析导致实时性、精确度不高,需要引入态势智能分析技术,对决策算法进行优化,高效处理海量数据,挖掘数据内在联系与“知识”,精确识别复杂卫星通信系统的运行态势,对未来趋势进行预判,提升可信度,保障系统运维人员客观、全面、准确地管控卫星通信系统。
本文提出一种卫星通信系统决策融合的运行态势智能分析技术,首先基于数字孪生理论技术,建立体系化数字空间模型;其次在数据空间中提取数据特征,得到高质量数据样本;进而使用4种决策分析算法结合历史数据训练结果对实时数据样本进行分析,再通过决策融合分析方法,对大量卫星通信系统运行数据进行精确识别分析,并针对某真实卫星通信系统6项指标主题进行实验,验证了技术的有效性。
数字空间模型是对物理空间的实体进行虚拟化抽象,借鉴数字孪生技术理论,即将卫星通信系统的物理实体,在虚拟空间创建等价的数字空间模型,数字孪生理论中的虚拟空间本质是以计算、存储、网络传输设备为基础构成的仿真平台。数字孪生理论提出数字空间模型除了包括物理实体的仿真模型外,还包括采集到的物理实体历史运行数据,以及采集到的实时物理实体运行数据,便于对真实卫星通信系统进行仿真算法分析。数字空间模型能够根据物理实体运行的实时反馈信息对物理实体的运行状态进行监控,能够依据采集的物理实体的运行数据完善分析算法,从而对物理实体的后续运行和改进提供更加精确的决策。
为了将真实的卫星通信系统合理地映射到虚拟空间,需要根据多卫星通信系统融合运维的3级架构,创建体系化数字空间模型,包括5个层级,依次是板卡级、设备级、节点级、网络级、应用级,不同层级包含的信息各有差异,如图1所示。
图1 体系化数字空间模型Fig.1 Systematic digital space model
通过分布于不同层级的数据采集单元以上报、采集、统计等方式将物理空间实体的信息体系化映射到数据空间。数据采集单元包括4型,分别为部署于板卡级的软硬传感部件,部署于设备级、节点级、网络级和应用级的智能感知代理、部署于节点级的网络探针、以及部署于节点级、网络级、应用级的ICT融合器件。如图2所示。
图2 数据采集单元部署Fig.2 Data acquisition unit deployment
1)板卡级态势信息映射
主要包括芯片状态、计数器信息等,由板卡内置软硬传感部件提供。软件传感部件包括调度程序、计数器等,通过软件打桩方式进行各单元的数据映射;硬件传感部件包括温度传感器、转速传感器等,用于映射芯片、风扇等不同硬件单元的工作状态数据,在板卡内监控单元存储。
2)设备级态势信息映射
主要包括配置参数、设备统计分析参数等,是对天线辐射单元、滤波、T/R功放、上下变频、射频分合路器、采样处理等板卡内部以及板卡之间信息的汇总。依靠智能感知代理,周期性的将态势数据存储至本地,通过定义关联规则,能够融合分析设备内各板卡的态势数据生成设备级态势数据。
3)节点级态势信息映射
主要包括可用度、通信频度、QoS参数等。从天地一体化角度,通过智能感知代理和ICT融合器件收集天基卫星节点的工作频率、轨道根数、波束覆盖范围、通信载荷状态和故障信息统计、转发器资源调度情况统一等信息;通过网络探针、智能感知代理、ICT融合器件收集地基固定站点、机动站点、移动终端等节点型号、地址、业务种类、入网时间、退网时间、在网时间、工作状态和故障信息统计等信息,提供节点级态势数据存储、查询和计算服务。
4)网络级态势信息映射
主要包括业务服务、互联互通、资源利用等。通过智能感知代理和ICT融合器件获取高轨宽带、高轨移动、低轨等多卫星通信系统的波形体制、节点互联状态、用户接入状态、资源利用和业务传输能力统计等信息,提供网络级态势数据存储、查询和计算服务。
5)应用级态势信息映射
主要包括网络拓扑、流量、服务保障、安全抗毁等。综合利用智能感知代理、ICT融合器件,基于任务应用,反映用户操作体验、用户速率、业务差异化保障等情况,提供系统应用级态势感知和评估的数据源。
多卫星通信系统涵盖高轨宽带、高轨移动、低轨等多个异构卫星应用、网系、节点、设备、板卡体系,每秒钟数据量在PB甚至更多,海量的态势数据直接传输会占用大量的卫星传输资源,严重影响正常的通信业务。然而这些数据又是十分必要的,通过合理分析态势数据能够向运维管理人员提供大量“知识”,促进卫星通信系统的优化与效能提升。因此需要在态势数据传输与分析之间找到平衡,在保障不占用大量传输资源的前提下,及时精确地呈现态势分析结果。为实现此目的,需要引入ICT融合理念,其核心观点是以计算存储资源换取传输带宽资源,即通过在体系化数据空间中,各层级分别进行态势数据的特征提取与基于决策融合的分析评估,实时生成高价值精确的评估信息,之后再进行传输,能够大幅度缩减数据传输量级,避免因态势数据带来的传输时延增大、数据丢失等传输压力,运维管理人员依据评估信息,对物理空间网络实体进行合理管控,促进系统更好地运行。运行态势智能分析过程如图3所示。
图3 运行态势智能分析过程Fig.3 Intelligent analysis process of operation situation
数据特征提取是后续评估工作的基础,在体系化数据空间中,数据质量各不相同,需要结合各级相关指标对数据进行特征提取工作,提取出的数据质量越好,后续评估的可信度越高。
卫星态势数据种类繁多,包括定量数据和定性数据,定量数据是结构性的,由一定长度类型的字段组成;定性是非结构数据,数据字段仅由非数值的文字语言表征。为避免错误数据、不完整数据、非必要数据带来的负面影响,首先需要进行数据整理工作。常用的数据整理方法包括数据检测、平均值填补、样本丢弃等。数据检测方法通过在数据中引入逻辑规则,发现错误、重复、不完整等问题数据,并进行归类;平均值填补、样本丢弃等对检测到的数据进行补充完善或处理,确保数据完整。
对于定量数据,如果同一实体有多个相同记录,则仅保留重复数据中的一项;如果缺失少量字段使得不能完整地表达数据语义,则用历史数据的均值来填充;如果缺失半数以上字段,则抛弃该数据样本;如果少量数据出现错误,则采用分箱法,用错误噪声数据指标出现的前后一段时间的指标平均值或边界值来平滑修正;如果半数以上数据出现错误,则抛弃该数据样本。
对于定性数据,可以通过调查问卷、专家打分等方式进行数字化,但人工因素影响会导致数据不可信,因此需要运用模糊集统计法,通过构建评估等级来量化定性数据,尽可能将人工影响因素降到最小。模糊集统计算法如下:
1)建立评估等级集合V={v1,v2,…,vm},用模糊集bj=(bj1,bj2,…,bjm)表征定性指标,bjk为bj对vk的隶属度,k=1~m,j=1~n;
2)bjk可以利用模糊统计法计算得到;
3)V={v1,v2,…,vm}的数值集D={d1,d2,…,dm}由专家设定;
海军卫生学是军事医学教育课程体系中的一门主干课程,是海军临床医学本科和海军全科医学专业的必修课。作为预防医学的重要组成部分,本课程主要阐述海军部队平战时所处的各种环境与指战员健康的关系,以及利用有利环境因素、改善不利环境因素达到防治疾病、增进健康、提高战斗力等目的的对策和措施,为学生提供今后从事海军临床医学、海军卫生管理等各领域工作必备的基本理论知识及专业技能。授课内容主要包括海军环境卫生学、海军营养与食品卫生学以及海军劳动卫生学3部分。
完成数据整理后,需要对数据进行规范化和特征提取。规范化是指数据具有统一的量纲,例如:信息传输速率单位换算1 024 kB=1 MB,1 024 MB=1 GB,如果使用不同量纲数据进行运算会导致错误的结果,规范化即是将单位换算一致。但由于不同指标要求的量纲会有不同,例如话音通信情况要求指标为呼通率、呼损率等,因此无法将所有指标换算为统一量纲,需要分门别类,对不同类别指标分别进行规范化。如果指标为离散型,则对照指标体系的枚举数值定义和数据源的定义进行转换;如果指标为连续型,则对照指标体系的默认采用单位和数据源采用的单位进行计算转换;如果指标为指标体系定义的数据模型,则对指标的语义进行转换。
对于规范化的数据样本,常采用概率统计的模式识别方法、规则推理方法等来进行特征提取。其中,概率统计的模式识别方法是对历史数据等先验知识进行训练,得出数据特征,对数据信息进行分类或者预测,虽然原理简单,但需要非常丰富的先验知识,工作量较大。规则方法是运用逻辑规则对复杂不确定性的信息进行模糊量化处理,但对数据样本质量要求较高,易受噪声等错误数据影响。
在对多卫星通信系统运行态势数据进行特征提取后,可基于数据特征进行板卡、设备、节点、网络、应用各层级的故障定位、态势预测等,例如通过对节点下所有设备关键数据的特征进行提取,可以找到节点故障的问题根源。节点级的数据融合与关联可指导卫星和地球站故障的快速定位;或者话音业务呼通率下降问题,原因可能有:用户的业务需求突然增加、通信链路受到干扰、卫星资源带宽或功率资源不足、网控中心处理能力饱和、卫星有效载荷故障、关口站设备故障等,需要对各指标进行联合分类,找出一个或多个制约因素,进而制定应对措施;在态势预测方面,如对历史通信流量数据进行模式识别,拟合出回归曲线,预测未来的通信流量与业务增长,指导卫星通信系统网络容量规划设计。
对提取特征后的数据进行分析的算法有很多,常用的有层次分析法、BP神经网络等。因为没有一种算法可以解决所有问题,不同算法往往善于分析不同的数据样本,不存在所谓的最好算法、最差算法,在解决复杂系统中的问题时,多算法间能够取长补短。在对各算法的适用范围、优缺点、运行机制进行分析的基础上,将各算法对不同指标主题的评估结果基于可信度进行决策融合,生成全面、精确的分析结果。决策融合分析过程如图4所示。
图4 决策融合分析过程Fig.4 Decision fusion analysis process
传统的决策融合算法是对态势评估结果取平均值,但这种方式忽略了不同算法针对某些方面训练不足或专家主观经验设定待完善,给出的结果可能与实际偏差较大,在求平均值的过程中会影响整个结果的可信度。针对该问题提出基于决策融合的态势评估,如果指标之间的好坏关系比较直观容易确定时,AHP算法的结果可信度较高,如果指标对上层准则的影响度比较模糊时,BP神经网络算法结果可信度较高[16-17]。
不同算法针对不同指标主题得出的分析结果的可信度确定过程如下。
1)设有m种算法,对n个主题进行评估,第i(i=1,2,…,m)个算法得出的结果向量为
Wi=(wi1,wi2,…,win)。
(1)
3)统计第i种算法的结果,如果全部结果都在置信区间以外,则可以判定该算法在本次分析中结果偏差较大,放弃该算法;如果在置信区间以外存在部分结果,若在置信空间外的结果大于50%,则丢弃结果,反之保留结果;如果所有的结果都在置信区间以内,认为该算法为优质算法,可进行后续计算。
4)假定筛选得到m种算法,算法的可信度通过对不同指标主题的历史数据进行训练确定。计算第i种算法相对于第j种指标主题的历史Kj次分析结果与历史融合分析结果的标准差σij,算法历史分析结果与融合后的结果的标准差σij越小,算法的可信度越高,计算第i种算法相对n个指标主题的标准差σi:
(2)
5)考虑标准差可能为0的情况,计算第i种算法可信度:
(3)
(4)
6)设筛选共得到m种算法,则第j个指标主题的分析结果为
(5)
决策融合分析方法兼顾了不同算法分析结果的范围性、优势性和准确性,并且具有可扩展性,支持任意其他分析算法的扩展。
以某真实多卫星通信系统为例,验证决策融合分析方法的可行性。6项指标主题在4种算法分析下的初步分析结果见表1。
表1 初步分析结果
经正态分布统计,对于6个指标,TOPSIS法对于抗干扰通信能力、全域互通能力、资源利用效率、快速组网能力4个指标评估结果分别为0.473,0.371,0.510,0.290均在置信区间以外,超过了50%,因此丢弃TOPSIS法分析结果。
训练AHP算法、BP神经网络法、模糊综合评估法相对于6个评估指标的历史评估结果与历史融合评估结果的综合标准差分别为0.027 9,0.001 9,0.004 8。
根据AHP算法、BP神经网络法、模糊综合评估法综合标准差计算各算法可信度为0.781 8,0.981 0,0.954 5,归一化后分别为0.287 7,0.361 0,0.351 2。
按照决策融合方法进行计算,结果如式(6)所示。
可以得出6个指标主题的最终结果分别为抗干扰通信能力0.6526;全域互通能力0.2146;机动传
(6)
输能力0.554 8;业务承载能力0.628 1;资源利用效率0.849 5;快速组网能力0.521 5。从实验过程可以看出:1)算法可以根据正态分布置信区间,在多个决策算法中筛选优质算法,剔除不善于处理该样本数据的算法,减小对结果的负面影响,例如TOPSIS的4个指标评估结果均在置信区间以外,属于不善于处理该样本数据的算法,被决策融合算法自动剔除;2)能够依靠历史结果数据对算法进行训练,确定可信度权重,表1中的结果即为依靠历史数据对4种算法训练后的结果,之后再通过综合标准差计算以及归一化得到各算法的可信度,该可信度即可作为输入,用于处理实时数据下的指标主题分析结果;3)能够通过决策融合分析方法,在保留各优质算法特征信息基础上,通过将可信度作为权重,能够平衡各算法结果。因为每种算法可能善于处理特定的指标,例如AHP算法在处理抗干扰通信能力指标时结果最好,但处理全域互通能力时结果较差;BP神经网络算法在处理抗干扰通信能力时结果较差,但处理全域互通能力指标时结果更优;模糊综合评价法在处理资源利用效率指标时结果最好,但在处理抗干扰通信能力时效果最差。所以通过可信度的加权平均,兼顾了各算法评估结果的全面性、客观性和准确性,对不同的指标主题均能得出较好的结果,使得最终结果更加客观准确,具有参考价值。综上所述,通过实验分析证明了多卫星通信系统融合运行态势分析技术的有效性。
本文结合卫星通信系统发展趋势,重点解决多卫星通信系统融合运行态势不全面、不精确等问题。
1)借鉴数字孪生理论技术,建立板卡级、设备级、节点级、网络级、应用级5个层级体系化数字空间模型。通过部署于板卡级的软硬传感部件,部署于设备级、节点级、网络级和应用级的智能感知代理、部署于节点级的网络探针、以及部署于节点级、网络级、应用级的ICT融合器件共4型分布于不同层级的数据采集单元,以上报、采集、统计等方式将物理空间实体的信息体系化映射到数据空间。
2)运用数据特征提取技术对数字空间数据样本进行优化。首先对定性、定量数据进行数据整理,避免错误数据、不完整数据、非必要数据带来的负面影响。其次对数据进行规范化,使数据具备统一量纲。最后采用概率统计的模式识别方法、规则推理方法等来进行特征提取,用于后续分析。
3)通过决策融合分析方法进行数据分析得到评估结果。首先对数据样本运用多种算法进行初步分析。其次剔除分析结果处于置信区间外的算法。最后结合各算法对不同指标主题的历史数据训练结果计算得出可信度权重,再对各算法进行加权融合,生成全面、精确的分析结果。
4)实验结果表明,基于决策融合分析,一是算法可以根据正态分布置信区间,在多个决策算法中筛选优质算法,剔除不善于处理该样本数据的算法,减小对结果的负面影响。二是能够依靠历史结果数据对算法进行训练,确定可信度权重。三是能够通过决策融合分析方法,在保留各优质算法特征信息基础上,通过将可信度作为权重,平衡各算法结果,对不同的指标主题均能得出较好的结果。
基于决策融合的多卫星通信系统态势分析技术在数据体系化采集、定量与定性数据优化、基于可信度权重进行加权融合等方面进行了创新研究,通过决策融合得到的分析结果,可以帮助卫星通信系统运维人员更好的优化多卫星通信系统的运行状态。但是在数据采集分析等方面仍不够完善,存在数据被动式采集问题,数据采集单元缺少主动信道测试类设备,对故障的主动检测评估能力弱。未来可以进一步完善态势融合方法,例如设计更加精细的数据采集设备,研究更加高效的数据特征提取方法,进一步优化可信度权重,以提供更为有效的态势分析结果。