基于PCA 的航空装备管理检查信息筛选模型研究∗

2023-11-15 06:51战希臣
舰船电子工程 2023年8期
关键词:方差航空向量

战希臣 刘 超

(海军航空大学航空基础学院 烟台 264001)

1 引言

航空装备管理工作检查,能够反映航空兵部队航空装备管理工作进展情况,从而指导改善和加强航空装备管理工作,提高航空装备综合保障能力,增强航空兵部队战斗力[1]。科学合理的航空装备管理工作检查指标体系是高效反映航空装备管理进展情况的关键[2],因此,优化航空装备管理工作检查指标体系具有重要意义,开展航空装备管理工作检查指标体系优化研究是十分必要的,如果指标体系不合理,后续信息处理将受影响。

2 航空装备管理检查信息筛选流程

针对航空兵部队航空装备管理过程中工作项目庞杂多样导致反映装备管理工作进展情况的检查指标繁复众多的问题,结合航空装备管理工作实际情况和战斗力生成特点,对前期构建的“航空装备管理工作检查指标体系”进行了优化。首先,运用主成分分析法,筛选确定能够影响航空装备管理工作水平的装备管理主要工作项目[3]。然后,从反映航空装备管理工作进展情况的众多检查指标中,针对装备管理的主要工作项目,筛选保留能够高效反映航空装备管理工作进展情况的主要检查指标,从而对航空装备管理工作检查指标体系进行优化,形成了有助于后续信息处理的更为科学合理的工作检查指标体系[4],满足装备管理流程中各工作环节对装备管理工作检查信息的需求。最后,选取“航空装备管理工作检查指标体系”中某二级指标下的多个工作检查指标,通过建模仿真[5],验证了优化工作检查指标的信息筛选模型合理性。

2.1 筛选确定主要工作项目

主要工作项目是指,在装备从接收到退役期间的管理活动中,对装备管理工作水平起重要影响作用的一系列关键工作项目[6]。在对装备管理工作进展情况进行跟踪监管的过程中,只要掌握了装备管理的主要工作项目的进展情况,就能充分掌握装备管理的整体进展情况。所以,计算影响装备管理工作水平的众多工作项目的权重,筛选确定影响装备管理工作水平的主要工作项目,是非常有意义的。

2.2 筛选保留主要检查指标

主要检查指标是指在对装备管理工作进展情况进行跟踪监管的过程中,能够高效反映装备管理工作进展情况的一系列关键检查指标[7]。在对装备管理工作状况进行了解的过程中,通过针对装备管理主要工作项目的检查指标,可以高效掌握装备管理工作的整体状况。所以,从反映装备管理工作进展情况的众多检查指标中,针对装备管理的主要工作项目,筛选保留能够高效反映航空装备管理工作进展情况的主要检查指标,是非常必要的[2]。

3 检查指标信息筛选模型原理

航空装备管理工作检查信息筛选模型是基于主成分分析法对装备管理工作检查指标体系进行指标权重计算及筛选。

3.1 主成分分析法引理

主成分分析法(Principal Components Analysis,PCA)是一种基于字段内方差及字段间协方差关系的常用数据降维分析方法[8]。当一组数据,通过改变对其信息进行表示的坐标空间的维度数量,能够在一个比初始坐标空间维度数量低的新坐标空间上得到表现时,称之为数据降维。本质是这些数据在各个新维度上分别体现的信息,相互之间非线性相关;这些数据的新坐标基向量,按行或列排成一个矩阵,这个矩阵的秩小于初始坐标空间的维度数量;这些数据过原点构成的新向量,最大线性无关组包含的向量个数小于初始坐标空间的维度数量。该方法的优点是经过处理的数据在各个新维度上分别体现的信息相互间差异性更大,旨在利用降维思想,用少量的维度也能反映原先多维度所表示的重要信息。

主成分分析法的基本思想如下。

构建新坐标空间,虽然基向量选取的唯一要求是非线性相关,非正交也可以,但是正交基有较好的性质,所以通常基向量是正交的(即内积为0 或相互垂直)。内积的几何意义是向量A 向向量B 所在直线投影的矢量长度,表示为

其中两个n维向量的内积运算定义为

维度数量相同的不同坐标空间之间,变换数据的坐标,将m 个n 维数据由在初始基上的表示,变换为在由r 个n 维向量构成的新基上的表示,就是求在初始基上表示各数据的坐标向量对新基向量的投影矢量。根据内积的几何意义,以及两个维度数量相同的向量的内积运算定义,将r 个新基向量按行排成矩阵A,然后将在初始基上表示的m 个数据的坐标向量按列排成矩阵B,当新基向量是模为1的单位向量时,两个矩阵的乘积AB就是各数据在新基上的坐标向量按列构成的矩阵,表示如下:

其中pi为第i 个新基向量(单位向量),aj为第j 个数据在初始坐标轴上的坐标向量。

降维变换数据的坐标,即让r 小于n,要想新坐标更大程度表现数据包涵的原有信息,需要将数据的初始坐标向量在其新基向量上的投影尽可能分散,或新坐标上每一维度上的数值字段的方差尽可能大。根据方差的几何意义,当数据0 均值化后,分散大小可以表示为

其中xij表示这组数据在新坐标上第i 个维度上的数值组成的字段。

当新坐标的维度大于1 时,要想新坐标更多表示数据包涵的原有信息,需要新坐标的不同维度之间的数值字段或新基向量满足非线性相关性,因为线性相关性意味着存在重复信息。根据协方差的几何意义,相关性可以表示为

其中xij、xoj表示这组数据在新坐标中任意两个维度上的数值组成的字段。

选取主要新维度,计算新坐标上表示数据信息差异性大小的各个维度上的数值字段的方差,根据某个维度上的方差占全部维度上的总方差比例,选取新维度。第i个新维度上的方差占全部维度上的总方差比例ωi为

选取主要初始维度,计算k 个主要新维度上表示对初始维度负载程度的因子负载,根据新维度对初始维度因子负载筛选初始维度,越大表明初始维度l 对新维度的影响越显著,越应当保留;越小则表明初始维度对新维度的影响越弱,越应当剔除。保证了筛选后的初始维度对新维度有显著影响。第l个初始维度的因子负载可以表示为

由此得出主成分分析的模型为

其中,Fi为第i 个新维度(主成分),xl为第l 个初始维度,αil为对应第i 个特征值的特征向量的第l个分量。

3.2 信息筛选模型原理

运用主成分分析法对航空装备管理工作检查指标体系进行优化,可以实现通过少量且能全面反映航空装备管理工作进展情况的主要检查指标替代原有复杂的指标[9]。首先对影响装备管理工作水平的众多工作项目进行主成分分析,得出各工作项目的影响度。然后按照一定的标准,保留对装备管理工作水平起重要影响作用的工作项目,删除对装备管理工作水平影响小的,得出主要工作项目,进而从反映装备管理工作进展情况的众多检查指标中,针对影响装备管理工作水平的主要工作项目,筛选保留能够高效反映航空装备管理工作进展情况的主要检查指标,实现对工作检查指标进行精简。

不同维度可以包含不同信息,从多个维度出发,可以更全面地分析问题。但是当维度之间存在一定相关性,所描述的信息存在一定重叠,会增加不必要的信息采集处理工作,增大问题研究的难度,难以把握众多维度中的重点。要想只对少量维度的变量进行定量分析,又能全面把握所研究问题的重要信息,主成分分析法是理想的方法。

通过坐标转换,数据信息量得到最大表示即数值字段方差最大的新维度作为第一主成分,数据信息量得到第二大表示即数值字段方差第二大的新维度作为第二主成分,以此类推。取各主成分方差占总方差比值之和达到相应规定的前几个主成分,相比初始维度数量便减少了维度,而且这几个主成分上表示的信息能够涵盖原有维度上表示的重要信息。进一步分析这几个主成分跟初始维度的映射关系,得出初始维度对前k个主成分的贡献度。

为了区分影响航空装备管理工作水平的重要工作项目和一般工作项目,需要设定适当的界限值,保留方差贡献度大于或等于该分界值的,即影响航空装备管理水平的重要工作项目,删除小于该分界值的,即影响航空装备管理水平的一般工作项目,从而得出主要工作项目。

本文保留方差占比之和达到85%以上的前k个主成分,并以此对影响装备管理工作水平的工作项目进行分析。前k 个主成分只是对原始指标表示的信息进行了转换,忽略了原始指标表示的少量无效信息,这些被忽略的信息对航空装备管理工作水平影响很小。

参考以往主成分分析法界限值的选取及相关文献资料,首先将界限值设为0.9,利用该界限值对影响航空装备管理工作水平的各工作项目指标进行取舍,然后通过对筛选结果的分析来调整界限值的取值,使之最终趋于合理。

4 检查指标信息筛选模型构建

设(x1,x2,…,xn)T为n 个影响航空装备管理工作水平的工作项目指标变量构成的向量,用λi(i=1,2,…,n)表示向量(x1,x2,…,xn)T的样本协方差矩阵的对称矩阵,并由大至小排列;αil为第i个主成分对第l个工作项目指标的因子载荷数。

信息筛选模型流程如下:

1)将n 个影响航空装备管理工作水平的工作项目指标信息作为一组数据,构成向量(x1,x2,…,xn)T,将m 组数据向量的各项指标信息分别0均值化,得到矩阵B。

3)用Jacobi 法,求矩阵C 的特征值λi(i=1,2,…,n),并将特征值按大小排序,λi表示第i 个主成分上的数值字段的方差。

4)求对应的特征向量。

5)根据方差占比,按照累计方差占比≥85%的要求,选取前k个特征值对应的主成分。

6)根据因子负载,按照绝对值0.9 为界限,选取初始指标。

5 模型的实例仿真与分析

为了检验信息筛选模型的有效性,针对前期已建立的“航空装备管理工作检查指标体系结构”,本文仅选取一级指标“机关装备管理工作检查”下的二级指标“机关组织领导”下的众多工作检查指标,进行实例分析[10]。通过信息筛选模型,采集分析对应的数据信息,确定科学合理的具体工作检查指标。

5.1 指标列举

在“航空装备管理工作检查指标体系结构”基础上,按照工作检查标准里针对各项三级指标“工作内容”的检查方法与实施要求,将二级指标“机关组织领导”下的多项“工作内容”依次展开,逐一列举具有操作可行性的更具体的“工作项目”检查指标,作为四级指标[11]。

机关组织领导包括机关党委装备管理工作、履行职责、机关建设、年度计划、奖励处分。

1)机关党委装备管理工作

(1)重要议事日程完备度;

(2)问题应对能力;

(3)装备教育;

(4)装备工作重视程度;

(5)机关人员素质。

2)履行职责

(1)贯彻上级指示;

(2)检查基层工作;

(3)领导基层训练;

(4)培养技术保障人员;

(5)组织大项任务。

3)机关人力分工

(1)机关人员称职率;

(2)机关人员分工合理性。

4)年度计划

(1)年度计划完整性。

5)奖惩情况

(1)创先争优效果;

(2)奖惩规范度。

5.2 数据处理

5.2.1 指标评估标准

高效反映航空装备管理工作进展情况,对航空装备管理工作状况进行了解,不是将工作检查指标简单堆积和随意组合,而是在建立检查指标基础上根据评估标准对航空装备管理主要工作方面的工作状况进行评估处理。评估标准应注意以下几点[12]:

1)等级划分

评估标准的等级划分要科学合理,符合专家评估习惯,体现实际差异,通常划分为5个等级。

2)范围覆盖

评估标准的范围覆盖要全面,能够包括项目表现的最高水平到最低水平,充分反映实际情况。

3)客观真实

评估标准的内容要客观,针对不同领域的评价问题,要符合该领域的实际情况,反映真实情况。

4)量化处理

评估标准的打分采用专家打分法,根据等级划分(优秀、良好、较好、一般、差),对应分数范围(100 分~91 分,90 分~81 分、80 分~71 分、70 分~60分、59 分以下),对项目表现进行等级界定,进而给出评分。

5.2.2 数据统计

根据以上检查指标及评估标准,收统计5 个航空单位的数据,进行数据信息分析。具体情况如表1所示。

表1 “机关组织领导”工作检查指标评估数据

5.3 指标评估数据筛选过程

1)数据输入

打开SPSS 软件,点击菜单栏“文件”选项,选择下拉菜单中“打开”选项,点击“数据”选项,选中数据文件,导入指标评估数据。如图1。

图1 数据输入

2)功能选择

点击菜单栏“分析”选项,选择下拉菜单中“降维”选项,点击“因子分析”选项,进入主成分分析界面。如图2。

图2 功能选择

3)样本分析

将待分析“指标”移入“变量”栏,点击“确定”选项,得出“特征值”、“特征向量”,如图3、4。

图3 特征值

图4 特征向量

4)数据处理

根据特征值结果,前三个主成分对指标评估数据样本描述累积贡献率达到了92.775%,超过85%。且从第四个主成分开始对指标评估数据样本描述贡献很小,为了筛选能够高效反映装备管理工作进展情况的主要检查指标,保留前三个主成分。根据特征向量计算每个指标在前三个主成分上的因子载荷,如表2。

表2 影响度统计

5)处理结果

根据每个指标在前三个主成分上的因子载荷,可以看出“机关人力实力”指标在跟其他指标相关度高的维度上方差贡献较小,在跟其他指标相关度低的维度上方差贡献不大,所以删除。由此得到二级指标“机关组织领导”下的科学合理的具体指标。

6 结语

针对航空兵部队航空装备管理过程中工作项目庞杂多样导致反映装备管理工作进展情况的检查指标繁复众多的问题,为使前期构建的“航空装备管理工作检查指标体系”更加科学合理,构建了基于主成分分析法的航空装备管理工作检查信息筛选模型,利用SPSS 软件,选取指标体系中某二级指标下的多个工作检查指标的评估数据进行仿真分析,验证了优化工作检查指标的信息筛选模型有效性。

猜你喜欢
方差航空向量
方差怎么算
向量的分解
概率与统计(2)——离散型随机变量的期望与方差
聚焦“向量与三角”创新题
“闪电航空”来啦
“闪电航空”来啦
计算方差用哪个公式
方差生活秀
向量垂直在解析几何中的应用
向量五种“变身” 玩转圆锥曲线