知识图谱在信息系统运维领域中的应用研究

2023-11-03 14:10杨靖凡孔繁鹏韩立强
新一代信息技术 2023年12期
关键词:网段物理层示例

杨靖凡,孔繁鹏,韩立强

(中铁信(北京)网络技术研究院有限公司,北京 100038)

1 引言

随着信息技术的不断发展和深入应用,信息系统运维成为企业信息化建设中不可或缺的一环。然而,随着系统规模的逐渐扩大、复杂性的增加,传统的手工运维方式带来了更多新的挑战和风险,已经难以满足管理和优化的需求[1]。知识图谱作为一种新型的智能化技术,可以通过对大量异构数据进行语义建模和图论分析,实现知识的自动获取、处理和推理,实现信息系统运维的问题快速发现并解决,提升运维效率和服务质量[2]。因此,知识图谱在信息系统运维领域中的应用研究,具有重要的研究意义和实际应用价值。

2 知识图谱技术特点与优势

2.1 知识图谱技术概述

作为一种能够广泛结构化各类知识的通用技术,知识图谱已在学术界及工业界取得了广泛关注。知识图谱是一种表示知识的语义网络,它能够将各种不同来源、不同类型、不同格式的数据进行融合和链接,并通过语义化建模来实现知识的自动获取、处理和分析[3]。

知识图谱通常由基本的三元组构成,即实体、属性和关系。实体指现实世界中相对独立存在且可区分的事物,如人、物与地点等,每个实体在知识图谱中都有具有唯一性;属性针对实体而言,主要描述实体的各类特征,如名字、颜色、价格等,与此同时属性也可以作为实体使用,因为它们也可以拥有自己的进一步属性描述;关系指知识图谱中实体之间的关联,其主要负责描述实体间的语义联系,例如关联关系、工作关系、位于关系等[4]。

知识图谱作为一种新型的智能化技术,可以通过三元组概念将各类数据结构化,实现实体间的关系检索及联动分析[5]。而在企业信息系统系统中,信息系统设备具有数量众多、关系繁杂的特点。知识图谱的技术特性很好地适配了这一情况,可以使运维人员在运维工作中快速检索设备间的关系,同时缩短故障处置时间,综合提升运维效率与服务质量文。

2.2 知识图谱技术优势

(1) 更强大的知识抽取与融合能力

本质上,知识图谱是建立在知识抽取和数据融合上的综合技术。知识抽取可以实现对非结构化数据的知识重构,自动化提取出使用者感兴趣的相关信息,并以实体、属性及关系等三元组形式进行展现;而数据融合则将来自不同来源的数据进行清洗,清除重复信息,并形成清晰统一的语义空间。这两项技术的结合使得知识图谱更加具有可扩展性、灵活性和丰富性。

(2) 更易理解的知识结构

知识图谱的体系架构往往包含了多领域的各类知识,在提供全面丰富的知识检索服务的同时,繁杂的知识体系往往带来知识的难以理解以及整合困难,而知识图谱的特质可优化这一问题。知识图谱可将实体和关系进行结构化组织与标注,使内容更易被人理解,同时具有更好的组织性和可读性。另外对于机器而言,相较于传统的数据处理方式,知识图谱独有的结构化表示方式更容易被机器理解和处理,从而提升了系统在语义理解和深度挖掘方向上的分析能力。

(3) 更强的适用性

相比于其他数据分析技术,知识图谱在多领域都具有更强的适用性。目前知识图谱技术在医疗、金融、教育及物联网等多种行业中都得到了广泛应用并取得了较好效果,究其原因是各领域基础设施均能普遍抽象为系统中的三元组,配合独有的分析及展现方式,使其具备极佳的易用性及适用性,另外在提供基础关系服务的同时还能进一步提升数据分析和挖掘的效率与价值,为用户提供清晰便捷的展现方案。

(4) 更便捷的可视化与交互模式

知识图谱在数据的存储和管理方面具有一定创新性,数据一般以有向图形式用专有的图数据库存储,这种方式使图数据库在数据存储和图遍历能力上极具优势,可以快速检索和查阅知识图谱中的实体间关系,从而更好地支撑可视化和交互技术,以更直观、易懂且智能的方式呈现给用户。一般知识图谱会提供多种形式的可视化与交互方式,如图形界面、查询接口、API等,从而满足不同用户的使用需求。

3 知识图谱在运维工作中的应用

3.1 当前运维工作的痛点问题

随着各大企业信息系统系统规模逐步扩大,其运行环境也越来越复杂,涉及的不同技术及平台种类也在不断增加,这增加了运维工作的难度。而当设备或某业务出现故障时,如何快速定位故障并提供相应故障链,明确故障影响范围,是当前亟需解决的痛点问题。

在设备故障层面,需在定位故障的同时,快速确定故障影响的范围,明确连带遭受影响的相关设备;在业务故障层面,需在修复故障的同时,明确本次故障涉及的全部硬件设备及系统。当前相关运维工具能够较好地实现对单一设备或业务的故障诊断,但缺乏故障影响范围分析及联动计算能力。故需提出一种覆盖全面、易于理解的运维方法,解决上述问题。

3.2 多层级运维知识图谱

信息网络由网络设备、计算设备以及将之串联起来的传输网络等信息化基础设施组成。在知识图谱的框架下各类设备以及网段等可以构成图谱中的实体,而这些实体之间基于物理、逻辑的连接可以视为图谱之中的关系。因此,信息网络中各类物理设备和逻辑网段便可以基于连接关系构成运维图谱。

基于以上架构,多层级运维知识图谱应运而生,其抽象OSI模型中的关键层级即覆盖设备层、物理层、转发层、路由层及应用层,多角度覆盖网络系统实体,同时在各类运维监控系统的数据加持下可以动态地呈现该实体和关系的变化状况,客观反应当前实体运行状况以及连接关系。其各层级主要设计内容如下。

(1) 设备层

设备层是整个运维知识图谱的最底层,该层的视角主要聚焦在单台的物理设备上。在该层里,每个物理设备可分解为本体实体和多个组件实体。其中,本体实体为设备物理层面的本体,组件实体则指代设备运行所依赖的各个组件、模块的实体。而组件实体也被分为两类:一类包括该设备物理组件,如端口、CPU、内存、风扇、电源等;另一类为表征设备正常运行的逻辑功能实体,如温度、转发表、路由表、进程表等。设备层示例如图1所示。

图1 运维知识图谱设备层示例

(2) 物理层

在物理层中,存在两种类型的实体:第一种是设备实体,设备的实体属性来源于设备层的信息;第二种是链路实体,链路为连接各设备实体的网络线路实体,其物理表现形式可以为光纤、网线、同轴电缆,也可以是无线通道。设备实体和链路实体之间通过自动发现技术自动构建动态的拓扑连接,进而展现当前网络整体的实时物理层连接状态,并展现整体网络物理层运行态势,并在出现异常的连接或链接断开后能够快速感知。物理层示例如图2所示。

图2 运维知识图谱物理层示例

(3) 转发层

转发层对应网络的数据链路层。网络内配置了多少个二层VLAN域,便有多少个相互独立的转发层,每个独立的二层广播域对应一个独立的转发层。从整体来看,转发层是一个由转发设备和端设备构成的树状网络。转发层主要面对的是抽象化的物理设备,所展示的也主要是单一转发域内的连接关系。转发层示例如图3所示。

(4) 路由层

该层级对应网络的路由层,该层级将每个转发层的转发域上卷为一个网段实体。若干网段实体由路由设备连接,共同构成一张路由网络。从某一个网段出发,到其他任意网段,都会建立一条由中间若干台路由设备串联起来的路由路径,即路由层展现的是端到端的有方向的路径。该层级主要对网段之间的路由异常及路由状态进行检测。路由层示例如图4所示。

图4 运维知识图谱路由层示例

(5) 应用层

该层级对应网络的应用层,主要结合以上层级的综合信息,依托每台设备标记的IP地址,将服务器等应用实体进行统一纳管,构建应用层级的知识图谱架构。由于每台服务器都有IP地址作为身份标识,转发层域内管理以及跨网段管理更加便捷。应用层示例如图5所示。

图5 运维知识图谱应用层示例

3.3 应用示例

多层级运维知识图谱可面向实际运维场景,针对性进行问题溯源提示。结合以下示例可对其工作模式进行呈现。

在某业务系统中,由“交换机1”作为核心连接着业务、管理和终端三个二层区域,其中每个区域都有一台交换设备作为汇聚交换机同时承担网关职责,各区域均布属带外管理。该系统在业务区部署了探测设备,在管理区域部署了应用服务器和存储服务器,并在终端区部署了终端进行访问。场景中,探测设备需要向应用服务器传递探测信息,终端具有访问应用服务器需求,同时应用服务器会与同网段的存储服务器进行交互。其架构示例如图6所示。

图6 某业务系统架构示例

此时业务部门反应某应用访问异常,可观察多层级知识图谱对于这一问题所做出的连锁反应。

针对应用层,以IP地址作为标记探测出在“交换机3”与应用服务器出现故障;下探至物理层,“交换机3”、应用服务器与二者中间链路均为不健康的状态,提示其部分参数出现异常;转发层也可观测到应用服务器断开连接;再次下探至设备层,观测到交换机某网络端口异常,查看其下联参数时端口状态为DOWN状态,最终判断该故障为应用服务器端口中断。运维知识图谱分析逻辑如图7所示。

图7 运维知识图谱分析逻辑

多层级运维知识图谱可从多角度剖析实际运维问题,辅助运维人员将各类运维数据进行有机串联,同时通过时序数据存储,使运维人员可以回溯故障时段的网络运行状态,为运维事件处置与运维经验积累打下基础。

4 结论

运维知识图谱是一种新型的知识表示和管理方法,其凭借强大的知识抽取与融合能力,以及便捷的用户交互模式,在运维领域得到了广泛关注。与此同时,运维知识图谱仍存在数据来源不充分、知识表达方式有限等问题。相信在未来应用场景持续扩展、数据质量不断提高的大背景下,运维知识图谱将进一步迭代优化,并取得更好的应用效果。

猜你喜欢
网段物理层示例
基于K-ML-MPWFRFT的物理层安全传输技术
2019年高考上海卷作文示例
单位遭遇蠕虫类病毒攻击
公路联网电子不停车收费系统路侧单元物理层自动测试软件研发
常见单位符号大小写混淆示例
常见单位符号大小写混淆示例
网上邻居跨网段访问故障
“全等三角形”错解示例
多天线物理层安全传输系统性能分析
Onvif双网段开发在视频监控系统中的应用