代天成 张笑
摘要:网络遥测属于一种全新的大数据信息采集、大数据信息分析技术,实现了数据分析、人工智能两项技术的结合,能够可视化全局e-learning状态、流量,提升了互联网的运维水平。文章首先分析了IP互联网运营存在的挑战,对其问题进行整理归纳,其次对互联网遥测技术进行了介绍,最后研究与探索了IP互联网智能运营,以此为IP互联网的智能运营提供可靠参考和有效指导。
关键词:网络遥测技术;网络自动化运维;对策
中图分类号:TP393文献标志码:A0引言5G承载系统可以同时实现EMBB,URLLC,MMTC等业务的要求,这无疑对IP承载网络提出了更高的要求。IP网络自动运维包含了网络遥测+AI技术,能够实现网络故障的精准定位,可主动发现网络拥塞、丢包及时延问题,从而提升业务体验。作为业界研究、应用的热点,网络遥测技术得到了学术界的广泛关注。
1当前IP网络运维面临的问题和挑战1.1网络攻击风险计算机用户在应用网络进行网上浏览时,不管是浏览哪一种网页或网站都有遭受攻击的风险,他们的网络安全可能会受到严重威胁,可能导致企业或个人的计算机网络中的一些重要信息被盗取,也有一些不法分子会进入计算机网络,对内部信息产生破坏[1]。
1.2数据传输安全隐患计算机网络在数据传输的过程中也存在安全隐患,因为数据传输过程所使用的数据流属于明码数据流,所以这些数据可能会被截获,会被其他IP地址冒充目标用户截获数据,盗取计算机中的数据信息。
1.3自然安全威胁计算机网络在工作过程中也可能受到来自自然的安全威胁,这些威胁多为一些极端的天气或灾害,比如地震、龙卷风、暴风雨,这些都可以直接破坏计算机网络路线、设备,威胁计算机的网络安全。
1.4计算机病毒入侵计算机病毒具有很强的潜伏性,因此很难被发现。这些病毒能够在网络上进行传播,逐渐扩散到计算机的各个部分,而且这些病毒能够被某些特定条件触发,用户很难及时发现这些病毒的入侵[2]。
2网络遥测技术2.1网络遥测技术特点网络遥测技术与传统网络OAM工具相比,前者遥测对象为数据用户,后者对象为手动操作员。网络遥测技术能够实现网络自动化运行,传统技术可协助运营商监管、诊断网络,能够有效指导网络操作,两者技术差异显著[3]。网络遥测技术作为一种全新的技术,其特点如下。
2.1.1推送和流媒体网络遥测技术采集器通过订阅获取设备内的流数据,转变了传统的数据获取方式。
2.1.2数据容量和速度遥测数据能够满足机器使用需求,遥测数据量较大,一般为实时处理数据。
2.1.3标准化统一遥测技术能够满足网络自动化需求,传统单一解决方案应用优势不大。网络遥测技术能够实现数据的标准化处理,可确保遥测协议的统一。
2.1.4模型遥测数据一般借助预先建模,允许程序简化配置,以此实现数据的最大化利用。
2.1.5数据源多样单个应用程序所需数据来自多个数据源,包含跨域、跨层与跨设备、需要的关联数据等。
2.1.6动态性和互动性在网络自动化内,网络遥测技术可实时闭环控制,一般需要持续运行,以便适应网络运行控制器的查询需求。
2.2网络遥测框架2.2.1数据获取机制网络数据一般借助推动或者只轮询获取,在订阅者准备好之后,能够发出请求数据,发布模式可遵循发布-订阅(pub-sub)模型或订阅-发布(sub-pub)模型原则。基于pub-sub模式,合格订阅者能够借助发送预定义的号码实现数据订阅[4]。sub-pub模式能够为订阅者提供数据,要求网络设备交付数据。网络设备数据类型主要包括:(1)简单数据。能够从储存器、静态探头内获取数据,杨氏模式可解释其数据。(2)复杂数据。一个或多个网络设备原始数据需要合成、处理操作,一般在网络设备内,数据处理功能为静态加载和动态加载。(3)事件触发数据。能够依据时间针对性地获取数据,并设置有限状态机(FSM)。(4)流式数据。连续生成数据、定期生成数据,一般为时间序列,或者是数据库传输。网络的实际状态和测量由流数据处理反映,需要较大带宽和较强数据处理能力。
不可否认,传统OAM技术虽然技术较成熟,但是仅可查询简单数据。而高级网络遥测技术关注的是其他3类数据类型,擅长的是事件触发、流式数据和复杂数据查询的订阅。
2.2.2数据对象模块遥测技术在网络设备中的应用包含3个数据对象模块,分别为转发平面、控制平面和管理平面。各个模块可借助接口和网络操作实现程序交互。区分数据对象模块主要因为不同遥测数据对象会导致数据源、导出位置存在差异,这些差异会对数据编程和处理能力、数据编码和传输协议、数据传输带宽和延迟产生影响。
2.2.3功能部件在数据对象模块内,遥测可划分为不同的功能组件,其架构如图1所示。
(1)数据查询、分析和存储。
应用层内设置了数据查询、数据分析与组间储存3个组件。数据查询部分负责数据的查询和发布,查询可实现事件、数据的快照及订阅,可处理、保存与接收数据,查询采用交互式分析。数据分析部分借助设计,获得相应的模型数据信息,借助程序设计,能够获取定义数据。设备一般在网络设备和遥控器内。
(2)数据配置和订阅。
查询设备上的部署数据,可确定应用程序需要的协议,并建设通道,从而配置無法直接获取的数据源。通过订阅数据,能够描述模型、模块及程序。
(3)数据编码和导出。
网络遥测可实现遥测数据传输、储存与分析,其中数据编码、传输协议会受到数据导出位置的影响。
(4)数据生成和处理。
在网络设备内,数据源的捕获、处理及格式化包含网络设备快速路径、慢速路径的计算及处理。
(5)数据对象和数据源。
网络遥测可确定监控对象、数据源,能够进一步提供原始数据,可实现数据源的探查,并开展静态、动态安装。
3网络遥测在自动化运维中的应用3.1微突发检测基于TCP/IP的网络统计复用特性可决定流量的突发性,系统内的微突发、短期拥塞会加剧消息的丢失,使得通信消息重新传输,影响业务流的通信质量。微脉冲数量的增加会对通信质量产生影响。基于此,网络管理系统必须对微突发事件进行实时监控,并实现网络流量的快速调整,借助SNMP技术,能够搜集设备的访问流量。
数据采集期间,客户端系统、服务器通信频率较高,数据采集效率较低,会加剧客户端-服务器资源处理器的浪费。传统数据采集方式可实现终极流量的采集,但无法实现二级、毫秒流量的采集。一般情况下,5 min的采样周期流量曲线可反映每5 min的平均流量,但不能显示时间小粒度的流量,比如:毫秒突发流量、亚秒突发流量。订阅/分发推送模式下,网络遥测能够将客户端系统、服务器通信简化,可实现客户服务端效率与质量的提升,实现毫秒数据流量的采集与上传。为精准地反映互联网的实时流量动态,需要实时检测端口的微突发流量,若可及时发现网络拥堵,运维人员通过网络流量的动态调控,借助自动运维手段,可优化关键业务流程,延迟路径,减少影响,确保业务效率及质量。
传统网络监控方式已经不能满足现代网络对超大规模、快速定位、精细监控的需求,具体区别如表1所示。从表1中可以看出,只有亚秒级的精度才能有效捕捉运行中的微突发情况。
3.2关键业务流SLA检测5G时代将出现大量高价值服务,如eMBB和uRLLC。这些服务对延迟、抖动和丢包等质量指标提出了更高的要求,其SLA水平需要充分的稳定力,能准确地检测这些关键业务流,如网络运营和维护。传统的主动测量包含插入式探针、IP Ping、IP traceroute、设备内置等性能测试,通过发送测试消息,能够监测真实的业务流程,对其服务质量进行判断。若情况严重,这类测量方式会入侵网络,对正常的业务流产生干扰。但是测量结果仅反映业务流的服务质量,无法真正地反映业务流的路径。网络遥测技术本身屬于流内/带内检测IOAM方法,在用户数据包内嵌入新的指令,通过指示网络节点,在分组内添加IOAM数据,能够在转发路径上,获取最佳服务体验。这种混合检测技术不仅可以准确地检测服务质量流,而且可以规避传统测量缺陷。在IOAM域内部署了IOAM,包含封装节点、穿透节点与解包节点,在IOAM域前端中,IOAM封装节点能够向标记数据消息添加多个选项字段;在IOAM域的末尾,IOAM解包节点能够拆分节点消息内的IOAM选项字段,可恢复原始消息格式。IOAM穿透节点还能够感知消息内的IOAM选项字段,可实现数据的更新。在IOAM域节点内,能够处理数据消息。IOAM定义、IOAM跟踪选项内包含了固定大小的“跟踪选项头”“节点数据列表”。基于明信片的遥测(Postcardbased Telemetry,PBT)解决了IOAM的问题,PBT采用IOAM直接导出(DEX)选项,该选项经过IOAM封装节点,添加在包头内,包节点移除由IOAM进行。封装、穿透、解包节点DEX选项处理,能够将请求内的IOAM数据导出,并储存在采集器内,在PBT模式下,节点可处理数据包。DEX option的fixed option头包含32位流ID、32位消息序列,流ID能够关联多个节点,也可关联来自多个数据的消息,消息序列号可用于标志特定流的特定消息。这不仅有助于收集器关联路径节点发送的同一类别的特定消息IOAM数据,而且可精准分析数据包的丢弃位置。PBT方法能够将IOAM数据从分组内分离出来,以IOAM数据消息的形式导入服务器,在数据平面慢路径内可执行数据消息,避免对快速路径上的正常业务流性能产生影响。虽然PBT可有效解决IOAM问题,但消息通过节点可向采集服务器输出专门的IOAM数据,导致网络带宽消耗加剧,增加采集服务器的处理负担。基于此,找寻切实可行的方案,则需要对关键业务的传输、消息进行监控,以此启动PBT功能。在header节点(IOAM封装节点)内配置了访问控制列表,ACL能够选择接收监控的流量,可配备相应的采样率,比如:时间间隔、消息百分比等,能够获得受监控流量的子集。这可以大大地减少IOAM的带宽占用,以此降低采集服务器的储存与处理压力。
4结语综上所述,由于当今网络面临的超大规模、快速定位、精细监控等方面的需求,传统运维方式存在监控颗粒度大、运维系统效率低、无法检查微突发情况等缺陷。网络遥测技术作为全新的数据和信息收集技术,可实现数据收集种类的增加,包含了管理引擎、流量管理器,能够为网络用户的监控服务提供协议,从设备安装、网络系统运行到管理应用,可实现传统OAM统计信息收集范围的扩大,实现精细监控、快速定位及主动上报,提升网络自动化运维水平。
参考文献
[1]张璇,陈瑛.基于MAPS监控策略的FC交换机自动化运维方案设计[J].微型电脑应用,2021(12):120-124.
[2]黄靓.基于大数据平台的自动化运维及监控技术研究[J].无线互联科技,2021(22):115-116,162.
[3]魏小梅,傅林,苗晶晶.一种基于命令的网络设备自动化运维工具[J].科学技术创新,2021(32):96-98.
[4]李朝阳,周波,张小锋,等.一种基于Netmiko的网络设备自动化运维方法研究[J].通信技术,2021(3):773-778.
(编辑 王雪芬)
Network telemetry technology and its application in network automation O&MDai Tiancheng, Zhang Xiao
(Chengdu College of Arts and Sciences, Chengdu 610401, China)Abstract: Network telemetry is a new big data information collection and big data information analysis technology, which realizes the combination of data analysis and artificial intelligence, and can visualize the global e-learning status and traffic, so as to improve the level of Internet operation and maintenance. The paper first analyzes the challenges of IP Internet operation, summarizes their problems, introduces Internet telemetry technology, and finally studies and explores intelligent operation of IP Internet, providing reliable reference and effective guidance for intelligent operation of IP Internet.
Key words: network telemetry; automated network O&M; countermeasure