基于多源异构数据的IT智能运维体系构建与应用研究

2024-09-27 00:00陆康炎
科技资讯 2024年16期

摘要:为适应数字化时代对企业网络基础设施运维的新要求,探讨了基于多源异构数据的IT智能运维体系的构建与应用,深度梳理了当前企业IT基础设施运维的现状和需求,据此提出了一个整合数据采集、分析、监控、自动化操作和安全管理等功能的智能运维解决方案。结果表明:采用该智能运维体系能够显著提升网络运维的效率和安全性、实现对网络设备和服务状态的全面监控,有效预防和响应网络安全威胁,支撑企业的数字化转型。

关键词:多源异构数据智能运维体系IT企业监控系统

ResearchontheConstructionandApplicationofITIntelligentOperationandMaintenanceSystemBasedonMulti-SourceHeterogeneousData

LUKangyan

ZhanjiangBranch,CNOOCInformationTechnologyLtd.,Zhanjiang,GuangdongProvince,524057China

Abstract:Inordertomeetthenewrequirementsofenterprisenetworkinfrastructureoperationandmaintenanceinthedigitalage,thispaperdiscussestheconstructionandapplicationofITintelligentoperationandmaintenancesystembasedonmulti-sourceheterogeneousdata,deeplysortsoutthecurrentstatusandneedsofenterpriseITinfrastructureoperationandmaintenance,andproposesanintelligentoperationandmaintenancesolutionthatintegratesthefunctionsofdatacollection,analysis,monitoring,automationandsecuritymanagement.Theresultsshowthattheintelligentoperationandmaintenancesystemcansignificantlyimprovetheefficiencyandsecurityofnetworkoperationandmaintenance,achievethecomprehensivemonitoringofnetworkequipmentandservicestatus,effectivelypreventandrespondtonetworksecuritythreats,andsupportthedigitaltransformationofenterprises.

KeyWords:Multi-sourceheterogeneousdata;Intelligentoperationandmaintenancesystem;ITenterprises;Monitoringsystem

随着数字化转型加速,企业对计算机网络基础设施依赖增强。全球数据流量未来五年将增长五倍,网络安全事件频发,对网络稳定和安全性需求提高。智能化网络运维(ArtificialIntelligenceforITOperations,AIOps)技术依托云计算、大数据分析、人工智能(ArtificialIntelligence,AI)和机器学习(MachineLearning,ML)成为保障网络运行效率和安全的关键,实现网络基础设施的自动化监控、管理和优化[1]。虽然,领先的IT企业和金融机构已部署智能化NetOps解决方案,应对网络扩张,但许多企业在实施中遇到运维平台缺失、子系统集成度低、运维数据孤岛等问题,降低了运维效率,增加了网络运行风险[2]。面对网络安全形势的挑战,迫切需要通过技术创新和系统整合构建高效、安全和可靠的网络智能运维解决方案,为企业数字化转型成功带来希望。

1智能运维的关键技术

如下表1所示,智能运维实施需关注综合监测技术、数据分析与可视化技术、智能决策支持技术、自动化运维工具、运维流程优化技术和安全防护与响应技术。

2系统架构设计

2.1总体蓝图

基于云技术的计算机网络智能运维系统,以数据为核心生产要素,构建了一个全面的架构体系。该系统采用“1+N”模式,目标涵盖网络运营管理、生产组织及设备维护的现代化转型[3],以维修业务策划、用户需求分析和生产组织优化等设计策略实现了资源的高效配置和利用。

2.1.1智能云主线

整合企业内外的网络资源,构建统一的云平台,依托云计算技术这一核心,推动大数据和人工智能技术的应用。利用云计算和边缘计算的先进技术,提供集中的计算和数据分析能力,支持大规模网络设备监测、数据分析和智能化监控。依托大数据技术,优化网络安全运维和信息化服务,使服务的专业性和定制化增强。

2.1.2业务板块创新

针对计算机网络的管理、运营和服务需求,实施全生命周期的管理策略,构建全方位服务体系[4]。创新形成了包括智能监控、自动化操作、安全防护、故障诊断、管理决策、工具集成、信息展示等多个关键业务领域,在新一代信息技术的支持下,深入探索计算机网络智能运维技术的应用,加强技术和业务的融合发展。

2.1.3全面安全策略

构建了全面的网络信息安全策略,考虑到网络的多层安全需求,实现智能运维系统的安全保护,建立完善的技术标准和设备状态评估体系,推动计算机网络智能运维的全面进步,最大限度地发挥智能运维在网络安全管理中的核心作用。

2.1.4综合能力构建

在智能运维的战略指引和总体目标下,目标锁定于构建智能化和数字化驱动的核心运维能力,实现服务全覆盖、流程优化和信息共享。

2.1.5智能运维设备配置

配置了服务器、路由器、交换机及其在线监控设备、智能分析系统、安全防护工具等多套智能运维工具和设备,为实现网络的自动化和智能化运维提供硬件基础。

2.2系统架构

在架构设计上,计算机网络智能运维系统采用了层次化和分布式架构,包含基础设施与接入层(涵盖数据采集、网络连接和基础设施管理)、平台层和应用展示层。该系统能够与网络监控系统、环境及安全监控系统、自动化响应系统、时间同步系统等进行数据接口交换,实现对网络设备状态的实时监测、智能故障诊断和预警及设备健康状态管理,构建完善的知识库以支持故障应急指挥。

在计算机网络智能运维系统中,基础设施与接入层主要负责数据采集,包括服务器和网络设备的状态、故障记录、操作日志、安全警报、配置管理、用户活动追踪、运维进程监控、性能评估、环境监测等。该层的设计使数据能够从各个感知点无缝汇聚并融合,克服了信息孤岛的问题,满足了复杂的数据处理和应用需求[5]。网络构建方面,该层支持站点间及站点到数据中心级别的有效连接,为数据传输和通信提供骨干网络,并实现不同网络层次间的无缝集成。

平台层负责处理从基础设施与接入层获取的信息,并执行存储、分析和计算任务。该层需要建立标准化的设备管理和健康评价指标体系,并能根据数据性质和应用需求灵活选择存储解决方案,优化运维数据的集成利用。利用数据挖掘技术,该层可以累积丰富的运维知识库,支持基于人工智能的数据分析,为智能化决策提供必要的支持,从而以高效和精准的方式提供操作和管理的智能辅助。

应用及展示层为运维人员、管理层和维护团队提供交互界面。这一层分为决策、管理、业务和接口4个子层。在决策子层,主要关注网络系统运维的长期战略、绩效和成本管理;管理子层侧重于检修、维护流程和成本控制策略的制定与执行;业务子层依靠大数据分析执行网络设备的实时监控、异常检测、趋势分析和可靠性评估;接口子层则确保系统与其他监控、安全、自动化响应等应用的数据和资源整合,促进跨领域的信息交流和协作,进一步提升网络智能运维的效率和效果。

3系统功能

基于计算机网络智能运维系统的功能需求分析,该系统能够实现下表2中展示的核心功能。

3.1自动化监控检测

利用高级监控技术,如自动化巡检脚本和网络性能监控工具,实时监控关键网络设备和服务的运行状态。系统支持自定义监控规则,以实现对网络流量、服务器负载、应用响应时间等关键性能指标的自动追踪和检测,及时发送告警信息,确保网络环境的全面自动化监控。

3.2操作智能化

集成了基于AI的自动化运维工具,能够支持远程自动化执行配置更改、软件部署、故障恢复等操作。借助先进的机器学习算法,系统可以自动识别和执行最优操作流程,实现高度精确的操作执行和快速问题解决。

3.3安全智能化

融合了最新的网络安全管理技术和工具,包括入侵检测系统(IDS)、入侵防御系统(IPS)和安全信息与事件管理(SIEM)系统。结合访问控制和身份认证机制,确保只有授权用户能够访问敏感网络资源和数据。系统利用高级的安全算法和加密技术保护网络环境,防止安全威胁和数据泄露。

3.4诊断智能化

引入了基于AI的故障诊断和预测管理系统,对网络设备和服务的实时数据进行深度分析,以评估系统健康状态、预测潜在故障并实施预防性维护策略,这一功能帮助系统管理员及时发现问题并采取措施,避免故障发生或减轻其影响。

3.5管理智能化

采用全面的信息化管理平台实现对网络设备、配置、工作计划和工单的数字化管理。系统通过数据分析和机器学习技术评估运维任务的效能,提供仿真培训和决策支持,优化资源分配。此外,系统还能对网络能源消耗进行监控和优化,提高能效和减少运营成本。

4结语

综上所述,基于多源异构数据构建并应用IT智能运维体系可解决当前网络运维面临的数据孤岛、效率低下、网络安全威胁等挑战。本文依托云计算、大数据、AI、ML等前沿技术,对智能运维体系的设计理念与关键技术进行了深入探讨,详细阐述了系统架构与核心功能,最终得出以下结论:(1)实施智能运维体系显著提升了网络运维效率,自动化监控检测、操作智能化等功能的介入减少了人为操作错误,使问题可被快速题解决;(2)该体系能有效提高网络安全性,利用IDS、IPS和SIEM系统,结合访问控制和身份认证机制,为网络环境提供了全方位安全防护;(3)全面监控与智能诊断增强了网络系统的稳定性,系统可基于数据分析评估系统健康状态,预防潜在故障;(4)智能运维体系促进了企业数字化转型,在集成化平台构建、运维模式创新等功能的支持下,运维流程得以改善,帮助企业更好地适应数字经济时代的新要求。

参考文献

[1]张海彬,罗玉林,区云帆,等.基于中铁贵州智慧社区管理的多源异构数据集成方法[J].建筑技术,2023,54(22):2808-2813.

[2]李超.数字新基建背景下能源工业云网多源异构数据接入与融合研究[J].电子元器件与信息技术,2023,7(11):106-109.

[3]闫佳和,李红辉,马英,等.多源异构数据融合关键技术与政务大数据治理体系[J].计算机科学,2024,51(2):1-14.

[4]库新勃,张海龙,杨帅.基于XML格式融合多源异构数据建设智慧社区数据管理平台[J].电力勘测设计,2023(8):1-5,17.

[5]石俊杰,赵子岩,何永远,等.基于多源异构数据湖平台的电力信息通信多源异构数据清洗方案[J].电力信息与通信技术,2023,21(7):59-66.