曹玮炜
(广东省电信规划设计院有限公司,广东广州,510630)
大数据技术在电信网络故障管理中的应用研究
曹玮炜
(广东省电信规划设计院有限公司,广东广州,510630)
随着我国社会和经济的持续发展,我国的电信网络发展的也越来越快,所使用的管理技术也在电信网络中发挥着越来越重要的作用。因为大数据技术具备很多优势,所以受到了社会的极大重视。本文对大数据技术的内容进行了详细的介绍,并把故障相关数据进行了汇总,提出了基于大数据的故障管理结构,说明了对大数据在故障处理时的主要功能和作用。不仅使解决故障变得简单、快捷,还满足了用户的使用需求,为以后的故障管理工作提供了有价值的参考依据。
大数据;故障管理;业务故障;用户感知
本文对大数据技术在故障处理中起到的关键作用进行了详细的说明,并把业务和用户产生的多种数据进行了深度的研究,进而找出其中包含的有价值的信息,及时找出故障的发生地点,制定出对应的解决方案,从而保证业务的正常运行,满足了用户的使用需求。
当网络开始运行的时候,业务、网络和用户等都会产生非常多的数据。这些数据不仅可以对网络运行情况进行清晰地反映,而且还能够说明业务当时的质量情况。因此,应该全面掌握电信业务运行过程中产生的故障数据信息。
1.1 网络资源故障有关数据;因为网络资源具有种类多,较分散的特点,所以网络资源数据是进行电信故障管理的关键数据来源。网络资源故障相关数据主要包括:
(1)一些最基础的信息数据。(2)每个设备上的重要文件。(3)故障的初始信息。(4)网络资源的配置信息。(5)资源性能故障信息。
1.2 业务服务故障相关数据;如果业务服务产生了故障,那么将没有办法为电信用户提供正常的服务。所以,业务服务数据是找出电信业务发生故障地点的关键数据来源。业务服务故障相关数据有:
(1)业务服务的基本信息。(2)资源故障表。(3)用户的基础使用情况信息。(4)服务系统的文件。(5)用户报修单。(6)积累的经验知识等。
1.3 用户体验类故障信息;用户体验类故障信息和用户的使用感受有着直接的影响。用户体验类故障信息有:
(1)用户自动产生的SLA违反单。(2)SLA的评估结果单和SLA评估数据。(3)用户的基本使用信息。(4)积累的经验知识等。
传统的故障管理系统比较落后,数据的来源比较单一,并且故障数据在管理系统中分布的比较分散,使得所有的故障数据不能很好的联系起来,无法及时的进行自动化故障处理工作,只能依靠相关人员来进行维修处理。总而言之,传统的故障管理结构已经没有办法满足现在的网络和业务管理的需求。
为了能够找出故障的发生地点,实行及时保护和解决工作,满足用户的使用需求,文章提出了基于大数据的故障管理框架,形成了以大数据的故障相关数据为基础的研究平台,达到了故障数据的统一储存和管理,并可以向别的应用系统提供故障数据存储、查询、汇总等服务。
2.1 数据源;数据源主要是利用收集手段对电信业务故障相关数据进行全面的采集。除此之外,还对企业内外部数据,例如天气情况、重大事情等进行收集。数据源所拥有的数据必须非常的全面和广泛,从而才能够成为分析大数据的强大数据来源。
2.2 数据存储;数据存储主要是存储所有的数据。存储的数据既包括最基本的原始数据,也包括突然出现的暂时数据。数据存储层的主要功能就是提供故障相关数据的存储、查询等。
2.3 数据汇聚;数据汇聚就是把所有的系统联系在一起,汇总成多数据源的数据,并使其拥有相同的数据格式,为故障处理提供方便。
2.4 数据处理;数据处理主要是对数据集实行多种处理功能,包括互换和质量保证等。
2.5 数据分析;数据分析是对故障进行管理的核心。采用Hadoop技术,提供非实时和实时的计算功能。
2.6 数据监管;数据监管主要通过数据保护和数据访问等手段,为数据提供良好的保护功能。
2.7 数据应用;数据应用层是结合处理故障数据的真实需要,对故障数据服务能力进行多方开放,对外提供查找故障发生地点、检测故障发生原因、进行故障处理等故障使用功能。
基于大数据的故障管理应用技术主要是通过监督和控制网络和业务、观察用户的使用行为,形成智能控制、测量和保护系统,对运行中产生的故障相关数据进行汇总和研究,从而能够及时找出故障的发生地点,并及时进行解决,满足用户的使用需求。
在面向用户感知的故障管理过程中,大数据主要在以下四个方面发挥着关键的作用
3.1 多源故障数据处理;故障管理数据的来源非常的广泛,收集的方法也非常多。而在大数据环境下以前的故障管理数据,需要从所有的系统收集和业务有关的数据,达成数据共享平台,使用多种有效的评价和测量方法,来达到数据质量控制的目的。
3.2 面向用户感知的业务质量评估;当用户看视频的时候,系统需要对用户的使用情况和业务质量进行监督和评价,从而为用户的业务质量提供保障。
传统的信息采集和流量监控,只关注视频的使用情况,而在大数据环境下,对用户的业务质量会从多个角度进行分析,建立全面的业务质量评估制度,从而优化了网络使用资源,为用户业务质量提供保障。
3.3 业务质量趋势预测;在上述情景中,系统要根据网络情况、用户使用行为等信息,对用户业务质量进行监督,从而达到用户的满意程度。
通过研究电信业务的传统数据,形成故障预防方式;通过全面分析各类数据,发现其中规律,预测其发展趋势,对故障进行预防和管理,满足用户体验。
3.4 故障定位及恢复;和原始的故障定位系统相比较,使用大数据技术找寻故障发生地点,结合用户、网络等数据,展开数据分析,为找出故障发生点并进行故障解决提供了更有价值的数据信息。
当上述场景中,当视频在观看中产生问题或者用户的业务质量不断降低的时候,系统能够对故障地点进行准确的定位,并制定相应的解决方案,保证业务的持续使用。
本文在故障管理中使用大数据技术,从而提升了用户体验。随着电信行业的快速发展,大数据技术在其中的应用价值也将会有更大的提高。
[1]郭道荣.基于数据挖掘的电信网络故障诊断技术的研究[D].重庆大学,2003.
[2]牛作元,张锋军. 大数据技术在电信网络故障管理中的应用研究[J]. 通信技术,2016,08:1051-1056.
Research on the application of big data technology in telecom network fault management
Cao Weiwei
(Guangdong Telecom Planning & Design Institute Co., Ltd.Guangzhou Guangdong,510630)
Along with our country social and economic sustainable development, the development of China's telecom network is becoming more and more quickly, the management technology is also used in telecom network is playing an increasingly important role. Because of big data technology has many advantages, so the related research department. In this paper, the content of big data technology was introduced in detail, and the fault data has carried on the summary, proposed based on fault management structure of big data, illustrates the data in the main functions of the fault processing and function. Make it easy for troubleshooting and fast not only, still meet the use requirements of users, for the following fault management work provides valuable reference basis.
Big data; Fault management; Business failures; The user perception