基于云计算的通信工程数据智能处理技术分析

2024-04-16 11:36申乃芝曹晓微

通信电源技术 2024年3期

申乃芝，曹晓微，刘瑜，秦月，张玉

（国网天津市电力公司城东供电分公司，天津 300250）

0 引言

随着信息化建设的不断深入，通信行业的数据量呈指数增长态势，海量异构数据的高效分析处理对通信工程质量和通信业务运营的支撑能力提出更高的要求。文章研究采用云计算技术，设计通信工程数据智能分析处理方案，以提高数据处理效率，发掘数据价值，实现通信网络的智能决策。

1 云计算技术的内涵及范畴

云计算的核心技术集群包括虚拟化技术、分布式存储体系、大规模数据处理技术等多个维度[1]。在技术内核层面，云计算依赖虚拟化技术的力量，成功整合不同硬件配置的系统资源，并实现精细化调度与高效优化，使得用户能够依据需求灵活访问和利用数据中心的各项计算能力、存储空间和网络带宽资源。例如，借助虚拟化技术，多个独立的物理服务器可以被虚拟化整合成一个统一且弹性的资源池，既提升资源的整体利用率，又确保各应用程序间的性能隔离与安全性保障。而在应用实践层面上，云计算极大促进基于互联网的服务的即时供应与自动扩展能力，用户能够根据实时业务负载的变化情况，无缝增减所需的服务器规模、存储容量和网络资源，全程无需人工介入，从而显著减少应用迁移至云端环境的时间成本，并降低复杂性。

2 传统通信工程数据处理技术局限性分析

传统的通信工程数据处理技术受限于一系列固有的局限性，表现为数据管理流程烦琐冗杂、存储格式多样不一以及计算平台的封闭性等。举例来说，在现代通信场景中，单个基站每日所产生的业务数据量可能高达300 GB以上，主要包括交易记录、网络状态数据、设备性能指标以及网络资源调度等各种类型的数据[2]。这些海量数据碎片化地分布在众多不同的数据库系统中，由于格式各异，形成大量不必要的冗余和重复，增加数据处理的复杂性。针对如此庞杂的数据集，现有的处理方法通常需要运用MapReduce、Hive、Spark 等多种大规模数据处理框架，开发高度耦合的数据分析模型，而这不仅导致模型的复用性差，还增加开发与维护的成本。此外，由于数据体量庞大，批处理过程耗时较长，无法实现实时数据更新，致使决策支持的有效性和时效性受到严重影响。随着5G 网络部署步伐的不断加速，通信领域的数据规模正以前所未有的速度迅猛增长，传统数据处理手段愈发显得力不从心，难以应对指数级增长的数据洪流。因此，迫切需要一种创新的通信工程数据处理解决方案，旨在推行统一的数据存储格式标准，打破计算框架之间的封闭性壁垒，实现流式与批量计算的无缝融合，最大化挖掘数据蕴含的价值，进而有力驱动通信网络向智能化决策方向演进。

3 基于云计算的通信工程数据智能处理技术构建

3.1 云计算基础设施搭建

在构建针对通信工程数据处理的云计算基础设施时，关键目标在于确保系统具备强大的弹性扩展能力和智能化调度机制。因此，设计方案依托于高效能数据中心服务器集群，采用先进的虚拟化技术实现硬件资源的深度整合与池化。具体硬件层面，选用高性能计算与大容量内存兼备的服务器，单个计算节点搭载双路28 核心处理器，配备512 GB 内存容量，充分满足大数据密集型并行计算任务的需求；同时，本地存储配置6 TB 硬盘用以临时存储实时流数据，并借助固态硬盘（Solid-State Drive，SSD）大幅提升读写性能。在网络架构设计上，每一个计算节点均标配至少2 块万兆速率的网卡，连接至支持40/100 Gb/s 低延迟链路聚合功能的交换机，从而有效保障东西向流量间的高速稳定传输。在虚拟化层级，部署VMware vSphere 环境，通过对底层物理服务器资源进行逻辑抽象，构建一个支持多租户的资源分配体系。这样便可以根据业务需要动态地创建、删除虚拟机实例，灵活扩充资源，最大化资源使用率。例如，在应对5G 单基站实时数据接入场景时，估算所需动态创建虚拟机实例数量的公式为

式中：n表示所需动态创建的虚拟机实例数量；D表示单个基站每秒产生的数据流量；λ表示单基站的数量；C表示单个虚拟机CPU 的处理能力；U表示虚拟机CPU 的平均使用率。

在平台管理层级，采用开源的云管理框架OpenStack，用于统一管理和调配所有虚拟资源，并通过开放RESTful API 接口实现基础设施即服务（Infrastructure as a Service，IaaS）。这套精心设计的云计算方案能够弹性适应不断增长的通信工程海量数据存储与计算需求，提供高度定制化、高效响应的服务能力。

3.2 数据集成与预处理

针对通信工程中数据分散存储在关系型数据库、文档型数据库、时序数据库等多系统的现状，本设计采用数据集成和预处理技术对数据来源进行统一管理[3]。采集层通过配置转换适配器的方式获取不同来源数据：关系数据库开发自定义Java 数据库连接（Java Database Connectivity，JDBC）驱动程序加载数据到Hadoop 平台；文档数据库利用开源组件Mongo-Hadoop 建立MongoDB 和Hadoop 的连接，使用MapReduce 直接对文档进行分析处理；时序流数据则通过Kafka Connect 采集工具订阅数据库变更日志。传输层利用Apache NiFi 构建集成数据流水线，实现异构数据格式、传输协议的转换。例如，将MySQL数据库使用JS 对象简谱（JavaScript Object Notation，JSON）编码映射为优化行列式（Optimized Row Columnar，ORC）文件，Avro RPC 协议转换为Thrift RPC 等。存储层采用Hadoop/HBase 等分布式存储系统，对结构化和非结构化数据统一存储，基于文件元数据构建数据目录服务，支持结构化查询语言（Structured Query Language，SQL）、文档、流式3 种查询接口。查询优化层使用Alluxio/Cache 技术缓存热点数据块，利用列式存储技术对宽表进行压缩，根据查询负载情况自动调整数据布局，实现原子性、一致性、隔离性以及持久性（Atomicity Consistency Isolation Durability，ACID）事务与高并发的平衡。该数据集成与管理设计可有效整合异构系统数据，优化数据流水线，为后续的智能分析算法提供高质量的数据集。

3.3 智能分析与模型构建

针对通信工程海量异构数据的智能分析问题，文章设计采用基于Spark 的机器学习平台，构建弹性扩展的分布式模型。采用专门的接收器来处理流式数据和批处理数据，分别由Structured Streaming 和Spark SQL 引擎进行预处理。特征工程层将数据统一映射为特征矢量，并调用MLLib 等算法工具包进行特征提取、转换等，构建高质量的特征空间。以网络质量诊断为例，输入源包括核心网元素的告警日志、性能指标时间序列和网络配置数据等，经特征处理后构建样本集X={x1,x2,…,xn}，样本特征矢量包含用户号码、地理位置和蜂窝基站标识等多维属性[4]。

模型构建层按照不同预测目标，选用支持向量机（Support Vector Machine，SVM）、随机森林等监督学习算法或主成分分析法（Principal Component Analysis，PCA）、K-Means 等无监督学习算法。以网络故障预测为例，目标变量为网络元素的异常指标，使用随机森林二分类模型，损失函数为

式中：yi和i分别表示样本xi的真实标签和预测标签；θ表示模型参数；N表示样本容量。该模型承载于弹性的Spark 计算框架，可充分利用集群动态资源实现模型并行训练，降低单机内存压力。模型操作层使用MLflow 等工具进行模型版本的管理、比较、部署，并与下游分析任务链连接，构建闭环的通信网络数据分析体系。

3.4 结果可视化与决策支持系统

通信工程数据分析结果的可视化呈现和决策支持是实现智能化网络运维的最后一步。本系统设计以Apache Superset 为核心，构建支持多终端的分析可视平台。数据接入层集成Spark、Hive等分布式计算框架，编写SQL 查询转换数据源，封装符合Superset 逻辑的数据抽象层。呈现层支持包括地图、表格、图表多种可视组件，通过动态控制面板容纳组件，实现综合化的仪表盘设计。以5G 网络质量监控为例，仪表盘以服务小区为维度展示关键性能指标：独立小区用户速率扩散图实时反映质量服务（Quality of Service，QoS）；在Top 10 小区中，无线电资源控制（Radio Resource Control，RRC）连接建立的时延情况，能够反映信令流程的性能表现；蜂窝网络空中下载（Over-The-Air，OTA）配置故障的工单数量在地理分布上的热力图，有助于定位网络覆盖的差异等问题[5]。

决策支持方面，平台提供模式发现、根因分析、资源优化等智能引擎服务。例如，采用关联规则算法发现高流量小区常见配置模式，指导网络扩容规划；利用深度学习模型预测接下来一个月故障工单数量，优化维修资源预配比；根据多时空维度（天、周、月）的用户密度变化和移动性模型，生成下一周候补封站小区的优先级排序建议。该分析决策系统向业务、运维人员提供全面的网络运行数字化视角，有助于实现智能化和精细化的通信网络管理。

4 实验验证

4.1 实验设计

为验证所设计方案的有效性，构建通信工程海量数据处理实验平台，模拟现网环境产生类似数据集，设计端到端流程评测。数据层面，使用开源工具生成包括核心网元告警日志、性能指标时间序列、网络配置数据、用户业务日志等多个数据集，数据格式覆盖关系型、时序、文档型等。Singles 实例按照自定义模式随机生成异常事件和故障样本，保证分类样本分布平衡；用户日志利用SUMo 工具基于实际路网和用户移动模型生成，峰值流量达到实时5 万个订单。

计算框架方面，部署基于Kubernetes 的Spark 集群，资源配置为30 个工作节点。测试案例设计网络故障预测模型训练和预测流程，包含特征提取、模型构建、离线验证和在线服务4 个阶段。离线阶段对历史故障工单数据提取空间特征和时序特征，利用随机森林算法训练，每个时空样本包含100 多维属性，标签为二分类。在线阶段集成模型对流式数据进行实时预测，输出故障概率，按照效果曲线评估延迟、吞吐量指标。

4.2 结果与讨论

实验结果显示，基于云计算技术的通信工程数据智能处理方案可以有效提升数据处理效率和质量。数据集成层面，异构数据接入吞吐量可线性、弹性扩展，单工作节点最大可达到20 000 条/s 日志数据的摄入速率；数据集中存储具备PB 级容量，支持SQL和Ad-Hoc 这2 种查询接口。测试案例中，包含有线、光纤和无线多域网元的历史故障日志数据，原存储大小为621 TB，经过压缩和索引后，存储占用降低到243 TB，查询速度提高68%。机器学习模型的效果如表1 所示，在大数据量条件下，关键指标与单机情况相当，最终取得了89.36%的F1分值，能够满足工程场景的在线需求。

表1 机器学习模型的效果比较

5 结论

文章主要构建端到端的通信网络数据处理技术方案，通过虚拟化、大数据、人工智能等技术的有机融合，解决了数据分散、计算框架封闭、业务应用僵化等问题。方案具有平台无关、可扩展、智能化等特点，可高效实施通信数据的集中管理、模型训练、智能预测以及自动决策等功能，显著提升数据驱动业务的敏捷性，赋能通信网络的智能运维与精细化管理。