[曹德强]
大数据技术的基础是数据,移动网络作为目前最大的数据产生源之一,其每天会产生海量的数据。数据中蕴含着网络的健康情况,用户的使用感知等各种各类的信息,如果不加整理直接进行存储,则会对后续的数据分析带来极大的不便。因此需要针对不同的数据类型,建立符合其自身数据特点和应用场景的数据库模型,以提升数据的存取效率,使数据更易分析使用,为后续的数据挖掘打下一个良好的基础。本文主要针对参数类的数据,结合网络的拓扑结构,提出了一种符合范式、易维护、易扩展的数据存储模型,供各位读者在实际的应用中进行参考。
现阶段,移动网络的经历了由2G 到5G 的技术演进,网络也从模拟时代进入了数字时代,网络中硬件结构的组成也不断发生着变化。但移动网络整体的拓扑结构依然使用着树状组网的拓扑方式,因此如果在数据存储方面也采用与网络拓扑结构相同的架构进行数据存储,可以极大的提升整体数据的可读性,增强用户体验。
同时,在数据存储方面采用树状的存储方式,可以极大的减少数据库表的数量。但也存在一定的问题,比如在树状分支较深的情况下,数据间的关联就显的比较繁琐,会导致数据查询效率较低。因此,需要一种数据存储方法,能够优化整个树形结构表的查询、更新和删除方式,提升整体的数据查询和更新效率。
结合移动网络的拓扑结构,设计出一种树状的数据库模型,能够方便地进行数据查询,实时响应用户的查询动作,且便于数据维护和更新。
(1)数据库三范式原则
第一范式:原子性原则,字段不可分,每个字段是原子级别的
第二范式:完全依赖,非主键字段完全依赖主键
第三范式:消除传递依赖,非主键字段不能相互依赖
(2)可扩展性原则:移动网络的业务是不断扩展的,其中的网元也会不断增加,因此模型设计上要遵循可扩展性原则,便于后期的业务扩展。
(3)易维护:当网络节点出现增删等情况时,能够方便快捷的维护整体数据库的架构。
移动网络的拓扑结构从单个基站的角度来讲是树状的,以LTE网络为例,其单个基站的拓扑结构从硬件上可分为:BBU-板卡-RRU-天线四层结构,从逻辑结构上又可大体分为:基站-小区-邻区三层结构,整体结构相对清晰。
但从现网北向数据(按集团规范,厂家需将网络参数上传至北向服务器)的组成上来看,其板卡、RRU、天线这些硬件并未在数据上显示明显的树状结构,而是并列呈现的,其整体的数据组成结构如图1 北向参数架构图所示。
图1 北向参数架构图
由图1 可知,在常规的数据存储中,如果需要得到一个BBU 下,主要的硬件和逻辑网元信息,则需要对板卡、RRU、天线、基站、小区等数据表分别进行关联,才能得出结果,其查询效率相对较低,数据库语句写法也相对较为复杂。
那么有没有更简单的存储方式呢?图1 中,我们把各表单独进行存储,表与表之间虽然可以通过外键进行关联和约束,但在统计上就显的较为复杂。
如果我们把各表内通用的字段提取出来,按照树状结构放在一张表内,再将各表的私有字段存储在私有表中,那么我们在统计上就会显得相对简单一些,只需要在一张表内进行即可。如果需要各参数表的具体参数信息,则可以通过与相对应的参数表进行关联获取,其数据库模型可以抽象为图2 树表结构设计图。
图2 树表结构设计
在该模型中,将各参数表的通用字段存储在一张通用表内,添加网元类型字段用于区分参数类型;添加父节点ID 字段,用于进行表内的数据关联和统计。该模型将原本树状的网络架构进行了扁平化,将网络内的主要网元信息存储在了一张通用表内,与原有的模型相比,有如下几个特点。
(1)简化了数据统计
将原本需要在多个表间进行的关联统计,简化到了一张主表内。在主表内通过递归查询,即可实现原本需要多个表关联的统计,极大地简化了统计语句,同时提升了查询效率。
(2)结构灵活,数据易扩展
随着网络的不断升级,数据版本不断地演进,网络存在多版本共存的情况,但实际网络规模扩长并没有那么快速。
传统的数据架构设计中,每新增一个版本,就需要新增一张数据表,在做数据统计时,就需要多关联一张表。采用树表结构设计后,如果新增了一个版本的数据,只需要在主表内进行相应的数据更新即可,其新版本可以作为一个新的参数表,与主表进行关联,其原有的统计方式不变。数据扩展方便,可以根据需求随时进行扩展,脚本改动小,开发迅速。
(3)维护方便
当某个参数版本不需要时,可以对该版本的参数表进行整体删除,而不影响统计结果,极大地降低了维护成本。
本部分以LTE网络为例,对各主题域所包含的内容和关系进行描述,整理各主题内资源的逻辑关系
通用参数表主要将LTE网络内的通用参数进行存储,并添加相应的网元类型和父节点信息,便于进行数据统计。如表1 所示,通用参数表。
表1 通用参数表
包含了RRU、BBU、板卡、天线、逻辑基站、逻辑小区等网络参数信息,与通用参数表进行关联,用于查询某个网元的具体网络参数。参数信息表如表2 所示。
表2 参数信息表
通信网络数据架构多以树状结构为主要的拓扑形式,传统的数据存储方式虽然可以满足数据存储的需要,但在数据查询效率和扩展性方面存在较大的不足。当出现数据版本升级时,会导致较大的代码改动,数据维护升级维护成本较大,在数据统计方面需要关联大量的表格才能出结果。
采用主表与实体参数表相结合的模型进行数据设计,可以极大的减少数据和代码的维护成本,而且极易实现数据的横向扩展,对后续的网络升级极为有利。
其不足之处在于:
(1)通用表的数据量可能相对较大。在实际的模型设计中,需要根据网络的规模进行通用表的拆分。不需要将所有的数据存在一张通用表内,可以适度拆分,减少通用表的数据存储量。
(2)对于树状分支较深的表,采用递归查询,效率会有所降低。递归查询在多层的深度分支表内,其查询效率会有所下降,且对资源的占用率比较大。因此,在遇到多层分支表的情况下,可以提前将树状关联关系计算出来,再进行数据统计。
在实际的网络数据库设计中,应结合当地网络规模和数据组织结构以及实际的业务场景,选择合适数据库模型进行设计,以提升整体的系统资源利用率和网络响应速度。