韩永涛,程乔
(1 中国联通福建分公司网优中心, 厦门 361006;2 中国联通广西分公司网优中心,南宁 530028)
随着电力系统改革的全面展开和不断深入,电力逐步走向市场化,改进传统的电费结算手段,是提高电力部门的生产经营管理水平和管理效率,最终实现电网商业化运营,建立区域乃至全国统一的电力大市场而采取的重要举措。通过移动运营商的GPRS网络系统,电力部门可将工业和民用电表采集的电力系统数据实时传递到地、市、省级的集中监控中心,以实现对电力监测设备的统一监控和分布式管理,开创数字化工作模式。
某市联通2G网络在用的电力抄表终端1300多户,据供电局反馈部分电力抄表终端的在线率不高,影响了电力数据的传输,但是全网的电力终端分散在城区和乡镇,且终端安装在电力机房,常规的现场测试排查手段存在处理效率低、问题定位难的弊端。为此,本文介绍了基于信令特征分析的电力抄表系统优化方案,是以实时采集Gb、Gn信令为基础搭建数据业务综合分析系统,融合多接口端到端关联分析手段,可以实现快速定位终端、用户、无线、核心网、业务服务器等的异常问题,保障电力抄表终端的在线率,提升客户感知。
联通GPRS电力抄表终端可以看作一台GPRS接入终端,采集终端接入到2G的GPRS网络,GPRS网络提供到电力公司网络的数据采集服务器的接入,即GPRS核心网网元GGSN提供到电力公司企业网的接入(可以通过专线或隧道),GPRS网络为电力公司服务器所在网络分配APN。
数据采集终端发起PDP激活时,提供对应电力网络的APN,指明接入到数据采集服务器所在的电力公司网络,GGSN在收到采集终端的激活请求,认证成功后为采集终端分配一个IP地址。此IP地址由企业用户规划,配置在GPRS APN管理平台上。采集终端PDP激活成功后,能够成功接入电力公司网络访问数据采集服务器,进行必要的通信。图1为电力抄表系统部署方案。
远程无线电力数据采集是通过APN专网接入方式,以GRE隧道加密方式基于GPRS无线数据网络进行电能量相关数据的传输应用。电力通过安放在与变压器相连的电能量采集终端,不需要爬杆就可以轻松实现电能量采集。
GPRS电力远程抄表系统由位于电网公司的配电中心和电表数据采集点组成,利用联通现有的GPRS网络,电表数据通过联通的GPRS网络进行传输。
在使用GPRS网络的情况下,要求终端通过定时发“心跳分组”将终端保持在连续在线的工作模式,便于系统主站了解各终端的工作状态和统计上线率,目前为了提高终端在线监测而将电力数据采集终端的心跳周期设置为2 min。采集终端定时每15 min采集并上报一次电力数据,每次的数据1~2 kbyte,每天主动采集96个时间点的数据。
电力数据采集终端要求通信网络支持“每次传输数据量较少、传输次数频繁”的工作方式,监控系统还可以根据数据分组的交互来实现对电力环境以及表具的实时远程监控,完成数据的集中存储和统一管理,实现对表具的远程维护和远程控制。
总的来说,要求终端可以随时向主站上报数据,电力的主站服务器也可以随时找到终端,并向终端下发采集任务。
图1 电力抄表系统部署方案
电力抄表行业应用在网络中的信令及业务交互涉及到多个网元之间的接口,本次基于Gn口和Gb口信令进行行业应用的分析。无线抄表无线网络数据传输信令特征如图2所示。
图2 抄表终端的数据交互信令流程与无线链路释放信令流程
从图2的Gb口的信令可以看出,电力无线自动抄表系统中,终端与服务器进行数据交互所使用的协议为TCP协议。数据采集终端(插有联通SIM卡的集中器)与服务器进行数据交互前首先通过附着鉴权、PDP激活过程与联通GPRS网络连接;其次进行TCP三步握手连接来与电力系统的数据服务器(如IP:172.32.2.30)建立连接; 然后以Ack、Push和Ack分组进行数据交互;最后当数据交互完成应用结束时,以Ack、Fin分组的形式断开连接来结束本次应用。
电力抄表终端的心跳是用来维持终端与服务器之间连接,方便系统监控终端的在线情况,为了提高抄表终端的在线监测,某市的电力抄表终端心跳间隔设置为2 min,其Gb口的信令流程可见抄表终端的心跳交互过程,心跳间隔为2 min,心跳分组Ack大小为92 byte,Ach、Push大小为121 byte,一次心跳的产生的IP分组大小合计约为426 byte,上下行交互分组数为3个或4个。
图3 电力抄表系统E2E优化方案
由于电力抄表终端数量多、分布广,常规的现场测试排查手段存在处理效率低、问题定位难的弊端,因此,引入基于数据业务综合分析系统的E2E解决方案,以信令特征手段定位终端的异常问题,是提高问题处理效率,实现批量用户监控及优化的最佳手段。
数据业务综合分析系统是基于Gb、Gn信令采集与处理,可提供网络性能统计分析、用户实时信令跟踪、用户历史记录查询、异常问题定位等,因此,基于数据业务综合分析系统的E2E分析方法,能更有效地监控及排查电力抄表端的在线情况。电力抄表系统E2E优化方案如图3所示。
电力抄表系统E2E的分析流程如下:
STEP 1:确认电力终端在线率是否正常。从日常平台监测、历史记录查询分析得到电力抄表终端的在线性能。
STEP 2:异常终端的Gb指标分析。建立Gb口的电力抄表终端性能指标体系,从接入性能、保持性能和完整性能全面评估指标优劣,排查异常问题。
STEP 3:异常终端占用的小区无线性能分析。基于Gb口关联出电力抄表终端占用的小区,排查小区无线的无线性能。
STEP 4:总结问题根源,提出优化方案。以终端、无线、Gb、Gn的端到端分析定位思路总结异常电力抄表终端的问题根源,提出相应的优化方案。
STEP 5:优化方案实施及验证。对优化方案进行实施后,再次使用数据业务综合分析系统对电力终端的在线性能进行优化验证。
根据客户反映,某市电力抄表系统存在的最主要问题是终端不在线问题。电力抄表终端的数据集中器现设置为2 min发一次心跳数据分组,即数据集中器每隔2 min便会通过联通无线网络,与服务器进行一次数据分组交互,如果服务器接收到该心跳数据分组,那么服务器便会认为该号码实时在线;否则该号码被认为是不在线。常见的终端不在线分为如下两类:
第一类:一直都不在线号码:此类号码在电力抄表监控平台上表现为一直都不在线,这种情况既不能进行电力数据采集也不能进行实时监控。
第二类:时而不在线号码:此类号码在电力抄表监控平台上表现为部分时间显示为实时在线,部分时间显示为不在线,即在电力抄表后台监控平台上,此类号码时而在线时而不在线,这种情况用户不能实时有效地对终端进行监控。
根据数据业务综合分析系统对电力抄表终端的Gn口心跳分析,建立终端的Gn口的交互流量和交互分组数标准,则可反映抄表终端的在线率情况,如下:
1小时心跳分组流量=单次心跳产生的流量×1小时心跳次数=426×(60/2)=12 780 (byte)
1小时心跳分组数量=单次心跳交互的分组个数×1小时心跳次数=4×(60/2)=120 (个)
可见,单用户1小时心跳分组流量为12 780 byte,1小时心跳分组数量为120个,以在线率80%以上定义正常电力终端的心跳分组流量最低门限为10 000 byte,心跳分组个数为100个,即心跳分组流量低于10 000 byte或心跳分组个数小于100个的终端判断为在线率异常。
通过主动统计电力抄表终端每小时的上下行流量和分组个数是否符合最低门限,就能快速定位终端的在线性能,建立两个评估电力抄表终端在线率的评估指标:心跳流量缺口和心跳分组个数缺口,计算如下:
* 心跳流量缺口= 终端每小时实际的流量—心跳流量最低门限(10 000 byte)
* 心跳分组个数缺口= 终端每小时实际的个数—心跳分组个数最低门限(100个)
统计某市全网电力统端的平均每小时的心跳流量缺口和心跳分组个数缺口,共有232个终端存在缺口,即232个终端的心跳交互存在异常而导致在线率偏低。
通过与供电局进行核实,发现232终端在供电局不在线终端列表中匹配度达到了97.23%,说明利用心跳分组主动发现异常电力抄表终端的方式可行。
针对主动发现的异常终端,通过数据业务综合分析系统针对关键信令点进行流定制,可以实现批量找出异常终端的产生原因所在。
4.2.1 基于Syn无响应信令定位服务器IP配置错误
Syn连接是电力抄表终端与服务器建立通信的关键流程,在电力抄表终端的设置界面需手动配置服务器(主站)的IP地址。从信令流程分析,Syn消息的dest_IP就是服务器的IP,若电力抄表终端的服务器IP输入错误,那么终端就无法与服务器建立TCP连接,将导致电力抄表终端长期不线。
基于Gb信令分提取Syn消息的dest_IP进行分析,对于Syn无响应的电力抄表终端,均是由于终端侧配置的服务器IP错误造成,如图4所示,共发现某市15个电力抄表终端服务器IP配置错误,提交供电局重配置IP地址,目标服务器IP地址重配置后,该15个终端Syn无响应问题均得到解决,终端均能正常保持在线。
4.2.2 基于Flow-control信令定位小区资源不足
图4 电力抄表终端IP配置修正前后的连接性能
通过数据业务综合分析系统对异常终端用户信令分析,发现存在电力抄表终端在Gb口存在大量的流控消息,Flow-control(流量控制)主要用户控制SGSN和BSS之间的QoS,一般流控主要是由于小区资源紧张导致,如用户13100470741是由于所在小区阳光都市无线资源紧张造成掉线,影响终端在线率低,属无线侧原因。共发现12个终端所在小区无线侧资源利用率高问题导致此部分电力抄表终端在线率低,针对小区实际情况通过增加Abis空闲时隙,合理配置PDCH信道,调整上行复用动态信道转换门限等参数,使得在不影响现网语音业务的情况下,降低上下行PDCH复用度,合理分配PDCH资源。
如图5所示,小区调整前后总体的PDCH复用度下降明显,利用率高问题得到解决,流控现象得到有效缓解,12个终端的在线率得到明显提升。
图5 小区资源优化调整后的指标变化
4.2.3 基于GPRS Services not Allowed定位欠费用户
由于终端有定时传输数据的需求,为了与网络建立连接,它将会不停的发起网络Attach请求,如果用户欠费将不能使用GPRS业务,网络对欠费用户会回应Attach拒绝,拒绝原因为GPRS Services not Allowed,该失败原因指示用户欠费或停机。根据Attach拒绝原因为GPRS Services not Allowed的信令,即可发掘出由于欠费导致不在线的电力抄表终端。
信令跟踪分析发现有5个电力抄表终端全天频繁地发起大量的Attach请求,均被SGSN以GPRS Services not Allowed拒绝,该失败原因指示用户欠费或停机,经计费系统排查,确认该5个用户的状态为欠费停机状态。将此5个欠费终端提交供电局缴费后,终端能够连接上GPRS网络并进行电力数据传输,保持在线。
4.2.4 基于Insufficient Resources定位GGSN地址不足
通过分析异常终端信令发现,共计有23个终端发生PDP激活GGSN侧失败,失败的原因为“Insufficient Resources”,该原因说明是无足够可用的资源。核查发现,为GGSN的IP地址池资源不足,用户无法分配到IP地址,导致PDP激活失败。
针对GGSN IP地址池不足影响电力抄表终端在线率的问题,某市集客部申请为每张电力抄表终端号码IP地址绑定,有效解决了此部分终端无法获取IP而掉线的问题。
4.2.5 基于User Aauthentication Failed定位终端异常
通过信令分析发现,共有6个电力抄表终端存在User Aauthentication Failed(鉴权失败)导致用户PDP激活失败,全天频繁的PDP激活均无法成功。针对用户在PDP激活过程发生User Aauthentication Failed(鉴权失败)的问题,核查了用户数据正常,无线网络正常,因此判断为终端侧异常引起。对该6个终端进行现场排查,通过拔插SIM卡并断电重启后,跟踪其Gb信令可看到,终端PDP激活成功,数据交互正常,保持在线状态。
基于信令特征分析提升电力抄表系统在线率,实现批量排查在线率低的电力终端,对终端异常、欠费、服务器IP配置错误、用户IP冲突和无线原因等问题进行优化解决,整体工作成果总结如表1所示。
本次基于信令特征分析的电力抄表行业应用优化取得了良好成果,共解决61个不在线终端问题,某市全网电力抄表终端的在线率得到明显提升,总体在线成功率由86.54%提升到91.25%,明显优于友商的85.65%,为某市供电局解决了长期困扰的终端不在线问题,大大提升了客户的感知度。
表1 基于信令特征分析的异常终端定位方法
基于信令特征分析评估电力抄表终端的在线性能,是以Gb、Gn接口实时信令搭建的的数据业务综合分析系统为基础,通过流定制主动发掘以“心跳分组”缺陷发现异常终端,实现全网电力抄表终端7×24 h的监测,以信令流程的特征分析实现批量化定位异常问题,有效解决了传统手段的问题复现难、原因定位难,为保障电力抄表行业应用的网络质量提供有力效的手段,实现了用户感知的提升。