施巍巍 谷俊江 赵波
1.中国联通江苏省分公司;2.南京邮电大学
当前全国高铁网络优化工作已基本实现了问题点的集中管理和管控,高铁网络质量逐步提升。但是高铁网络质量提升也逐渐呈现出了一定的技术瓶颈,主要体现在:(1)无法实现快速精细化分析,对高铁网络的分析仍停留在传统大网的分析方式上;(2)无法直观快速评价网络性能,对网络问题点、网络质量管控手段方面目前还以表格、数据等存储为主;(3)用户问题分析过程复杂度高,对VIP用户跟踪目前还主要停留在用户投诉后才去分析的被动阶段,无法事先主动发现和反馈用户投诉;(4)无法评价车厢内用户的真实感知,对高铁车厢内高铁用户的网络感知评价分析,还主要依据对覆盖高铁小区的网络性能分析,以网络质量代表用户感知;(5)高铁网络分析还停留“碎片化”阶段,每个省只能分析本省路段网络情况,不能实现跨省全线路分析能力,高铁整条线路网络质量分析“碎片化”。
本文根据高铁网络特征,从用户感知最敏感的高铁车站(点)和高铁线路(线)两个方面开展分析和研究,总结出一套高适合高铁网络全方位网络智能分析与优化方法:1.实现车站站台地理信息绘制和栅格化呈现;2.实现高铁跨省(上海段)分析与呈现能力;3.实现“车站和站台”网络性能地理化呈现;4.引入“影响集中度”模型探索站台扩容标准;5.实现“高铁线路”形态的场景化分析与呈现;6.实现用户随高铁运动情况的场景化分析与呈现;7.探索开展高铁用户上网问题智能分析;8.实现针对高铁用户感知场景化分析与评价。
根据高铁网络特征和传统优化高铁网络方法存在的问题,从用户感知最敏感的高铁车站(点)和高铁线路(路)两个方面开展研究,探索高铁全方位智能分析的新模式。图1为高铁网络全方位智能分析思路流程图,分别以车站为点、以线路为线,从“点、线”两个维度进行分析。
(1)利用Python开源工具结合访问网站运行特征,获取高铁车站整体的地理边框信息、站台中心经纬度信息和所有列车运行信息。现有的网络地图平台不提供站台的地理边框数据,要根据站台的中心经纬度,运用地球球面的区域经纬度算法获取站台的边框经纬度信息。采用JavaScript实现高铁车站和所有站台场景绘制工作。
(2)利用python的自动FTP功能自动对接网管,获取高铁车站网络承载能力、网络性能、覆盖能力数据和网络稳定性能数据,于在线地图上精准呈现高铁车站和所有站台的网络运行状态。
(3)根据获取的高铁车站列车信息,运用python的大数据分析能力分析全天分钟级“列车聚合度”,根据对列车聚合度分析,并在列车主要运行时段(6:00-22:00),对网络分钟级指标跟踪分析,实现“列车集中度”和“用户感知集中度”联合分析,探索制定高铁车站扩容模型标准。
高铁线路网络形态主要从网络运行稳定性,网络运行资源可视化,网络运行性能可视化和全线路覆盖情况四个方面进行分析与呈现。利用python爬虫手段采集高铁小区的告警、覆盖数据、基站可用资源和用户感知数据,运用大数据分析呈现方式,实现高铁线路所有网络故障点及各类KPI、KQI及路测指标场景化呈现,可以更直观、快速综合评价高铁整条线路的用户感知和网络质量。
通过python爬虫手段采集多个数据平台单用户的驻留小区的信息,运用开源软件工具实时跟踪分析用户业务(语音、Volte、数据)在铁路沿线小区的占用变化过程,对突发的网络问题快速形成有效的分析结果。
根据高铁用户驻留基站小区信息和时间制定出高低速用户分离算法,基于算法分离出高铁车厢内用户,以这些用户的实际感知分析网络中存在的问题,并根据这部分用户分析评估全线网络质量。
当前高铁用户反映的问题80%以上发生在车站候车室和站台,本次以南京南站站台问题为例,建立问题分析流程和模型,可实现自动化分析该类问题点。
分析流程:
(1)获取到用户使用号码及问题发生时间,并从相关系统上通过互联网化的方式获取用户占用小区和网络资源;
(2)通过开源工具自动获取相应网络KPI和KQI信息,并建立数据库;
(3)用户占用网络资源的主要KPI和覆盖数据进行关联分析;
(4)通过车站投诉智能分析工具,评价和分析影响用户感知的关键因素和原因。
2.1.1 高铁车站物理形态地理化呈现
(1)采用互联手段获取高铁车站地理信息
编写python代码模拟浏览器爬取高铁车站边框的经纬度信息,然后对响应的数据提炼,最终获取车站的电子边框信息并写入Excel文件中。
(2)南京南站整体和各个站台地图生成
采用百度地图开放平台上添加线和面的JavaScript源代码编辑接口方式。用获取的南京南站边框经纬度,使用百度地图提供的JavaScript代码接口,在网页地图上添加整体车站边框图层。另外地图平台不提供站台边框的经纬度数据,只能获取到单个站台的一个中心经纬度,课题组通过中心经纬度数据,采用对地球北半球球面维度区域经纬度算法,计算出站台四角的经纬度数据,从而成功实现南京南站所有站台边框生成和呈现。
2.1.2 高铁车站网络“多维度性能”分析与呈现
(1)网络性能指标的自动提取
为了更加快速高效分析和呈现南京南站网络性能,可通过Python代码编程实现自动化从OMC网管采集和FTP下载网络配置和网络性能数据。下面以南京南站为例进行说明。
(2)南京南站网络地理化呈现
提取南京南站边框数据和指标数据后,在地图上南京南站的每个站台区域被分为以下4个维度进行指标呈现,根据指标范围来显示不同的颜色,可以更加形象地了解当前南京南站的总体网络情况。
①影响用户感知的网络故障实时呈现:
可快速实时发现和跟踪所有车站网络故障告警情况,及时预警和推动分公司快速解决。图2为南京南站告警信息的地理化呈现图,可以区分覆盖不同站台的RRU告警。
②用户实时感知分析与呈现(平均单用户速率Mbps,平均上网RTT时延):
实现用户感知最敏感的平均上网速率、平均上网时延等关键性能快速实时呈现,动态掌握车站网络性能变化情况。图3为南京南站下载速率和RTT时延区间图,可以区分不同站台的指标。
图3 南京南站下载速率和RTT时延区间图
③网络负荷分析与呈现(PRB利用率,用户数):
常州的竹炉山房位居41处被写仿的江南景观榜首,西苑北海北岸、香山静宜园、玉泉山静明园、盘山静寄山庄、清漪园、避暑山庄和紫禁城建福宫等7座皇家园林对其进行了仿建。清漪园的清可轩、玉泉山静明园的竹炉山房、香山静宜园的竹炉精舍和避暑山庄千尺雪的茶舍均建于乾隆十六年,盘山静寄山庄千尺雪的茶舍建于乾隆十七年春,或于室内置有竹茶炉,或名称源自竹炉山房。乾隆二十二年,乾隆帝在《汲惠泉烹竹炉歌叠旧作韵》诗中还写道,“玉泉山房颇仿效,以彼近恒此远灌。”⑯
通过典型的网络负荷指标“小区下行PRB利用率”、“单小区用户数”,及时掌握车站网络负荷情况。图4为南京南站PRB利用率和用户数区间图,可以区分不同站台指标。
图4 南京南站PRB利用率和用户数区间图
④网络覆盖的呈现(10米x 10米栅格化RSRP和SINR):
根据高铁车站局部范围内用户密度大、用户话务集中度高的特性,首次引入10米x 10米MR覆盖栅格分析,通过RSRP精细化分析站台覆盖问题,通过SINR精细化分析站台网络质量。图5为南京南站RSRP和SINR区间图,可以区分不同栅格指标。
图5 南京南站RSRP和SINR区间图
2.1.3 引入“影响集中度”模型,探索站台扩容标准
(1)车站、车次信息的获取
(2)停靠列车车次集中度和网络指标关联分析
通过对南京南站每分钟的列车停靠数量进行聚合计算,将其一天每分钟列车聚合度与网络主要指标小区用户数和PRB利用率进行关联分析,分析发现车数与小区PRB利用率呈正向分布。
(3)高铁车站网络扩容模型分析
引入用户“感知影响集中度”分析思维,以全天影响用户使用感知程度作为扩容的重要判决因素。进行1min粒度流量抑制分析,对比15min粒度,站台流量抑制发生的更早,更能模拟站台用户突增情况。通过分析得出,随着小区吞吐率的增加,下行单用户速率明显下降,即用户需求受到抑制。
通过列车聚合度分析发现列车运行时间主要集中在6:00-22:00,以分钟级指标跟踪得出如下扩容标准,以全天影响集中度30%为判断依据,即一天用户感知受影响能容忍的程度不能超过30%(“影响集中度”表示站台高负荷可容忍程度,可根据实际情况调整)。表1为根据“感知影响集中度”分析得到的高铁小区扩容标准模型。
表1 高铁小区扩容标准
2.2.1 线路网络稳定性形态呈现
通过Python自动化实现手段,实时从网管获取高铁车站点活动告警信息并进行告警信息解析,经过与工参信息匹配后得出告警网元归属地市、高铁线路以及经纬度等信息,利用JavaScript接口实现告警地图展示。
2.2.2 线路网络多维KPI质量呈现
通过将高铁线路小区的KPI指标(PRB利用率、小区单用户平均速率、小区最大用户数等数据)进行地理化呈现,能快速评价全线路各路段网络负荷情况、用户速率情况等。
2.2.3 线路网络多维KQI指标可视化呈现
通过将高铁线路小区的KQI指标(用户大页面感知速率、RTT时延等)进行地理化呈现,能快速评价全线路各路段用户实际体验情况。
高铁网络具有网络场景归属清晰、用户对场景判断明确的特征,全线路网络质量有保障才能整体提升用户感知。本研究打破传统省份只分析本省路段高铁网络、整条高铁分段分析零散破碎的现状,实现具备整条线路网络质量分析能力,为实现京沪以及其他高铁线路全线跨省分析工作进行探索。
跨省数据采集与分析:
(1)获取某省段数据,在江苏进行关联分析
通过分析某省提供的沪宁高铁用户+位置+应用业务数据,与江苏现网高铁用户业务预统表关联,通过用户号码聚类关联合成沪宁高铁用户全线的业务轨迹数据。
(2)后续计划采用自动化采集某省数据方式
后续相关省可以通过FTP向中间接口机分发数据文件,江苏本地集群通过数据解析程序实时读取文件,并入到集群数据库,再通过用户号码关联实现沪宁全线路分析。
通过从核心网接口获取用户占用小区信息(LAI/ECI),利用综合分析方式匹配高铁工参数据,实时分析跟踪用户业务产生的相关小区,从而实现对高铁单用户(或VIP用户)的跟踪分析,在第一步实现高铁网络形态场景化呈现的基础上,关注业务(语音、Volte、数据)用户在铁路沿线小区上的占用变化过程,主要关注用户随基站小区的移动而不是用户本身的经纬度变化,根据高铁内手机依次占用不同高铁小区,在高铁线路图上快速跟踪分析用户使用情况。
2.5.1 高低速分离算法研究
首先通过四个数据源获取用户占用小区基本信息(基于MR+信令+话单数据的高铁用户用户识别,基于S1-U接口XDR数据的高铁用户识别,基于S1-MME、IU-PS接口信令面数据的高铁用户识别,基于O侧的位置更新、切换信令及用户特征的高铁用户识别);其次记录用户驻留的第一个高铁小区时间为T1,用户驻留到第二个高铁小区时间为T2,通过两个小区间驻留的时长记录为T,计算对应到高铁小区的路测经纬度采样点间距离为S,计算用户在这两个小区间移动的速度V,通过时速来区分高铁用户与普通用户,再通过计算一小时内小区驻留时长T的集合,来筛选出高铁用户。(其中V>300KM/H,定义为“复兴号”用户,200<V<300KM/H,定义为“和谐号”用户,T的集合>1H,定位为高铁用户。)
2.5.2 高铁用户感知场景化分析
主要通过对分离出的高铁车厢内的用户开展高铁主要感知指标评价,以这些用户的实际感知可以实现两个方面的目的:一是通过高铁用户的感知指标、KPI指标,分析网络存在问题,二是基于这些车厢内用户的感知评价高铁全线网络质量情况。(因此,基于网络质量分析与评价的目的,与之前分离算法评价系统不同,在这里不追求高铁用户分离100%完整性,而是追求对分离出来的那部分高铁用户网络感知评价的准确性。)
重点开展高铁车厢内用户业务感知分析(主要包括上行RTT时延、下行RTT时延、大页面下载速率、视频下载速率、页面响应平均时长、页面响应成功率、0卡顿率、每GB卡顿次数)和网络性能指标分析(语音接通率、掉话率),按以上10个关键性指标作为高铁网络评分标准,每项指标计10分,共计100分。通过对高铁各线路及地市进行评分,挖掘网络短板指标,为网络优化重心提供决策依据。表2为高铁车厢内用户评价分析模型。
表2 高铁车厢内用户评价模型
2.6.1 高铁用户使用问题分析的痛点
当前高铁网络用户投诉分析主要存在以下3个痛点:
(1)要通过登录多平台获取数据(信令平台、感知平台、网管平台)。
(2)只能采用表格化的关联分析方式,分析效率低、响应时间长。
(3)无法有效呈现分析结果,用户对分析结果满意度低。当前高铁用户投诉80%以上发生在高铁车站,如何提高车站用户投诉反应效率是提高用户满意度的关键。本次通过研究“高铁车站用户上网问题智能化分析”,建立用户在车站发生投诉的快速反应机制,显著提高了用户满意度。
2.6.2 探索高铁问题分析的新方法
(1)建立问题分析流程
①获取到用户使用号码及问题发生时间,并从相关系统上通过互联网化的方式获取用户占用小区和网络资源。
②通过开源工具自动获取相应网络KPI和KQI信息,并建立数据库。
③用户占用网络资源的主要KPI和覆盖数据进行关联分析。
④通过投诉智能分析工具,评价和分析影响用户感知的关键因素和原因。
(2)探索问题智能分析算法
图6为高铁问题智能分析算法图,通过对RSRP、SINR、用户数和PRB利用率等关键性KPI指标进行判决,可得出发生投诉的问题小区存在的主要问题,从而快速得出投诉反馈结果。
图 6 高铁问题智能分析算法图
2.6.3 高铁问题分析方法的实践应用
端午节前一天,用户反映南京南站上网速率低,通过输入用户投诉号码和时间,智能分析系统自动获取问题小区信息,并根据分析算法得出问题小区存在的问题,整个投诉反应时间从接到投诉到得出结论共用时5分钟,而正常投诉需要登录平台、查询信令平台、感知平台、网管平台等多个平台,最少需要60分钟,效率提升12倍左右,投诉分析效率显著提升,节省了大量人力成本。
运用互联网开源工具与大数据分析手段,突破高铁场景传统分析和管控方法的瓶颈,利用Python、JavaScript以及Spss Modeler等互联网工具和大数据分析软件,以及利用高铁用户分离算法,首次提出“影响集中度”概念的高铁车站扩容标准,总结出一套高铁网络全方位管控及优化方法,该方法具备车站扩容指标评估功能、用户投诉快速响应功能、网络性能实时地理化显示功能、跨省网络形态的场景化分析与呈现能力、单用户运动轨迹实时显示功能、车厢内用户感知分析评估功能,能有效实现高铁网络点线场景快速精准化分析与管控。
截止2019年5月累计实现网络告警通报208次,处理1096条,极大提高网络故障处理效率,提高了高铁网络稳定性;智能分析处理VIP用户投诉46次,平均时间由40分钟降低为7分钟,用户满意度由30%提升为90%。每月对省内高铁分析4次,累计评估80余次,共发现问题点398处,真实反映了高铁车厢内用户感知,为高铁优化提供新的思路,且减少了分析和测试成本支出;共完成30余次节假日和重要活动(春节、国庆、未来网络峰会、金博会等)保障,实时分析高铁用户感知指标,提前进行预警和快速投诉分析,多次圆满完成保障了任务;本项目可以推广实现其他重点场景,如校园、地铁、机场等场景的快速迭代分析,提升重点场景整体分析管控效率和能力,提升网络竞争力和减少维护成本。