基于用户位置的集中投诉分析报表工具开发

2023-06-22 22:38:41李超光刘干刘博琳
无线互联科技 2023年4期

李超光 刘干 刘博琳

摘要:针对目前投诉量增加,每月上千例投诉,投诉分析工作费时费力的问题,文章研究开发了基于用户位置的集中投诉分析可视化报表工具。该研究基于PVthon开发语言并运用聚类算法,对数据进行处理,筛选集中投诉位置信息:应用PVecharts库实现集中投诉分析数据的地图可视化、分县区、分类型、TOP5投诉热点大屏效果展示,导出集中投诉问题清单,大大节约了投诉分析人员的时间,提高工作效率。

关键词:报表可视化:集中投诉分析:用户位置分析

中图分类号:TN929.5

文献标志码:A

0 引言

在移动网络迅猛发展的当下,用户对4G/5G网络的需求急剧增加,由于4G/5G网络以及VOLTE网络的复杂性,用户投诉也有增加趋势。怎样实现快速分析用户投诉并从中提取有价值的数据信息,从而定位到用户问题,快速有效解决用户问题,改善用户感知、提升用户满意度,成为无线网优工程师要考虑的一个现实问题。

1 程序总体设计思路

鉴于目前日均投诉量多.工作人员进行人工投诉分析T作量大,笔者根据日常投诉记录表,编写程序自动分析投诉数据,从而提取到有价值的数据信息和能够用来给领导汇报和展示的图表信息。根据人工对日常投诉分析的特点,结合日常工作中给领导汇报数据的要求,本程序实现如下功能:根据用户位置分析用户集中投诉的区域,了解到用户的集中需求,有针对性的调拨资源优先处理:用户位置数据的地图可视化呈现,让数据展示更直观;分县区用户投诉数据分析,让各县区能够了解到自己当前问题:投诉分类分析:集中投诉位置的TOP展示:输出集中投诉问题清单。

为实现以上集中投诉分析的功能,import Tkinter模块创建程序的图形用户界面窗口、下拉菜单、对话框等图形化组件,通过导入操作就可以打开需要分析的Excel文件。通过鼠标点击菜单栏、按钮或者弹出对话框的形式来实现人机互动,从而提升程序使用的交互体验和程序的易用性,让投诉分析人员拿到程序就可以使用、不需要花时间去学习。

Import numpy和pandas数据分析模块进行相关表格处理和计算。为处理表格、混合数据专门设计的PANDAS非常适合统计投诉分析中的表格结构数据。通过对投诉清单数据的分析筛选构建程序需要的数据,通过对用户位置经纬度的密度聚类的分析,计算出用户集中投诉的片区,为数据分析提供数据支持。

在数据处理上P vecharts可谓是为Python的数据分析可视化而生。应用该库进行集中投诉分析数据的可视化处理,可以提供更加直观的数据可视化图表,能够高度定制个性化需求报表且有着非常丰富的交互性。在Pvchon中使用该库可以非常方便地完成程序各种图表的输出。其输出格式有两种:一种是图片格式,另一种是Html网页格式。笔者采用网页格式,方便图表的缩放和查看[1]。

笔者通过div+html+P yecharts来实现整个集中投诉可视化大屏效果的展示,输出集中投诉Excel清单。

程序需要设置一些容错机制,比如使用者没有导入要分析的Excel表格就进行分析操作,则提示请导入表格后再进行分析:如果使用者没有选择地图,则提示请从下拉列表选择地图后再点击分析。程序整体架构如图l所示。

2 集中投诉分析可视化方案

2.1 用户集中投诉位置的数据分析

日常投诉中记录用户位置信息,对用户位置信息进行分析,找到集中投诉的位置,便于对问题点进行跟盯处理。程序采用密度聚类算法计算用户集中投诉的位置信息。

在进行数据分析前需要对导入的Excel表进行处理,读取经纬度数据,通过colisc函数将数据转换成列表,再对列表进行格式化处理。地球是球形,为了更真实地反映两点之间的距离,文章采用欧几里得距离算法计算球面两点之间的距离。该距离参数以及从投诉表取到的数据被格式化后传递给聚类算法进行数据的处理。

密度聚类又称“以密度为基础的聚类”,该算法通过样本分布的紧密程度来确定聚类结构。密度聚类算法是从样本密度的方面来考察样本间的联结性,通过不断扩展其可连结的聚类簇,得出样本的聚类结果。

DBSCAN密度聚类算法是通过一组“邻域”参数来描绘样本分布的紧密程度。其样本数据集中在某特定点的聚类密度是由该点的半径EPS内的点数估算出来的[2]。具体算法描述如下:

输入对象是集中投诉位置点数据n,聚类邻域半径Eps,簇最少点数MinPts参数;输出对象是生成符合聚类密度要求的簇的集合[3]。

密度聚类算法最重要的是确定邻域半径eps的大小,对每个月投诉数据进行实际测试,发现eps=200,也就是聚类邻域半径设置为200 m是比较合适的,最贴近实际。因为投诉人员在记录投诉位置经纬度的时候是有一定的偏差,大概偏差在50 m。如果半径太小会造成无法聚类,或者聚类的点不全:如果半径太大会造成聚类过程中将其他的聚类重新聚集,聚类误差偏大。将簇最少点数MinPts设置成两个,也就是只要有两个以上的投诉点本研究都认为该区域有重复投诉或者集中投诉。

本研究引入组号的概念,就是密度聚类分析结果中的每个簇定义为一个组,给每个组编一个序号,每个组号代表一個集中投诉的区域,后面的数据处理中会引用到这个数据。这也是分析结果中一个非常重要的参数,去重筛选时就以这个组号为依据进行去重数据。

密度聚类分析输出的结果是字典数据,为了后面更加便捷地对数据进行处理,本研究应用数据集组件DataFrame将字典转换成表格数据。

2.2 集中投诉位置地图可视化呈现

对用户位置的数据分析结果进行地图呈现,能够更直观地展现集中投诉的地理分布信息。数据的展示要有区分度,比如投诉位置多的区域显示红色,投诉少的位置颜色相对浅些,能够突出展示集中投诉位置信息。

Geo组件是Pyecharts库中用来绘制地理坐标系地图的重要组件,用该组件来实现集中投诉位置的地图可视化。Geo(width,height)画出地图的背景,设置地图的基本信息。通过add_coordinate()读取要在地图上显示的集中投诉的位置信息,在这一过程中,最重要的是将通过密度聚类算法得到的经纬度信息和集中投诉次数进行格式化处理。套用for循环将所有点位信息读取完成。通过geo.add()在地图上加载集中投诉的位置点信息,最后通过geo.render()来生成地图文件。

地图类型选择的是城市地图,目前只做了河南全省和18个地市的城市地图列表,通过下拉菜单可以选择,省公司使用可以选择河南省地图,本省其他地市的同事使用,只需要选择自己的城市名称就可以使用本工具,简单方便。暂不含其他省份地市数据,其他省市使用本工具涉及不同省份的地图数据,需要改地图列表。地图可实现缩放效果,方便查看具体点位。

对用户集中投诉位置的地图呈现,可以分析JH{用户集中投诉区域,可以很直观地发现投诉热点,如图2所示。本研究就可以根据投诉热点的具体情况,采取相应解决措施来提升用户满意度。如果集中投诉区域是网络覆盖不足,那么就可以采取拆闲补盲,倾斜资源进行相应的补点建设解决覆盖问题:如果集中投诉位置是故障引起,那么就可以查找故障的根本原因,制定相应的网络保障方案,比如更换基站电池保障电力续航,处理光缆线路隐患保障线路安全;如果是设备板卡故障则更换备件解决;如果是用户終端问题则对用户进行详细指导,避免此类问题再次发生等。

2.3分县区数据的玫瑰图分析呈现

Pie组件可以非常方便地绘制玫瑰图图表。为将原始数据格式化排序操作,本研究调用sort_values()函数来实现,排序后的数据绘制出玫瑰图花瓣半径是递增的,绘制出的图表对比效果也更加明显。

通过opts.InicOpcs()设置Pie的初始参数,而后.add(””,[lisc(z)for z in zip( rose _keys. rose_values)])加载绘制图表使用的数据,并设置rosetype参数为radius来绘制玫瑰图。调用set_series_opt进行系列配置,调用seLglobal_opcs进行全局配置,完成包括图表的ticle、label等信息设置。对分县区数据分析,能够让各县区营业部直观看到其区域内集中投诉数量的多少,玫瑰图的呈现更具有冲击力,数据对比效果明显。在数据通报中,怎样让各县区能够直观地看到自己当前的问题形势非常重要,俗话说百闻不如一见,即使给相关人员说再多遍问题的严重性,不如让他亲自看一眼自己的数据和问题所在。那么分析分县区的数据就显得特别重要,能让各县区看到自己的短板,查漏补缺,有的放矢,需提升网络覆盖、扩容及补盲建设,及时修复故障,改善用户感知。

2.4 集中投诉位置的TOP呈现

集中投诉位置的TOP5数据的呈现,采用数据列表的方式直接呈现TOP投诉位置数据,简单明了.TOP问题的呈现能够加深阅读报表者对问题的印象,提醒重点关注和解决。

在进行TOP呈现的过程中,首先对聚类算法输出的集中投诉数据清单运用drop_duplicates函数进行筛选去重;再进行排序,取出TOP5清单,并格式化TOP5数据,使其能够包含各个集中投诉区域的重要信息,包括县区信息,投诉位置,集中投诉的数量,将数据格式化完成后进行输出。

2.5 集中投诉分类分析

集中投诉分类分析,主要对产生集中投诉的根因进行归类分析,需对集中投诉分类结果进行排序。在P yecharts库中,bar组件可以实现对集中投诉分类分析结果进行柱状图的呈现,能够非常直观的反应集中投诉的原因,包括广度覆盖不足、深度覆盖不足、无室分覆盖、设备故障、终端原因等。

2.6 输出Excel集中投诉清单报表

聚类算法得到的结果是字典数据,将字典数据通过DataFrame转换成表格数据,对表格进行数据格式的整理。为了方便对集中投诉问题的跟踪处理,输出Excel报表,包含区县,投诉位置,投诉数量.投诉分类等信息,通过Excel报表能够查看集中投诉的问题清单,其中[组号]将集中投诉进行分组,每一个组代表一个集中投诉的片区。[TO集中投诉个数]能够显示该片区集中投诉个数。

导出集中投诉清单不仅能够为网络建设提供数据支撑,更好地实施精准投资、精准建设,把好钢用在刀刃上;还能够为故障修复或者实施考核提供依据,让考核和提升用户满意度工作更有针对性。

3 结语

用户投诉能够客观反映存在的问题,需要分析产生的深层次原因,制定积极详尽的方案,推动问题的整改和优化,达到满意度提升的目的。为践行“客户至上、用心服务的”理念,一方面,要倾听客户声音、反映客观事实,对存在的问题不避讳、不遮掩;另一方面,要深入剖析问题产生的原因,从管理、流程、支撑等方面提出优化建议。聚焦集中投诉热点,深挖根因,推动网络问题闭环,切实改善用户感知,通过定期对投诉清单进行稽核与分析,聚焦无线网络热点投诉区域。推动集中投诉热点问题闭环解决是降压投诉的重要牵引力。

本程序通过对用户集中诉分析方法的研究,来提高工作人员对日常投诉分析处理的效率。原来通过mapinfo或谷歌等地图软件打点进行投诉分析,需要一个熟练的工作人员工作3h以上,才能制作好地图图层,分析出集中投诉区域,形成报表。而使用本工具只需要约5 min就可以完成上述工作,并可以为网络建设、故障修复、用户问题解决提供有效的数据支撑,大大节省人力资源,提升用户满意度。

参考文献

[1]曹阳杨.作物种植密度优化系统的设计与实现.[D].哈尔滨:东北农业大学,2021:.

[2]刘凤.K-means算法类簇中心优化研究[D].贵阳:贵州大学,2021.

(编辑姚鑫)

[3]李小畅.基于相对密度的聚类算法研究[D].杭州:浙江工业大学,2011.