网络游戏客户感知量化及预测方法*

2019-11-05 10:45刘安平贾诗炜
西安工业大学学报 2019年5期
关键词:性能指标数据挖掘预测

刘安平,贾诗炜

(中国移动通信集团陕西有限公司,西安 710077)

根据中国互联网络信息中心(China Internet Network Information Center,CNNIC)发布的第42次《中国互联网络发展状况统计报告》显示,截至2018年6月,我国网络游戏客户规模达到4.68亿人,占总体网民的60.6%,较2017年末增长4 391万人。伴随移动互联网产业飞速发展,网络游戏产业也呈现出蓬勃发展的态势,网络游戏整体客户规模在互联网客户规模的占比不断攀升。网络游戏要求实时交互、多人在线参与和画面流畅清晰的特征,确定其对网络传输速度、客户终端配置及服务器响应速度都有极高的要求。近年来,中国移动公司宽带业务大规模发展,网内互联网数据中心(Internet Data Center,IDC)资源匮乏,客户数据业务感知劣势也日益突出,尤其是网络游戏业务卡顿、掉线问题频出,直接导致客户满意度下降、客户投诉增加,严重影响客户口碑。因此,须准确刻画客户游戏业务感知,快速识别测试游戏业务质量,先于客户发现感知劣化趋势,针对性优化网络质量。

在实际网络运营中,针对网络游戏业务的客户感知定向优化面临诸多挑战:① 网络关键性能指标(Key Performance Indicator,KPI)无法准确衡量客户体验质量(Quality of Experience,QoE)。网内游戏质量指标如时延、丢包等异常,实际游戏业务客户感知不佳的现象时有发生。② 网络游戏的客户体验质量QoE无法量化分析,难以进行针对网络游戏业务客户感知的实时监测、评价和优化。③ 网络游戏在客户登录、进入分区、创建角色及开始游戏过程中,客户端与资源服务器频繁交互,客户行为产生海量、随机和模糊的应用数据,运营商难以根据其进行客户感知劣化的预测,不能有效保障客户体验。文献[1]构建了客户端/服务器端网络游戏架构,并对其进行设计,分析用户体验质量。文献[2]提出了顾客满意度指数测评方法,对客户感知的实时监测进行评价和优化。文献[3-4]基于回归分析提出用户体验质量评估方法,分析了客户感知劣化规律。文献[5]研究了移动云计算用户体验质量的模糊综合评价方法。文献[6]对用户体验质量评价方法进行综述,构建了用户体验质量评价模型。文献[7]基于神经网络建立了用户感知预警模型,对客户感知劣化进行预测。文献[8]对TCP /IP 协议在多人网络游戏中的应用进行研究。文中借助深度包检测技术对网络游戏业务进行识别,根据采集的网络性能指标及客户行为数据,对网络游戏感知进行定量评估,实现网络游戏客户感知量化;基于数据挖掘技术,对网络游戏客户感知预测进行建模,以对客户满意度进行预测。

1 网络游戏客户感知量化方案

在网络运营方面,数据业务量不断增加,为保障网络指标良好,运营商持续推进网络建设和扩容,网络结构日趋复杂。传统的分析方法和工具已无法高效地支撑网络问题定位及网络维护优化工作。故本文从提升网络游戏客户感知的实际需求出发,提出了基于网络游戏客户感知的端到端网络游戏业务质量分析体系架构(如图1所示)。该分析架构根据网络层次将端到端网络游戏业务质量分析体系自下而上分为三层:采集层、存储处理层和应用层。采集层在客户终端及网络节点采集客户行为数据,如信令数据、业务数据等;存储处理层借助深度包检测技术(Deep Packet Inspection,DPI)对采集的海量数据进行特征识别及深度挖掘;在应用层建立针对客户满意度的评价及分析模型,实现客户感知的量化分析。

图1 基于客户感知的端到端网络游戏业务 质量分析体系架构

1.1 网络游戏客户数据采集

采集层在现实应用中具有普适性,不同地区、多样场景、各种业务、多样网络、各类接口及不同终端均可采集获取数据。针对网络游戏业务,实际是在网吧客户终端及移动数据网络的各个关键节点部署软、硬探针来统一配合进行数据采集、上传及下发。基于游戏业务的特征,选取访问速率、平均通信时长、客户端时延、客户端丢包率、客户切服频率、客户活跃时长和游戏帧数7个技术指标数据(见表1)进行周期性采集、上传和存储。

表1 网络游戏客户数据采集指标

1.2 网络游戏业务特征识别及分析

处理层应实现海量测试数据的内在映射体系建立,形成统一的管理和分析方法,并且可以集中呈现不同业务、不同参数的分析模型。对于网络游戏业务,要实现对网络游戏的准确识别,需对指标数据与客户体验进行关联分析。在实际应用中,网络游戏业务的识别主要是借助深度包检测技术。陕西移动公司在省网出口部署统一深度包检测设备完成业务识别。

传统的IP包流量识别和服务质量(Quality of Service,QoS)控制技术是基于开放式系统互联参考模型(Open System Interconnection Reference Model,OSI/RM)七层模型中的二层、三层和四层,通过对IP包头中的“五元组”(信息源地址、目的地址、源端口、目的端口及协议类型)进行分析,从而确定当前流量的基本信息,确保清楚标记所有数据。DPI技术可以提供传统技术的包头分析功能,还可对应用层进行分析,属于流量捡测和控制技术。当IP数据包、TCP/UDP协议数据流经过统一DPI设备时,该设备系统通过读取IP包载荷的内容来对应用层信息进行重组,然后按照系统定义的管理控制策略对流量进行操作。DPI技术可针对不同客户、服务和内容进行不同的应用。

DPI识别技术可分为三类:① 特征字的识别技术。不同的应用使用不同的协议,各类协议有着类似于指纹的特殊标记,特定端口、特定字符串和特定Bit序列均可作为标记。② 应用层网关识别技术。应用层网关识别技术针对控制流和业务流分离的部分业务,由应用层网关识别控制流,控制流协议选择特定的应用层网关对业务流解析,进而识别业务。③ 行为模式识别技术。行为模式识别技术即根据客户已实施的行为,判断客户进行中的动作或即将实施的动作。基于网络游戏业务特征,陕西移动公司统一DPI系统通过业务携带的特征指纹进行识别,如图2所示。针对《绝地求生》游戏的识别,利用DPI抓取IP数据包中含有“Playerunkown’s Battlegrounds”字符串的流记录,对识别为《绝地求生》游戏的数据流进行整合。

1.3 网络游戏客户感知定量评估算法

应用层在客户体验角度,建立端到端的全面评测与分析体系模型,进行客户感知异常告警实时跟踪和优化分析。针对网络游戏业务,可将采集层收集的7类分离性能指标整合,使用多元回归方式拟合分析关联业务客户感知。回归分析是一种预测性建模技术,其可用于确定两种或两种以上有关联关系的变量间的定量关系。网络游戏的客户满意度受到各项基础性能指标和外界因素的影响,故通过回归方程拟合作为对网络游戏客户感知的定量评估算法。

图2 DPI技术对应用特征的分析

将网络游戏客户满意度由原来的主观评价,划分为百分制得分:很不满意(0~20分)、不满意(20~40分)、一般(40~60分)、满意(60~80分)和很满意(80~100分)。以满意度得分作为定量评估的综合质量指标Y,统计其与一组基础性能指标(X1,X2,…,Xn)的关系。采集的7类基础性能指标,根据对游戏质量的影响标识为两类,指标数值越大游戏质量越好,如访问速率,对指标进行正向标识;反之,对指标进行负向标识。给出各类性能指标的评价区间[Z,Z′]。

以客户端时延指标为例,若某次采集客户访问游戏的客户端时延为x,该指标为负向标识,其评价得分为

W1=(Z′-x)/(Z′-Z)

以此类推,可分别计算出7类性能指标的评价得分:W1,W2,W3,…,W7。建立多元回归方程,对于每条记录,通过适度拟合,计算7类性能指标的影响因子α1,α2,α3,…,α7,对指标得分归一化后可得客户满意度得分为

Y=α1W1+α2W2+α3W3+…+α7W7

以上评估算法即可将采集的性能指标映射为综合质量得分,进而计算出客户满意度得分,实现对网络游戏客户感知的量化评估。

2 基于数据挖掘的网络游戏客户感知预测方法

在量化网络游戏客户感知的基础上,为提升客户体验,增加客户黏度,应对客户感知劣化需进行精准预测。在实际运营中,难以在海量数据中提取到客户感知的有效信息。借助数据挖掘技术,研究并搭建了网络游戏客户感知预测模型,可根据网络性能指标和客户行为数据,采用分类算法,讨论客户的感知劣化趋势,并进行满意度预测。

2.1 网络游戏客户感知预测模型选择

网络游戏客户感知预测模型的选择,需要考虑实际问题:网络游戏业务具有个性特征,需将海量行为数据及网络性能指标进行关联,运营商掌握的客户数据可能存在不平衡及部分数据空缺现象,并且模型算法多样化,选择合适的算法对预测效果至关重要。对此,本文采用跨行业数据挖掘标准流程(如图3所示)来搭建规范的预测模型。

图3跨行业数据挖掘标准流程

Fig.3Cross-industrydataminingstandardprocess

根据流程规范和游戏业务特点,网络游戏客户感知预测的数据挖掘过程共分为五步:① 数据理解。采集包括网络游戏性能指标和客户行为数据,对其相关性进行分析以理解原始数据。② 数据准备。将原始数据映射为特征值。③ 建模。根据不同的算法及模型将参数调整至合理。④ 评估。审查模型是否完成挖掘目标。⑤ 部署。将模型应用于海量实际数据中。完成各个阶段的循环即可实现完整的数据挖掘流程。

2.2 预测模型数据准备

此阶段完成对网络游戏客户原始采集数据的处理,进行特征值提取。在网络游戏客户感知的特征值提取中,主要考虑网络性能指标和客户行为数据,包括访问速率、平均通信时长、客户端时延、客户端丢包率、客户切服频率、客户活跃时长和游戏帧数7个特征值(见表1)。这些特征值根据业务特征和运维经验选取,可实时更新。

2.3 网络游戏客户感知预测建模

根据选取的客户特征值,选取合适分类算法进行数据训练。网络游戏客户感知预测属于离散分类问题,训练样本包括“满意”及“不满意”两类。分类算法包括逻辑回归、决策树和随机森林等训练算法模型,本文选用逻辑回归算法进行分类,提出网络游戏客户感知预测框架(如图4所示)。完成数据挖掘的训练指标集包括两部分:用于训练模型的训练集以及用于验证模型的测试集。

图4 网络游戏客户感知预测框架

模型的训练是采用适当的算法构造分类的过程,逻辑回归算法主要使用逻辑回归函数g(z)=1/(1+e-z)对数据进行拟合,其中z表示与特征值线性相关的变量,预测值g(z) 即为逻辑回归函数的值,显然0≤g(z) ≤1,故将预测问题适度拟合为0~1分类问题。

本文使用上述算法对陕西西安地区中国移动公司某网吧网络游戏客户感知(满意度)进行了预测,结果预测值g(z)=0.932,与实际客户满意度相符。由此可见,逻辑回归算法的准确性较高,可实现网络游戏客户感知的预测。

3 网络游戏客户感知量化及预测实施效果

本文面向网络游戏业务,采集网络性能及客户行为数据,利用DPI标识不同游戏业务的特征,通过合理的回归方程,量化网络游戏客户感知,借助数据挖掘的方式,精准预测客户满意度,解决了网络游戏业务客户感知差的问题,提升了客户满意度。

在网络性能指标方面,实施客户感知量化和预测后,陕西移动公司主动发现游戏感知劣化问题,及时优化网络配置,网吧专线游戏链路平均时延为45 ms,环比降低10%,丢包率为0.31%,环比降低31.11%,见表2。

在游戏业务方面,陕西移动公司借助DPI标识50余种热门游戏,根据业务流量统计出全网热门游戏,经过实测验证,识别的准确性高达98%。同时,进行基于量化的客户感知指标的游戏业务质量分析,清晰呈现本省各地区网络游戏质差情况,通过定点支撑、专项投诉处理等方式,有效减少了客户投诉,陕西移动公司客户针对网络游戏相关投诉约48次,环比降低40%。

在客户服务方面,陕西移动公司使用调查问卷的方式对新发展的13家网吧的780位网游客户进行调查,同时,采用数据挖掘技术对此客户群体的满意度进行预测。对比发现,网络游戏客户感知预测准确率高达87%。公司通过针对性预测分析,对专线业务发展做出了合理的规划改进。先于客户发现网络感知劣化问题,及时优化,同时推出配套客户服务。实施预测方案期间,网络游戏客户满意比例提升至85%,环比增长23%,增加了存量客户黏度,促进了游戏业务客户增长。

表2 感知量化及预测实施效能指标

4 结 论

基于数据挖掘的网络游戏客户感知量化及预测方法,能够精准识别网内客户使用网络游戏业务,结合采集的网络性能及客户行为指标,建立网络游戏客户感知定量评估模型,通过模型的回归拟合算法计算网络游戏的真实满意度得分。在此基础上,利用数据挖掘技术,进行网络游戏客户感知预测建模,对客户感知进行提前预测,通过定向分析,准确评估感知劣化趋势,定位质差问题,实现主动发现、快速解决网络问题,提升网络游戏业务客户使用感知,提升客户满意度。

猜你喜欢
性能指标数据挖掘预测
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
沥青胶结料基本高温性能指标相关性研究
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
北斗卫星空间信号故障与监测性能指标定义
不必预测未来,只需把握现在
自动控制系统的优劣评价分析
储热水箱分层性能指标的研究进展