人工智能在VoLTE语音质量评测优化中的应用与研究

2019-04-24 03:23李飞曹雷雷付永振
中国科技纵横 2019年5期
关键词:机器学习评测优化

李飞 曹雷雷 付永振

摘 要:中国移动VoLTE业务基于IMS实现语音控制,承载于4G网络之上,在提供高清语音更短接续的同时,也面临着端到端业务流程复杂、多域协同等问题和挑战。传统的语音评测方法存在的多种弊端,难以从感知的角度多方面评测语音质量。本文主要研究提取用户通话语音特征,采用基于机器学习的深度神经网络大数据分析算法,利用智能语音分析技术建立感知语音质量考核指标体系、优化方法论及措施,实现对VoLTE用户感知进行更准确的评估。

关键词:VoLTE;机器学习;评测;质量;优化

中图分类号:TN915.18 文献标识码:A 文章编号:1671-2064(2019)05-0042-03

1 研究背景

2015年开启VoLTE商用服务,为客户提供更优的语音感知体验,实现了语音业务由传统电路域向数据域的转变,是运营商未来一段时间发展的关键。

传统的语音质量评测方法存在以下劣势:

一是ATU路测方法存在劣势,数据直接上传系统计算评估,数据真实性可靠,但是覆盖范围较小,IT化成本高,无法实现实际通话场景真实感知还原。

二是基于S1-U信令分析存在弊端,一定程度上满足了运维人员对于网络问题发现和定界的需求,通过语音丢包、延迟简单计算MOS值,客观上反映了VoLTE客户语音感知,不能真实反映VoLTE客户语音单通、断续、吞字、抖动情况,缺乏有效的支撑手段。

三是人工智能带来机遇,人工智能技术的不断成熟,促使我们探索使用先进的方法真正体现客户感知,帮助运维人员创新性的解决疑难问题,从而更好的满足用户使用需求,提升用户体验。

本课题通过提取用户通话语音特征,采用基于机器学习的深度神经网络大数据分析算法,利用智能语音分析技术建立感知语音质量考核指标体系、优化方法论及措施,实现对VoLTE用户感知进行更准确的评估,对单通、断续、吞字故障进行深度挖掘,进而支撑面向用户感知的端到端VoLTE网络优化。系统上线以来聚焦MOS质差和单通断续通话,通过MOS质差定界分析方法开展VoLTE语音质量优化工作,融合MR指纹库的网络问题总体定界率达到77.5%,目前结合声学特征对终端质差定位已发现十余款具有一定保有量终端问题,对39类覆盖场景的深度覆盖不足问题进行输出,同时通过VAD能量检测和关键词语谱匹配识别多起时域事件(丢包、抖动引起)和频域事件(非丢包、抖动引起)引起的单通断续问题,进一步提升了VoLTE网络用户感知。

2 系统构建

2.1 系统整体架构

基于声学特征提取和深度神经网络大数据建模两大核心技术,能准确、高效、全面评估端到端用户感知,保障用户语音通话质量,提升用户体验,提升网优效率的创新型网优平台,平台分四层架构:采集层、信令处理层、数据处理层、应用层。如图1所示。

2.2 基于深度神经网络模型的语音质量评测方法

依托语音处理技术,基于海量测试样本的声学量化特征信息(时域、频域参数),采用基于深度神经网络大数据分析算法,利用移动通信网络中的退化语音来客观评价MOS质量,提取对应声学特征,拟合训练出不同声学特征信息与MOS值的对应关系,建立“MOS值与语音声学特性信息关系”模型;将后台采集的用户面码流,通过解析用户媒体面载荷,提取声学特征,还原包括无声、静默和背噪等真实感知,通过已经训练完成的模型进行处理,实现评估的准度与深度。

2.2.1 深度神经网络建模流程

ePOLQA-MOS算法依托语音声学特征信息,利用深度神经网络进行大数据建模,实际评估效果接近路测POLQA指标,建模训练流程如图2所示。

建模数据涵盖商场、写字楼、道路、居民区、景点、学校等各类场景。

2.2.2 语音信号的声学特征提取

提取时域和频域信息,可将复杂声音波形分解为简单的叠加,可精确地衡量波形的“构造”,基于声学特征信息分析可精准地评估语音质量:

本系统使用的声学特征包括9个时域特征,如音色、响度、噪声等,以及84个频域特征如共振峰、MFCC参数、PLP参数等。

2.2.3 深度神经网络模型在VoLTE网络的应用

利用单边数据实现全网通话感知的精准评估,感知评估指标包括MOS、单通、断续及RTP的丢包等完整指标体系。数据即采即弃,不识别语音内容,安全高效,步骤如下:

(1)将已经训练好的模型部署。

(2)通过SBC与P-GW间SGi口采集用户面数据。VoIP使用RTP协议对语音数据进行传输,语音载荷都封装在RTP包里面,将过滤出的RTP数据包发送至语音解析系统。

(3)進行RTP信息的抽样和还原,进一步生成可用于语音质量评估的媒体面语音样本,即抽样获取语音信息,提取声学特征。

将特征参数输入评估模型,即可输出该通话的语音质量MOS评分。

2.3 基于能量检测及语谱匹配的单通、断续算法

断续的表现是持续纯无声状态,可以通过VAD检测技术实现声波能量的精准量化,同时基于关键字匹配技术和深度学习语音特征分析技术,采用断续的语音段分析挖掘建模方式和5000余条断续拨测样本,建立起高准确率的单通和断续判断规则。

2.3.1 VAD能量检测

单通断续能量检测流程说明:

(1)输入层:通过周期性检测获取的RTP包采样解码片段。(2)中间层:将采样信号片段分帧,计算每帧的短时能量,最后计算出完整的声音信号平均能量值。(3)输出层:根据声音信号的平均能量值为采样点状态赋值(状态码=0:Eaver=0;状态码=1:Eaver>0)。

2.3.2 关键字语谱匹配技术

基于信息安全考虑,采用与语种无关关键词语谱检索技术,通过结合HMM-Filler+融合置信度的判别方法,实现单通关键词的快速准确检索匹配,不作语义识别,不获取用户通话内容。

2.3.3 单通判断规则及分类

(1)一端无声。上行无声段丢包率低于阈值、对应无声段无语音活动、对应无声段能量方差<=阈值且对端同时段有声碎片中检索出满足关键字语谱>=2个,则判断为单通1。下行则判断为单通2。(2)高丢包。无声段丢包率大于阈值且对端有声碎片中满足关键字语谱>=1个,则判断为单通6,阈值可设置。(3)全程无能量。无声片段丢包率低于阈值、无声段无语音活动且对端同时段有声碎片中检索出满足关键字语谱>=1个,判断为单通7。

2.3.4 断续判断规则

基于关键字匹配技术和成熟的深度学习语音特征分析技术,采用断续的语音段分析挖掘建模方式,通过5000余条断续拨测样本,建立起高准确率的断续判断规则。

2.4 基于用户位置及分段评估的指标问题挖掘方法

利用用户位置上报信息,关联用户通话过程的全部占用小区信息,并结合分段的语音质量及KPI指标(8秒分段,可设置),将一单通话指标统计输出为起呼小区指标算法(每8秒关联一次用户位置并将指标统计输出为目前占用小区指标)。

通过该方法,可将单通、断续等语音质量问题,以及乒乓切换等问题精确定位至时间点,并保证了占用小区的正确性,避免移动通话中的指标问题及通话故障误判。

2.4.1 用户位置信息获取及关联

(1)通过计费单元PCRF的RX、GX接口原始码流,获取用户通话信息及实时上报的小区位置信息。该方法对于开启基站用户位置信息上报情况下有效,对网内X2、S1切换的位置更新均能捕捉,位置关联正确率及完整性95%以上。(2)RX接口包含用户呼叫信息,可获取号码及IP四元组,GX接口包含用户上报的位置信息及IP四元组,二者关联可获取完整的用户话单及位置信息。进而通过四元组、时间,与分段的语音质量信息关联,即可获得包含用户位置信息的8秒分段的语音质量信息。

2.4.2 指标问题挖掘

(1)通过2.4.1获取的各种信息,将通话过程中的通话故障时间点和地点一一对应,该方法可以避免将通话故障误判至A小区,并对通话过程中B小区发生的断续故障进行有效判断。如表1所示。(2)通过2.4.1获取的位置更新信息,通过设定的判断门限(如8秒内发生3次及以上位置更新),能有效对VoLTE业务的乒乓切换进行判断。

2.5 基于融合指纹库MR数据的质差用户位置精准定位

基于融合指纹库的MR数据,通过软硬采关联算法,实现用户话单信息、包含小區位置信息的分段语音质量指标精准定位。基于精准定位,既可以为用户投诉分析定位提供数据支撑,又可以通过栅格化指标呈现实现精准质差区域定位,辅助网优日常优化工作。

2.5.1 数据关联及定位原理

通过TIME、MME_CODE、MME_GROUP_ID、MME_UE_S1AP_ID四个字段关联软采MR数据与S1-MME数据,将软采MR数据中的LONGITUDE、LATITUDE、RSRP、SINR等信息填至S1-MME数据中。

通过TIME和IMSI字段关联S1-MME数据与VoLTE语音数据,将S1-MME数据中的LONGITUDE、LATITUDE、RSRP、SINR等信息填至VoLTE语音数据中,形成包含用户(IMSI)在具体时间(TIME)具体位置(经纬度)上的通话质量(MOS)和所在位置的无线环境(MR电平RSRP、质量RSRQ)关联信息库。

2.5.2 网络覆盖引起的质差用户挖掘

(1)通过深度神经网络的用户感知评估及单通、断续、吞字等通话故障的准确判断,结合MR位置信息及小区无线指标,利用GIS等呈现手段,实现无线质量问题(如强干扰、弱覆盖)导致的用户感知问题快速定位分析。(2)根据各区域的话务模型、用户价值、感知质差发生次数及概率,对问题区域进行栅格、建筑物、地理区域汇聚,输出重点需要优化的VoLTE高价值感知质差区域。

2.5.3 非网络覆盖引起的质差用户挖掘

对于非网络覆盖引起的质差,可用系统从网元、终端等维度进行聚类分析。目前已从终端维度进行了研究。问题主要表现在终端降噪导致的能量损失和终端降噪能力不足两个方面。

3 VOLTE语音质量关键评测技术

本论文基于机器学习方法进行VoLTE语音质量评测,规避了传统方法存在的劣势和弊端,方法独特,具有很高的实用性和创新性,具体应用效果如下。

3.1 关键技术一:语音评测关键技术

利用移动通信网络中的退化语音来客观评价MOS质量,根据人耳的听觉特性提取声学特征,并结合语音的信噪比、自然度、传输RTP指标等参数,通过神经网络回归算法,深度学习这些声学特征参数与MOS分之间的非线性关系,最终实现提取单边退化语音样本,直接评估出语音MOS分。

3.2 关键技术二:VOLTE单通判断关键技术

通过VAD检测技术获取符合制定规则的语音,并结合能量特征检测与关键词语谱匹配技术获取单通通话,对丢包及非丢包情况的单通均能有效判断,并在无线、核心网、终端等维度的定界定位均较传统方法具有优势。

3.3 关键技术三:断续判断关键技术,提高语音质量分析准确率

基于大数据量的断续拨测训练集,人工标注断续特征段,通过各种特性指标训练获取SVM分类模型,最后结合断续在能量上的感知落差的事件检测,建立起高准确率的感知断续判断规则。

3.4 关键技术四:分段评估关键技术

传统DPI系统的语音质量评估,仅支持评估话单级平均语音质量,位置信息仅包含起呼和挂机小区,评估结果无法体现用户真实感知,无法准确定位质差区域。利用精细化的评估结果,将话单级指标转变为秒级时间粒度、准确实时小区空间粒度的新指标,支撑新型网络指标考核体系建设,同时也提升了质差小区优化效率和投诉处理效率。

分段语音质量评估思路:

(1)利用RTP组包技术,实现任意时长的分段语音质量评估,分段输出MOS、单通、断续等核心指标;(2)解析RX、GX口计费策略中的实时上报位置信息,获取VoLTE通话中系统内位置的全量信息,实现通话中占用小区信息遍历;(3)将实时位置信息填充至分段的语音质量评估结果中,实现指标精确到秒、位置准确至占用小区的统计。

4 应用效果

目前,基于人工智能的VoLTE语音质量评测优化方法的系统已上线,应用效果覆盖某运营商地市分公司的全部区域,实现小区、用户级别语音感知质量综合评估、语音质差区域定界、业务指标统计、语音感知质量场景监控、投诉分析及处理等功能。

4.1 MOS应用效果

项目聚焦MOS质差通话,通过MOS质差定界分析方法开展VoLTE语音质量优化工作,结合MR数据的网络问题总体定界率达到77.5%;结合声学特征对终端质差定位已发现十余款具有一定保有量终端问题;对39类覆盖场景的深度覆盖不足问题进行输出。

4.2 单通应用效果

從某运营商地市分公司的现网验证,单通质差占比0.34%、准确率85%,其中识别类型为时域事件(丢包、抖动引起)占比32%,频域事件(非丢包、抖动引起)占比68%左右。

单通质差定界从11项语音质量问题根因排查,定位至网内、异网、终端、无线环境4大维度。

参考文献

[1] 魏宗静.VOLTE语音质量优化方法研究[J].科技经济导刊,2016(05):33.

[2] 孙平强.VoLTE业务的性能分析及优化研究[D].北京邮电大学,2015.

[3] 张永飞,郭宝,张阳.基于端到端的VoLTE通话质量优化方法[J].科技经济导刊,2016(06):17-22.

[4] 任君明.VoLTE语音呼叫时延优化的研究与实践[J].电信工程技术与标准化,2016,29(05):57-60.

[5] 楼舒慧.面向客户感知的提升VoLTE通话质量的研究[D].浙江工业大学,2017.

[6] 姜先贵,李勇辉,朱斌.VoLTE语音质量研究[J].邮电设计技术,2015(10):51-55.

[7] 吴修权,钟其柱,候德濠.一种基于IMGW接口的VoLTE语音质量评估方案[J].通信技术,2017,50(05):973-978.

[8] 姚玉华.探究VOLTE语音质量的评价方法及测试方案[J].通信设计与应用,2017(04):36-37.

猜你喜欢
机器学习评测优化
超限高层建筑结构设计与优化思考
一道优化题的几何解法
次时代主机微软XSX全方位评测(下)
次时代主机微软XSX全方位评测(上)
攻坡新利器,TOKEN VENTOUS评测
Canyon Ultimate CF SLX 8.0 DI2评测
前缀字母为特征在维吾尔语文本情感分类中的研究
基于支持向量机的金融数据分析研究