基于人工神经网络的VoLTE MOS预测

2018-12-27 09:59陈秀敏刘兵关禹斌黄毅华

移动通信 2018年10期

陈秀敏刘兵关禹斌黄毅华

【摘要】在现阶段的网优工作中，难以得到全网范围的VoLTE MOS数据，提出的基于人工神经网络的VoLTE MOS预测，采用MCMC方法对路测未能获取的缺失数据进行数据模拟以增强样本数据，对增强后的数据采用人工神经网络模型进行拟合并建立预测模型，进而得出VoLTE MOS的预测值，经理论验证以及与仪表实测结果进行对比，证实该方法有效可行。

VoLTE MOS；人工神经网络；数据模拟

1 引言

在频谱资源紧张，电路域语音面临清退，VoLTE业务亟待推广的形势下，语音的主观品质评估受到了重视。用MOS来评价语音是目前最为通行的手段之一，然而大多数情况下获取VoLTE MOS值的方式仍依赖于现网的DTCQT测试，这种方式无法做到全天候、全时段、全区域，需耗费大量的人力物力进行长期的数据采集，不但成本高，而且人为操作的失误或者偶然事件也会影响到VoLTE MOS的准确性。在此背景下，如果能通过计算机对VoLTE MOS进行预测和仿真，不但可以大大降低网络优化人员的工作量，而且可以不受天气、时间、区域的约束获取VoLTE MOS数据，这将使VoLTE MOS数据在更大的领域获得更深入的应用成为可能。

2 MOS评估算法现状

MOS（Mean Opinion Score）语音评估是指以用户主观感受的角度来评估语音质量的一个指标，因为其代表的是真实通话时语音通过无线网络传播后，与原有声音之间的差异，所以能客观地反映经过网络传输后对语音的保真情况。

传统MOS测试主要是通过路测软件外接含有内置声卡的MOS测试盒来实现，将声卡记录的放音语料与原始语料参考ITU-T P.863标准进行算分，这种方式设备间连接较为复杂，出现的问题较难定位。影响MOS评估的因素很多，包括时延、抖动、丢包、编码器性能等网络损伤因素对语音质量的影响，还有用以评估该语音呼叫的主观品质影响。MOS既受无线因素的影响，也受到核心网因素的影响，影响因素众多，如果只是通过以往简单的回归模型来对MOS进行预测，预测效果往往差强人意。本文通过引入深度学习的人工神经网络模型进行MOS预测来解决上述问题。

3 人工神经网络概述

ANN（Artificial Neural Network，人工神经网络）模仿了生物神经网络的结构和工作原理，利用许多逻辑简单但高度互联的处理器（神经元），通过带有权重的连接传递信号。每个神经元通过这些连接收到若干个输入信号，并产生输出信号，由神经元向外传送，这样信号一直传递下去，直到传播过程结束。在这个过程中，人工神经网络不断调整连接的权重，而这权重正是ANN中长期记忆的基本方式，它表达了每个神经元输入的重要性。

在神经网络中，数据的处理是全局的而不是局部的，正是由于这种原因，使正确答案的神经元连接得到强化，反之则被弱化，从而神经网络可以自动学习样本数据的分布，并对未来的数据进行预测。

人工神经网络包含一个输入层，一个输出层和若干个隐藏层，其结构示意图如图1所示：

4 建模及预测

4.1 模型样本生成

受限于现网测试数据采集的资金成本、时间跨度、人为操作失误等，训练模型使用的样本数据有时候往往样本量不会很大，如直接用于模型的训练，模型泛化效果必然会受到影响。针对这种小样本的情况，可以使用数据模拟的方法来进行数据增强，本文采用的是构建Gibbs抽样器进行抽样模拟来对样本数据进行扩充，从而实现数据增强。

Gibbs抽樣是马尔可夫链蒙特卡尔理论（Markov Chain Monte Carlo，MCMC）中用来获取一系列近似等于指定多维概率分布（比如2个或者多个随机变量的联合概率分布）观察样本的算法。因此，当数据维度较多时，应考虑使用Gibbs抽样，利用条件概率完成多维度数据的模拟。Gibbs抽样将多维数据的后验密度转化为多个单变量的密度，其原理是多维数据的联合分布是由所有的单维条件分布的集合决定的。当数据是多维变量相互协同发挥作用时，可使用联合分布来定义多重事件的概率，而联合分布可以分解为单变量分布，从而可得条件分布与联合分布成比例关系。于是，多变量的联合分布，通过上述关系都可以进行分解，从各个参数的条件后验中轮流抽样，Gibbs抽样器的一个迭代将会同时更新每个参数，最终实现对多维度数据的抽样模拟。

在选取输入模型训练的样本时，可以利用现成的之前采集的现网MOS测试数据。将采集的MOS值按呼叫粒度取平均，并从网管平台导出相应呼叫的MR数据，对MR数据按呼叫粒度汇总并与测试得到的MOS平均值关联生成样本数据。如果在进行路测数据采集时设置的是一个长呼，呼叫过程中可能跨越多个无线小区，使得在一个呼叫中无线环境变化波动频繁，此时也可以考虑按时间切片的粒度来汇总数据，但是这种方法在后期数据关联时要注意关联准确性的问题。

表1为训练模型所取的样本实例，该VoLTE MOS数据有38个维度，共4千条数据。

4.2 模型训练

基于人工神经网络，用于VoLTE MOS预测的模型张量流图如图2所示。

图2中，将Gibbs抽样模拟的增强数据样本批量标准化后从输入层data输入人工神经网络，经过y1、y2两层隐藏层（由于网络的反向传播会使训练误差出现逐级放大的可能，所以设置两层隐藏层），到达输出层y。通过预测值与观测值分别计算损失Loss以及误差MSE（Mean-Square Error）、MAE（Mean Absolute Error），其中Loss通过Adam优化器逐步迭代，使Loss不断逼近最小值，从而训练模型达到最优效果。Adam优化器可以避免模型陷于局部最优，一般解决Loss函数非突情况下的优化问题，在使用中可设置学习率的衰减参数，这能使梯度的下降更加精确。为避免模型泛化效果差以及出现过拟合现象，还需对Loss函数进行L2正则化。ANN模型通常要进行不止一次的训练才能使模型达到对样本数据较好的拟合，所以数据训练需经过多次迭代和多个Epochs，每个Epoch都将数据的顺序重新打乱，最终训练出Loss最小的权重和偏置参数矩阵。

图3是训练误差MSE趋势图，从图中可以看出，经过多个Epochs的训练后，MSE基本稳定在0.09左右，也就是平均误差MAE在0.3左右。通过对比数据增强前的样本数据测试平均误差MAE（达到0.6以上），验证了使用小样本数据训练神经网络会使模型的泛化能力下降导致测试集的预测精度降低，而在加入Gibbs抽样模拟后，模型泛化能力增强，明显提高了测试集的预测精度，可见数据增强的效果是显著的。也就是说，在样本数据量不多的情况下，通过科学的数据模拟可以很好地提高模型的泛化能力，提高预测精度。再结合图4测试数据拟合残差图（残差指观测值与预测值之差，此处使用的是差值的绝对值），可以看到离群值数量较少，并且可控，这说明人工神经网络对VoLTE MOS数据有较好的预测效果。

训练得到的模型还要通过测试数据进行交叉验证，以检验模型的预测以及泛化效果。

4.3 预测结果验证

为形成整个预测过程的闭环，预测结果必须再次回到现网中依靠实际的路测MOS数据来进行检验。

从上述与路测的MOS对比可见，单个的预测结果偏差值在0.3以内，整体预测结果的偏差率在0.1以内，证明基于人工神经网络模型预测出来的VoLTE MOS值达到了预期效果，接近于传统路测仪表测试所得的MOS评估结果。

5 应用前景

基于人工神经网络的VoLTE MOS预测虽然在样本训练期间需要与传统DT/CQT相结合，但在经过训练后其数据模型能在一定程度上替代传统的DT/CQT测试MOS值，从而弥补了路测受时间、地域约束的不足，为准实时提取呼叫粒度的MOS值提供了可行途径，也为从MOS角度把握网络状态的变化提供了便利。

日常网优采集MOS是一个高重复的测试行为，传统方式需要调用测试车辆、测试人员、测试卡以及采购对应数量的路测仪表，耗费的成本与MOS测试量成正比。应用人工神经网络的VoLTE MOS预测系统，只需在前期结合一定数量的路测数据进行数据训练，在接下来的相对较长一段时间里就可应用MR数据对VoLTE MOS进行预测，大大节省了优化和维护成本。

VoLTE MOS预测还可以为用户投诉处理以及重点客户保障提供帮助，应用人工神经网络的VoLTE MOS预测系统可以通过提取投诉用户或重点客户对应的MR数据，得到预测的VoLTE MOS分值，无需现场测试便可提供有针对性的数据支撑，指导现场优化。

6 结束语

为解决日常网优遇到的测试数据量不足、数据不完整、数据缺失、成本耗费高、数据采集非实时、投诉处理时效不够高等问题，本文创新性地将先进的统计方法应用到运营商日益关注的MOS值预测实践中，将经过数据模拟后的样本输入人工神经网络，这在一定程度上提高了神经网络模型的泛化能力。该模型具有数据分布自动学习、大规模并行计算、分布存储和容错性等优点，而且拟合效果好，无论是经过测试集的收敛测试验证还是现网环境下与仪表的对比检验都达到了预期满意的结果，论证了本文的方法是可行的、有效的，可以实现高效低误差的MOS预测。

参考文献：

[1] 魏宗静. VoLTE语音质量优化方法研究[J]. 科技经济导刊， 2016（5）.

[2] 王伟. 人工神经网络原理[M]. 北京：北京航空航天大学出版社， 1995.

[3] 韩力群，康芊. 人工神经网络理论设计及应用[M]. 北京：化学工业出版社， 2007.

[4] 樊宏伟，李涛，伍良富，等. 智能神经网络开发系统的实现技术[J]. 高技术通讯， 1998（11）： 16-19.

[5] 李晶，栾爽，尤明慧. 人工神经网络原理简介[J]. 现代教育科学， 2010 （s1）： 98-99.

[6] 王萍，单超. 神经网络在通信中的应用[J]. 现代电子技术， 2003（13）： 7-8.

[7] 徐京皓，曹达仲. 移动通信中神经网络在信道分配上的应用[C]//中国通信学会学术会， 2003（1）： 803-807.

[8] 陈佳昀，武斌，唐唐. AHP和BP神经网络在通信效能评估中的应用[J]. 现代电子技术， 2009，32（7）： 65-67.

[9] 党志恒. 基于用戶感知体系的神经网络算法研究[J]. 数字技术与应用， 2013（10）： 136-137.

[10] 陈鹏，景志宏，王伟. 基于BP神经网络的用户感知体系优化仿真[J]. 计算机仿真， 2012，29（1）： 102-105.